

阿里云AnalyticDB承载了光云海量数据的实时在线分析,为各个业务线的商家提供了丝滑的数据服务,支持实时物化视图、租户资源隔离、冷热分离等企业级特性,很好地解决了SaaS场景下的业务痛点,也平衡了成本。同时也基于通义+AnalyticDB研发了企业级智能客服、智能导购等行业解决方案,借助大模型和云计算为商家赋能。
—— 光云科技CTO 王祎

客户介绍
光云科技是中国首批电商SaaS服务商,是互联网SaaS模式的软件技术创新型企业。光云科技秉承“让企业经营更卓越”的使命,专注于为企业提供电商运营的全链路解决方案,致力于成为全球企业软件服务领域的领跑者。光云科技累计服务包括海澜集团、慕尚集团、地素集团、百丽集团、森马集团在内的数十家上市集团以及超过2000家大型国内知名电商及零售企业,服务范围涵盖服装、鞋靴、箱包、运动品类、配饰等泛时尚类目。
在Data+AI技术发展驱动下,电商软件服务正在发生变革,在线数据处理、实时分析和智能化决策成为新的业务趋势。

技术挑战
挑战一:复杂自定义配置
挑战二:实时计算能力
挑战三:长周期数据应用
挑战四:混合业务负载
挑战五:高可用和高可靠

数仓升级之路
应对业务发展对技术的挑战,光云科技基于阿里云瑶池旗下的云原生数据仓库 AnalyticDB PostgreSQL 版实现了架构升级,打造新一代的在线数仓,同时构建AI原生的仓内智能能力,并且在AI创造场景上进行了探索。

动态资源弹升
数据产品对外提供付费服务,因为需要时刻保障业务连续性。开源MPP架构产品虽然能提供高可用能力,但在计算节点依赖的宿主机发生宕机情况下会影响整个集群的性能。为了保障集群性能不降级,AnalyticDB for PostgreSQL提供了动态资源弹升的能力。

流批一体实现商品分析

混合负载与资源隔离
集群同时存在高吞吐写入、历史数据重算、实时计算和在线分析服务需求,因此需要支持混合业务的数仓负载。AnalyticDB for PostgreSQL基于CGroup、共享内存等实现资源组技术,支持对并发数、CPU资源、内存资源等进行管理;构建不同的资源组,根据业务在不同时间段的重要性动态地分配资源,比如在早上需要保障在线分析服务和实时计算的业务连续性,在数据刷新的资源可以调低一些。在凌晨则相反,批处理加工的资源最大,同时也保留一部分资源保障KA客户的分析服务。通过资源配置,在保证业务资源权重的基础上,充分利用其他租户业务的闲置资源。

冷热数据分层存储

实时数据集成
Zero-ETL:提供Zero-ETL服务,将分散、零乱、标准不统一的数据整合到一起,实现数据平滑“无感”的流动,为企业的决策提供分析依据,并降低建仓资源成本。
Kafka订阅:提供Streaming Server服务,支持订阅Kafka数据直接入库,将数据直接并行写入Segment节点,实现高性能流式数据写入。
写入能力扩展:支持横向及纵向扩展Streaming Server资源及节点数量,实现更高吞吐写入。
实时数据集成:提供Flink Connector和ClientSDK等,支持Flink及应用直接对接Streaming Server。


AI赋能业务的探索实践


总结与展望

点击了解 云原生数据仓库AnalyticDB








