暂无图片
暂无图片
9
暂无图片
暂无图片
暂无图片

波司登 × 阿里云 SelectDB:存算分离架构如何让羽绒服巨头降本 30%、性能翻 5 倍?

数据极客圈 2025-08-26
411

在羽绒服行业,“旺季抢收、淡季节流” 是永恒的经营命题。波司登作为全球领先的羽绒服企业,每年 4 个月销售旺季要支撑 3500 + 门店、5000 万 + 电商粉丝的实时数据分析需求,淡季又需控制成本避免资源浪费。过去,多引擎并存的旧架构让数据冗余、性能卡顿、成本高企成为难题;如今,基于阿里云 SelectDB 的存算分离升级,不仅实现了 2-5 倍性能跃升,更让总体成本降低 30% 以上,为传统企业数字化转型树立了标杆。

一、旧架构的 “三重困境”:支撑不了的旺季,省不下的淡季

作为年营收超 230 亿元的服饰巨头,波司登的数据分析场景早已渗透到业务每一环 —— 门店实时监控库存波动、电商应对大促流量峰值、用户运营精准圈选人群,但早期搭建的 “Apache Doris+PostgreSQL+StarRocks” 多引擎架构,却逐渐跟不上业务节奏:

1. 架构复杂,数据 “重复躺平”

为满足不同场景需求,波司登部署了多套分析引擎:Apache Doris 处理复杂实时查询,PostgreSQL 承接简单实时需求,StarRocks 负责离线报表。但多引擎意味着同一份数据要存储 3 份,仅存储成本就居高不下,更遑论跨引擎数据流转时的效率损耗。

2. 稳定性不足,性能 “掉链子”

为满足时效需求,复杂报表有时直接在业务库中查询以提高数据时效性,但会为在线业务系统带来风险,影响其他重要业务稳定性。此外,复杂查询占用大量机器资源,性能受限,且因多个业务查询负载不同,需多独立计算组隔离资源,数据共享需多次跨计算组流转查询,导致效率较低。

同时,由于复杂查询会占用大量机器资源,性能受到极大限制。多个业务查询负载差异显著,需要通过多个独立计算组进行资源隔离。但数据共享时,又需多次跨计算组流转查询,使得全国门店实时库存查询在高并发时排队堆积,一些长周期查询甚至会占用 80% 的资源,导致业务效率低下。

3. 弹性不足,成本 “旱涝不均”

存算一体的架构让扩缩容成为 “老大难”:旺季需提前采购服务器,成本高且闲置率高;淡季想缩减资源,又因数据与计算绑定,只能让服务器空转。每年仅为应对旺季储备的冗余资源,就吃掉了不少的IT 预算,实在是浪费~

二、SelectDB 存算分离:一招破解 “性能” 与 “成本” 的矛盾

面对困境,波司登最终选择阿里云 SelectDB 作为统一分析引擎,核心在于其云原生存算分离架构—— 将数据存储在低成本 OSS 对象存储,计算节点按需弹性调度,再通过资源隔离确保业务互不干扰,完美适配 “旺季弹性扩容、淡季缩容降本” 的需求。

1. 资源隔离:让 “盘点” 与 “分析” 互不打扰

波司登最头疼的场景,莫过于 “全国门店盘点” 与 “年度销量分析” 撞车。SelectDB 通过标签化计算组隔离,将业务拆分为 4 个物理隔离的计算组,从根源解决资源争抢:

  • 实时报表计算组:专属支撑 3500 + 门店的实时库存查询,2000 QPS 场景下响应时间稳定在 20ms 内,寒潮期间也能快速调整铺货策略;

  • BI 计算组:承担夜间离线数据导入、异步物化视图刷新、人群圈选计算,避免夜间数据加工占用白天资源;

  • 离线报表计算组:直接复用 BI 计算组的加工结果,无需重复存储,避免多份存储造成冗余浪费;

  • 人群圈选计算组:仅负责查询圈选结果,小巧灵活不占用核心资源。

如今,即便分析师在门店盘点时运行近一年的销量分析,也不会影响门店查询响应 —— 资源隔离让 “同时做两件大事” 成为可能。

2. 分钟级扩缩容:旺季 “秒加资源”,淡季 “一键瘦身”

SelectDB 的计算节点与数据完全解耦,扩缩容无需迁移数据,仅通过 FE 元数据动态映射即可完成。波司登的 IT 团队发现,过去需要长期筹备的旺季扩容,现在分钟级就能完成

这种 “弹性” 不仅是技术升级,更改变了波司登的成本结构 —— 不再为闲置资源买单,每一分钱都花在刀刃上。

3. 数据链路重构:实时 + 离线 “双管齐下”,效率翻倍

为让数据流转更高效,波司登基于 SelectDB 设计了 “实时 + 离线” 两条优化链路:

  • 实时链路:大规模场景用 Debezium 采集 100 + 张表数据写入 Kafka,再通过 Doris Kafka Connector 同步至 SelectDB,支持多 Topic 并行处理,数据延迟控制在秒级;中小规模场景用 Flink SQL 直连写入,支持 Checkpoint 模式确保数据不丢失;

  • 离线链路:MaxCompute 存储 T+N 离线数据,通过 Dataphin 全量 增量导入 SelectDB,同时在合适时机触发异步物化视图刷新,让离线报表查询速度得以提升。

三、看得见的 “收益清单”:性能、成本、效率全面跃升

升级后的数据平台,给波司登带来的不仅是技术优化,更是业务价值的显性提升:

1. 性能:从 “卡顿” 到 “秒响”,体验质变

  • 中小查询:2000 QPS 小查询,阿里云 SelectDB 平均响应时间低于 20 ms。142 QPS 中等查询,平均响应时间为 8 ms。相较原数据架构,性能提升 2-5 倍;

  • 复杂查询:过去需数分钟甚至失败的 “近一年销量 + 人群画像” 关联查询,现在 10 并发下秒级完成,数据分析师不用再熬夜等结果;

  • 数据导出:2GB 的离线报表文件,从原架构优化至 43.8 秒;

2. 成本:从 “高耗” 到 “精益”,预算减负

  • 数据库成本降 30%:存算分离 + 按需付费,旺季资源消耗虽增,但淡季成本直降,全年综合成本减少 30%;

  • 存储成本降 61%:SelectDB 采用 OSS 单副本存储,替代传统数据库的三副本模式,仅这一项就节省近 2/3 存储开支。

3. 效率:从 “救火” 到 “从容”,运维减负

过去,旺季需要多名工程师通宵值守应对系统故障;现在,SelectDB 的 SaaS 化部署实现高可用,旺季仅需 1-2 人值守,晚上 9 点半即可结束工作,大幅削减了通宵排班需求,运维效率显著提升。更重要的是,业务部门的自助分析能力显著提升。

四、不止于 “降本增效”:数字化转型的下一站

如今,波司登的 SelectDB 升级还在持续深化:不仅计划用 SelectDB 替换自建的 Doris 可观测平台底座,进一步降低运维成本;还将借助 Arrow Flight SQL 功能,让门店店长、电商运营等一线人员也能自主生成经营报表。

从多引擎混乱到统一存算分离,从性能卡顿到秒级响应,从成本高企到精益管控,波司登的实践证明:传统企业的数字化转型,不需要 “大而全” 的颠覆,而是 “准而精” 的升级 —— 选对一个适配业务场景的技术架构,就能让数据从 “成本中心” 变成 “增长引擎”。

对于同样面临 “旺季压力大、淡季成本高” 的企业而言,波司登与阿里云 SelectDB 的合作,或许正是可复制的转型样本。

往期推荐

Doris BE节点下线卡住?快速排障技巧全攻略!

Apache Doris 索引的全面剖析与使用指南

Apache Doris 湖仓一体:打破数据边界,解锁实时分析的终极答案

Doris vs ClickHouse 企业级实时分析引擎怎么选?

Doris查询报错-230?别慌,教你几招秒解!

Doris Tablet 损坏如何应对?能恢复数据吗?

Doris 导入慢该如何排查和优化

Doris 建表与分区问题全解析









数据极客圈子介绍

圈子1

Apache Doris社区是目前国内最活跃的开源社区(之一)。Apache Doris(Apache 顶级项目) 聚集了世界全国各地的用户与开发人员,致力于打造一个内容完整、持续成长的互联网开发者学习生态圈! 

如果您对Apache Doris感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组

💡官网文档:https://doris.apache.org 
💡社区论坛:https://ask.selectdb.com 
💡GitHub:https://github.com/apache/doris 
💡dev邮件组:dev@doris.apache.org

      可以加作者微信(Faith_xzc)直接进Doris官方社区群
圈子2

PowerData是由一群数据从业人员,因为热爱凝聚在一起,以开源精神为基础,组成的数据开源社区。

社区群内会定期组织模拟面试、线上分享、行业研讨、线下Meetup、城市聚会、求职内推等活动,同时在社区群内你可以进行技术讨论、问题请教,结识更多志同道合的数据朋友。

社区整理了一份每日一题汇总社区分享PPT,内容涵盖大数据组件、编程语言、数据结构与算法、企业真实面试题等各个领域,帮助您提升自我,成功上岸。

可以加作者微信(Faith_xzc)直接进PowrData官方社区群

叮咚✨ “数据极客圈” 向你敞开大门,走对圈子跟对人,行业大咖 “唠” 数据,实用锦囊天天有,就缺你咯!快快关注数据极客圈,共同成长!

 

点击上方公众号关注我们

最后修改时间:2025-08-26 10:13:21
文章转载自数据极客圈,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论