暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

官宣| Zilliz Cloud 推出在线迁移功能,无感迁移不停机

ZILLIZ 2025-05-23
139

我们在做 Zilliz Cloud 的过程中,其实遇到过很多用户问我们一个问题:

“如果我想从 Serverless 集群切到 Dedicated,要怎么迁?”

看上去,这是一个再正常不过的 SaaS 使用场景。从小团队到独角兽,没有哪家公司的系统架构是一夜长成的——规模小的时候,业务在 serverless 上跑,大点了换成 Dedicated 集群,再长出多地容灾、多副本隔离、CU 动态伸缩……业务演化的结果,一定是架构的迁移、集群的升级。

但是从技术角度来说,它又从来不只是一个按钮那么简单。它可能意味着大停机,可能意味着团队必须协调好时间窗口,备份数据,通知用户,甚至准备好应急预案。

我们见过太多因为升级迁移导致的灾难现场:

迁移中断,但表没同步完,直接导致结算系统金额偏差;跨区迁移,CDC失败未告警,用户行为数据延迟;数据是完整的,但迁移过程中字段类型做了强制转换,导致召回率直线下跌……

为什么大家都默认迁移就会出bug,而且这是一件要靠人扛的事?明明是合理的系统演进,为什么要让所有人如临大敌?

我们觉得不应该是这样。 所以我们开始尝试,能不能把“迁移”这件事做得更自然一点,甚至不被察觉。

基于这一背景,我们推出了Zero-Downtime Migration,在线迁移(内测版)。

通过这个功能,无论是升级集群,还是变更部署方式(例如从 Capacity CU 迁移至其他类型),现在都可以在不中断服务的情况下完成数据迁移。

01 

为什么需要在线迁移?

最常见的迁移动因,其实只有三个字:“不够了。”

Serverless 跑不动了、响应太卡了;CU 被打满了、后台写入延迟飙升;索引改不了,配置调不动;再或者业务扩张需要海外多地部署……

以往,在不同集群之间迁移数据通常需要计划性的停机维护——对于有严格可用性要求的企业而言,这会对日常的生产带来极大的影响。

而通过“在线迁移”,迁移操作和发起一条查询一样简单,借助这个功能,你可以

  • 高可靠性地迁移整个集群

  • 同步迁移历史数据和实时数据

  • 仅以极小的服务扰动保持服务可用性

无论你是从 Serverless 集群升级至 Dedicated 集群,还是需要更换集群 CU 类型的组织,本功能非常适合你在不中断服务的前提下完成迁移。

02 

它是如何工作的

传统上,实现真正无缝的数据迁移(即同时涵盖历史数据与实时写入)需要构建复杂的数据管道,包括快照备份和 CDC(变更数据捕捉)机制。

这类工程不仅需要精密的编排,还要处理故障转移、事件顺序保证等问题。

而 Zilliz Cloud 的“在线迁移”则为你封装好了所有底层复杂流程。

在底层,我们结合了两大核心系统:

  1. 备份工具:捕获源集群完整、一致的快照数据

  1. CDC 工具:持续监听并实时将新增写入同步至目标集群

这种“双引擎”架构确保了目标集群始终与源集群的状态仅相差数秒,而你的业务系统可以在迁移过程中正常运行

这样,无需手动配置 CDC 或快照计划,用户只需点击“迁移”按钮,Zilliz Cloud 就会自动完成快照捕获、写入监听、增量同步等流程。

此外,我们见过很多用户自己写迁移脚本,调试好几天。常见问题包括:

  • 数据一致性问题(历史 vs 实时)

  • 写入冲突、schema 不兼容

  • 切换时序错乱或遗漏

  • 多集群状态调度复杂

这些问题 Zilliz Cloud 都已经帮你考虑过了。我们把它变成了一套产品内建的能力,从数据同步到最终切换,全部托管,安全可靠。

整个过程长这样:

  1. 选择目标集群,点击“开始迁移”

  2. 后台启动全量备份,同时自动接入 CDC,同步实时数据

  3. 迁移完成后,按提示即可将业务切换到新集群

整个流程中的各个环节(备份、CDC、故障切换)都被彻底屏蔽复杂度。无需额外基础设施、无需写脚本、无意外风险。另外,你会在每个关键节点收到邮件提醒,整个过程只有秒级延迟,对现有服务的影响非常小,几乎可以忽略。

对于开发者来说,它意味着:你可以随时升级你的集群,不用等业务空窗期;你可以更大胆地做架构演进,不会被“迁移成本”绑住手脚;你可以把迁移当成一个普通的运维任务,不再是一场战役。

03 

如何体验它

我们在设计“在线迁移”这个功能时,我们讨论最多的问题是:

“如果我是一个正在用 Zilliz Cloud 的人,我为什么不敢迁?”

后来我们意识到,真正让人恐惧的不是操作本身的复杂,而是不确定点了迁移之后,服务会不会卡;不知道同步过程出问题了,能不能回头,而这种不确定,正是因为绝大多数基础设施演进还在“未完成阶段”。

我们花这么大力气做“在线迁移”,其实是想传达一个态度:你可以从小集群开始试错,也可以随着业务增长去切更强的配置,如果有一天你需要迁移数据,希望你不会再觉得这是个负担,而只是一件可以顺利完成的小事。

现在,“在线迁移(Zero-Downtime Migration)”已上线 Zilliz Cloud 控制台进入内测,并且当前阶段完全免费(未来或按传输量计费)。

如需体验此功能,欢迎在后台联系我们。如需操作指南与注意事项,请参阅我们的文档在线迁移内测说明(https://docs.zilliz.com.cn/docs/zero-downtime-migration),或随时联系技术支持团队。

——Zilliz Cloud 产品团队

推荐阅读
从部署到迁移,怎么用好Milvus,这是我们的经验总结

从BGE到 CLIP,从文本到多模态,Embedding 模型选型终极指南

Milvus Week|开源,Milvus 2.6功能预览:内存减少 72%,速度比ES快4倍

文章转载自ZILLIZ,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论