
本次分享的主要内容:
为什么选择 Databend 归档 TiDB
归档工具,归档的流程,实践效果
归档实践总结,对 Databend 未来的展望
为什么选择 Databend 归档 TiDB
TiDB 在多点 DMALL 使用的非常好。可以实现透明扩展, 研发无感,数据增加,架构不变;TiDB 在使用中给人的感觉是没有容量限制,支持更多的数据;在 TiDB 中扩容更便捷,加节点即扩容,自动 Rebalance。基于以上优点,TiDB 越用越舒服,但成本也就越来越高。


存储成本:对象存储和 HDD, SSD 的成本,其中对象存储是 HDD 的1/10, 是 SSD 的 1/30,
在线查询能力:但数据又不能直接放到对象存储中,还需要提供对外的查询能力,
支持大表持续备份:这块也调研了 MariaDB on S3,需要先写入 InnoDB,然后在转成只读的 s3 engine ,这样备份 10 TB 的表,本地也要有 10 TB 的空间, Databend 是直接写入对象存储。
兼容 MySQL 协议:可以保持 TiDB 的使用习惯。

其中 Databend-query 有点类似于 MySQL server 直接连接对象存储,对于用户管理,权限,meta 信息存储在 Databend-meta 中,这个节点可以单点部署,生产中也可以部署成集群模式。
归档工具、归档流程、实践效果

DMALL 研发一个新的归档工具,工作流程如下:
先做归档表结构到 Databend 创建
基于小批量读取源端到 Channel 中,同时检测源端压力,如果源端压力大,降低读取速度,如果压力小,就可以加大读取
Databend 端写入时,可以合并写入,实现更大的 batch
在 Databend 写入成功后,再去源端删除,保证数据安全

归档任务,由开发人员发起,DBA 审核,自动化归档,数据永久保留。基于上面的方法,可以实现开发人员,查询 2,3 年前的数据,也可以自助完成。



归档实践总结,对 Databend 未来的展望
降本显著:基于对象存储,冷数据存储成本除低 98%,如果你是 SSD 到对象存储,基可以达到 99% 以上的降本。
云中立:支持 AWS, Azure,GCP,阿里云,腾讯云,华为云,青云,火山引擎,minio,ceph 等
研发友好:MySQL 协议兼容,可在线查询,统计分析性能好
运维无忧:无限空间,高可靠性,免维护,迁移便捷

关于 Data Infra 社区
Databend 文档:https://databend.rs/
Twitter:https://twitter.com/Datafuse_Labs
Slack:https://datafusecloud.slack.com/
Wechat:Databend
GitHub :https://github.com/datafuselabs/databend
文章转载自yangyidba,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




