1.前言
在传统的数据迁移流程中,数据完成迁移后,往往缺乏快速、直接的数据一致性校验机制,也无法直观地向用户展示校验结果。数据一致性验证通常需要依赖外部工具(如SQL客户端、第三方校验软件)或手动编写脚本实现,主要存在以下主要痛点:
校验流程与迁移流程相互脱节,容易导致信息出现偏差;
校验结果依赖人工汇总与分析,定位异常数据效率较低。
此次羲和(Halo)数据库迁移工具的升级,核心目标即为解决上述难题。新版工具无缝整合了Oracle、MySQL、PostgreSQL等国外主流数据库到Halo数据库的数据迁移与校验,形成一体化流程。其在提升效率、降低门槛的同时,也彻底打消了用户对迁移后数据不一致的担忧。
2.功能使用流程
前提条件:
工具已获得读取权限,已完成数据迁移任务。
源数据库、目标数据库处于正常的运行状态。
校验配置说明:
在开始数据校验前,需要在管理模块的【校验配置】页面完成预校验配置。这里举例一个常用的重要参数“ batch-compare-size”,它用于设定抽样比对的批次大小。该参数默认为 “2000”,意味着校验时将从每张表中抽取 2000 条数据生成哈希值,并进行一致性比对。

具体操作步骤:
配置校验任务时,建议按顺序完成以下选择:
填写校验任务名称 → 选择源端数据源 → 选择源Schema → 选择需要校验的表 → 选择目标端数据源 → 选择目标Schema。
说明:支持按“百分比”随机抽样校验,或手动指定具体表进行校验(二者选一)。若Schema内表数量过多,建议采用百分比校验以提升效率。

点击确认,弹出运行日志的抽屉框,开始进行数据校验任务。

点击详情按钮可以查看校验任务中所有表的校验结果与校验状态。点击查询日志按钮可以复查运行时的日志。

点击差异详情按钮,弹出差异分析抽屉框,可以查看具体的差异数据。

此界面会集中展示所有差异记录。“check 对比总数” 明确为该表数据校验时,基于主键抽取的数据对比总数;校验规则上,若源端缺失而目标端存在,将显示“MissingSource”,若目标端缺失而源端存在,则显示“MissingTarget”;对于主键相同但字段值不同的记录,界面将并排显示源端和目标端双方差异的数据,并分别以“source”和“target”作为前缀标识,让各类数据差异一目了然。
3.功能价值
实现“迁移 + 校验”一体化:迁移工具中增加数据校验功能,无需切换工具和编写脚本,即可完成数据迁移后的一致性核对。
自动化适配异构场景:内置主流数据库映射规则,自动识别源/目标库数据类型,生成适配的校验逻辑。
简化操作与结果分析:提供可视化的校验配置界面和数据界面,将校验差异详情数据直观的展示给用户,方便快速定位与对比。




