暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

「最佳实践」只需四步!搞定虚拟机在线热迁移!

青云QingCloud 2023-07-14
694

国产虚拟机替代浪潮下,企业不可避免有迁移需求。比如,将 VMware 数据中心上的业务资源平滑迁移到新建的数据中心集群上。

在虚拟机数量大、数据量大的双重压力下,用户无感知地实现新旧数据中心之间的业务数据同步,并且新数据中心能够完全接管源业务中心的业务,就成为这一场景的挑战。

青云在线热迁移工具,是怎么满足用户这一要求的呢?主要是基于卷块级别的 CDP 技术与专用传输协议。
数据零丢失

在磁盘卷驱动层面,通过实时监控生产环境磁盘上每个块(block)的改动,完成捕捉、读写,复制和重放。

基于卷块级别的 CDP 技术保证数据的一致性,实现物理机/虚拟机整机级别的热迁移,不仅能够迁移生产数据,还能够迁移操作系统、磁盘上的应用软件、中间件、数据库等所有数据,从而实现数据的零丢失。

应用不中断

在业务运行的同时实现原系统和数据的在线热迁移,无需中断应用。

通过 CDP 技术实现数据迁移并执行一致性校验,不影响业务运行。在同步完成后,再对增量数据进行秒级的实时复制,可以在几分钟内完成业务切换。

数据传输高效安全

采用专用传输协议,可以启动数据压缩和多流传输,充分利用带宽,高效传输数据。所有数据传输默认采用 AES-256 加密,并可以根据使用场景选择其他加密方式,以确保数据传输的安全性。

四步完成迁移规划

按照评估&调研、规划设计、实施、后续及验收这四个步骤执行,可以建立一个系统化的迁移方案,从而有效地完成虚拟机的迁移,让企业顺利过渡到新的数据中心集群,并保证业务的连续性和稳定性。

第一步
评估&调研

在评估和调研阶段,了解企业当前数据中心架构和网络规划是非常重要的,需要收集汇总数据中心集群资源(如 IP、CPU、内存、存储、操作系统等)使用情况。一般本地数据中心多为物理服务器承载 VMware 虚拟机,服务器通过 FC-SAN 网络连接集中式存储,本地通过专线连接到数据中心机房,如下架构图。同时,明确对迁移的期望和要求也很重要。

第二步
规划设计


迁移方案拓扑

如果企业的新建数据中心是通过专线与老数据中心互联的,那在此网络环境下,将原数据中心内的业务数据同步到新建数据中心内,在迁移计划的整个运行时间内,生产端主机的全量数据和实时改变数据,都会发送到目标端,达到源端和目标端的准实时(秒级)同步,此连接在不切换数据中心的时候,老数据中心可以正常使用,如下是迁移架构拓扑图。


迁移步骤


序号

任务工作

描述

1

系统备份(1)

安装迁移工具前对系统进行备份,防止迁移工具与系统应用不兼容,用于系统恢复。

2

迁移工具安装与准备

对拟迁移的服务器安 Agent 和准备目标服务器。

3

系统迁移

系统+应用数据迁移到目标服务器。

4

系统验证测试

启动目标服务器的系统以及应用程序,验证系统以及应用功能是否正常。

5

差异数据同步

根据数据验证测试结果,并再次进行差异数据同步。

6

系统备份(2)

在正式切换前对系统环境进行备份,物理机建议进行全系统备份。

7

业务切换

如果源服务器可以停止服务,保证业务数据处于静止状态,数据持续同步,直到数据同步完成,并由目标服务器接管业务。如果源服务器不能停止服务,可等到业务数据更新低谷时,开始持续同步,直到数据同步完成,并由目标服务器接管业务。

8

关联系统变更

变更其他关联系统的网络连接设定,如 DNS 等。

9

业务测试

切换完成后,进行业务测试。保证业务正常。

10

业务回退

如果业务测试不正常。则关闭目标服务器,重新启动源服务器。

11

评估监控

进行日常的 OS,进程等监控。

12

业务迁移验证

业务测试正常、评估监控正常,则业务迁移完成。


迁移建议



A

提前规划目的端数据中心的网络设置

确保目的端数据中心的网络设置与源数据中心相匹配,指定的网络设置与目标数据中心的实际网络环境匹配,包括网段划分、网关、路由设置等。青云在线热迁移工具支持在迁移主机时设置指定的静态 IP 地址、网关、DNS 服务器和域名,或者使用 DHCP。

B

停止生产数据改变和数据库服务

在执行切换操作之前,建议提前一段时间停止生产数据的改变操作。同时建议数据库服务器暂时停止数据库服务。这是因为通常的软件系统,特别是数据库服务,会有缓存机制,一部分数据存储在内存中而不是实时写入到硬盘。当停止数据库服务时,缓存内的所有数据将被回写到硬盘,接着被迁移工具软件抓取并发送到目标端,从而保证数据的完整性和一致性。

C

提前估算业务和服务的停机时间

可以根据服务器类型和数据库规模来估算。例如,对于一台 64 GB 内存的数据库服务器,假定数据库缓存和系统缓存和内存大小相当,在千兆网络下,假设数据库缓存大小与系统缓存大小相当,实时复制这些缓存数据大约需要 64x1024/100/60=11 分钟。同时要考虑其他迁移计划或业务对带宽的占用,以此来合理估算所需时间。

D

提前估算业务和服务的停机时间

如果迁移机器较多,建议使用批量导入主机来创建计划,并可自行配置迁移时是否执行源主机关机和断网操作,以及在迁移完成后是否卸载迁移工具等个性化设置。

E

提前估算业务和服务的停机时间

迁移所需时间受数据量和网络带宽的影响,请参考下图了解它们之间的关系。


第三步
实施

迁移模拟演练

迁移模拟演练通过模拟一个批次业务迁移场景,对业务迁移的有效性进行全面的检查和验证。这可以验证业务迁移组织协调能力、人员的协同操作能力、业务迁移工作手册的实际执行能力以及迁移流程的有效性。通过演练过程中发现的问题,提出改进措施和建议,并改进迁移过程中的流程和工作手册,以适应项目的实际需要。

系统测试

在模拟迁移完成后,对迁移过来的业务进行系统测试,以确定业务在平台上能够满足业务需求。这可以包括对案例、性能、压力、功能等方面的测试,以确保迁移后的系统正常运行。

  • 测试案例分析:

根据迁移后系统的业务流程设计,生成足够数量的自动化测试案例。确保测试案例能够覆盖系统的各个功能,并能有效验证功能的正确性。

  • 性能测试

针对迁移后的系统进行应用性能测试、网络性能测试和软件版本性能测试。通过性能测试,评估系统在正常负载下的运行效果,确保系统能够快速、稳定地响应需求。

  • 压力测试

对迁移后的系统进行版本验证测试和必要的压力测试。模拟系统面临的高负载情况,检查系统在压力下的表现,以确保关键性能指标达到设计目标。

  • 业务功能

针对迁移后的系统与老系统进行连接测试,在数据完成同步后,执行批处理测试与高风险业务功能的测试。

  • 系统连接性测试

对迁移后的系统与外部系统进行全面的连接测试和与网络的连接测试,发现问题并提出整改目标,确保系统的稳定性和可靠性。

源端业务系统数据备份

在正式迁移前,备份源端业务系统和数据是非常重要的步骤,主要是为了确保业务数据的完整性,并能降低迁移风险。同时,备份也为回滚机制提供了必要条件,需要将源端业务系统及数据进行备份,以防迁移出现问题需要恢复到原始状态。

常见备份方式有:备份软件备份、Ghost 备份、移动存储设备备份、原设备冷备备份,建议采用多种备份方式、多份备份数据的方式,以增加备份的可靠性和安全性。同时,定期检查和验证备份数据的完整性和可恢复性也是非常重要的。这样,即使在迁移中遇到问题,可以使用备份数据进行恢复,最大程度地降低迁移风险。

业务系统正式迁移

正式迁移流程包含:确定迁移对象、确定可迁移时间段,准备迁移工具、安装迁移工具、安装迁移客户端、登陆迁移工具并启动迁移,等待数据同步结束,对新增数据进行实施复制、启动切换、迁移完成、迁移测试。

以上是一般业务系统正式迁移的流程。具体的迁移过程会根据实际情况和迁移方案进行调整和执行,使之满足实际应用场景对业务系统的需求。

第四步
迁移验收

整体迁移完成后,进行业务测试和验收是确保迁移成功的关键步骤,对于确保迁移的顺利完成和系统的正常运行非常重要。通过充分的测试和验收,可以提升迁移的成功率和业务系统的可靠性。以下是迁移验收的一般内容:

单项验收

进行系统各个模块和功能的单项测试验收,确保服务器、云平台正常运行。

网络联机验收
将迁移后的所有系统连接到网络上,模拟实际用户使用场景,并进行联机测试验收,确保系统在联网运行时能够正常工作。
系统运行验收
确保迁移后的系统能够正常运行,达到预期的业务需求和性能指标。

在国产化的浪潮下,青云云易捷简单便捷的迁移工具和专业贴心的服务,能够帮助客户快速推进 VMware 国产替代进程,构建更高效、更灵活、更低成本的现代数据中心。


- FIN -

更多推荐



   
点击“阅读原文”咨询更多

文章转载自青云QingCloud,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论