
摘要
中大型银行的投产发布管理是个非常重要的场景,往往需要多团队参与,整个过程长链条,同时应用发布的频率越来越频繁并且数量众多。
在自动化运维的大趋势下,如何实现投产发布运维场景的端到端的自动化协作与管理?本文将针对这个主题进行相关的探讨与说明。
1
传统的投产发布场景管理跟不上时代要求

▲ 中大型银行单应用系统投产发布过程示意图
由于应用系统复杂性、与其他系统紧密关联、业务用户量大等原因,中大型银行的投产发布管理,是个较为复杂的过程。从以上示意图,我们能够看出,针对单个应用系统的整个发布过程分为四个环节:
部署方案制定
部署资源准备
应用部署上线
业务切换验证
每个环节涉及不同的子任务,例如部署方案制定阶段包括:在线编制结构化部署方案、部署方案修订、部署方案评审、部署方案终稿等过程;而资源准备过程又包括从产品版本信息到调度作业配置的完整过程。各个阶段之间,不仅有操作执行的先后顺序,同时还有过程数据的交互,以及人之间的协作等。
在业务稳定,发布不频繁的情况下,这种投产发布模式是能够适应的。但是在分布式应用架构、云基础资源的模式下,越来越难以适应,主要体现在以下五个方面。
1.孤岛的团队工具
整个投产发布的过程中,每个职能团队使用自身的工具解决职能范围内的操作执行的问题,团队间的操作执行的联动往往大量依赖线下的人员沟通和邮件传递等非结构化、非自动化的方式。
自动化局限在一个又一个的团队孤岛内部连不起来,在每个团队看来,似乎都实现了自身工作的自动化;从投产发布管理的全局来看,依然是一个人工沟通为主、手动传递为主的半自动化过程。无论在运维质量、效率和安全等维度,都难以匹配分布式+云模式下的发布管理。
2.散落的过程数据
如上所述,投产过程中,各个团队之间、各个步骤之间往往需要频繁的数据交互;例如网络团队配置网络策略,需要系统团队给出具体的主机资源的IP地址列表。
投产过程中的各种数据往来,例如所需资源数据、主机IP地址列表数据等,也是靠人员线下传递等,效能较低,容易出错。整个过程中,团队间的沟通与协作成本是比较高的。
3.复杂的人员协作
基本上,在这种投产发布模式下,基于人的线下的、口头的沟通协作方式是贯穿始终的。之所以我们需要构建运维管理的数字化、自动化,根本原因在于口头沟通的效率、可靠性较低,成本高;我们需要使用线上化的、工具化的、结构化的信息与数据传递来替代线下的、基于人的、口头的沟通。
4.断点的投产过程
最为重要的是,投产发布管理是个重要场景,不过由于工具的孤岛、大量的线下协作、散落的过程数据,整个投产过程是断点式存在的,难以形成完整的自动化链条,执行效能和管理效能都比较低。
5.低矮的效能可见度
由于无法完整度量整个过程,不具备全局的运维数字化可见度,因此也较难以实现管理效能的不断提升,依然是粗放式的运维模式。
面对传统模式下的种种问题,解决的方式是怎样的呢?我们用一句话概括解决的思路应该是:基于统一平台构建的,结构化协作的、自动化执行的、可视化度量的,端到端的投产发布管理体系。
2
构建端到端自动化投产发布管理
指导思想
基于统一平台的端到端的管理:
基于统一的运维管理平台,构建银行一体化的投产发布指挥调度中心,实现投产发布的计划、任务、数据、执行、协作的统一管理。
基于结构化数据的自动化协作:
投产发布的过程中的各类数据,经过必要的梳理、分析,固化到对应的工具系统中;通过合理的软件设计,使得各种输入和输出的数据能够准确地、自动地、结构化地在各个必要团队之间流转。
自动化驱动:
通过指挥调度中心,按照投产发布的各个环节,合理衔接各个团队的已有自动化工具及新建自动化工具,实现投产发布过程的端到端的自动化执行。
可视化呈现:
基于统一的指挥调度平台,能够将整体计划、单体任务以及各个步骤环节等的过程和结果可视化、数字化;使得运维管理层和团队执行层均能够清晰了解整体的工作进度、质量、问题等信息,并进行必要的处置。
数字化度量:
运维管理的主要目的是度量和改进:投产发布的质量、效率如何,存在的问题以及未来如何改进。在统一可视化呈现的基础上,通过合理的指标设计,就能够对整个投产管理的过程进行数字化的度量和分析,检视存在的问题,并进一步优化与改进。
建设方式

▲ 投产发布指挥调度系统
如上图所示,在传统的中大型银行内,考虑到银行的运维现状和工具现状,可以考虑通过三层构建的架构模式实现统一的投产发布指挥调度管理。
一体化运维管理平台层
一体化运维平台是系统集成、数据交互和操作执行的中枢,主要通过API网关实现前述功能。除此外,平台需要提供资源统一接入的管控平台,提供具备基础自动化运维能力的作业编排平台,还需要提供实现所有运维对象实例信息存储的CMDB模块。
各团队运维工具
这是各个职能团队已经建设或者准备建设的团队级运维工具,主要解决本团队内部的自动化运维监控场景。在端到端的投产发布管理体系内,各个团队的工具需要通过注册API到平台的方式,实现对外服务能力的提供,并通过投产发布指挥调度系统实现所有团队工具能力的串联和端到端的自动化。
投产发布指挥调度系统
投产发布指挥调度系统是整体体系的核心,并建议基于运维平台使用低代码方式进行构建。这样的好处是,通过平台提供的能力以及和团队级工具的联动,能够非常低成本地实现整个投产过程的运维数据的流转和运维执行的自动化联动,并且大大降低人工的参与,降低协作的复杂程度。
3
总结
银行的运维管理场景是个持续建设的过程,投产发布管理的未来应该是智能化投产管理。但在此之前,需要考虑现状,合理整合存量。逐步从点的自动化进化到端到端的自动化,从工具执行的自动化进化到投产管理的自动化,之后才是进一步的智能化。
感谢您的阅读
如果您的企业有相关研运需求
请点击阅读原文或长按二维码,留下您的需求
我们将安排对应区域的同事与您详细介绍
↓ 扫码申请试用 ↓


Reading


在看一下,让更多人同享好文哟!







