该商业银行为了确保业务系统安全连续运行,针对各类设备、业务系统构建了各种不同的监控软件,而数据库作为银行核心系统的基础软件,承载着金融核心资产的客户数据和账户数据。如何构建一个数据库自动化监控运维平台,让运维人员及时掌控数据库的整体运行情况从而高效、快速、精准的进行故障定位诊断处理,是商业银行保证业务系统安全稳定运行的关键。
需求背景
该商业银行在国内城商行资产排名位列中上游,目前数据库既包含了传统商业数据库(Oracle),又有开源数据库(MySQL),且数量众多(生产库、测试库加起来近300套)。面对外部的监管要求和内部发展需要,内外双重压力催生了数据库自动化运维监控平台建设需求:
监管需求:为满足《商业银行数据中心监管指引》等监管相关规定和要求,应使用有效的监控管理工具,实时监控运行情况,快速定位故障、诊断、事后审计。
缺乏SQL审核工具:数据库性能问题多由不合理、不规范的SQL语句导致。需引入SQL审核工具,规范和优化SQL编写,将运维风险前置,提高生产环境SQL代码质量,预防数据库性能风险。
监控的深度和广度不够:当前使用的ZABBIX监控工具的功能仅限于数据库进程、空间等基础监控,缺失数据库历史性能指标展示工具。需引入更加全面和精细的数据库监控和性能展示工具,用于防范数据库风险。
数据库自动化运维程度低:当前该商业银行日常运维工作内容过于繁杂,需增加数据库自动安装、部署、自动化切换等功能,降低误操作风险,提升数据库自动化运维水平。

综合上述需求,该商业银行决定与具备丰富数据库运维平台建设经验的云和恩墨合作,共同搭建数据库自动化运维监控平台,及时、准确的发现数据库故障和性能瓶颈,提升数据库自动化运维水平。
客户应用
云和恩墨根据客户当前架构现状,帮助客户构建以zCloud为核心的数据库自动化运维监控平台。通过zCloud平台的自动部署、智能诊断、数据库监控巡检管理、性能容量管理等核心功能,实现标准化、自动化、智能化的数据库运维,增强数据库运行的稳定性,节省企业IT平台的资源和成本。
zCloud平台所具备的主要功能模块与客户需求相契合:
SQL审核模块:平台支持离线、在线、历史SQL语句的审核,提示风险并提供优化建议;
数据库监控:支持数据库运行指标、状态、日志等的监控和告警;
数据库性能展示:支持数据库实时、历史性能指标和运行SQL展示和分析;
数据库自动化运维:支持自动化安装、部署、切换等数据库自动化运维功能。
客户价值
目前,zCloud平台已在客户现场上线并稳定运行数月,极大满⾜了该银行在数据库监控方面的要求,提供了⾼可靠、⾼性能、高可用的数据库运维管理服务。客户表示,zCloud平台自上线后整体使用流畅性非常好,通过接口形式与该商业银行当前平台进行对接,无缝集成,例如通过CMDB系统直接纳管目标数据库,集成Zabbix监控平台采集的主机监控数据等等,为平常的运维工作提效不少。
01、全面监控
平台基于IT架构全面采集,提供不同维度的数据库运行指标监控及变化趋势分析,运维人员日常只需要不定时关注监控大屏,即可直观了解数据库整体运行和资源利用情况。
02、前置管控预防
通过存储和管理数据库历史运行数据,构建基于时间线的性能变化趋势,帮助运维人员提前发现问题并进行必要的人工干预,减少数据库性能风险。
03、故障精准定位
平台提供的全面的SQL性能下钻分析能力,帮助运维人员快速定位数据库问题,利用历史执行计划分析问题SQL,利用SQL事件告警记录快速处理SQL会话阻塞等。
04、SQL审核
平台的SQL审核模块提供标准的工单流程,对用户发起的SQL变更进行合规性审核,从而杜绝危险变更影响到数据库运行的安全性和稳定性。
面向未来,智能运维将成为银行精细化管理的必然要求。该商业银行将持续关注和投入智能运维领域,以监控标准化作为基准,进一步优化自服务自助式的运维监控模式,提升监控服务的覆盖度。




