
随着中国光大银行云平台的不断发展,在云端部署的业务应用已占全行业务应用近90%,用云迈入深水区,原本天然具备降本增效特点的云原生架构在资源配置不当时,也会引起大量云上资源闲置、云支出浪费,所以合理的资源成本管理势在必行。
2022年5月19日,由中国信息通信研究院、中国通信标准化协会主办的“第四届云管和云网大会”在线上召开。大会以“新云管 新云网”为主题,正式发布了《云优化治理实践指南》等重磅研究成果,并启动“云优化能力提升计划”,正式公布提升计划首批成员单位名单,中国光大银行成功入选。

“十四五”规划和2035年远景目标纲要中提出“加快数字化发展,建设数字中国”,云计算作为企业数字化转型的底座,成为数字经济发展的核心引擎。在数字化转型潮流之中,企业着手关键业务系统上云。随之而来的上云方案如何合理规划、用云资源如何有效管理、云成本支出如何进行优化等问题成为企业广泛关注的焦点。在此背景下,信通院发起成立“云优化能力提升计划”,旨在结合产、学、研各方力量,建立云优化领域的共促共享团体。
目前中国光大银行基于完善的全栈云云原生监测工具建立的多维细粒度的资源利用率观测体系,对于所有上云的应用系统进行监测,发现以下需要整改的问题:
资源分配率过高,资源使用率却偏低;
资源分配一概而论,导致计算密集型和内存密集型的应用在不同程度上对于CPU和MEM的利用率低;
同一应用不同时段的波峰波谷差距巨大,导致资源利用率不高;
存在‘被遗忘’的闲置资源。
针对这些问题,首先需要针对复杂的云上资源建立统一的成本定量和定价标准,利用资源标签模型对资源进行标记和追踪。其次建立资源和成本的可视化模型,只有清楚了解资源的使用情况,才能不断优化和提升资源使用率,进而优化成本。

中国光大银行全栈云云优化模型
针对不同的环境不同应用,中国光大银行制定了不同的优化策略,持续地进行云资源的成本优化。优先解决开发测试环境资源使用率低的问题,短期内,释放‘闲置’资源,根据监控的数据优化资源分配,同时利用自动扩缩容来保证应用系统的稳定运行。长期的目标则是利用智能化的手段,通过对历史监控数据的分析和计算,智能地推荐资源配置额度,实时地预测资源的容量变化,及时调整运行数量和资源配置情况;对于存在波峰波谷、离线在线的业务,可以利用智能调度器对于不同优先级和资源画像的任务进行统一预测和调度,进而提升资源在空闲期的利用率。通过一次次的资源画像和优化迭代,最终达到云资源效能的最大化。
近日,由中国信息通信研究院和中国通信标准化协会联合主办的“2022首届云优化创新发展论坛”通过线上方式成功召开。本届论坛以“更经济·更高效·更深度”为主题,大会发布了《云资源效益度量模型》标准,中国光大银行作为云优化能力提升计划指导委员会顾问对大会发表寄语。后续中国光大银行将作为参编单位与中国信通院一起建立云平台管理能力标准体系,并持续推动云优化体系在中国光大银行落地,通过合理的资源优化治理,提升业务整体云资源效益、降本增效。

作者 | 冯 帆
视觉 | 王朋玉
统筹 | 郑 洁







