暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

案例解读 | 深度赋能某保险公司IT运维平台,推动智能升级(功能篇)

乐维社区 2022-03-04
1117
点击蓝字 关注我们

       上期我们已经讲过该项目的架构篇,乐维通过搭建一个支持多功能插入、可横向扩展的完整架构,实现纵向对系统管理员、部门领导、企业领导等决策层的多层次监控展现。保障目前各功能模块有效整合,同时为未来其他功能模块即插即用,为后续智能化打下基础。本期我们继续聊一聊乐维在功能上做了哪些升级。

NO.1

项目背景

运维工作缺乏规范化、标准化、流程化      

    作为一线金融数据中心,该公司信息化建设从基础设施、人才储备、风险管控、创新投入都属于国内先进水平,基于数据中心IT基础设施日益扩大,运维团队规模不断壮硕,亟待将日常运维工作逐步规范化、标准化、流程化。以监控平台一期建设为基础,有效的将监控和告警与CMDB、机构组织、流程作业、自动化运维有效关联起来,完善日趋扩大的IT设施维护及人员管理,让整个运维实现井然有序,保障数据中心安全、稳定运行,为公司业务人员提供坚实的后勤保障。



NO.2

项目目标
以监控为基础、CMDB为核心,流程作业为载体,自动化为辅助,相互联动

以一期监控为基础,在功能上丰富完善。新增CMDB、数据仓库、自动化运维、流程作业、告警中心,并将各功能模块融合起来,做到以CMDB为核心结合机构组织为全局功能、资产权限管理。以监控为基础、以告警为事件推动,有效的将告警、自动化运维、CMDB、流程结合,做到事件由发起到关闭整个闭环流程将流程与CMDB、自动化运维结合实现物理巡检、逻辑巡检等日常作业由发起到结束或转故障作业等切合实际流程的作业串联,达到规范化。最终实现事事有工单、事事有回顾、事事有依据。

 将数据和功能实现有效整合,进行集中可视化展示,从基础运维、业务视角等方面,直观呈现当前信息中心即时状态及健康情况。

NO.3

乐维解决方案
功能解决方案  

以监控为基础,新增资产、自动化、流程等其他功能,实现有效窜连。

监控为基础,多个server 将采集数据推送上层集中处理,获取最基础数据

CMDB为核心,CMDB与监控实现对接,有效将监控信息与CMDB字段实现同步,人员角色权限统一由CMDB对象分配。

流程作业为载体,与监控告警、CMDB、自动化结合,做到事件完整闭环。

自动化为辅助,与CMDB、流程、告警结合,实现快速作业。

NO.4

功能模块

主要功能模块分布

1

夯实的基础—监控中心    

覆盖率98%以上的基础监控,是一切功能的基础,由下层分布的server汇总至告警中心,通过权限配置,不同人员查看各自关注对象,并与告警形成实际关联。

2

功能的核心CMDB

保障基础资产数据准确、权责分明,为其他功能提供场景消费。关联用户,决定权限;关联监控,动态更新;关联告警

CMDB实例拓扑,可视化展示实例间关系,从不同视角将不同类型资产结合实际网络链接、逻辑关系链接、业务关系连接分类展示。

3

通知的媒介—告警中心

告警由监控产生,监控关联了资产基础属性,人员属性,结合告警中心分配功能、通知配置功能,对所有告警实现“归属制”分配,用户接收或是认领告警后,结合告警抑制、告警收敛,最终查看到自己关心的告警,并通过自己设定的媒介接收

4

事件的载体—流程作业

运维工作日趋规范化、标准化、流程化,流程作业功能则应运而出,结合了告警中心、CMDB、自动化等功能,可做到手动发起或是告警推送,结合该保险公司信息中心实际人员组织结构、运维流程,配置了丰富的流程作业样例,并可支持后台灵活处理流程节点、表单样式。

5

辅助功能(一)—自动化运维

通过同步CMDB资产实例,保障了作业对象符合权限管控,同时严格管控脚本的创建与授权,结合该保险公司信息中心实际运维的责任对象,如网络组、系统组、存储组等,进行了分级授权,将脚本分为了个人(有权限创建情况下)、运维小组、公共组,实际作业包含了我的作业和公共作业。保障基础功能有效可用下,严格进行了权限管控,从设计上保障了自动化作业安全。

6

辅助功能(二)—报表中心

依据数据仓库为数据源的报表,兼容了一期报表功能,同时提供了自定义报表功能,利用PGSql支持json功能,将凌乱的原始监控数据,按时间节点有序整合起来,符合监控的数据特性,提供报表查询时,可将时间节点上多项监控指标集中展示,为运维人员性能分析、故障判断等呈现了直观的数据整合视图。

7

个性化展示—大屏中心

集中入口,分别展示全国MV网络大屏、SAN网络大屏、业务视图大屏

全国MV轮播各省份公司及下属机构,左边展示框列出全国链路健康情况top排序,右边展示框同步省分地图列出省份机构健康top排序,鼠标移动可弹框展示具体机构详细情况及趋势展示,直观汇总了MV链路整体健康状况及指标数据。

SAN网络分三层展示SAN网络架构从物理服务器——SAN 交换机——存储设备整体链路情况,同时通过绑定关联存储设备与服务器映射关联,直观查看存储设备提供给哪些物理服务器使用,物理服务器使用了那些存储设备,并支持虚拟化虚拟机动态获取层级关系及各虚拟机的实际IO指标。

NO.5

自动化场景功能串联

1

CMDB与监控关联

CMDB与监控完成映射,CMDB管控用户资产权限,也同时管控了监控对象;同时CMDB字段与监控模型监控项实现关联,保障CMDB实例属性字段动态更新,减少人工维护。

2

告警中心与CMDB关联

告警中心告警详情支持关联CMDB资产,可通过告警查看实际影响的CMDB实例详情,直观获取该告警影响的资产及资产负责人。

3

告警中心与自动化关联

告警中心告警详情支持快速链接自动化运维,通过该条告警描述,调用自动化脚本进行简单、快速判断,由值班人员即可完成快速告警判断及定位,为运维人员提供了告警的筛选及初步数据依据。

4

告警中心与流程作业关联

告警中心可自定义设置推送告警到流程作业并生成工单,自动发起事件,进行事件流转。

5

流程作业与CMDB关联

流程作业关联CMDB,尤其是涉及到设备上下架及变更时,可由工单流转进行调用CMDB,流程结束后相关资产信息中同步到CMDB进行新增、删除或变更。

6

流程作业与自动化运维关联

流程作业关联自动化运维,主要对于故障处理及相关资源变更时,可调用自动化运维作业进行执行结果返回 进行故障或事件等级判定,为流程流转节省不必要环节,有效提高事件完成效率。

7

CMDB与自动化运维关联

自动化运维执行对象由CMDB根据实际设定,通过分组或是其他标签属性同步到自动化主机管理,在主机对象归属上实现权限管理,过滤后的主机再根据自动化功能权限设定执行自动化作业操作。

NO.6

客户收益
功能互通,有效串联,多功能联合调用,运维工作体验升级
1

中枢流转效益

统一监控平台通过每次异常的处理积累,以业务系统为单位,将各自维护的信息汇总、集中展示,大大减缓了故障处理前期沟通协调的时间,快速有效的为各部门提供相关数据参考,便于快速定位分析,定位故障,处理故障,以及优化整合处理。部门之间形成有效的协同流转。

2

提高工作效率,提升人员能力

提供实时监控,快速准确定位异常,及时告警信息,快速有效的推送给维护人员,缩短故障处理时间。

实现自动化、半自动化(人工确认可行性)运维工作,自动化运维场景的流转,大大缩短了运维流程时间,将重复、繁琐的日常工作通过自动化解决,大大释放运维人员时间、精力。

3

智能化、大数据支持效益

随着大数据技术的不断成熟,监控平台通过数据仓库保留了IT资源运行中实际原始数据,为后续大数据建设打好了良好的基础,为大数据分析、后续智能化建设提供了真实、可靠的数据保障。 

扫码关注我们
全球开源运维服务方案和服务专家
DEMO体验
公众号
NO.1
往期推荐
Historical articles

案例解读 | 深度赋能某保险公司IT运维平台,推智能升级(架构篇)



喜讯 | 乐维入选广州工信局信创产品资源池第二批名单



案例解读丨深圳某证券公司基础监控实践



乐维智能监控为何能替代Tivoli?


文章转载自乐维社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论