暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
基于机器学习的智能运维
1488
6页
37次
2019-08-28
免费下载
专栏
第 13 卷  12 期 2017 年 12 
68
基于机器学习的智能运维
关键词 机器学习 智能运维
裴 丹
1
 张
2
 裴昶
3
1
华大学
2
大学
3
阿里巴
当代社会生产生活的许多方面都依赖于大型复
杂的软硬件系统, 包括互联网、高性能计算、电信、
融、电网络、联网、 疗网和设备、航空
航天、军用设备及网络等。这些系统的用户都期待
有好的体验。 因而,这些复杂系统的部署、运行和
维护都需要专业的运维人员,以应对各种突发事件,
确保系统安全、可靠地运行。由于各类突发事件会
产生海量数据,因此,智能运维从本质上可以认为
是一个大数据分析的具体场景。
1 示了智能运维涉及的范围。它是人工智
能、行业领域知识、运维场景领域知识三者相结合
的交叉领域,离不开三者的紧密合作。
智能运维的历史
手工运维
早期的运维工作大部分是由运维人
员手工完成的,那时,运维人员又被称为系统管理
员或网管。他们负责的工作包括监控产品运行状
性能标、产上线、更服等。因此,单个
运维人员的工作量员的数量都是随着
个数或者产品的用户规模呈线性
运维工作消耗大量大部分运维工作都
低效的重复。这种手工的方式必然无法满
产品日新月异的需求和进的规模
自动化运维
现,
部分自动化脚本用以监控分布式系统,产生
大量的日 另外一部分被用于在人工的监督下
行自动化处理。这些脚本能够被重复调用和自动
发,并在一定程度上防止人工的误操作,从而极大
地减少人力成本,提高运维的效率。这就诞生了自
动化运维。自动化运维可以认为是一种基于行业
域知识和运维场景领域知识的专家系统。
运维开发一体化
的运运维
员从产品开发人员中抽离出来,成立单独的运维
门。这种模式使得不同公司能够分享自动化运维
工具和想法,互相借鉴,从而极大地推动了运维的
发展。然而,这种人为分割的最大问题是产生了两
个对立的团队——产品开发人员和运维人员。他们
1 智能运维涉及的范
行业领域知识
运维场景
领域知识
机器学习
互联网、电信、金融、
电力网络⋯⋯
智能运维
聚类、决策树、
卷积、神经网络
⋯⋯
瓶颈分析、
异常检测、
故障预测⋯⋯
第 13 卷  12 期 2017 年 12 
69
的使命从一开始就截然不 产品开发人员的目
是尽快地实现系统的新功能并进行部署,从而让
使能。
障。
现,大部分的异常或故障都是由于配置变更或软
升级导致的。因此,运维人员本能地排斥产品开发
人员部署配置变更或软件升级。他们之间的目标
突降低了系统整体的效率。此外,由于运维人员不
了解产品的实现细节,因此他们在发现问题后不
因。盾,
DevOps
1
应运而生。DevOps 最核心的概念是开发运
维一体化,即不再硬性地区分开发人员和运维人员。
开发人员自己在代码中设置监控点,产生监控数据。
系统部署和运行过的异人员
定位析。 能够
据,便 时,
运维发人员,后能
找出根因。谷歌的站点可靠性工程 (Site Reliability
Engineering, SRE) 就是 DevOps 的一种特例。
智能运维 (Artificial Intelligence for IT Opera-
tions, AIOps) :
化运维在手动运维基础
高了运维的效率,DevOps 有效地提升了研发和运维
配合效率。但是,随着整个联网系统数据规模
急剧膨胀,以及服务类型的复杂多样“基于人为指
规则”的专家系统得力不从心。因为自动
维的瓶颈在于人脑 必须由一个长期在
运维的专家手动地出现的、有迹可循的现
总结出来,形成规则才能完成自动化运维。然而
来越多的场景表明,简人为制定规则
并不能够解决大规模运题。
与自同,
维强习算量运据(
括事及运人工)中
习,则。说,
运维运维增加于机
习的脑,监测决策
据,
做出析、
策,标( 2
Gartner Report 预测 AIOps 的全球部署率将从 2017
年的 10% 增加到 2020 年的 50%
智能运维现状
关键场景与技术
3
涉及大型分布式系统监控、分析、决策等。
在针对历史事件的智能运维技术中,
瓶颈分析
颈。
热点分析
指的是找到对于某项指标(如处理服务
1
DevOps英文 Development Operations 、方的统促进用程 /
质量 (QA) 沟通整合
2 智能运维与自动化运维的最大区别是有一个基
于机器学习的大脑
运维
目标
测量
分析决策
控制 海量日志自动化脚本
基于机器学习的智能运维大脑
3 智能运维的关键场景和技术
针对历史事件
针对当前事件
针对未来事件
瓶颈分析
热点分析 KPI聚类
KPI关联
关系挖掘
异常事件关
联关系挖掘
全链路模块
调用链分析
故障传播
关系图构建
异常检测 异常定位 异常报警聚合 快速止损 故障根因分析
故障预测 容量预测 趋势预测 热点分析
of 6
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜