暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

性能优化中心是个什么鬼

白鳝的洞穴 2022-06-15
1058
D-SMART V2.1.6版本马上要发布了,虽然和前阵子发布的V2.1版本相比,在版本号上变化不大,菜单和界面也没太大的变化,不过实质上还是有很大的区别的。其中最大的区别就是性能优化中心。
以前很多用户在使用D-SMART的时候,总是问我们的工程师某某功能有没有虽然我们总能帮他们找到所需的功能,不过确实让用户用起来很不爽。知识自动化系统和普通的运维管理系统确实不同,其主要能力来自于知识变成的工具,知识是不断迭代的,而且并不是按照规划一点点迭代的,而是从用户生产环境的需求中不断产生知识。因此知识的组织有些杂乱,并不能像普通的运维管理系统一样组织成十分清晰的菜单呈现给大家。在大多数情况下,用户也不需要直接去使用这些工具,它们都隐藏在一些自动化诊断过程中了。不过有些时候客户还是需要主动的去找一些工具来分析一些问题。
性能优化中心就是针对用户的优化分析需求而组织的一个工具中心,除了自动化生成的一些告警、报告之外,还提供了一个优化工具中心。实际上优化工具中心是一个十分典型的专家系统,由我们的专家把每种运维对象可用于优化分析和诊断的工具挑出来,再分类展示给大家。运维人员选择了一个运维对象的时候可以看到这个对象的一些关键指标,运维经验告警,日志告警等基本信息。根据这些也可以初步判断系统可能存在的性能问题在哪里。
昨天我写的一篇关于专家系统和智能系统的区别的时候也讲到了这个案例。实际上优化工具中心并不是一个纯粹的专家系统,罗列了专家推荐的工具。利用智能化异常检测,以及D-SMART内置的知识图谱,系统给运维人员提供了一个小惊喜。
当我们点击到某个运维对象的时候,后台经过自动计算,快速的定位分析时段内D-SMART采集的数据,并将存在问题的地方计算出来,利用关联算法找出分析这些问题的工具,再和专家推荐的工具集进行比对,找出“专家推荐”的工具来,特殊标注。这样就可以提醒我们的运维人员,在这个分析时间段里,系统哪些地方存在问题,哪些工具可以用来进行分析。
比如系统提示共享池存在问题,点击泛路由智能分析工具,可以发现共享池相关的指标确实存在大量的异常,系统也初步定位了共享池问题的根因,是因为SQL并发过高引起的。
一个运维自动化系统,如果做成一个工程,一个项目是比较容易的,因为我们面对的是比较确定的用户需求。而作为一个产品,就不那么容易了,因为你面对的将是不同需求,不同技术水平,不同运维习惯,甚至对运维的理解都差异甚大的客户。我们最初设计的懒人运维模式并不一定能让所有的客户接受。在一些大企业里,我们安排驻场运维的企业都对产品比较满意,而自己使用的企业对这个系统褒贬不一。有很多客户很满意,觉得很有用,有些客户觉得太复杂了,用起来不如一些传统工具那么顺手。
做运维自动化系统的朋友都会有这样的感受,那就是通用性的系统缺乏深度,分析复杂问题的能力不足,专业化的系统又过于繁琐,在日常的一些场景中那些“屠龙刀”也找不到龙来屠。如何满足不同客户的不同诉求一直是我们这些年在探索的。因此我们也在学习传统的运维监控软件,尝试把深度分析能力隐藏在传统运维的界面后面。运维工具中心就是我们的一个小尝试。
文章转载自白鳝的洞穴,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论