暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

你与高级运维工程师之间,仅仅差一个 AI 搜索的距离

Zabbix开源社区 2024-06-27
187

作为运维工程师,你是否曾在检索运维知识中遇到过以下难题:

“知道是个什么问题,但是不知道这个问题叫什么?” ——关键词遗忘

“这个问题好像是这么形容的,但总觉得还是没说到点上。” —— 检索语义模糊

“要找产生这个问题的原因,但搜出来的全是这个问题的影响。” —— 检索逻辑混乱

同时,由于新的知识的不断出现,又会产生:

“这个新问题好像跟之前的有点像,但好像又不一样。” —— 内容相似导致混淆

“这个问题我上周遇到过,但是这几天的问题太多了,早忘了。” —— 知识太多产生记忆负担


面对这些问题,经验尚浅的运维工程师如何才能轻松化解?他们与资深的运维工程师有哪些差距?

来看看“菜鸟”小李与“资深”老王在相同的运维工作中,各自会有怎样的表现。

小李

初级运维工程师,入行一年,虽已能独立解决问题,但缺乏经验积累,工作中仍面临诸多挑战。

VS

老王

高级运维工程师,入行十年有余,经验的加持与技术的磨练使他在任何运维场合都能游刃有余的解决问题。

大家在看的过程中,也可同步思考,如果是你会怎么做呢?


Round One

运维的反馈迭代检索

即在运维问题的初始搜索得到结果后,如何通过基于阅读和分析进行关键词调整和搜索迭代。



小李的做法


在遇到服务器响应变慢的这一常见的运维问题时,小李一般会从以上这几个方面进行检索。

可以看出,虽然小李得到了一大堆从硬件问题到网络配置的解决方案和各种可能原因,但他并不能快速判断哪些信息有用,只能不断在页面之间跳转,但每次结果都没有直击核心问题,几个小时过去了,他依然止步不前。

老王的做法

经验丰富的老王来说,他在初次搜索了:

之后会根据运维文章敏锐地调整搜索词

他快速筛选出其中一篇可信度高的技术博客,并获取到具体解决方案,定位到最近应用更新导致的资源瓶颈:

不到半小时,老王就解决了对于小李需要花费一天时间去解决的问题,为下次类似问题提供了宝贵经验。

向左滑动查看老王高阶做法



Round Two

运维代码检索

即如何实现并调用即时的代码化查询需求。

运维场景的监控需求无处不在,有时公司会需要实时检测特定应用服务的延迟和错误率。然而当现有的监控模板并未覆盖到这个需求时,则需要即时手写复杂的PromQL查询对白名单应用进行监控。



小李的做法


对于经验不足的小李而言,他会尝试用搜索引擎找到相关查询模板,例如:

然而得到的结果大多是基础教程

或不相关的例子:


虽然他能勉强阅读几个论坛帖子和博客,尝试组合各种查询语句,但由于经验不足,他花费了数小时仍未能编写出符合要求的查询语句,导致监控滞后。

老王的做法

对于经验丰富的老王来说,他会通过搜索:

从而自上而下回顾下PromQL的语言框架,并确定需要综合用到多种高级关键字

最后结合这些关键词搜到了对应的官方文档与一些使用示例,综合这些资料,老王成功写出了符合要求的PromQL查询语句,完成实时监控需求。

向左滑动查看老王高阶做法



Round Three

信息过滤比对

即如何通过比对多种信息来源,筛选出可信度高的解决方案

这一难点经常出现在运维安全漏洞的应急响应中,倘若信息源对比稍有不慎,就有极大可能引入新的风险。


小李的做法


对于安全意识不足的小李来说,虽然首先会参考国家漏洞数据库(NVD),但是他在了解基本信息后会直接在各种讨论帖中寻找更具体的解决方案(以CVE-2024-21683为例):



然而该论坛内容是否正确,下载链接是否安全,小李很少进查证,于是经常会产生解决措施并未能有效解决问题,反而可能引入了新的风险的问题。


老王的做法

经验老道的老王深知“一切以官方发布为准”的准则,在参考完NVD的官方公告后,会对比多个信源,包括安全研究机构的报告、安全厂商的解决方案、技术社区的讨论和行业标准。

(NVD报告)

(CVE报告)

(阿里云报告)

通过整合比对这些信息,老王制定了详细的应急响应计划,包括应用官方补丁、更新安全策略和进行安全审计,有效修复了漏洞并增强了系统安全性。

向左滑动查看老王高阶做法



Round Four

复杂检索拆解

即如何分解复杂任务,逐步解决每个关键问题,实现系统部署和优化以Nebula Graph的安装部署为例:


小李的做法


如果小李直接查询“Nebula Graph安装部署”,很有可能会遇到以下问题:

1、rpm安装完后,不支持自动注册成Linux服务;

2、Linux服务器部署时,用本地的Studio连接nebula的时候报错;

3、Nebula提供的nodejs的安装链接,不是nodejs的官网链接,不够通用。

这些都是小李在首次进行Nebula Graph安装部署中的常见问题。所以在搜索引擎中,想要通过一条查询获得全部信息是不现实的。

老王的做法

 对于老王而言,会通常对问题进行拆解,把“Nebula Graph安装部署”的问题分为以下几部分:

1、什么是“Nebula Graph最佳实践”和“图数据库部署策略”

2、软硬件配置需求

3、安装脚本

4、最佳集群配置实践

5、监控方案

最终,Nebula Graph部署成功:

老王通过实施了一套详细的部署计划,通过逐步解决每个关键问题,确保了Nebula Graph的成功部署和高效运行。

向左滑动查看老王高阶做法


那么,是否有一种工具,可以让小李不再受运维检索经验的桎梏,能在短时间内,也能像经验丰富的老王那样,解决各种运维问题呢?

向大家推荐一款帮助每个运维工程师都能快速成为高手的“AI搜索“神器——NextConsole

NextConsole个人版已上线

立即体验,开启智能运维新篇章

NextConsole企业版正在火热内测中,敬请期待




NextConsole



NextConsole,基于RAG(Retrieval-Augmented Generation)技术的运维AI搜索引擎,旨在帮助每一个运维工程师都能够像资深运维专家一样迅速找到有效的解决方案,解决运维搜索难题的强大利器。


什么是RAG?

RAG(Retrieval-Augmented Generation)又称检索增强生成, 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。它将检索模型(设计用于搜索大型数据集或知识库)和生成模型(例如大型语言模型 (LLM),此类模型会使用检索到的信息生成可供阅读的文本回复)结合在一起,允许模型在生成文本时,从外部知识库中检索相关信息,从而提高生成内容的准确性、相关性和时效性。



RAG的工作流程


1、找信息:当你问一个问题时,RAG模型首先会在知识库中搜索与问题相关的内容。比如,你问“帮我介绍Oracle数据库的架构”模型会在Oracle网站中找到关于Oracle数据架构相关的资料。

2、生成答案:找到相关资料后,RAG模型会利用这些信息生成一个完整、详细的答案。这不仅是简单的复制粘贴,而是把信息重新组织,形成更自然、更符合你提问的回答。


NextConsole的企业级RAG架构

相比一般RAG系统,NextConsole的企业版RAG架构在文档处理、Query理解和工程实现等方面都投入了巨大研发成本。

文档处理上:NextConsole的目标是让机器学会阅读理解文档。我们综合使用了版面分割、版面分析以及语义理解技术,可以高效分析和处理各类非结构化文档数据,包含文档中的图片、表格、代码等信息,细节方面具有很大优势。

Query理解上:NextConsole的目标是让机器真正理解用户意图。虽然常言道:学会提问是一门学问,我们综合运用各类意图理解、会话系统、检索系统技术,使得NextConsole能够自动准确捕捉用户意图,优化查询路径,显著提高查询的准确性,用户无任何使用成本。

工程实现上:NextConsole创造性地设计了一套分级检索算法,可以在保持效果的基础上,以极低的成本将系统在超大规模文档上的检索结果保持在亚秒级返回。另外我们在拓展系统架构,实现低延迟和高并发也做了相当大的工作。

相信这些技术的投入,能最终反映在用户的每一次检索体验中,如果你对我们的技术感兴趣,欢迎扫码体验,加入社区进行交流。


NextConsole未来两个月内将开放更多功能:

后续还有端对端排障辅助、运维报告生成、自动化脚本...更多功能即将开放。




NextConsole FAQ

一、什么是AI 搜索引擎?与传统的搜索引擎以及类似于chatgpt的会话助手有什么区别?

AI 搜索引擎是一种基于人工智能技术的高级搜索系统。它不仅能够通过关键字检索信息,还可以理解用户的意图,并提供更精准、更相关的结果。与传统的搜索引擎相比,AI 搜索引擎在以下几个方面具有显著优势:

1、无需记忆关键词:AI 搜索引擎可以理解用户语言背后的需求和意图,无需记忆关键字进行匹配。

2、自动筛选参考资料:当前的AI 搜索技术背后有很长的流水线技术来仔细筛选参考资料,免去用户一一比对信源的时间。

3、整合答案生成:能够从不同来源获取信息,整合为一个综合性且高质量的答案。


相比于类似ChatGPT的会话助手,AI 搜索引擎在以下方面有所不同:

*精准搜索:专注于提供精准、可靠的信息,而非泛泛的聊天和生成内容。

*专注领域针对特定领域(如运维)优化搜索结果,提供高度相关的专业方案。


二、NextConsole 运维AI 搜索与市面上其他AI 搜索相比有什么优势?

NextConsole作为面向运维领域的专业AI搜索引擎,在以下几个方面具有突出的优势:

1、大规模运维知识库:建立了全球最大、质量最高的互联网运维知识库,包含上百万条运维相关文档,极大提升了检索的广度和深度。

2、运维多模态内容支持:除了支持文本、表格、图像等内容的精准检索,同时支持运维独有的日志、配置、代码指令等数据的深度解析与检索,提供更全面的解决方案。

3、场景化提示与工作流:基于丰富的运维场景和工作流,智能识别用户意图,提供快速且精准的解决方案。


三、NextConsole与GitHub上流行的各类开源RAG框架相比有什么优势?

NextConsole与GitHub上流行的开源RAG 框架相比,具备以下优势:

1、深度自研开发:开源的RAG框架上手容易却难落地,回避了非常多落地细节问题,我们深度自研开发的系统无论在效果还是性能还是成本上,都低于开源RAG框架。

2、深度定制的运维场景化方案:我们深度定制了运维各大场景的检索生成回答的工作流,智能识别用户意图,并自动路由到最合适的运维场景化方案。这极大降低了使用门槛,提升用户体验。


通过NextConsole,运维工程师能够快速获取专业、精准的解决方案,极大提高工作效率和问题解决能力。



—— E n d ——

最后修改时间:2024-06-27 12:08:03
文章转载自Zabbix开源社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论