暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

AI AGENT成功的秘诀是真正有用

白鳝的洞穴 2025-07-02
203
很多业内人士都说今年是AI AGENT元年,确实也是,各个行业的AI AGENT的大量出现,是AI从基础模型到应用落地的关键一步。我身边的不少人都在做这方面的工作,包括我也是如此。
从今年春节前的DeepSeek浪潮兴起的时候,我就觉得利用开源推理大模型本地化部署,可以解决数据库领域AIOPS方面的很多问题。于是我开始和DBAIOPS社区的几个朋友一起尝试利用DeepSeek来解决一些国产数据库运维的问题。我们这个团队都是DBA出身的,没有AI专家,所以也不知道我们在做的事情是什么。直到有一天,一个朋友说,老白,你们做的这个AI AGENT项目还挺不错的。我才知道原来我们正在做的事情,就是外面炒得火热的AI AGENT。其实做这件事的初衷是利用LLM来整合运维工具和专家经验,并没有考虑到我们现在做的事情是风口浪尖上的热点。
误打误撞,我们又走到了一条正确的道路上。在研发的初期,我们就没有纠结什么框架,而是完全从如何帮DBA解决日常运维中的烦心事入手。Dify、n8n、RagFlow、AnythingLLM等框架只是最初的一周里简单试了试,就没有深入研究了。因此我们一开始就把精力放在了如何利用LLM解决运维中的实际问题上。
另外在选择本地部署的模型上,既然只是一个DBA助手,那么我们就必须在一些大家都用得起的硬件上去部署这套系统。于是我们选择了30/32b规模的模型作为目标模型。我们最初的智能体开发是在DeepSeek-r1:671b上调试的,不过在知识图谱的制作上,我们要求在DeepSeek-r1:32b/qwq32b/Qwen3:30b-a3b这样的中等规模模型上也能跑得通。随着知识图谱的细化,对模型规模的要求也越来越低,现在一个新工具的开发都直接在Qwen3:30b-a3b做调优了。当我们发现Qwen3:30b-a3b在一台没有GPU的ARM服务器上也能抛出不错的性能的时候,我们觉得DBA助手的应用场景更加广阔了。
AI应用落地,最重要的是落地二字,效果是评价一个AI工具是否有用的关键要素。在AI时代,你可以把系统的交互方式做得很酷炫,但是用户如果和AI聊了半天,没做成啥正事,那不是瞎耽误功夫吗。前阵子听到不少人说今后用户会对AI应用按结果付费,只有真正能给人以帮助的AI工具才能获得收入。
确实,在MCP大行其道的今天,行业应用开发者不需要费劲巴拉地去出售他们完整的系统,而只需要出售他们的工具,说得更直白一些,他们可以通过MCP 工具去出售他们的能力和数据。用户也不需要花大价钱去采购没有几样功能是自己需要的大型软件系统,只需要购买一些MCP调用,甚至按次付费就可以了。
在AI时代,应用系统的架构会逐步被重构,把LLM作为中枢,去自动发现并调用解决问题所需的MCP TOOL,自动对数据进行汇总分析,自动生成用户所需的报告,这些都变得十分简单了。
回到我们目前的这个项目上,我们在最初的框架里没有引入复杂的Dify,这是因为我们的很多场景在使用Dify做编排的时候,在32b规模的模型上跑的效果并不好。于是我们自己定义了一个简单的框架,目前已经能够很好地完成单意图任务了。不过随着产品的深入,多意图识别和多意图流程编排是必然要实现的,比如“帮我分析一下当前数据库存在阻塞的原因,如果存在一个长期未提交的空闲事务阻塞了超过10个会话,如果这个事务是SQLPLUS发起的,帮我杀掉它。”,这个任务可以分解为阻塞分析,未提交空闲事务发现,杀会话三个任务,就需要框架找到这三个任务,并根据场景进行串行调度。我们也希望能够用一个比Dify简单得多得框架能够实现。
现在在我们得团队里,有一个做框架技术研究的人,一个人负责整体框架的开发,其他的人大多数都是在做运维知识数字化和运维工具的开发。借助cursor这样的代码补全工具,一个小团队也可以把一个大项目构架起来,这也是AI时代应用系统研发的一种新的形态吧。

文章转载自白鳝的洞穴,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论