暂无图片
暂无图片
5
暂无图片
暂无图片
暂无图片

BIC-QA正式发布

白鳝的洞穴 2025-08-18
665
    三年前的今天,我们埋下了一粒种子,几个来自不同公司的好友一起创建了一个公众号,DBAIOPS社区,希望能够通过这个公众号分享一些“运维知识自动化”和“智能运维”方面的技术和案例。同时通过社区协作,分享与收集运维案例和运维经验,用于构建运维知识图谱。
    三年过去了,社区目前已经有3000多关注用户,体验DBAIOPS社区版的朋友也超过了1000。我们也依托社区的力量,外加与广大国产数据库厂商的合作,在社区里对国产数据库的运维知识图谱不断扩充,目前已经形成了相当可观的规模。如何更好地利用这些运维知识,回馈社区的新老朋友是我们一直在思考的问题。这两年AI技术的发展已经给了我们一个标准的答案。运维知识是不断发展的,随着国产数据库的发展,运维知识的迭代速度更加迅猛。仅仅依靠一家企业或者一个团队来运营这些知识,把它锁在自己的档案库里,并非正确的方案。于是DBAIOPS社区准备把这个知识库开放出来,供广大数据库使用者共享。
    这个想法被大家认可后,大家就开始分头行动。正好我们几个老家伙结束了南京公司的合作回到深圳,必须要干点什么,于是我们几个老同学又在深圳拉起了佰晟智算(深圳)技术有限公司。公司成立的第一件事情,就是利用社区的运维知识构建一系列智能体。BIC-QA国产数据库智能问答系统就是其中之一。
    前阵子我在调试这个知识库的时候,在网上和一个朋友聊起这个事情,发了一张截图给他。他看了说这东西挺不错的,现在大家都在学习国产数据库,有时候遇到问题,只能去问大模型,或者在百度上搜索。这些知识真假难辨,挺让人头痛的。我就说我们想做一个国产数据库的知识库,能知之为知之,不知为不知。他说如果真的想做这样一个知识库,一定要免费开放,依靠社区力量才行,否则光凭你们一己之力恐怕很难做得很到位。
    我觉得他的观点是靠谱的,做国产数据库的知识库这件事太大了,光凭几个专家的力量肯定是做不好的,必须依靠广大的数据库厂商和DBA群策群力,才能越做越好。于是我们决定把这个知识库免费开放给大家使用,并通过大家使用过程中遇到的问题,不断优化知识库。公司的同事对这我的这个想法表示赞同,于是在开发BIC-IA国产数据库运维智能体的间隙,大家一起开始开发了这个免费的小工具。
    知识库的建设是一个长期工程,我们总觉得目前的知识库还不够好,怕拿出来大家不满意。不过总是闭门造车肯定不行,于是我决定在8月18号,我们社区的生日,正式对外开放这个知识库。今天我们发布的是一个chrome浏览器插件,只要chrome兼容的浏览器(包括WINDOWS自带的EDGE)都可以安装使用。有兴趣的朋友可以去https://gitee.com/BIC-QA/bic-qa 下载插件。插件下载后解压就可以在浏览器里安装了。
在浏览器的管理扩展页面,选择“加载解压缩的扩展”,就可以安装扩展了。
    安装后,建议大家点击左下角的使用说明,先看看如何一步步配置,并且注册API服务,从而获得完整的知识问答服务。安装好插件后,第一步就需要配置一个大模型服务,因为我们的算力有限,所以LLM问答服务需要使用用户本地的算力,最小配置只需要一块4060显卡,能够跑deepseek-r1:8b的蒸馏模型或者Qwen3:8B/Qwen3:4B模型就可以了,因为大模型主要是为了对知识库进行加工后输出结果的,而知识库的内容来自于我们的API服务,对大模型的规模和数据库知识能力要求不高。基于专业知识总结这个工作,有些时候大参数模型输出的结果并不一定比小参数模型更好,因为大参数模型里似是而非的国产数据库知识可能会干扰知识库的准确性。当然为了获得更好的体验,你也可以在阿里云、Deepseek、硅基流动等申请API KEY,使用付费的大模型服务,目前这种服务价格很低,个人使用一个月用得比较多也就是几块钱的费用。
    我的笔记本电脑上有一块8G显存的RTX 4060,部署了一套Ollama,所以我就可以配置本地服务了。
    如上图所示,如果聊天测试通过了,就说明目前的大模型服务已经配置好了。接下来就要去佰晟的API 服务器上免费申请一个API KEY了,这个API KEY是长期有效的,并且申请一次可以多地配置,所以一定要保存好这个API KEY(如果丢失也可以通过邮箱找回)。
    填写简单的注册信息,就可以申请注册了,邮箱一定要写对,因为API KEY是发到邮箱里的。
    收到邮件后,把API KEY填写到知识服务配置里。就完成配置,可以开始使用知识问答服务了。
    配置完成后,点击“测试连接”按钮,测试API KEY和API 服务是否工作正常。除了这个免费的公共版本外,我们也提供企业商用版本,可以部署在企业的内网中。

    如果你对知识检索有特殊要求,可以在知识库参数规则配置里去定义你的个性化配置。对精确度的要求可以调整,输出内容的格式也可以通过修改提示词来让它更符合你的口味,不过检索相似度不建议低于0.6。
    保存了配置之后,可以测试知识库。首先我们必须选择数据库类型。目前是强制将不同种类的数据库的知识分开的,因为国产数据库很多都在做与O记得兼容,一些概念名字类似,但是实现原理和技术细节差异巨大,按数据库分开知识库是让知识不串味的唯一方法。
    如果你还是怕回答不靠谱,可以查看后面的参考知识库的相关内容,这是通过API KEY从我们的知识库里检索到的实际数据,便于你去确认上面的回答是否合理。
    知识库提供了一系列的数据库的知识库,要注意的是,DB2,REDIS,mongodb这几个数据库暂时还没有上线,随后我们会陆续上线相关知识。目前知识库总计有210万条数据,主要来自于各个数据库的官方文档以及数据库厂商给我们提供的一些最佳实践的资料,再加上一些来自于我们的运维知识图谱的数据。不过知识条目的数量还在快速增加,一个月多前,这个知识库的条目数才区区20多万。
    因为各个国产数据库厂商在运维知识建设方面存在差异,目前知识库里,除了Oracle、MySQL、PostgreSQL之外,达梦和Oceanbase以及KingbaseES的知识库内容更为丰富一些。随着后续这些厂商和我们的合作陆续开展起来,其他国产数据库的知识库也会更为丰富。
      另外一方面,未来我们会更加注重高价值知识的收集,让这些知识帮助我们解决运维中遇到的问题,目前我们正在整理高价值运维经验和故障模型,未来也会发布在这个知识库中,利用这些高价值运维经验,可以帮助用户在BIC-QA中定位所遇到的数据库问题。不过在知识库的质量还没有达到一定水平的时候,利用知识库直接诊断故障还是镜中观花一样看得到,得不到。可能很容易做出一个DEMO,但是想要实战,还差得很远。
    因为我们还是一个初创团队,缺钱缺人,所以也不可能一下子推出一个令大家十分满意得知识库,这个知识库得质量依靠大家共同努力才能不断提高。同时今天我们也不会花钱去搞一个产品发布,不过今年的DTCC上我们准备了一个展位,希望届时能和有兴趣的朋友一起聊聊这个小工具。






最后修改时间:2025-08-18 14:41:37
文章转载自白鳝的洞穴,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论