
上篇介绍了大型制造企业在日常生产物料管理场景中衍生出对运营提效的背景和需求,本篇我们将继续分享国双产品及技术团队如何利用自研产品满足客户需求的实践路径拆解。

知识智能+RAG,在生产物料管理领域实现了场景落地
国双知识智能平台是国双的核心产品之一,由国双产品团队自主研发,依托NLP、知识图谱、机器学习、深度学习等技术能力,形成了融合LLM的模型构建、数据标注、知识抽取、知识计算和应用的完整工具链,并在油气、制造、交通、电网、司法、政府等专业领域实现复合技术方案的成功落地,积累了众多AI技术在产业内的落地实践成果。
此次针对客户的需求,国双产品团队在自研平台产品的基础上,坚持深化以知识图谱技术为核心,利用RAG检索增强生成技术将结构化知识见解转化为灵活生动且信息准确的语言表达,在一系列任务处理过程中持续优化了平台产品的体验。其实现的过程更多依靠的是多模块技术的调度、复合与协同。
在整个研发过程中,国双产品团队设计了三层架构,将知识图谱融合RAG检索增强生成技术,助力制造企业核心生产场景的智能化落地。基本的实现步骤是:
1. 数据存储与访问:
1.1 知识图谱构建
数据映射:将结构化数据(如库表)转换为图谱数据,通过本体模型与结构化数据的映射配置,建立数据表字段与本体属性、关系的映射关系。
数据抽取:根据“数据映射配置”从结构化数据中提取图谱数据,支持自动化处理。
知识融合:基于相似度算法实现跨本体的知识融合,支持单点及批量多种融合方式。
1.2 文档向量库构建
文档解析:预处理文档,去除噪声信息并深度理解内容,以提取关键信息。
文档拆分:根据文档结构和内容特点进行章节段落拆分,并对文档进行向量化处理。
1.3 APIs数据接口对接
数据科学建模API:数据科学建模内置分类、预测、时间序列等基础算子,支持多种模型创建方式(包括可视化和自动建模),支持从HIVE等数据源获取数据,并进行周期性运算。
大数据模块API:大数据模块基于Hadoop生态,通过数据治理统一规范数据标准、汇聚异构数据、支持批量实时计算分析,支持通过API共享数据。
2. 规则匹配与校对:
2.1 检索规则匹配
将语义理解后的检索语句转换为查询语句,通过规则匹配,对图数据库、向量数据库及APIs进行分类检索。
2.2 知识图谱检索
基础检索:按指定语句进行图谱本体、实体、属性及属性值的知识检索,适合快速查找某一实体、属性的检索,以及实体、关系的追溯,计算资源消耗少。
高级检索:利用图算法进行社区分析、路径分析、最短路径分析及组合分析等模型分析后,进行复杂问题的检索,计算资源消耗高,适合复杂关系分析,根据关系进行主题聚类检索。
2.3 向量数据检索
支持高效的向量相似度计算,通过向量化索引在数据库中检索相关文档或信息片段,适合对规范手册、操作文档、更改通知等进行检索。
2.4 APIs数据检索
对结构化数据,JSON对象,使用键值对直接进行高效查询,适合对数据仓库应用层业务目录汇总表进行检索。
2.5 内容校对输出
对知识图谱、向量库及APIs返回的结果进行校对,提升识别质量并选择性输出。
3. 问题查询与结果:
3.1 检索语句处理
对用户检索语句进行分词处理,匹配同义词典并进行语义扩展,构建新的检索语句,并转换为不同的查询语言。
3.2 结果融合生成
对返回的结果进行融合生成,以原始查询结果及扩展查询结果形式返回用户,并进行相关性排序,增强生成响应的清晰度和连贯性。
从最终实践效果来看,这种技术融合能够实现协同效应,带给客户更好的使用效果,并实现了运营管理工作中的提质增效,包括:
实现增强信息检索:知识图谱提供结构化且相互关联的信息,可以极大地提高信息检索的效果。通过使用知识图谱,RAG模型可以检索到更准确和相关的信息,从而提高生成的质量和响应质量。
提供可靠且多样化的信息:知识图谱是从权威来源构建的,因此它们是可靠和值得信赖的信息来源。RAG模型可以利用这些可靠的信息来生成更准确的响应。此外,知识图谱通过提供更广泛的相关事实和实体,有助于多样化生成的响应。
对上下文感知的增强理解:知识图谱使RAG模型能够理解和推理上下文信息。通过利用知识图谱中编码的关系和语义连接,RAG模型可以更好地把握用户查询或对话的上下文,从而产生更连贯和恰当的响应。
高效处理复杂查询:知识图谱使RAG模型能够将复杂查询拆分为较小的子查询,从知识图谱中检索相关信息,然后基于检索到的知识生成响应。这使得RAG模型能够有效处理各种用户查询。
具备可解释性和透明性:知识图谱提供了一种透明和可解释的知识表示方式。通过将基于知识图谱的检索整合到RAG模型中,生成的响应背后的推理过程变得更具解释性。用户可以清楚地了解用于生成响应的知识来源和连接。
保持可扩展性:知识图谱作为大规模的信息仓库。RAG模型可以利用知识图谱生成对各种查询或对话的响应,而无需额外的监督训练数据。这使得RAG+知识图谱方法能够处理广泛的知识领域和用户查询。
作为一家深耕产业数字化、智能化转型近20年的企业级数智软件厂商,国双一直持续积极拥抱最新涌现出的AI技术成果。围绕自研的数智底座,针对客户的具体业务场景需求,探索以AI技术在产业核心业务场景内的有效落地。深耕场景以点带面,突破积累可规模化、安全可控的产业智能化方案,为成为大型企业及组织在数字化、智能化转型中值得信赖的同行伙伴而不懈努力。







