


“在技术层面,新型数据基础设施的核心路径是“湖仓一体”与“AI原生”的深度融合。它将数据湖的开放性和灵活性与数据仓库的结构化管理、ACID事务特性相结合,形成一个统一的数据底座。同时,它将AI模型的训练、部署与数据治理紧密耦合,实现从数据到智能的无缝流转。
这种架构不仅是技术上的整合,更是理念上的革命,它为Data&AI深度融合体提供了坚实基石。支撑数据价值逐级跃升,从“点”(功能提效)到“线”(组织创新),到“面”(行业协同),再到“体”(产业带动),最终形成支撑未来智能社会的国家战略,成为智能革命的核心引擎。”
——甲子光年:《2025中国Data&AI数据基础设施白皮书》

全球AI浪潮翻涌,千行百业演进到了产业智能化跃迁阶段,麦肯锡研究显示生成式AI已经为全球经济贡献约7万亿美元价值,中国有望占近2万亿美元;IDC则预测到2028年,中国AI总投资规模将突破1000亿美元,五年复合增长率达35.2%。
在这场变革中,需要数字化、智能化的技术融合方案在业务中实现场景落地,而传统的系统建设思路将很难支撑企业及产业内AI落地的需求。同时,Data&AI融合的数据基础设施建设目前仍为进行时,且愈加成为刚需,也将成为促动AI+行动落地的关键要素。
以要素式数据贯通驱动为基、以AI技术应用为连接,全面支撑起产业模式升级井形成向外辐射全球的新产业能力,或将助推起全球经济新格局形成,涌现出独具特色的中国现代产业新质生产力。

面向产业的数智一体化融合底座
国双数智底座GRIDSUM COMPaaS是国双专家团队集20年研发,围绕“数据、知识、模型”三位一体为核心能力,通过融合大数据、AI、云计算、物联网、边缘计算、地理信息等多元技术,构建起来的全栈式大型企业级数智基础设施。
区别于数据整合及应用与AI技术的相互独立,早在数字化转型启动初期国双便发现将以自然语言及知识图谱等AI能力深度嵌入基础设施层,利用知识图谱在知识标准、可解释性、可信性、可溯源性等方面的优势,通过知识图谱增强大模型从预训练到应用的全生命周期各环节,可提升大模型的训练效果和推理结果的可用性,解决大模型输出的可信度不足的关键问题,以实现数据处理与智能分析的原生融合。
这种早期原生的架构设计使数据从多源采集、高效治理、统一管理到知识沉淀、深度推理、智能应用的全生命周期都能在统一平台内高效流转,能大幅降低系统耦合度与应用门槛,更能真正实现“数智一体”的闭环进化,为产业级智能决策提供扎实的“燃料”与“动能”。

同时在多年的研发与发展中,国双始终坚持以产业应用导向来沉淀平台,再以平台赋能产业级数智化的高效落地。历经了深入传统工业、制造业,在大型央国企的复杂业务场景中持续的实践和验证,如今的GRIDSUM COMPaaS国双数智底座体系架构已成型及成熟,不仅支持系统、功能模块之间可解耦、插拔,更可相互协同、反向灵活再组合,并自始至终践行全栈自主可控、安全可靠的信创标准。



夯实数据基础设施仍是产业AI的落地前提
作为数据密集的技术领域,以“知识、模型”为代表的AI技术体系发展离不开高质量数据集的加持。首先AI技术的能力发展必须以海量高质量数据作为基础,数据越多模型的效果越优;其次,产业AI落地更脱离不开丰富的场景及业务要素,专业跨领域的知识库构建,必须要从大批量多批次的数据中进行萃取。
数据既是AI发展的必备“燃料”,同时作为产业AI落地不可或缺的“动能”,数据的有效程度更直接决定了智能化是否具备了启动建设的条件。根据多年深耕企业数字化、智能化转型落地的实战经验总结,国双一直认为在启动产业AI落地的语境下,过往传统数据工程中仅从“数据”出发,将海量零散的、不完备的数据通过质量管理、生命周期管理、元数据管理等常规处理工作必定是远远不够的。这样大而笼统的数据处理将很难支撑企业业务的场景化落地,进而必然导致应用效果和价值的缺失。

在过往传统系统建设的套路中,对非数字原生企业的数据处理常常被视为“一次性工程”——清洗、整合后即可支撑业务需求的实现。但随AI变革的浪潮袭来,企业对智能化技术的需求急切迫近、热度持续走高,面对实际落地中所凸显出来的问题与矛盾,这一过往的逻辑将必然被颠覆。
不同于传统数据管理,乃至不能视同于整体一次性的数据治理,服务于企业智能化的数据工程需要以满足动态适配业务、场景化落地验证、全生命周期治理等新的更高要求出发,从数据管理、数据治理、进而迭代到当下面对智能化技术所需的数据准备,这无疑已出现了递进、演进的发展变化。也因此决定数据工程已经变化成为了一项长期且可持续的系统性建设及陪伴式服务,并将高度依赖于结合语义、知识、治理和集成等多维一体的、面向AI智能化的数据基础设施及体系化方案的支撑,以便为分散、异构的数据建立一张充满语义和关联的“知识网络”,更智能的生成数据集成管道,将相关的数据连接起来,解决多模态数据孤岛、治理困难、使用复杂的问题。

以多年深入企业数字化转型一线的观察来看,面对这种需求升级,国双认为大部分企业组织的数据基础设施构建工作仍处于不完备状态。从“支撑决策”到“协同驱动智能”的实现,需要从认知到规划进行整体优化,才能让数据基础设施在面向AI落地上发挥实效,匹配成为实现数据价值流转与智能闭环的“核心引擎”。

数智一体化融合底座需要更多的“硬核”能力
数智一体化融合底座是利用新一代数字技术,对物理世界进行数字表达的强大设施,并通过对不同业务系统数据的统、通、融,实现数据通、业务通、决策通,从而使数据与数据之间、业务与业务之间拥有到相关性。当数据能够变成基本生产要素,能够达到既参与其他生产要素的创新配置,也参与生产技术的演化和迭代,才能通过建模,进行各种“赋能”,实现真正的产业价值创造。
作为能够让数据平台和AI智能工具融合一统的系统性底座,其能力脱不开多元化、全链条、一站式的“硬核”能力集约,属于复杂的体系化能力“合集”。以GRIDSUM COMPaaS国双数智底座为例,原生于数据、融合于智能,多年积累中陆续形成了十三项核心的“硬核”能力:
一、基于存算分离的数据全生命周期管理能力
提供多源异构数据的统一接入、存储、计算、管理、可视化分析等全生命周期管理能力。可以对数据库、表、行、列进行精准权限管控,对TB级别以上的海量数据进行高效管理。分布式架构保障了数据存储、计算和分析挖掘的稳定性、可靠性和安全性 。
二、基于多人协同的多场景异构数据智能标注能力
提供多源异构数据集分类管理,支持文本分类、实体关系抽取、图片分类、目标检测等场景的标注,可对接常用大模型和 专用模型进行智能标注。支持多人标注、多轮标注,提高了数据标注的效率。能够直接用标注数据集进行模型训练生产模型。
三、基于模型与算法的专业知识加工能力
提供基于模型与算法的数据流工具,支持标签库、词典库、规则库、参数库、API库、数据标注、模型训练、规则抽取、业务 模型、NLP自然语言处理等功能,结合知识图谱与数据科学建模,可以有效支撑RAG知识库等大模型问答应用的场景化落地,实现有学识的人工智能。
四、基于基础算法与机器学习的强大AI建模能力
经过多年钻研及行业实践,国双沉淀并积累了大量的基础算法模型和能力模型,涵盖各个基础领域:自然语言处理15大任务 30+算法模型、图像分析7大任务20+算法模型、机器学习23类 140+算法模型、图计算4大类任务20+算法模型等。
五、基于低代码方式快速搭建可视化分析应用能力
提供丰富的可视化图表,自由拖拽式场景构造器,可以满足数 据分析师的专业需求,帮助企业提升商业决策能力。提供数据门户高效搭建的能力,在面向演示、展厅场景时,提供演示脚本录制及自动播放功能,有效提升演示效果。
六、基于云边协同的物联网边缘计算能力
提供边缘计算基础设施,将云计算能力延伸至边端,提升边缘场景事件响应速度,降低云端存储计算成本。在边缘端提供边缘数据采集、智能识别、实时计算、数据分享、数据上云等能力,在云端提供物联网设备统一管理、规则链统一管理、下发等能力,具备架构稳定、扩展性强等特性。
七、基于数据模型专用知识体系的仿真推演能力
提供丰富的3D模型组件库、数据模型库、计算模型库,在数字孪生底座引擎和基底数据基础上,依托专用领域知识体系能力,对特定业务问题、生产流程进行模拟运算、动态推演和结果预测,实现对复杂场景的精准模拟、潜在风险的提前预判及最优方案的研究和高效验证。
八、基于统一业务架构的多角色协同能力
平台主要面向各类开发人员、运营管理人员、业务用户提供服务,多角色可以在COMPaaS数智平台实现高效协同。运营管理人员负责保障平台的基本运作和资源的分配、管控;数据、模型、应用的开发者使用平台提供的专业工具进行各类产品的开发,开发出来的成果可以通过云市场提供给各类业务用户申请 使用。
九、基于安全可信的数据模型产品跨组织分享能力
提供统一的数据、模型、API、应用资产及市场管理能力,可以跨部门跨组织分享企业的数智化建设成果,提供成果的申请、审核、鉴权、水印、加密、脱敏、审计等功能。提升了企业数智资产的跨组织应用能力,可以帮助企业提升数智化成果的市场价值。
十、基于微服务架构的应用共享能力
提供微服务架构应用部署的能力,应用市场发布的应用系统具备随请随用的共享能力。成熟的应用系统,可进行跨组织和部门分享,对提升企业数字化转型和升级提供有效方向引导。
十一、基于弹性伸缩的可插拔式部署能力
平台支持一键化部署,8小时内可按需部署完成,实现快速投产。平台资源使用情况可实时监控,根据使用情况可以进行弹性伸缩,实现资源高效利用,降低软硬件成本。
十二、基于DevOps 的平台一站式整合能力
云平台提供应用开发需要的预置中间件,开发全生命周期的工 具和过程管理能力,实现应用的高效开发、集成和使用,具备 一站式应用整合能力。
十三、基于故障发现和工单处理的综合运维能力
综管平台能够快速发现并识别问题产生链路,形成完整的故障关联性拓扑展示。提供现场问题取证、问题工单处置等功能,为问题重现、问题解决提供必要信息,解决客户现场运维难的问题。
相信对大型企业而言,践行数字化优先、以智能化驱动发展越来越需要依托健全的体系化融合数智能力。而AI规模化落地的关键不再是“有没有数据”,而是“有没有能支撑AI的数据基础设施”。
正如知名IT行业研究机构甲子光年在《2025中国Data&AI数据基础设施白皮书》中提到过的:“打破数据孤岛,解决高质量数据供给不足、模型与业务场景割裂以及数据安全合规等痛点正在倒逼数据基础设施实现一次范式跃迁,从单一的数据存储与分析工具,向支撑全业务流程的智能化底座演进。“相信未来,能掌握这一核心底座的企业组织将必然在智能时代的大潮中,因具备了更完备的基础能力而抢占先机。


《GRIDSUM COMPaaS国双数智底座产品手册》新版已上线。
敬请关注国双公众号,后台回复“国双数智底座”,即可查阅文件。








