暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

构建面向大模型的数据底座!AIDB数据库正式发布

恒生电子股份有限公司 2025-05-12
291


5月10日,2025中国数谷·西湖论剑大会在杭州举行。

作为“三数一链国家数据基础设施杭州先行先试任务阶段性成果”,恒生电子旗下金融数据服务子公司恒生聚源在会上正式发布AI友好型金融数据库AIDB



作为面向大模型深度优化的金融数据底座,AIDB通过统一数据范式、简化查询逻辑及强化数据治理,为大模型在投研、投顾、营销、合规等场景的应用提供高可靠、高精准的底层数据支持,助力金融机构实现数智化转型。


金融大模型“精准取数”的挑战


近年来,大模型技术的快速发展,推动金融行业加速迈向数智化。

但在大模型生成能力和推理能力日益提升的同时,基于金融行业的严谨性,AI时代的金融大模型用数精准性问题仍是行业应用的重要瓶颈。

NL2SQL(自然语言转SQL查询)、NL2API(自然语言转API调用)等现有结构化数据调取路径,仍面临准确性不足、开发成本高、灵活性差等痛点。

恒生聚源推出的AIDB数据库,依托聚源全市场金融数据,通过面向AI友好的数据建设,实现大模型对金融结构化数据的精准调取,可以大幅提升AI场景应用全链路数据调取准确性与可靠性,让金融AI应用更加可用、可信赖。


统一数据范式,重构AI友好底座


与传统数据库相比,AIDB数据库的构建范式在金融大模型取数应用场景具有多重优势:包括数据模型结构简单,场景数据内容丰富,指标数据一标一用,结果指标可控、取数方式易部署、上线高效等

在数据模型设计方面,AIDB数据库摒弃以往关联复杂、非标准化的传统数据表结构,创设“LLM元数据表-LLM关系表-LLM数据表”三表体系,将业务数据转化为通用格式,创建大模型更易于读取的数据体系。

同时,AIDB数据库创新性地采用极简式查询SWOD(Select+Where+Order -> Data)的取数范式。
在场景赋能上,AIDB数据库深度融合业务场景,严格依托场景构建指标集,覆盖股票、基金、债券、财务、指数、EDB等基础指标信息,并从传统的“遵循原始披露、尽可能全面收录”转变为“引入特定场景最关注的指标”,以主体+指标的主键形式进行数据存储,并对内容进行升级。

根据金融应用场景下的用数需求,AIDB提供三个阶梯版本:
  • 标准版本:常见金融基础数据的简单取数

  • 投研版本:赋能研究员投研场景的取数

  • 专业版本:覆盖行业、概念、指数、个股等二维三维指标,面向2B+2C场景复杂问题的检索


除数据库外,恒生聚源AIDB系列还提供基于AIDB金融数据库构建的金融市场数据取数API开放接口订阅服务,基于面向大模型应用的数据架构体系建设咨询服务,和AI应用场景下的内部数据治理与多源数据融合的数据治理服务


恒生聚源总经理吴震操表示,在大模型时代,越来越多的数据应当面向大模型应用而建设,而非面向人类和传统软件。

AI友好型金融数据建设的核心本质,是基于大模型友好数据模型的统一范式,对所有数据内容进行治理并提炼成一套有效的取值逻辑,建设一套大模型友好的数据底座。

AIDB是大模型时代数据治理范式的创新产物。

我们希望通过AIDB为金融机构提供强大的AI友好型数据底座,让大模型真正理解金融、服务金融,充分释放AI应用的业务价值,助力金融行业数智化转型。



助力高质量发展!恒生投资交易系统风控能力全面升级

千亿级资管业务迁移成功!中信期货上线!


多维度升级!恒生电子发布2024年可持续发展报告

最后修改时间:2025-05-13 11:53:19
文章转载自恒生电子股份有限公司,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论