当前,数据已经成为大模型发展的关键要素,为满足大模型训练和应用效果,如何开发高质量数据集、制定高效统一数据集管理策略成为大模型产业关注的热点,同时是企业进行大模型落地应用的第一步。目前,在大模型数据的开发、管理和应用中缺少统一、系统的专业标准,导致大模型对数据开发和利用时,需要投入大量人力和财力进行数据清洗和比对,从而增加了运营成本,严重影响了模型产业化应用。
为破解大模型训练数据发展瓶颈,深入推进人工智能数据高质量发展,由中国信息通信研究院(简称“中国信通院”)牵头发起《大模型数据开发管理能力评价方法 总体要求》标准编制工作,联合发起单位包括中国联通集团、华为技术有限公司、科大讯飞、商汤科技、蚂蚁科技集团等18家单位。该标准围绕组织治理、开发维护、质量管理、资产管理、应用服务、合规可信等维度给大模型数据开发管理的全流程提供可借鉴可参考的标准规范。该标准拟于中国通信标准化协会进行行标立项。
参编单位可优先参与相关产业沙龙和学术研讨会,相关研究成果也将对各参编单位公开共享。同时,对《大模型数据开发管理能力评价方法 总体要求》内容编写、贯彻落地贡献突出的单位和专家,将作为核心编制单位、专家写入相关成果。
现面向社会各界公开征集标准发起单位和专家,请有意向参编的单位或专家请扫描下方二维码填写信息报名。报名截止日期为2023年12月31日。
咨询电话
樊老师
18612301312(微信同号)
fanwei1@caict.ac.cn
李老师
18611353631(微信同号)
lisun@caict.ac.cn

前期,中国信通院联合中国联通、华为、交通银行、中科院文献情报中心等多家单位已开展《大模型数据资源地图与治理路径研究》编制工作,为业界提供数据资源地图的编制方法论、AI高质量数据集界定、数据资源地图通用模版、数据治理方法体系,目前通信、汽车、电力、金融等领域报告已处于编制完善阶段并择机发布。在下一步的工作中,诚邀城市区域、行业场景和企业机构数据资源地图合作伙伴,共同推进相关工作。(参编联系方式同上)

校 审 | 谨 言、珊 珊
编 辑 | 思 寒

推荐阅读








