三、数据治理平台的智能化
通过人工智能技术降低数据治理的门槛将成为数据治理发展的重要方向。充分考虑到数据治理高复杂性的特点,数据治理平台不断融合AI新技术,力求通过智能化管理来简化数据治理实施过程,大大地解放技术人员,帮助企业实现更高效的数据治理,远离“数据黑洞”。
1、智能化元数据服务。睿治平台支持全自动元数据采集和关联,实现元模型智能化应用,提供图形化元数据分析视图。
2、智能化探查数据质量。睿治平台内置数理统计算法、绑定机器学习算法,实现自动探查数据质量,同时支持智能修复。
3、智能化构建数据标准。睿治平台支持智能化映射及落标,形成的数据标准和业务数据双向评估。
4、智能化识别主数据。睿治平台自动识别主数据,帮助重复数据自动匹配和合并,构建完整的主数据视图。
随着数据治理和人工智能两个领域的快速发展,二者的融合将会有更多场景和商业模式。
四、数据治理+AI的行业融合
AI技术创新应用大规模落地,带动大数据智能市场蓬勃发展
企业在部署AI应用时,数据资源的优劣极大程度决定了AI应用的落地效果。因此,为推进AI应用的高质量落地,开展针对性的数据治理工作为首要且必要的环节。而对于企业本身已搭建的传统数据治理体系,目前多停留在对于结构性数据的治理优化,在数据质量、数据字段丰富度、数据分布和数据实时性等维度尚难满足AI应用对数据的高质量要求。为保证AI应用的高质落地,企业仍需进行面向人工智能应用的二次数据治理工作。
面向人工智能的数据治理是传统数据治理体系在以AI应用落地为导向下的体系“升级”。
从数据管理维度来看,面向人工智能的数据治理体系仍会根据数据结构化流向、数据资产管理需要、数据安全需求等角度顺应搭建元数据管理、数据资产管理、主数据管理、数据生命周期管理和数据安全隐私管理等组件模块。而在数据治理过程中,则会更强调底层实现多源数据融合、数据采集频率、数据标准建立、数据质量管理,满足AI模型所需数据的规模、质量和时效,以AI应用的数据需求为核心,优化对应模块的体系建设。
AI应用驱动成为面向人工智能的数据治理服务的核心立足点
面向人工智能的数据治理服务常包含于数据服务、平台能力和数据产品三类采购形式中。第一类,数据服务即以单独的数据治理产品形式出现;第二类,数据平台,主要包括大数据平台、数据中台、数据仓库和AI能力平台等项目;第三类,数据产品,范围限定在应用AI算法的数据产品,可划分为机器学习产品、自然语言理解产品和知识图谱三类AI产品。
打造“治理+AI”体系的良性循环
相互关联,互为依托,共同促进人工智能应用的内外发展
面向人工智能的数据治理充分利用机器学习技术,将数据治理环节自动化智能化,可极大提升数据治理工作效率,同时基于自然语言理解和知识图谱挖掘关联非结构化数据的应用价值,解决数据质量管理的传统难题,使治理后的数据更加契合AI应用的要求,从效率和质量双侧推进AI模型的落地应用。
与此同时,AI应用落地效果的显著优化也会给企业带来更多智能化转型信心,让其加大相关AI项目的预算投入,进一步推进相关治理体系建设,打造“治理+AI”的良性循环




