了解图数据库系列之
数据治理的应用


1 ·元数据管理
图数据库具有快速查询数据的能力,任一节点的关系查询与展示都很明晰。如下图所示,输入要查询的某个节点“咪咕音乐——表”,则相关的上下游关系都会清晰地展现出来,比如上游来自蓝色的节点“咪咕音乐——数据库”,下游的绿色节点是“应用产品”。



每个节点都可以展开和收缩,可操作的元数据分析平台灵活性高,让运维人员更易懂。
基于图数据库的语言还可以灵活地进行高阶数据分析,如基于PageRank算法对表和作业的重要程度进行打分,从而决定运维处理的优先级,这样元数据的价值就会真正发挥出来。

2、数据资产可视化
如下图所示,传统数据库虽然运用 JOIN 操作,将不同的表链接了起来,从而隐式地表达了数据间的关系,但是当要通过 A 管理 B,B 管理 A 的方式查询结果时,表结构并不能直接展示结果。



图数据库在未来数据资产可视化中的应用包括:
· 提高企业数据资产配置效率
· 通过图数据库建立企业数据资产全景图,快速搜索定位
· 形成有效的数据交汇,以个性化展现企业的数据资产
·方便使用者获取关键信息,从而更好地了解数据资产的各个方面



3、主数据管理
由于主数据是高度关联和共享的,所以如果MDM系统的构建方式不佳,会降低业务灵活性,而现今业务要求数据模型能够随业务需求变化而提供任务特定的、可变的和特殊的结构。
图关系可以轻松关联CRM系统、库存系统、会计和销售点系统之间的孤立数据,提供企业数据的统一视图。



应用如数据库来做主数据管理至少有如下几点好处:
(1)分层的复杂数据集
组织数据和产品数据等主数据具有 自上而下、横向和对角连接的深层层 次结构。使用关系数据库管理这样 的数据模型需要臃肿庞大的复杂代 码,导致运行缓慢、构建成本高且维 护时间长。
(2)实时存储和查询性能
主数据存储必须与企业内的大量应 用程序集成并提供数据,有时需要 实时进行。然而,通过遍历复杂且高 度互联的数据集来提供实时信息是 一项严峻挑战。
(3)动态结构
主数据本质上是动态的,这使得开 发人员很难设计出适应其发展的系统。


4、数据血缘
数据血缘关系,正是体现数据的来龙去脉,帮助追踪数据来源以及数据处理过程。数据来源节点关联转换可以一目了然的通过可视化动态图展现出来,实现对异常数据原因溯源分析。



使用场景1:评估数据价值
可以从数据使用广度、数据更新量级、数据更新频率三个维度开展。
使用场景2:评估数据质量
例如,在完整性检测这个维度,图数据库可以很好地帮助检测如下维度:
① 模式完整性:一个本体包含的类别和属性是否完整
② 属性完整性:一个特定的属性的值是否缺失
③数量完整性:一个数据集里对象(object)的数量比例
④ 互连完整性:数据集里的实例互联的程度
使用场景3:数据归档/销毁
在数据关系图上,当某个数据没有了受众,不再被其他对象使用,便可以对其进行评估和需求分析,决定是否需要归档或销毁。

5、授权和访问控制
管理多个不断变化的角色、业务组、产品和授权成为一项越来越复杂的任务。图数据库则可以很好地存储那些复杂、高度关联、跨越数十亿参与者和资源的访问控制结构。




Reg Tech 未来




