元数据抽取有什么价值?信息化时代数据的重要性不言而喻,那么如何更有效的利用数据以及使数据提供更有价值的信息是非常关键的。在这种情况下,描述并有效利用各类信息的元数据就变得更加重要,元数据是数据整合与BI应用项目的灵魂,可以说没有元数据就没有数据整合与BI应用。今天来聊一聊元数据抽取。
一、什么是元数据
说到元数据抽取,我们首先需要了解什么是元数据。维基百科中对元数据的定义:元数据是“提供关于其它数据的信息的数据[信息]”。存在着许多类型不同的元数据,其中包含描述性元数据、结构性元数据、管理元数据、参考元数据和同级元数据。(Metadata is "data [information] that provides information about other data".[1] Many distinct types of metadata exist, among these descriptive metadata, structural metadata, administrative metadata[2], reference metadata and statistical metadata[3])
那么在BI应用中,哪些数据可以称为元数据呢?从广义上讲,元数据代表定义数据仓库的任何对象,无论它是一个表、一个列、一个查询、一个业务规则,或者是数据仓库内部的数据转移等等。从BI的角度来说,元数据贯穿商业智能系统数据“流动”的全过程,主要包括:数据源元数据、数据采集元数据、数据仓库存储元数据、数据集市元数据、应用服务层元数据、门户管理元数据。
二、为什么要做元数据抽取
元数据抽取是数据管理中重要的一环,是元数据存储、访问、浏览及其他处理过程的基础,而元数据管理在BI中也是非常关键的。由于元数据分散在BI系统的各个子系统中,有不同的元数据存储和访问方式,因此必须能够根据各子系统所提供的元数据访问方式正确抽取出管理所需的元数据。
对于元数据利用合适的查询和分析工具、元数据抽取工具、在线分析工具等对其进行分析和处理,最后形成知识以支持企业决策。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




