
行词(大数据这 三 个 字 本 身 传 递 的 语 义 信 息 很 有
限"*大+和*数据+都 是 极 其 常 用 的 词"两 个 词 组 合
起来"字面上 也没有办 法直接表 达出确切 的特定含
义(我 们认 为"这 正 是 大 数 据 这 个 词 语 的 妙 处 所
在
"它使 得不同领 域)不同 背景)不 同身份的 人可以
用同一 个术语来 表达自己 的思想(也就是说 "不同
的人可 以从不同 的角度有 各自不同 的解读"加之媒
体连篇 累牍的报 道 使 得 原 本 就 不 甚 清 晰 的 概 念 变
得更加 扑朔迷离 (但总的 来说"它 至少给人 们传递
了一个 重要的信 息"那就 是"信息 技术的发 展由*计
算
+转向了*数 据 +(长 期 以 来"数 据 库 处 于 数 据 管
理领域 的重要地 位"因此 有必要从 数据库的 角度对
大数据 以及相对 应 的 大 数 据 研 究 进 行 比 较 详 细 的
解读
"厘清 一些似 是 而 非 的 概 念 "这 就 是 我 们 撰 写
本文的 目的所在
(
在开始 从数据库 视角解读 之前"首 先来看看 其
他专业人 士群 体 对 大 数 据 的 理 解 (谈 论 大 数 据 的
群体大 约可以分 为 三 类 %第 一 类 是 战 略 科 学 家"包
括科技 管理专业 人士和政 府官员(这很容易 理解"
数据中 蕴含着无 穷的价值 "关乎社 会经济和 民生发
展乃至 国家安全 "数 据 是 重 要 的 战 略 资 源 "对 数 据
的拥有 以及对数 据价值的 有效开发 决定一个 企业)
一个机构 和一个国 家的核 心 竞争 力( 第 二 类是
8-
产品提 供商"包 括 技 术 和 产 品 提 供 商 "信 息 系 统 集
成和解 决方案提 供商"还 有信息服 务提供商 (大数
据是个 很亲民的 词语"没 有拗口的 发音和故 弄玄虚
的复杂 语义"作 为产品和 服务的崭 新标签再 合适不
过(技 术)产 品 和 服 务 的 演 变 是 渐 进 的 "在 这 个 追
逐日新 月异变 化 的 时 代"
8-
产 品 提 供 商 往 往 喜 欢
为产品 打上时髦 的 标 签 "在 当 前"大 数 据 是 厂 商 们
的 不 二 选 择( 在 此 之 前"
*2
D
2K)G
)
24K@?4@K
)
L@R
)
D
?2*
)
FG+;*
等 都 被 他 们 用 来 做 过 标 签( 第 三 类 就
是科技 人员"主 要是那些 希望利用 大数据使 当前从
事的研 究方向取 得 新 突 破 的 科 学 研 究 和 技 术 开 发
的专业 人士(现 在 的 科 学 研 究 和 实 用 技 术 绝 大 多
数都是 和数据直 接或间接 相关的"把所从 事的研究
和开发 工作归 结 到 大 数 据 范 畴 "不 但 可 提 高 层 次 "
赋予研 究和开发 工作新的 使命"也 可以让大 众更容
易理解 其意义(从这个意 义上来说 "大数据 这个概
念就像 一把伞"可以把 原本互不 相交的概 念罩在一
起"形 成一个新 的概念(
我们把 时间回退 到
"&!"
年底"仅从
!"
月当月
媒体的 相关报道 就可略见 一斑"了 解大数据 深入人
心的程 度(据
"&!"
年
!"
月
"
日的参 考消息报 道"
在美国 的
"&!"
十 大 流 行 词 评 比 中 "*大 数 据 +名 列
第二
"第一 是美国 人 最 为 关 心 的 政 治 事 件 *财 政 悬
崖+(关于 大数据的 描述"翻 译好的原 文是这样 的"
*最简单 讲"这是 用 来 形 容 如 今 产 生 的 海 量 数 据 的
一种方 式"我 们 生 活 在 大 数 据 时 代( 具 体 一 点 来
说"大 数据所指 的数据集 既可以无 边无际得 让我们
无从发 掘有用的 信息"也 可以翔实 全面得让 我们能
做些全 新的事情+(关 于神州大 地的大数 据之热难
以详述 "仅通过 当月的两 则 报 道 做 以 折 射 "据
"&!"
年
!"
月
!V
日光明 日报报道
,
!
-
"陕西 西咸新区 规 划
国内首 家大数据 产业园(报道称"为迎接 大数据时
代的到 来
"推动 大 数 据 产 业 的 发 展"陕 西 省 西 咸 新
区沣西 新城规划 了 国 内 首 个 大 数 据 处 理 与 服 务 专
业园区
"在全 国率先举 起大数据 产业旗帜 (就在同
一天"在 我 国 改 革 最 前 沿 的 广 东 省 的
"&!"
广 东 互
联网大 会上"广 东省通信 管理局副 局长蔡立 志说了
一句让 现场与会 观 众 振 奋 的 话"*!广 东$省 委 省 政
府)各 级市县政 府 对 于 信 息 互 联 网 很 重 视"省 政 府
层面也 要成立大 数据局+
,
"
-
(
"&!"
年
!"
月
!X
日的
羊城晚 报对此事 的报道引 起了广泛 关注
(
在这样的 背景 下"我 们 想 以 开 放 的 态 度"站 在
数据库研究者的 角度"从 以下 几个 方 面进 行 大 数据
的解读(首先讨 论大 数据 是 个什 么 样 的概 念"说 明
它是如何诞生的"作为一个概念"它有什么样的内涵
和外延(其 次 是 讨 论 与 大 数 据 相 关 的 一 些 热 点 问
题"比如说"云计 算与 大 数据 的 关 系"大 数 据 与 非 结
构化数据的关系"
=+E\7
与大数 据管理技 术等(我
们还会重点回顾
()*++
,
,
#
-
的发展历史"分析其 技术
本质"从而深入 分析 它在 大数 据管 理 中 的 贡 献 和 地
位"说明
()*++
,
只是大 数据管 理的 一个 成功 案例"
它和传统数据库一起为新形势下的大数据管理提供
了思路上的 启发(然 后"通过 对 传 统数 据 库 发展 历
史)根本目的以及发展成就的回顾"说明大数据和数
据库的发展是一 脉相 承的"大 数据 研 究是 传 统 数据
库回到起点后的重新出发"这个原点就是文件系统(
最后"陈述 我 们 对 于 大 数 据 研 究 的 理 解"分 别 针 对
<@R
数据)决策数据和科学数据三类大数据"说明大
数据研究是典型 的应 用驱 动的"应 该 根据 现 实 的应
用需求确定可能的研究方向和研究内容(结束语部
分给出了一些关于大数据研究的观点(
8
"
大数据概述
897
"
什么是 大数据"
这是个 很自然的 问题(从 认识论的 观点来看 "
人们总 喜欢用类 比的方法 来学习"利用已 有的一些
"
I+J
,
;K@?N4
D
24@@?24
D
Y EF2@4F@
"
计算 机 工程与 科 学
"
"&!#
"
#X
!
!&
$
评论