下一代大数据分析
• Volume
– 海量数据 & 指数级增长
• Variety
– 多结构化,来自不同来源 & 不一致的数据模式(schema)
• Value
– 简单(SQL): 描述性分析(descriptive analytics)
– 复杂(non-SQL): 预测性分析(predictive analytics)
• Velocity
– 交互式分析 (the speed of thought)
– 流式分析 (drinking from the firehose)
Apache Spark 软件栈
2
评论