暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
Spark大数据分析平台.pdf
41
5页
0次
2025-01-11
免费下载
技术成就梦想
@ DataGuru 专业数据分析社区 网址:edu.dataguru.cn
1
Spark 大数据分析平台
2015 年, Spark 只用了一年多时间,已实现开源到火爆 逐渐显露出与通用大数据平台
Hadoop 的分庭抗争之势。在这个大背景下,在大数据领域时代,谁将是独领风骚?Spark
无疑是最大的竞争者,无论是 2015 Spark 技术峰会 ,还是国内的大数据大会,可以看到
中国力量正在崛起,Spark 最大的集群来自腾讯——8000 个节点, Job 最大分别是阿里
巴巴和 Databricks——1PB,震撼人心!同时,截止 2015 6 月,Spark Contributor
2014 年涨了 3 倍,达到 730 人;总代码行数也比 2014 年涨了 2 倍多,达 40 万行,不
但大量的互联网企业已经在使用或者正准备使用 Spark而且大量的电信、金融、证券和传
统企业已经开始引入了 Spark
然而作为一个高速发展中的开源项目,其部署过程中存在的门槛和挑战亦不可谓不,本课
程将主要介绍 Spark1.4.0,引领大家进入大数据 Spark 入门。
课程大纲:
第一课:Spark 生态和安装部署
Spark 概述
Spark 现状
安装部署
Spark 安装简
Spark 的源码编译
Spark Standalone 安装
Spark Standalone HA 安装
Spark 工具
Spark 交互式工具 spark-shell
Spark 应用程序部署工具 spark-submit
第二课:Spark 编程模型和解析
Spark 的编程模型
RDD 的特点、操作、依赖关系
缓存策略
广播变量和累加器
技术成就梦想
@ DataGuru 专业数据分析社区 网址:edu.dataguru.cn
2
Spark 编程环境搭建
Spark 编程实例
第三课:Spark 运行架构和解析
Spark 的运行架构
基本术语
运行架构DAGSchedulerTaskSedulerTask、容错性、推测机制、数据本地性)
Spark on Standalone 运行过程
Spark on YARN 运行过
第四课:hive 入门
hive 的运行架构
hive 的安装
hive 的实例演示
第五课:SparkSQL 原理和实践
Spark 的运行架构
Catalyst
sqlontext
hiveContext
ThriftServer CLI
ThriftServer
CLI
SparkSQL 的实例演示和编
spark-shell 实例演
spark-sql 实例演示
SparkSQL 的编
第六课:SparkStreaming 原理和实践
SparkStreaming 原理
SparkStreaming 的原
SparkStreaming 的运行方
of 5
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜