【即学即用的Spark实战系列】开篇

AI自然语言处理与知识图谱 2020-04-15

359

Spark实战系列

首先说一下关注Spark的原因。Spark是处理大数据的常用手段之一，在百万级数据量的工业界应用广泛。在实习的时候因业务需要，需要处理海量数据，但是在本硕期间从未接触过大数据相关知识与工具，所以对这一块的知识需要弥补，我相信，这也是很多应届生从校园到公司要弥补的技术之一。最近，拉钩教育推出【即学即用的Spark实战44讲】，定期更新，借此机会，我将从零开始，理论实践结合学习Spark，并会定期整理知识点和代码进行分享。有需要的同学，可以和我一起交流学习。

说明：本系列内容来自拉钩教育【即学即用的Spark实战44讲】课程，本人学习总结，课程链接如下：

https://kaiwu.lagou.com/course/courseInfo.htm?courseId=71

导语

本篇文章是【即学即用的Spark实战系列】的开篇文章，将大体介绍讲师简历、Spark起源，课程结构等内容。

讲师介绍

范东来

Spark和Superset的Contributor

《Spark 海量数据处理》的作者

《Hadoop 海量数据处理》的作者

Apach Spark

诞生于 2009 年的 Apache Spark，目前已成为全球范围内最流行、功能最全面、社区最活跃的大数据处理技术。在所有大数据处理技术中排名第一，在Github开源项目上面获得关注25.7k个star，共有1486位贡献者的参与(数据统计至20200415)。

此外，Spark在资本市场也得到了极高的认可，其背后的商业化公司得到了62亿美元的估值。目前，绝大多数公司和组织都是基于Spark生态搭建大数据平台，构建支持业务的数据管道。可以说，提到大数据处理，Spark是一个无法避免的话题。

另外，Spark也很适合数据科学家与数据分析师进行中小规模数据处理，多语言接口与SQL支持让它赢得了很多分析师用户，而且这部分用户中Spark使用者的占比也越来越大，俨然成为了数据工程与数据科学的通用方案。

无论你是数据分析师、大数据工程师、大数据架构师，总之接触到海量数据的同学都可以尝试Spark，面对各种应用场景，看看能否提高效率、满足需求。

课程设计安排

本课程共有7个模块，是一个从0到1的过程。如下图，(图片来自于课程)。

结束语

本人觉得这个课程干货满满，将逐步学习并实践，如果有同学对这项课程感兴趣，欢迎和我一起学习，可以通过这个公众号或者是加我微信好友(关注后菜单栏有微信二维码)，随时交流。

AINLP与知识图谱旨在深度学习、自然语言处理、知识图谱、搜索推荐、大数据、相关竞赛等技术分享与解读。

欢迎扫码，关注我们！

你和我成长的加油站

成长的旅途是孤独，也是人生

您的在看是我们进步的动力!

↘↘↘

数据库

文章转载自AI自然语言处理与知识图谱，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。

【即学即用的Spark实战系列】开篇

评论