import

原创毛毛 2020-07-02

511

Hive + sql(数据类型) + 参数配置(SparkConf, SparkContext)

import org.apache.spark.sql.hive.HiveContext
import org.apache.spark.sql._
import org.apache.spark.{SparkConf, SparkContext}

为了让Spark能够访问Hive，必须为Spark添加Hive支持。Spark官方提供的预编译版本，通常是不包含Hive支持的，需要采用源码编译，编译得到一个包含Hive支持的Spark版本。
Spark的所有数据类型都定义在包org.apache.spark.sql中，你可以通过import org.apache.spark.sql._访问它们。
每个Spark程序都是需要导入SparkContext的. SparkContext使得Spark驱动的程序access the cluster through a resource manager(YARN, or Spark’s cluster manager)。为了建立SparkContext首先需要创建SparkConf.SparkConf存储构造器参数，这些参数将由你编写的程序传入SparkContext。
'. _ '用于隐式导入包中全部内容

scala

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

import

评论