6.1SparkSQL 实例创建与使用
课程介绍
本课程将带领您在已经部署 SequoiaDB 巨杉数据库引擎及创建了 MySQL 实例的环境中,进行 SparkSQL 实例的安
装部署并启动 Spark Thrift Server 服务使用 Beeline 客户端进行数据操作。
SparkSQL 简介
SparkSQL 是 Spark 产品中一个组成部分,SQL 的执行引擎使用 Spark 的 RDD 和 Dataframe 实现。目前 SparkSQL
已经可以完整运行 TPC-DS99 测试,标志着 SparkSQL 在数据分析和数据处理场景上技术进一步成熟。SequoiaDB
巨杉数据库为 Spark 开发了 SequoiaDB for Spark 的连接器,让 Spark 支持从 SequoiaDB 中并发获取数据,再完成
相应的数据计算。
Spark Thrift Server 介绍
Spark Thrift Server 是 Spark 社区基于 HiveServer2 实现的一个 Thrift 服务,旨在无缝兼容 HiveServer2。
Spark Thrift Server 的接口和协议都和 HiveServer2 完全一致,因此部署好 Spark Thrift Server 后,可以直接使用
hive 的 beeline 客户端访问 Spark Thrift Server 执行相关语句。
请点击右侧选择使用的实验环境
部署架构:
本课程中 SequoiaDB 巨杉数据库的集群拓扑结构为三分区单副本,其中包括:1 个 SparkSQL 实例节点, 1 个引擎
协调节点, 1 个编目节点与 3 个数据节点。
详细了解 SequoiaDB 巨杉数据库系统架构:
SequoiaDB 系统架构
评论