大数据
Hadoop
之——
DorisDB
介绍与环境部署
(
StarRocks
)
一、
Apache Doris
和
DorisDB
、
StarRocks
之间
的关系
Doris
最早是解决百度凤巢统计报表的专用系统,随着百度业务的飞速发
展对系统进行了多次迭代,逐渐承担起百度内部业务的统计报表和多维分
析需求。
2013
年,我们把
Doris
进行了
MPP
框架的升级,并将新系统
命名为
Palo
,
2017
年我们以百度
Palo
的名字在
GitHub
上进行了开
源,
2018
年贡献给
Apache
基金会时,由于与国外数据库厂商重名,
因此选择用回最初的名字,这就是
Apache Doris
的由来。
2020
年
2
月,百度
Doris
团队的个别同学离职创业,基于
Apache
Doris
做了自己的商业化闭源产品
DorisDB
,这就是
StarRocks
的前身。
【总结】
Doris
属于百度的,
Apache Doris
是有百度贡献给
Apache
的,
DorisDB
是百度前员工基于
Apache Doris
做的商业版本属于另外的公司,后面因为版权的问
题,将
DorisDB
改名为
StarRocks
,所以
StarRocks
和
DorisDB
是属于一个产品,
一个公司的。不知道小伙伴,还记不记得另外一个产品的经历跟
Doris
的经历非常的相
似,那就是
presto
。这里主要讲
StarRocks
,因为
StarRocks
更新迭代很快,活跃
度也高。
Apache Doris GitHub
地址:
https://github.com/apache/doris
Apache Doris
官网文档:
https://doris.apache.org/docs/get-starting/get-
starting.html
StarRocks GitHub
地址:
https://github.com/StarRocks/starrocks
StarRocks
官方文档:
https://docs.starrocks.com/zh-
cn/main/introduction/StarRocks_intro
二、
StarRocks
概述
StarRocks
是一款高性能分析型数据仓库,使用向量化、
MPP
(
Massively
Parallel Processing
:大规模并行处理) 架构、可实时更新的列式存储引擎等技
术实现多维、实时、高并发的数据分析。
StarRocks
既支持从各类实时和离线的数据
源高效导入数据,也支持直接分析数据湖上各种格式的数据。
StarRocks
兼容
MySQL
协议,可使用
MySQL
客户端和常用
BI
工具对接。同时
StarRocks
具备水
平扩展,高可用,高可靠,易运维等特性。广泛应用于实时数仓、
OLAP
报表、数据湖
分析等场景。
评论