@font-face{ font-family:"Times New Roman"; } @font-face{ font-family:"宋体"; } p.MsoNormal{ mso-style-name:正文; mso-style-parent:""; margin:0pt; margin-bottom:.0001pt; mso-pagination:none; text-align:justify; text-justify:inter-ideograph; font-family:'Times New Roman'; mso-fareast-font-family:宋体; font-size:10.5000pt; mso-font-kerning:1.0000pt; } span.msoIns{ mso-style-type:export-only; mso-style-name:""; text-decoration:underline; text-underline:single; color:blue; } span.msoDel{ mso-style-type:export-only; mso-style-name:""; text-decoration:line-through; color:red; } @page{mso-page-border-surround-header:no; mso-page-border-surround-footer:no;}@page Section0{ } div.Section0{page:Section0;}
Greenplum 大数据平台基于MPP(大规模并行处理)架构,具有良好的弹性和线性扩展能力,内置并行存储、并行通讯、并行计算和优化技术,兼容 SQL 标准,具备强大、高效、安全的PB级结构化、半结构化和非结构化数据存储、处理和实时分析能力,同时支持涵盖OLTP型业务的混合负载,为客户打通业务-数据-洞见-业务的闭环,可部署于企业裸机、容器、私有云和公有云中,支撑着全球金融、证券、电信、政府、制造、交通运输等各行业的大量核心生产系统。

全球权威研究和顾问公司Garnter在2019 数据分析管理产品和解决方案(Data Management Solution for Analytics, DMSA)行业报告中,从多个角度的12项关键指标中分析了19款重量级产品,Greenplum大数据分析平台排名跃居第三位,仅次于Teradata和Oracle。



从评测图中显示Greenplum在经典数据分析领域位列全球第三,在实时数据分析领域位列并列第四。两个领域中前十名中唯一一款开源数据库产品(这意味着如果选择一款基于开源的产品,前十名中别无选择,唯此一款)。
Greenplum 大数据分析平台的主要优势
处理和分析各种数据源的数据的平台:支持各种数据源,包括 Hadoop、HIVE、HBase、S3、Gemfire、各种数据库和文件等,不需要移动数据,避免了数据加载的复杂性,和其带来的数据不一致的问题。
支持各种数据格式的平台:不管是结构化、半结构化(XML、JSON、KV)还是非结构化,譬如文本数据、GIS数据、图数据等。
具有强大内核的平台:Greenplum 具有强大的内核技术,包括数据水平分布、并行查询执行、专业优化器、线性扩展能力、多态存储、资源管理、高可用、高速数据加载等。
具备强大灵活性和可扩展性的平台:支持扩展(Extension)、自定义类型和函数、PXF和外部表技术。可以使用多种语言实现用户自定义函数和聚集,包括 PL/Python、PL/R、PL/Java、PL/Perl、PL/PGSQL 和 C 等。
支持标准的平台:支持SQL、JDBC和ODBC等行业标准。经过半个多世纪的发展,SQL 成为了数据平台的万向头,向上可以连接各种 BI工具、可视化工具和数据分析工具,向下可以连接各种ETL工具、各种数据源和各种格式的数据等。
集成数据分析平台:支持商业智能(BI)、文本、GIS、图、图像、流式数据处理等。通过Pivotal开源的 Apache 顶级项目 MADlib,Greenplum 可以在数据内部运行 50 多种数据分析和机器学习算法。MADlib 提供 SQL 接口进行数据分析,大大降低了数据分析的门槛;MADlib 内建于数据库内,使用 MPP 的优势,提高了分析的效率;MADlib可以在全量数据而不是抽样数据上进行分析,提高了精度。
开放源代码:2015年10月Pivotal正式把投资超过10年的Greenplum开源,采用Apache 2.0协议,成为世界上第一款成熟的开源MPP数据库。
具备成熟生态系统的平台:Greenplum 生态非常完善,有大量的合作伙伴。




