分布式数据库
分布式(with data sharding)数据库是分布在计算机网络上,逻辑上相互关联的数据库。 分布式数据库可以分散在多个位置,不同位置的计算机中存有数据库管理系统的一份完整拷贝副本或部分拷贝副本, 通过网络互相连接,共同组成一个逻辑上集中、物理上分散的大型数据库。
分布式数据库对数据进行分片(sharding),通过全局事务处理模块和分布式查询处 理模块支持原生支持分布式事务和全局复杂查询。
分布式数据库通过数据分片的方式,每个节点来管理一个数据分片,可以通过增加分片来支撑数据的增长,不仅可以提升数据库的可扩展性,而且能够为客户带来更多业务价值。
分布式数据库优点
分布式数据库在灵活性和扩展性方面具有优势,一方面分布式给予了每个部门根据其应用程序的特定需求选择软硬件的自由,不必因为共享IT架构而做出妥协;另一方面分布式IT架构天生自带可扩展属性,能够根据业务规模实现无限弹性扩展。
-
弹性扩展:通过横向扩展解决了单机性能上限和业务数据量增长不匹配的问题;
-
高度可用:即使系统中的某些节点不可用(断电、系统崩溃等),也不影响其他节点正常工作,保证了面向用户的高可用;
-
成本控制:企业可以选取较低配置的硬件。
分布式的事务管理机制, 不存在中心化的事务管理模块, 实现了真正的分布式事务。分布式数据库在数据可靠 性、副本同步、查询性能、数据一致性、服务可用性等方面都优于分布式中间件。
分布式数据库缺点
-
复杂性:多节点横向分布提升了架构设计、运维、迁移的难度;
-
安全性:远距离访问和网络通信传输带来了安全和保密方面的风险;
-
数据完整性:多节点读写对事务性提出挑战。
分布式数据库代表
分布式OLTP数据库业界代表包括Spanner、GaussDB(openGauss)、OceanBase、PolarDB-X、 TiDB、CockroachDB、 Yugabyte、TDSQL等。
分布式OLAP数据库业界代表包括TeraData、Greenplum、GaussDB(DWS)、AnalyticDB、 Bigquery、 Clickhouse等。
分布式HTAP数据库业界表包括 SAP HANA、TiDB等。
分布式架构与集中式架构





