今天聊一聊分布式系统的奠基石CAP理论

杨磊

776

14页

0次

2020-08-18

5墨值下载

【引言】

这是一篇有关于



原理论的技术类文章。

前两天个人公众号推了一篇文章讲述在分布式系统中如何保持数据一致性的算法



《分布式一致性算法：



算法学习》

链接：



今天再来学习下分布式系统设计的一个指导理论：

CAP

理论。

中午看一篇微信推文《互联网不相信学渣》

链接：

https://mp.weixin.qq.com/s/Yx69k_LQmOesknSw4GS5nA

提到了今年闹得沸沸扬扬的“读书有用论”，年薪



万元的华为“天才少年”奖获得者张霁

在接受采访时，对“年薪”的回应：“有人开过

300

万，我拒绝了。”

顺着往下看，文中又提到网易高级副总裁的周枫。

因自己在用有道云笔记和有道词典，感觉不错就多关注了周枫。

以下来自百度介绍周枫：

周枫，江苏宜兴人。周枫分别于



年和



年在清华大学获得计算机学士和硕士学

位，



年于加州大学伯克利分校获得博士学位，主要研究兴趣是面向大规模服务的软

件基础设施、操作系统和编程语言。

现任网易高级副总裁，网易有道



。加入网易后，主持有道词典开发，有道搜索平台架

构，密码认证系统“将军令”开发。

周枫



年研究生毕业时，带着



满分（



分）的成绩和优异的学术成果，选择

加州大学伯克利分校计算机系攻读博士研究生。在伯克利，周枫的导师是

 !""

，

研究分布式系统和操作系统。

!""

教授是美国国家工程院院士，分布式计算领域的顶

级专家。

##

年，他与人共同创建了著名搜索引擎公司

$%&

，曾是纳斯达克



指

数成分股，后来被

'(

收购。

看到这里，你可能会问，这和分布式领域著名的

CAP

理论有啥关系。

其实，就是这个

Brewer

教授提出了著名的“

CAP

理论”。

“

CAP

理论”——任何基于网络的数据共享系统，最多只能满足一致性

%"%)

、可用

性

*++)

、分区容错性

% +"%"

三要素中的两个要素；这个定理也被称

为

!""

理论。

那么

CAP

理论是基于什么背景出现的呐？

大家都知道对于单机系统和集中系统是指一台或多台主计算机组成的中心节点，并数据和

业务处理逻辑都集中于这个中心节点上，客户端仅仅负责数据的录入和展示。集中式系统

的最大优点就是部署简单，同时不需要考虑分布式系统的协作问题。

但，分布式系统被部署在不同网络环境



不同节点

分区

的系统，通过网络进行互联互通，

通过数据的冗余来达到高可用（主备机切换）、高吞吐（备机分担读压力）的能力；而网

络传输不可信、不稳定是一共识，网络问题是分布式系统不可避免的问题，并且是一定会

发生的问题。

如果要保证分布式系统各节点间的强一致性，整体系统的可用性就会降低，（举例：数据

库通过网络进行主从库之间的数据拷贝，要等到所有的变更落盘在从库，系统才能对外提

供一致性的数据服务；但当其中一个从库不可达，或者网络异常不能传输同步数据时，这

个情况下系统的数据服务就变得不可用）。

而，可用性在系统中又是基本性能指标，因此在设计分布式系统时会根据其业务特性在一

致性和可用性之间进行权衡。因此在设计分布式系统时会根据其业务特性在一致性和可用

性之间进行权衡。

这时候，著名的



理论就别提出来了，其指分布式系统在一致性

%"%)

、可用

性

*++)

、分区容错性

% +"%"

只能同时满足其中两种。通过一些显式

处理分区情形，系统设计师可以做到优化数据一致性和可用性，进而取得三者之间的平衡。

但，



理论一定是对的吗？

这个问题多少问的有点欠揍，毕竟前面吹了



理论这么多彩虹屁。

以下转一篇



理论提出者

 !""

教授在

.' /0 

的一篇文章

《

 1"+*" '" 2" 3 " 45+"4 3*" %6"

》点击链接

%78+"9"+*"9)"9+"99"95+"9*"9

%6"

译文如下：

《



理论十二年回顾：

规则

变了》

%78%+"9"+*"9)"9+"99"95+"9*"9

%6"

以下文章版权属

$%7:

社区。



理论断言任何基于网络的数据共享系统，最多只能满足数据一致性、可用性、分区容

忍性三要素中的两个要素。但是通过显式处理分区情形，系统设计师可以做到优化数据一

致性和可用性，进而取得三者之间的平衡。

自打引入



理论的十几年里，设计师和研究者已经以它为理论基础探索了各式各样新

颖的分布式系统，甚至到了滥用的程度。

;<:2

运动也将



理论当作对抗传统关系型

数据库的依据。



理论主张任何基于网络的数据共享系统，都最多只能拥有以下三条中的两条：

-

数据一致性（



），等同于所有节点访问同一份最新的数据副本；

-

对数据更新具备高可用性（



）；

能容忍网络分区（



）。

of 14

5墨值下载

cap理论

关注

评论