暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

「分布式技术专题」数据分布(数据复制、数据分片及优劣势)

原创 天云数据 2021-03-02
391

数据复制

对于那些需要在多个场地上对数据进行更新的应用来说,自动快照的功能就显得很不够了。这些应用要求同一个表的多份拷贝在多个场上进行维护。把数据复制到远程节点,使数据更容易被系统中的较远的用户访问,从而境加了系统的本地自治度。分布式数据库必须解决一个重要问题是,保持所有拷贝的同步更新。

当同一表的多个拷贝存在时,访问这些分布数据的用户应该不会察觉这些副本的位置。否则,用户必须依靠系统当前的位置和当前维护的副本的编号进行修改。

复制、数据一致性和位位置透明性都是分布式数据库复制数据时要完成的功能。这些功能在设计和实现上都有一定难度。有些难题只能通过限制对分布式数据的访问来解决。

数据分片

数据复制是针对整个表的,数据分片处理对象是表的部分数据。可以说复制是分片的一种特殊情况。数据分片是和中复杂的数据分布技术。基本地自治度不如数据复制高。但是,数据分片和数据复制都且有实现复杂的缺点。特别是考虑到应用对数据进行透明访问时。这一缺点更为突出。

数据分布分析

分布式数据的位置取决于逻辑数据和处理(读或更新)模式,信息量及其它特征;数据分片是降低整个分布式系统开销的有效方法。

优势与劣势

优势

  • 更适合分布式的管理与控制。分布式数据库系统的结构更适合具有地理分布的特性的组织或机构使用,允话分布在不同区域、不同级别的各个部门对其自身的数据实行局部控制。
  • 具有灵活的体系结构。分布式ovgt据库系统的场地局部的自治性,使得大部分的局部事务管理和控制能就地解决,只有在涉及其他场地的数据时才需要通过网络作为全局事务来管理。
  • 系统经济,可靠性高,可用性好:与一个大型 计算机支持一个大型的数据库在加一些时程和远程终端相比,由超级微型 计算机或超级小型计算机支持的分布式数据库系统往往肯有更高的性价比和实施灵活性。分布式系统比集中式系统具有更高的可靠性和更好的可用性。
  • 在一定条件下响应速度加快,如果存取的数据在本地数据库中,那么就可以用户所在的计算机来执行,速度就快。
  • 可扩展性好,易于集成现有系统,也易于扩充。

劣势

  • 通信开销大,故障率高。
  • 数据的存取结构复杂。一般来说,分布时数据库中存取数据,比在集中时数据库中存取数据更复杂,开销更大。
  • 数据的安全性和保密性较难控制。在具有高度场地自治的分布时数据库中,不同场的局部数据库管理员可以采用不同的安全措施,但是无法保证全局数据都是安全的。安全性问题是分布式系统固有的问题。因为分布式系统是通过通信网络来实现分布控制的,而通信网络本身去在保护数据的安全性和保密性方面存在弱点,数据很容易被窃取。

面临挑战

•数据的分布对数据的管理理出了更高的要求。分布式数据库管理系统肯有管理分布数据的功能,使用户感觉不到数据是分布的。即用户不必知道数据是否分片、是否有副本、数据存放在哪个节点上以及事务在哪几个节点上执行并能保证前后数据的一致性。
•分布式数据库系统就是分布透明的。数据分杣策略的好环直接影响到分布式数据库的性能。

以上为数据分布(数据复制、数据分片及优劣势),「「分布式技术专题」是由hubble数据库团队精心整编,专题会持续更新,欢迎大家保持关注。

最后修改时间:2021-04-01 17:00:00
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论