暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

叶正盛:阿里云数据库PolarDB与RDS

DataFunSummit 2021-12-06
3981


分享嘉宾:叶正盛 阿里巴巴

编辑整理:郭天天 Golden Tech

出品平台:DataFunTalk


导读:随着计算和数据上云的趋势快速发展,以及数据库技术的不断更新,传统数据库步履蹒跚,云原生数据库利用云原生技术最大化的发挥池化的计算和存储资源弹性将是未来的发展趋势。同时随着AI技术的不断深入使用,数据库也将会越来越智能化,阿里云的目标是实现数据库的完全自动化和智能本次分享的主题是阿里云数据库PolarDBRDS,同时探讨云数据库的发展。

本文将围绕下面四点展开:

  • 数据库背景与趋势

  • RDS

  • PolarDB

  • 总结

01
数据库背景与趋势

首先和大家讲述一下数据库的发展历程。数据库与计算机技术是同时发展的,其基础设施就是计算机以及网络。

1. 数据库发展历程

上图中可以看出数据库技术在不同历史时期的发展情况,随着计算机技术和网络技术的不断发展,数据库技术也经历了从传统的商业数据库,逐步向开源数据库,以及今天发展势头最为迅猛的云数据库的过程。

2. 全球云数据库的市场格局

在全球云数据库市场中,Aws,Azure, Alibaba 分列一、二、三位。在中国数据库市场中,Alibaba已经超过了Oracle的市场份额,位列第一。

在云数据库方面,阿里也位于全球领导者的位置,同时华为,腾讯也进入了Gartner 2020数据库魔力象限。可以看出云厂商发展非常快,云是数据库最重要的发展方向,在未来的评估中,不再单独评估数据库技术,而是云和数据库一起评估。

Gartner在2019年给出预测,到2022年预计75%的数据库都会位于云上,同时在Gartner数据库魔力象限中可以看出,主要云厂商在2020年全部进入数据库领域最有影响力的领导者,而在2013年都是由传统数据库厂商占据数据库领导者位置,所以Gartner认为,云是数据库的未来。

3. 传统自建数据库管理的挑战

为什么说云是数据库的未来,首先需要了解传统自建数据库的一些问题。传统自建数据库可以分为两个类别,一种是传统自建商业数据库,另一种是传统自建开源数据库。两种自建的数据库各自存在如下的一些问题:

针对上述这些问题,云数据库应运而生。

4. 云数据库产品四大基础特性

对云数据库做个总结,其具有以下四个基础特征:

  • 简单易用,像水电一样只要接入,开户就可以直接使用;

  • 弹性伸缩,资源按量使用;

  • 比较高指标的安全稳定;

  • 避免传统数据库机房规划,服务器采购费用、流程,负载高时需要满足业务需求,云数据库就比较灵活,可以按需付费,传统数据库难以做到。

以上是对数据库领域,包括趋势,传统数据库与云数据库之间的对比。接下来,重点分享下阿里云在云数据库领域的思考和实践。

02
关系型云数据库RDS
1. 安装部署简单易用,按需付费

通过上图的比较可以看出,云上RDS只需轻点鼠标,就可以完成一站式的部署,而如果采用传统数据库的方式,复杂度会比较高。

2. 数据库自动驾驶

在数据库自动驾驶之前,以阿里为例,DBA数量众多,用来保障数据库的稳定运行,后来随着阿里业务的快速发展,DBA已经很难支持业务发展的诉求,所以后来阿里做了数据库自动驾驶。从数据库角度,自动驾驶需要包括如下几方面的能力:

① 自动优化和故障修复

在做数据库管理方面,经常遇到的问题,此类问题非常棘手,尤其是临时故障,需要快速响应(传统数据库运维只能做到小时级恢复),自动优化数据库,快速隔离故障,保证系统稳定运行。

② 自动容量评估和扩缩容

传统数据库管理非常难做,但是在云环境中,由于做到了资源池化,扩缩容具备了底层了资源和技术基础,系统可以根据业务负载自动调整。

③ 自动安全保护

安全保护是云上管理的核心诉求,保证全链路中数据存储和传输是安全加密的,另外对SQL注入,SQL后端审计都是基本诉求,保证数据库稳定安全的运行。主流云厂商都在做以上方面的事情。

数据库自动驾驶技术是永无止境的,会一直发展,尤其是在一些极端情况下,可以保障数据库安全,稳定的运行。

下图是阿里云RDS自动驾驶的一个例子

在RDS的数据库中,是可以配置自动优化,自动限流,扩缩容等选项,配置好之后,数据库就开启了自动驾驶模式。例如SQL诊断,SQL自动优化,自动建索引等,都可以自动配置,当CPU使用率达到一定阈值后,可以做自动限流,扩缩容,这在故障恢复的时候会特别方便。反之,如果靠DBA的监控和运维保障的话,故障恢复可能是小时级别的,但是在自动驾驶模式下,故障恢复是秒级或者分钟级的,这对系统稳定性是非常重要的。

3. 数据库安全

RDS在安全方面的也做了很多工作,从接入层、网络层、代理层、引擎层到存储层各个层面,都有相应的安全保障技术。

从安全技术的评估而言,云上数据库在基础安全方面比自建数据库更加全面。

4. 数据库可用性(SLA)

在可用性这方面,可以达到4个9(每年最多52分钟不可用),甚至5个9。

目前阿里云RDS的使用规模比较大,在规模上,有很多经验积累,在硬件选型和压测方面,都有专门的团队,会选择最稳定的硬件,来保证系统的高可用。另外,阿里云数据库和阿里巴巴集团内部的数据库是一致的,也经历过多次双11活动的业务考验。

03
云原生数据库PolarDB

1. 云原生数据库领导者PolarDB

PolarDB目前是阿里云增长最快的数据库,也是云原生数据库的领导者。同时,获得了很多国际国内的技术大奖。

PolarDB 非常重要的一点是软硬件结合。当今的数据库在性能方面,IO是最重要的方面,分为数据IO和网络IO。

  • 数据IO:内存和传统HDD磁盘之间有非常大的GAP,最近几年在Optane(分页式内存)方面有非常多的实践,这对于数据库来说可能会带来革命性的变化。

  • 网络 IO:RDMA是PolarDB中最核心的,因为要做存储计算分离,如果采用普通TCP网络,是有很大的瓶颈,采用了RDMA后可以把延时降到很低。

2. PolarDB的架构与特性

下图的左面部分是PolarDB的架构。

PolarDB的架构:最底层是一个分布式存储PolarStore,采用分布式协议ParallelRaft,保证数据的高可靠。中间一层是数据库引擎,称之为计算节点,与PolarSore通过RDMA高速网络连接,计算节点可以横向扩展。

PolarDB目前是由一个主节点,最多15个只读节点组成,在下个版本中,会提供多写能力,多个主节点可以同时写入。

最上面的PolarProxy是一个智能代理,根据业务负载,事务特征,自动路由到不同的计算节点。

PolarDB的主要特性包括完全兼容Mysql,PostgreSQL,高度兼容Oracle。快速弹性能力,没有主备延时,高QPS以及最大支持100TB的存储,自动读写分离。

PolarDB的增长趋势:去年在线教育以及游戏行业增涨很快,中国80%的游戏企业都在用PolarDB。

3. PolarDB弹性扩展

PolarDB可以快速进行scale-up以及scale-out横向加只读节点。对业务没有影响,不需要停机,改应用。添加只读节点后,负载可以自动路由到计算节点上。

另外,PolarDB也可以做到全球多可用区部署,负载自动路由,自动全球负载均衡,尤其适合跨区域性企业的业务。

04
总结

PolarDB 和 RDS 都应用在了双11场景,去年双十一,数据库请求达到了8700万次/秒的查询,传统的数据库架构很难满足这样的场景。

去年,尤其是在线教育领域,因为受疫情影响,无法评估负载,业务有波峰波谷负载的特点,希望数据库可以快速扩容,所以PolarDB的快速弹性扩展能力,非常适用于这样的场景。

最后做一个总体的总结:

在数据库领域有非常多的思考,在阿里内部最早去IOE, 异地多活,云计算,自研数据库技术,在这个过程中总结了6大关键技术,也是未来企业级数据库非常关键的技术。

  • 据库、数据仓库和大数据的一体化,通过底层分布式存储的高扩展能力+数据库的核心技术,一体化的趋势已经非常明显。

  • 云原生和分布式,PolarDB是一个典型的云原生数据库,存储计算是分离的,未来会做CPU和内存的分离架构,目前的弹性扩展是分钟级,未来可以做到秒级弹性扩展。

  • 智能化,主要是采用机器学习的技术来保证数据库的自动驾驶,尤其是故障诊断、异常检测方面,通过机器学习的算法准确的发现异常,一旦触发,会匹配对应的专家经验流程另一方面就是数据库与AI的结合,数据库中集成了AI的一些算法,做一些图像以及视频的智能化识别。

  • 多模,数据库需要同时具备多种类型数据的处理。

  • 软硬件一体化,PolarDB是典型的代表。

  • 安全可信,无论传统数据库,还是云数据库,由于数据是企业核心资产。安全可信尤为重要。尤其是在可信的日志和计算,全链路加密都是有比较大的技术挑战。

今天的分享就到这里,谢谢大家。


在文末分享、点赞、在看,给个3连击呗~


分享嘉宾:

活动推荐:

小伙伴们,DataFun年终大会又来啦,在今年的大会上,我们不但会回顾当下的热门技术方向,同时还将对未来的技术趋势进行分享总结。其中,我们也设置了大数据云原生论坛,感兴趣的小伙伴,欢迎识别下图二维码,免费报名参与~

关于我们:

DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请近1000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章500+,百万+阅读,12万+精准粉丝。

🧐分享、点赞、在看,给个3连击呗!👇

文章转载自DataFunSummit,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论