点击上方蓝字关注我们


YashanDB发展历程
崖山数据库系统YashanDB是深圳计算科学研究院自主设计研发的新型数据库管理系统,2018年深算院成立之前主要是理论体系奠基阶段,提出大数据计算复杂性理论,奠定大数据查询复杂性基础;2018年11月,深算院正式运营,汇聚了一批全球知名学府的青年科学家以及具有多年名企研发经验的资深工程师开启有界计算理论工程化;2021年YashanDB完成一阶段原创理论验证,产品和工程逐步落地,具备核心系统替换能力;2022年v22.2版本正式发布,功能、性能和稳定性等全面加强,和主流的国产操作系统和软硬件进行兼容适配,并在政务、能源和交通等多个行业取得突破。
24年4月,YashanDB正式发布长期支持版本YashanDB V23.2 LTS,新版本经过了严格全面的压力测试,性能、兼容性、易用性、可用性方面有了大幅度提升,产品已全面进入可规模化使用的长期支持阶段。
虽然正式产品发布时间不长,YashanDB已经在银行系统、智慧交通、央企集团等多个行业取得了不错的成绩,尤其是燃气集团核心业务系统上线,标注着YashanDB能够支撑大数据量高并发的场景,是国产数据库产品中有着不错的实力。

YashanDB产品体系架构
YashanDB产品体系包括核心的YashanDB内核、运维平台、开发平台和数据迁移平台等几大组件。

YashanDB内核代码是从第一行代码开始写的,经过权威机构的测试,代码自主率100%,并且在经典数据库理论基础上实现了诸多原创理论的突破,如有界计算、近似计算、异步并行执行、跨模计算等,在面向海量数据的处理、大并发事务处理,以及不同模态数据的混合查询等不同场景时都具备领先优势。据其公布的测试结果看,单机tpmC性能是Oracle单机的1.2倍,是MySQL的2.5倍,共享集群tpmC性能是Oracle共享集群的1.4倍。

部署形态上,YashanDB支持单机/主备部署、分布式集群部署和共享集群部署等三种部署方式,可同时支持混合负载能力,并且其所有部署形态均构建在同一个内核引擎之上,这也契合当下融合内核架构一体化数据库的趋势,算是在国产数据库中做的比较好的。对于最终用户来说,只需要管理一种内核的数据库,学习和运维成本下降不少。
Oracle RAC(Oracle Real Application Clusters)共享集群技术长期以来是高端市场的“王牌”,是国产替代最难攻下的技术堡垒之一。因此大部分国产数据库厂商都采用“弯道超车”的策略,采用分布式系统架构来解决高可用问题。YashanDB共享存储集群采用和Oracle RAC相同的Share Everything架构,共享存储,所有实例均可对外提供读写服务,实例之间通过全局缓存实现数据交换。共享存储集群对应用透明,集群内各实例数据强一致,无需业务做额外的改造,能够实现实例级快速故障检测和透明切换能力。

YashanDB存储引擎支持行存、列存和混合存储引擎等多种存储结构和加速模式,In-place Update行存引擎提供了极致的事务处理能力,In-place Update列存引擎提供了混合负载能力,Append-only列存引擎提供极致分析性能,通过支持不同的加速结构来提升性能。同时YashanDB还提供基于自研的文件系统打造了统一的存储底座,提供卷管理能力及标准的文件系统接口。
YashanDB优化器基于统一的自适应COST模型、静态/动态重写能力,构建了原生HTAP优化框架,支持单机和分布式计划的生成,智能选择行列混合执行计划,并融入向量化执行、分布排序属性,支持B-Tree索引、稀疏索引、R-Tree索引、AC物化视图等各类型加速结构,确保无论针对TP的短小交易,还是针对AP的大数据批量操作,都可以选择出最佳的执行方式。
YashanDB在SQL语法、表达式运算、FILTER CONDITION、数据类型、内置函数、系统视图和PL等基本功能上均与Oracle数据库兼容,数据库管理和开发人员不需要花费大量的时间去学习新知识,在已交付特性上直接查阅Oracle相关文档,即可流畅地操作使用YashanDB,实现从Oracle数据库到YashanDB的平滑迁移。此外,也提供了MySQL数据库的兼容性功能,并且通过控制开关,满足不同数据库底层架构和产品形态差异带来的功能兼容性问题。
深圳计算科学研究院成立于2018年11月,是深圳市政府批准建设的“十大基础研究机构”之一,以建设世界一流的计算基础科学研究机构为目标,致力于打破国外技术垄断,打造中国原创的基础软件品牌。借鉴贝尔实验室的成功经验,深算院采取“理论+工程”双轨科研创新模式,以市场需求为导向,推动源头创新及关键核心技术的突破,并实现大规模的产业应用。作为对标贝尔实验的机构,其目标愿景可谓远大,对Oracle的兼容也可谓是“极致”,以至于笔者学习的时候都有些恍惚,分不清到底是在学习Oracle还是在学习YashanDB,以至于20年的老Oracle DBA可以信心满满的说,YashanDB我也可以搞定!

写在最后
近几年乘着信创的东风,涌现出大量的国产数据库产品,都宣称自己独立创新,可是懂行的知道真正的创新能有多少。即便是诸如YashanDB号称100%自主代码,但是在我们看来,仍然是大量的模仿模仿模仿!当然,毕竟关系型数据库理论已经诞生了50多年,毕竟基于关系型理论的Oracle是这个领域无可争议的绝对霸主,对于国产数据库,我们也应该都足够的宽容和耐心,先模仿再创新,也是当下比较现实的路线,期望在不久的将来,能够诞生出超越国产巨头的国产数据库产品。

数据最前线
身/边/的/数/据/架/构/师




