
在这个数据驱动的时代,数据库作为IT基础设施的基石,正以前所未有的速度推动着各行各业的发展与创新。
为了紧跟时代步伐,引领前沿技术,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第15届中国数据库技术大会(DTCC2024)将于2024年8月22日至24日在朗丽兹西山花园酒店隆重召开。
转发文章并留言“赠票”,瓜分十张赠票。每张赠票价值3000元,先到先得,还等什么。
获得赠票的小伙伴们需要提供“姓名、邮箱、手机号、公司、部门、职位”等信息,信息收集后需要会务组审核,
大会主题:自研创新 数智未来
亮点纷呈
1.超百位行业专家齐聚一堂:大会将邀请超过百位数据库领域的顶尖专家和学者,分享他们在数据库技术创新与应用实践中的最新成果和宝贵经验。这些嘉宾来自国内外知名企业、高校及研究机构,他们的真知灼见将为参会者带来深刻的行业洞察和技术启发。
2.前沿技术深度解析:随着人工智能、大数据、云计算等新技术的不断发展和应用,数据库技术也迎来了新的变革。本次大会将围绕数据库内核技术、向量数据库、分布式数据库、云原生数据库等前沿领域展开深入探讨,为参会者揭示未来数据库技术的发展方向。
3.实践案例广泛分享:大会还将邀请多位来自知名企业的嘉宾分享他们在数据库应用实践中的成功案例。这些案例涵盖了金融、互联网、大数据处理、云计算等多个领域,为参会者提供了丰富的实践经验和借鉴价值。
展望未来
中国数据库技术大会(DTCC)作为数据库领域的顶级盛会,已经陪伴中国数据库行业走过了多年的风雨历程。在未来的日子里,DTCC将继续秉承一贯的干货分享和最佳实践精神,为广大数据领域从业人士提供一个交流思想、分享经验、探索未来的重要平台。
我的主题:《为什么大型数据库需要共享池》
关于要不要共享池、共享池好不好,这是一个仁者见仁、智者见智的问题,并不是我的主题。我这次分享,其实更关注底层。数据库,特别是OLTP数据库,一直被归属于基础软件,但我们对“基础”的研究,尚大大不足。我在去年曾指出opengauss执行相同逻辑的SQL,CPU Instructions(指令数)数倍于原生PG、MySQL和Oracle,就是对“基础“二字理解不足的结果。
数据库程序的特点十分鲜明,显著区别于其他应用程序。比如一次极简SQL的执行,也会有20多万个跳转指令(而且这只是极简SQL):

上图是postgresql 15.7中的统计结果,SQL是select 。。。from 。。。where 主键列=?。这是最简单的SQL了,使用了25,423个分枝跳转指令。占总指令数的24%,平均每4.17条指令,就有一个分枝跳转指令,这几乎能撑爆大部分CPU的BTB。
CPU BTB爆掉的直接后果,每执行一条SQL,CPU的分枝预测率准确率,都不会太高,也就80%上下。而CPU厂商公布的,这一数字通常都接近100%。
这导致你寄希望编译器、CPU让你的分枝/条件/循环以最佳的方式运行,你认为它们帮你做到了,但实际上并没有。这还不是最关键的问题,只是举个例子,最关键的问题是,“我们并不知道出了问题“。
我儿子在一岁多时,曾经在盛夏时分带他出去玩过一次,他并不知道去找有空调的地方乘凉,热的小脸红扑扑的,但也无动于衷,因为当时他还不知道有”空调“,在他的认知中,热,是正常且无解的,这并不是问题。
“不知道”,才是现阶段基础软件的关键问题。怎样才能知道一段代码真正的运行情况,它使用了多少条指令、有多少个分枝跳转、多少次分枝预测Miss、STALL了多少个周期、都是因为什么STALL……

你知道当SQL运行时,你的CPU都忙什么吗?上图可以一定程度上,告诉你答案。CPU在STALL。它总共用了601,693个时钟周期来执行那条极简SQL,其中,516,463个周期,都在STALL,占了85%。
意外吗?服务器上花了大价钱的CPU,85%的时候,并不是在计算,而是在STALL。
为何而STALL呢?我猜一定有人说是cache、内存。不,上图已经有答案了,idq_uops_not_delivered,简单解释下,就是CPU的“执行”阶段,在等待“译码”阶段的周期数。一句话:等米下锅。复杂指令集的指令,要被译为微码,uOP,才能被执行。这个uOP,就是“米”。米准备好,才能下锅(被执行)。
上图中,有431,154个时钟周期在等”米“下锅。占了总STALL周期的83%。
是不是又意外了一次。对OLTP数据库来说,那怕有1TB、1PB的L1 Data Cache,对性能的提升,都微乎其微,因为瓶颈不在这里。
使用如上图中的 perf ,并不能解决”不知道“的问题,因为观测粒度太粗了。怎么办?要如何提高我们基础软件的品质,使之能在国际舞台上,和Oracle正面对决,就像我们的新能源汽车一样,而不只是在“国产化替代”的政策保护下,长成温室的花朵。好了,不剧透了,欢迎来我的场次。北京见吧,期待与众多老友共同”西山论数“。
结束语
让我们携手并进,共创数据库技术的新辉煌!期待在DTCC2024与您不见不散!
附部分大会主题:
演讲主题 | 演讲人 | 公司 | 职位 |
国产数据库应用迁移设计与开发规范 | 邓琼 | 中信银行 | 软件开发中心系统支撑领域CTO |
为什么大型数据库需要共享池 | 吕海波 | 美创科技 | 技术专家, 北京大学数据库课程企业导师 |
从根生长—第三代分布式数据库CCDB | 李海翔 | 前腾讯 | TDSQL首席架构师 |
金融数据库数字化转型性能优化方法论 | 林春 | 太保集团数智研究院 | 首席数据库专家 |
金融交易场景下数据库运维体系建设与思考 | 张磊 | 某金融科技公司 | 数据库与存储团队负责人 |
多云数据库PG架构与开发实践 | 赵飞祥 | Airwallex(空中云汇) | DB架构师 |
金融级云原生数据库设计与实现 | 孔再华 | 民生银行 | 数据库专家 |
PixelsDB:云环境下高性价比、多服务等级的serverless查询处理技术实践 | 卞昊穹 | 中国人民大学 | 讲师、PixelsDB项目负责人 |
数智化时代打造超融合数据库 | 梁敬彬 | 知名企业 | 数据专家 |
快手降本增效的底层数据库技术支撑 | 尚灿芳 | 快手 | MySQL内核负责人 |
分布式 Data Warebase - 构筑 AI 时代数据基石 | 胡月军 | Protonbase(小质科技) | 技术VP |
PostgreSQL性能改进2、3事 | 章晨曦 | 易景科技 | 联合创始人、首席技术官 |
内核代码优化实践:基于MySQL 8.0的扩展性改造 | 王斌 | TCPCopy研发作者,MySQL代码优化专家 | |
MySQL性能优化之纯用户态锁 | 孟祥滨 | 京东科技 | 数据库架构师 |
平安在数据库技术创新转型中的应用实践 | 汪洋 | 平安科技 | 总工程师 |
数据库的多维度探讨与实践 | 王辉 | 某股份制银行 | 数据库专家 |
百度云原生数据库GaiaDB极致成本与复杂查询加速技术实践 | 邱学达 | 百度 | 云原生数据库负责人 |
得到APP向量数据库的场景化落地实践 | 郭富城 | 得到APP | 算法研发工程师 |
构建企业级AI知识库在ebay的实践 | 朱冠胜 | eBay | 资深架构师 |
面向云边端协同的新型分布式数据库管理系统 | 王宏志 | 哈尔滨工业大学 | 计算学部长聘教授、博士生导师 |
百度大规模商业实时报表存储底座BaikalDB的实践 | 于正泉 | 百度 | BaikalDB报表负责人 |
快手分布式 KV 存储底座的演进 | 陈星 | 快手 | 存储技术专家 |
解析云上实时数仓的挑战与应对 | 吴炳锡 | Databend Labs | 联合创始人 |
京东物流面向多源联邦查询场景下的探索实践 | 林恩伟 | 京东物流 | 高级数据开发工程师 |
快手大数据成本治理体系及实践 | 揣龙 | 快手 | 数据平台/数据管治组/资源成本负责人 |
抖音集团指标管理与消费体系建设实践 | 施检军 | 抖音集团 | 数据平台数据BP专家 |
去哪儿大数据成本治理 | 王玉峰 | 去哪儿网 | 大数据技术总监 |
保险行业数据治理与数据资产:从策略到实践 | 胡赵勇 | 海保人寿 | 架构师 |
探索近实时湖仓在同程旅行场景实践 | 吴祥平 | 同程旅行 | 数据中心计算集群研发组技术负责人 |
爱奇艺数据中台湖仓一体化应用实践 | 杜益凡 | 爱奇艺 | 研究员 |
多数据源下的业财一体化的实践分享 | 薛晓刚 | Oracle ACE | |
游戏业务数据库的管理优化之道 | 杨建荣 | 竞技世界 | 数据负责人 |
向量库在职业教育领域的实践 | 张国裕 | 高顿教育 | 技术总监 |
Oracle 23ai:JSON关系二元性视图与属性图 | 尹海文 | Oracle ACE | |
百度向量数据库创新和应用实践分享 | 朱洁 | 百度 | 数据库部门产品总架构师 |
信创数据库数字化运维 | 臧強磊 | 南京基石数据技术有限责任公司 | 智能运维平台知识图谱项目负责人 |
数据库统一操作管理平台 | 程勇 | 树安信息 | CTO |
快手低代码及智能化大数据开发平台实践 | 韩江 | 快手 | 大数据生产平台负责人 |
数据安全的攻与防,数据泄露了有DBA什么事 | 张文精 | 狮桥融资租赁(中国)有限公司 | DBA 总监 |
智能数据管理:AI 驱动的 DataOps 实践 | 代立冬 | 白鲸开源 | 联合创始人 |
抖音集团DataOps能力演进及建设实践 | 谢林萍 | 抖音集团 | 数据BP专家 |
百度智能云大容量KV数据库PegaDB的设计与实践 | 商雄 | 百度 | PegaDB 研发负责人 |
货拉拉⼤数据KV NoSQL数据库建设实践 | 章啸 | 货拉拉 | ⼤数据基础架构存储⽅向负责⼈/⼤数据专家 |
数据驱动变革:电商用户及行为数据大平台策略 | 邵锋 | eBay | 资深架构师 |
方正证券基于StarRocks的用户画像系统实践 | 陈晓燕 | 方正证劵 | 数据中台技术负责人 |
车联网大数据平台建设 | 袁兆国 | 长城汽车 | 车联网大数据技术主管 |
大数据处理技术进展 | 袁平鹏 | 华中科技大学 | 教授、博士生导师、计算机学会高级会员 |
美团MTSQL核心特性 | 王广友 | 美团 | MTSQL内核负责人 |
移动云海山数据库由云向算演进之路 | 于巍 | 移动云-苏州研发中心 | 数据库技术委员会主任,数据库资深架构师 |
vivo 分布式缓存探索与实践 | 汪翔 | vivo | 专家工程师 |
“后战国时代”数据库商业化出路和方向探索 | 王南 | 深圳计算科学研究院/崖山科技 | 深算院首席产品官/崖山科技副总裁 |
融合数据库多模态间的数据同步探讨与实践分享 | 王传阳 | 枫清科技(Fabarta) |
|
Qunar的向量数据库运维实践 | 李海龙 | 去哪儿网 | DBA总监 |
一站式数据库平台建设实践 | 劳志毅 | OPPO | 云数据库负责人 |
工业互联网基于开源数据库的应用和实践 | 王丁丁 | BOE京东方 | 技术专家 |
向量检索技术在京东广告检索系统中的应用 | 岳宝 | 京东广告 | 技术专家 |
数据库专家智能体应用实践 | 陈发强 | 蚂蚁集团 | 高级技术专家 |
企业级数据库DevOps最佳实践 | 周振兴 | NineData | 联合创始人 && 技术副总裁 |
字节跳动新一代高性能低成本图数据库ByteGraph存储设计与实现揭秘 | 杨世蛟 | 字节跳动 | 图数据库存储技术负责人 |
使用TLA+形式化规范驱动开发保证数据库系统软件质量 | 郭华 | scuptio | 创始人/CEO |
新一代高性能KV存储Bitalostored技术架构 | 徐锐波 | 作业帮 | 用户产品中台及存储技术团队负责人 |
Fql实时流批一体化计算引擎架构设计与落地实践 | 刘尉良 | 福佑卡车 | 大数据算法负责人 |
会议地点:朗丽兹西山花园酒店
会议时间:2024年8月22日-8月24日(周四~周六)
大会主办:IT168、ITPUB、ChinaUnix




