暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

中国数据库技术大会(DTCC2024)—— 共绘数智未来新篇章

IT知识刺客 2024-07-29
140

在这个数据驱动的时代,数据库作为IT基础设施的基石,正以前所未有的速度推动着各行各业的发展与创新。

为了紧跟时代步伐,引领前沿技术,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第15届中国数据库技术大会(DTCC2024)将于2024年8月22日至24日在朗丽兹西山花园酒店隆重召开。

转发文章并留言“赠票”,瓜分十张赠票。每张赠票价值3000元,先到先得,还等什么。

获得赠票的小伙伴们需要提供“姓名、邮箱、手机号、公司、部门、职位”等信息,信息收集后需要会务组审核,


大会主题:自研创新 数智未来

本次大会以“自研创新 数智未来”为主题,旨在通过深度交流与探讨,推动数据库技术的自主创新和数智化转型。大会将设置2大主会场和20+技术专场,涵盖向量数据库与向量检索技术实践、数据治理与数据资产管理、云原生数据库开发与实践、特定场景下的数据库管理与优化、大数据平台建设等前沿议题,为参会者提供一场年度的技术盛宴。

亮点纷呈

1.超百位行业专家齐聚一堂大会将邀请超过百位数据库领域的顶尖专家和学者,分享他们在数据库技术创新与应用实践中的最新成果和宝贵经验。这些嘉宾来自国内外知名企业、高校及研究机构,他们的真知灼见将为参会者带来深刻的行业洞察和技术启发。

2.前沿技术深度解析随着人工智能、大数据、云计算等新技术的不断发展和应用,数据库技术也迎来了新的变革。本次大会将围绕数据库内核技术、向量数据库、分布式数据库、云原生数据库等前沿领域展开深入探讨,为参会者揭示未来数据库技术的发展方向。

3.实践案例广泛分享:大会还将邀请多位来自知名企业的嘉宾分享他们在数据库应用实践中的成功案例。这些案例涵盖了金融、互联网、大数据处理、云计算等多个领域,为参会者提供了丰富的实践经验和借鉴价值。

4.深入交流与互动大会设置了多个交流环节,包括主题演讲、技术研讨、圆桌论坛等,为参会者提供与专家学者、业界精英面对面交流和互动的机会。这种深入交流的方式将有助于参会者更好地了解行业动态和技术趋势,拓展人脉资源,提升自身的专业素养和技术水平。

展望未来

中国数据库技术大会(DTCC)作为数据库领域的顶级盛会,已经陪伴中国数据库行业走过了多年的风雨历程。在未来的日子里,DTCC将继续秉承一贯的干货分享和最佳实践精神,为广大数据领域从业人士提供一个交流思想、分享经验、探索未来的重要平台。

我们诚挚地邀请您加入2024中国数据库技术大会,共同见证数据库技术的辉煌未来!期待在朗丽兹西山花园酒店与您相聚,共绘数智时代的新篇章!

我的主题:《为什么大型数据库需要共享池》

关于要不要共享池、共享池好不好,这是一个仁者见仁、智者见智的问题,并不是我的主题。我这次分享,其实更关注底层。数据库,特别是OLTP数据库,一直被归属于基础软件,但我们对“基础”的研究,尚大大不足。我在去年曾指出opengauss执行相同逻辑的SQL,CPU Instructions(指令数)数倍于原生PG、MySQL和Oracle,就是对基础“二字理解不足的结果。

数据库程序的特点十分鲜明,显著区别于其他应用程序。比如一次极简SQL的执行,也会有20多万个跳转指令(而且这只是极简SQL):

上图是postgresql 15.7中的统计结果,SQL是select 。。。from 。。。where 主键列=?。这是最简单的SQL了,使用了25,423个分枝跳转指令。占总指令数的24%,平均每4.17条指令,就有一个分枝跳转指令,几乎能撑爆大部分CPU的BTB。

CPU BTB爆掉的直接后果,每执行一条SQL,CPU的分枝预测率准确率,都不会太高,也就80%上下。而CPU厂商公布的,这一数字通常都接近100%。

这导致你寄希望编译器、CPU让你的分枝/条件/循环以最佳的方式运行,你认为它们帮你做到了,但实际上并没有这还不是最关键的问题,只是举个例子,最关键的问题是,“我们并不知道出了问题“。

我儿子在一岁多时,曾经在盛夏时分带他出去玩过一次,他并不知道去找有空调的地方乘凉,热的小脸红扑扑的,但也无动于衷,因为当时他还不知道有”空调“,在他的认知中,热,是正常且无解的,这并不是问题。

“不知道”,才是现阶段基础软件的关键问题。怎样才能知道一段代码真正的运行情况,它使用了多少条指令、有多少个分枝跳转、多少次分枝预测Miss、STALL了多少个周期、都是因为什么STALL……

你知道当SQL运行时,你的CPU都忙什么吗?上图可以一定程度上,告诉你答案。CPU在STALL。它总共用了601,693个时钟周期来执行那条极简SQL,其中,516,463个周期,都在STALL,占了85%。

意外吗?服务器上花了大价钱的CPU,85%的时候,并不是在计算,而是在STALL。

为何而STALL呢?我猜一定有人说是cache、内存。不,上图已经有答案了,idq_uops_not_delivered,简单解释下,就是CPU的“执行”阶段,在等待“译码”阶段的周期数。一句话:等米下锅复杂指令集的指令,要被译为微码,uOP,能被执行。这个uOP,就是“米”。米准备好,才能下锅(被执行)。

上图中,有431,154个时钟周期在等”米“下锅。占了总STALL周期的83%。

是不是又意外了一次。对OLTP数据库来说,那怕有1TB、1PB的L1 Data Cache,对性能的提升,都微乎其微,因为瓶颈不在这里。

使用如上图中的 perf ,并不能解决”不知道“的问题,因为观测粒度太粗了。怎么办?要如何提高我们基础软件的品质,使之能在国际舞台上,和Oracle正面对决,就像我们的新能源汽车一样,而不只是在“国产化替代”的政策保护下,长成温室的花朵。好了,不剧透了,欢迎来我的场次。北京见吧,期待与众多老友共同”西山论数“。


结束语

让我们携手并进,共创数据库技术的新辉煌!期待在DTCC2024与您不见不散!

 附部分大会主题:

演讲主题

演讲人

公司

职位

国产数据库应用迁移设计与开发规范

邓琼

中信银行

软件开发中心系统支撑领域CTO

为什么大型数据库需要共享池

吕海波

美创科技

技术专家,

北京大学数据库课程企业导师

从根生长—第三代分布式数据库CCDB

李海翔

前腾讯

TDSQL首席架构师

金融数据库数字化转型性能优化方法论

林春

太保集团数智研究院

首席数据库专家

金融交易场景下数据库运维体系建设与思考

张磊

某金融科技公司

数据库与存储团队负责人

多云数据库PG架构与开发实践

赵飞祥

Airwallex(空中云汇)

DB架构师

金融级云原生数据库设计与实现

孔再华

民生银行

数据库专家

PixelsDB:云环境下高性价比、多服务等级的serverless查询处理技术实践

卞昊穹

中国人民大学

讲师、PixelsDB项目负责人

数智化时代打造超融合数据库

梁敬彬

知名企业

数据专家

快手降本增效的底层数据库技术支撑

尚灿芳

快手

MySQL内核负责人

分布式 Data Warebase - 构筑 AI 时代数据基石

胡月军

Protonbase(小质科技)

技术VP

PostgreSQL性能改进2、3事

章晨曦

易景科技

联合创始人、首席技术官

内核代码优化实践:基于MySQL 8.0的扩展性改造

王斌

TCPCopy研发作者,MySQL代码优化专家

MySQL性能优化之纯用户态锁

孟祥滨

京东科技

数据库架构师

平安在数据库技术创新转型中的应用实践

汪洋

平安科技

总工程师

数据库的多维度探讨与实践

王辉

某股份制银行

数据库专家

百度云原生数据库GaiaDB极致成本与复杂查询加速技术实践

邱学达

百度

云原生数据库负责人

得到APP向量数据库的场景化落地实践

郭富城

得到APP

算法研发工程师

构建企业级AI知识库在ebay的实践

朱冠胜

eBay

资深架构师

面向云边端协同的新型分布式数据库管理系统

王宏志

哈尔滨工业大学

计算学部长聘教授、博士生导师

百度大规模商业实时报表存储底座BaikalDB的实践

于正泉

百度

BaikalDB报表负责人

快手分布式 KV 存储底座的演进

陈星

快手

存储技术专家

解析云上实时数仓的挑战与应对

吴炳锡

Databend Labs

联合创始人

京东物流面向多源联邦查询场景下的探索实践

林恩伟

京东物流

高级数据开发工程师

快手大数据成本治理体系及实践

揣龙

快手

数据平台/数据管治组/资源成本负责人

抖音集团指标管理与消费体系建设实践

施检军

抖音集团

数据平台数据BP专家

去哪儿大数据成本治理

王玉峰

去哪儿网

大数据技术总监

保险行业数据治理与数据资产:从策略到实践

胡赵勇

海保人寿

架构师

探索近实时湖仓在同程旅行场景实践

吴祥平

同程旅行

数据中心计算集群研发组技术负责人

爱奇艺数据中台湖仓一体化应用实践

杜益凡

爱奇艺

研究员

多数据源下的业财一体化的实践分享

薛晓刚

Oracle ACE

游戏业务数据库的管理优化之道

杨建荣

竞技世界

数据负责人

向量库在职业教育领域的实践

张国裕

高顿教育

技术总监

Oracle 23ai:JSON关系二元性视图与属性图

尹海文

Oracle ACE

百度向量数据库创新和应用实践分享

朱洁

百度

数据库部门产品总架构师

信创数据库数字化运维

臧強磊

南京基石数据技术有限责任公司

智能运维平台知识图谱项目负责人

数据库统一操作管理平台

程勇

树安信息

CTO

快手低代码及智能化大数据开发平台实践

韩江

快手

大数据生产平台负责人

数据安全的攻与防,数据泄露了有DBA什么事

张文精

狮桥融资租赁(中国)有限公司

DBA 总监

智能数据管理:AI 驱动的 DataOps 实践

代立冬

白鲸开源

联合创始人

抖音集团DataOps能力演进及建设实践

谢林萍

抖音集团

数据BP专家

百度智能云大容量KV数据库PegaDB的设计与实践

商雄

百度

PegaDB 研发负责人

货拉拉⼤数据KV NoSQL数据库建设实践

章啸

货拉拉

⼤数据基础架构存储⽅向负责⼈/⼤数据专家

数据驱动变革:电商用户及行为数据大平台策略

邵锋

eBay

资深架构师

方正证券基于StarRocks的用户画像系统实践

陈晓燕

方正证劵

数据中台技术负责人

车联网大数据平台建设

袁兆国

长城汽车

车联网大数据技术主管

大数据处理技术进展

袁平鹏

华中科技大学

教授、博士生导师、计算机学会高级会员

美团MTSQL核心特性

王广友

美团

MTSQL内核负责人

移动云海山数据库由云向算演进之路

于巍

移动云-苏州研发中心

数据库技术委员会主任,数据库资深架构师

vivo 分布式缓存探索与实践

汪翔

vivo

专家工程师

“后战国时代”数据库商业化出路和方向探索

王南

深圳计算科学研究院/崖山科技

深算院首席产品官/崖山科技副总裁

融合数据库多模态间的数据同步探讨与实践分享

王传阳

枫清科技(Fabarta)


图计算负责人

Qunar的向量数据库运维实践

李海龙

去哪儿网

DBA总监

一站式数据库平台建设实践

劳志毅

OPPO

云数据库负责人

工业互联网基于开源数据库的应用和实践

王丁丁

BOE京东方

技术专家

向量检索技术在京东广告检索系统中的应用

岳宝

京东广告

技术专家

数据库专家智能体应用实践

陈发强

蚂蚁集团

高级技术专家

企业级数据库DevOps最佳实践

周振兴

NineData

联合创始人 && 技术副总裁

字节跳动新一代高性能低成本图数据库ByteGraph存储设计与实现揭秘

杨世蛟

字节跳动

图数据库存储技术负责人

使用TLA+形式化规范驱动开发保证数据库系统软件质量

郭华

scuptio

创始人/CEO

新一代高性能KV存储Bitalostored技术架构

徐锐波

作业帮

用户产品中台及存储技术团队负责人

Fql实时流批一体化计算引擎架构设计与落地实践

刘尉良

福佑卡车

大数据算法负责人

以上为大会最新主题,更多主题敬请期待…

会议地点:朗丽兹西山花园酒店

会议时间:2024年8月22日-8月24日(周四~周六)

大会主办:IT168、ITPUB、ChinaUnix

大会官网:http://dtcc.it168.com/

文章转载自IT知识刺客,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论