暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

DTC2024数据技术嘉年华剧透:张勇深度剖析SUNDB分布式数据库查询优化技术

原创 墨天轮编辑部 2024-04-08
328

2024年4月12-13日,第十三届2024数据技术嘉年华(DTC)将在北京新云南皇冠假日酒店盛大召开。本届大会由中国DBA联盟(ACDU)和墨天轮社区联合主办,以“智能·云原生·一体化——DB与AI协同创新,模型与架构融合发展”为主题,汇聚80余位行业杰出技术领袖、学术精英、行业实践者、生态布道者,分享前沿技术见解、深刻行业洞察、创新实践案例,为广大从业者带来一场数据技术的盛宴。

IMG_256

在大会前夕,墨天轮有幸采访到了本次大会的演讲嘉宾之一——清华大学信息国家研究中心副研究员,清华科蓝先进智能数据库研究院副院长张勇。张勇教授从事数据库领域的研究20余年,研究方向是将人工智能技术与数据库技术相结合,包括利用人工智能技术来提高数据库的性能,以及利用数据库技术来提高人工智能算法的训练和执行的效率。他将为本次大会发表精彩致辞,并将在“专题论坛1:数据库内核创新”上发表题为《SUNDB分布式数据库查询优化技术》的主题演讲,介绍在分布式场景中的典型查询优化技术。让我们一起看看他剧透的演讲亮点吧。

大咖访谈第5期张勇

Q:在今年的数据技术嘉年华上,您将带来什么主题的演讲,可以先剧透一下亮点吗?

A:利用计算机硬件的横向扩展来提高数据库的性能是一种通用的做法,也就是我们常说的分布式数据库。面向OLTP的分布式数据库需要解决提高数据库的系统的性能,以保证严格的事务处理之间的矛盾。那么我将介绍在这个方面学术界的研究进展以及SUNDB在这方面最新的工作。

Q:您认为今年数据技术或数据库行业最值得关注的话题是什么?将有哪些发展趋势?

A:从话题的热度层面,我认为今年最值得关注的话题是大模型与数据库的关系。可以分为如下几个方面的趋势,第一,大模型作为一种智能友好的交互界面,大家平时用的ChatGPT、文心一言,还有通义千问等等这样的一些交互式大模型的工具,它们会使得我们数据库的使用方式发生变化,这个变化可以按照对象分为两个方面:第一个方面是如何更好地帮助数据库人员来做优化,包括数据库开发人员他们在做一个复杂查询的时候,可以利用大模型来帮助他们写出更好的查询语句,第二个方面是我们数据库的管理人员也可以利用大模型来帮助系统进行调优。

第二,用户也可以直接利用自然语言来访问数据库,用户不需要会用SQL,他只需要了解到数据库里存有哪些数据,那么他就可以利用合适的提示进行描述,然后获得自己想要的数据或者统计信息,这将大大降低数据库的使用门槛,从而使得人人都可以来用数据库,可以来管理数据库。

Q:对您来说,人工智能与数据库相结合的意义是什么?对整个行业将有哪些推动作用?

A:大模型与AI的发展对算力提出了更高的要求,数据库具备原生的内存存储和计算能力,对于AI发展的支持是至关重要的。所以这也是未来DB和AI的一个重要方向,清华科蓝先进智能数据库研究院在人工智能与数据库相结合方面做了三个方面的工作:

第一是设计了基于机器学习的数据结构,包括学习型索引和缓冲区的管理;二是利用GPU进行LSM索引和学习性索引的管理,以及如何利用GPU进行批量的事务的处理;三是在研究向量数据库怎么样去更好地支持大模型的训练和使用。

张勇 会前致辞

数据库作为数字经济的“根技术”,是我国需要攻坚的基础研究领域之一,需要加快关键核心技术攻关,优化底层技术布局。基于此清华大学与科蓝软件联合成立了先进智能数据库研究院,双方致力于先进科技成果的转化,打造一个科技创新平台,走出一条有特色的产学研用之路,形成多方协同创新,合作培育数据库人才的良好局面。期待未来能有更多重大的突破,也期待大家加入研究院。

智能·云原生·一体化,DB与AI协同创新,模型与架构融合发展,我在2024数据技术嘉年华等你来!

演讲嘉宾简介

张勇
清华大学信息国家研究中心副研究员,清华科蓝先进智能数据库研究院副院长

清华大学计算科学与技术系学士、硕士和博士,剑桥大学博士后,中国计算机学会信息系统专委常委,计算机学会高级会员,IEEE和ACM会员。研究方向为数据库系统和数据全生命周期管理。主持及参与了多项国家重点研发计划、新一代人工智能重大项目、973、863、科技支撑计划、自然基金、铁道部基金等纵向项目以及横向合作项目。发表论文200余篇,其中中国计算机学会A类期刊和会议论文20篇,包括如TKDE、VLDBJ、SIGMOD、VLDB、ICDE、AAAI、WWW、ACL、IJCAI、EMNLP等。获得发明专利26项,软件著作权25项。获得2023年中国发明协会发明创业创新奖一等奖、2021年中国产学研合作促进会产学研合作创新奖(个人)和2020年中国产学研合作促进会产学研合作创新奖二等奖。

“数据库内核创新”论坛演讲预告

演讲主题:《SUNDB分布式数据库查询优化技术

演讲时间:4月12日 14:30-15:00

分布式数据库进行查询优化,网络传输代价是重要考量因素,减少或优化查询时的数据传输是分布式优化器要解决的经典核心问题之一。如何在分散部署的数据库节点上更有效的处理数据?如何能更有效的调度系统资源?本次演讲将介绍在分布式场景中的典型查询优化技术。其中,SUNDB的分布式优化器在架构上实现了本地与全局、静态与动态的融合,基于统计信息对全局数据流转及本地计划创建全局优化方案,最终可以带来复杂分布式查询场景的性能大幅提升。

除了张勇的演讲外,邢春晓(博导/院长,清华大学信息国家研究中心研究员、清华科蓝先进智能数据库研究院院长)将亮相智能·云原生·一体化大会主旨演讲,科蓝软件SUNDB数据库解决方案部总经理曹平国将在“专题论坛9:金融行业应用”上发表主题演讲。大会还将涵盖众多与数据技术相关的议题和讨论,与会者将有机会与众多行业领袖和专家深入交流,共同探讨数据技术的未来发展方向和应用前景。科蓝软件期待与业界同仁共同探讨数据库在金融行业的应用和发展,让我们在春暖花开之际,相聚北京,不见不散!

我们期待您的参与,共同见证数据技术的辉煌未来!

0元购票福利:👉进入数据技术嘉年华官网 ( https://www.modb.pro/dtc2024 ),购票时使用专属优惠码【SUNDB】即可免费购买普通门票一张,数量有限,先到先得!

注:有关购票的任何疑问可添加墨天轮小助手(微信ID:modb666)咨询。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论