暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

范举:从0到1打造一个完整的数据库|OceanBase 数据库大赛访谈

“从 0 到 1,打造你的数据库”, 作为国内首个分布式数据库内核开发大赛,OceanBase 数据库大赛于 5 月 10 日公布 10 强名单,2021 年大赛正式落下帷幕。

决赛的结束,也是大赛分享的开始。我们对特邀评委和参赛队伍进行了系列访谈,邀请他们来分享自己对数据库未来趋势的观点、数据库研究的心路历程以及人才培养的建议。这次我们请来了本届特邀嘉宾 ——中国人民大学数据工程与知识工程教育部重点实验室范举,我们一起来看看他对数据库大赛的看法。

图片

特邀嘉宾简介:范举,中国人民大学数据工程与知识工程教育部重点实验室副教授、博士生导师,中国计算机学会数据库专家委员会委员、大数据专家委员会委员。近年来聚焦面向人工智能的数据准备、众包数据管理、大数据分析等研究方向,相关成果在计算机领域 A 类期刊和会议上发表论文 40 余篇。作为负责人先后获得国家自然科学基金优秀青年基金项目、重点项目课题、青年项目等。获得了 2017 年度 ACM 中国新星奖、2020 年度中国人民大学教学标兵等奖励。

下为中国人民大学 NoPassCET4 团队指导老师范举老师访谈实录:

Q:
作为参赛队伍的指导老师,您对本次数据库大赛最深刻的感受是什么?

A:
我最大的感受就是之前在采访中谈到的“ From Zero to Hero 从零开始”,数据库作为重要的基础软件,其实正欠缺的是这样一批青年的开发者。把一个东西从零做出来,和借助现有的框架在上面做再开发,我认为是有个非常大的区别的。这是 OceanBase 大赛最吸引我的地方。

“从 0 到 1,系统地打造一个完整的数据库”对学生的帮助是很大的。一方面,让学生明白课堂上学到的理论知识在业界的数据库系统中的应用情况。例如:课堂上讲过的 NLJ 查询是一种很基础的查询方式,但在实际的数据库系统中,也还有很多可以优化的空间;另一方面,这个比赛能让学生认识到理解并修改大型项目代码的能力还需要加强。

Q:
您认为在校学生参加数据库大赛有哪些重要意义?

A:
有关在校生参加数据库大赛的意义,我借用电影《一代宗师》中的台词来打个比方。

见自己:通过参加比赛,学生能够更好地理解课堂上学习到的理论知识,锻炼理论与实践相结合的能力,同时积累项目经验。

见天地:本次比赛吸引了国内外包括清华大学、中国人民大学、南洋理工大学、美国哥伦比亚大学等 246 所知名高校在内的共 1179 支团队,近 2000 名数据库爱好者参赛。学生在参赛的过程中能够扩展视野,了解真实的数据库项目,见识背景不同的同龄人(很可能是将来的同行)的技术能力——这些都会激发他们的学习热情。

见众生:就像 OceanBase 的 CTO 杨传辉说的:通过比赛,能够帮助年轻人树立信念、提供实践土壤,从而使他们为数据库技术创新贡献智慧和力量,成为改变国产数据库行业的下一代。

Q:
人大团队取得了首届大赛总冠军,您认为 NoPassCET4 团队获奖的优势在哪?

A:
决赛第一阶段的成绩出来后就比较有信心能拿到相对好的名次了,但冠军还是很出乎意料的,毕竟影响因素很多,不到最后一刻很难预知,这支团队有四个特点:

第一,有信心和决心。比赛需要冲劲儿,有冲劲在,就不会放弃——狭路相逢勇者胜。

第二,数据库基础知识扎实。能从多个维度考虑问题的解决方案——厚积才能薄发。

第三,具有扎实的系统编程能力。中国人民大学有很多数据库的课程会训练学生的系统编程能力。例如:我的研究生课程《分布式数据库系统》就会让学生从零到一搭建一个简化的分布式数据库系统。不少学生都反馈这个课程是他们编程量最大的课程。我感觉这是很重要——Talk is cheap,show me the code。

第四,学习能力强。对于之前不了解的东西,可以快速学习并运用起来。

Q:
您最早接触数据库是什么时候?在从事数据库研究这么多年的心路历程中,您碰到最大的难点是什么?

A:
尽管在本科的时候就接触过数据库,但给我印象最深刻的是在研一的时候上过的清华大学周立柱教授的《分布式数据库系统》课程。这门课的大作业就是分组做一个简化版的分布式数据库系统。我记得当时这个课上得很辛苦,但收获也特别大。

我觉得最大的难点是要搞明白“什么驱动创新”这个问题。我们过去大多数采用追催策略,看国外学术界或主流厂商在研究什么,我们就研究什么。但事情正在起变化:中国这样大体量的国家进行数字化转型,会给数据库行业带来丰富的应用场景和无限的机会。作为数据库领域的研究者,能不能抓住这些机会,会是未来很长一段时间内我面临的最大难点。

Q:
数据库是非常复杂的大型系统,在您看来,国产数据库有哪些机会和趋势?

A:
我之前和几位老师组织了一次《软件学报》的专刊“新型数据库系统”,我想节选这次专刊的前言回答这个问题。

近年来,数据库系统为了应对新应用和新数据类型给数据管理与分析提出的全新挑战,产生了一系列新的发展趋势,包括:

(1) 在数据管理方面,计算机硬件的创新与人工智能技术的深入为数据库系统带来了全新的发展机会,而伸缩性、容错性、可扩展性等应用需求又给数据管理带来了全新的挑战;

(2) 在数据分析方面,数据量的剧增、数据类型的异构与应用需求的多样对数据库系统的分析能力与性能提出了更高的要求;

(3) 在数据安全方面,多方安全计算、联邦学习等应用和需求的变化给数据库安全与隐私保护技术带来了全新的课题。因此,需要利用和发展现有的数据库理论,构建形成新的技术和系统经验。

Q:
您认为作为在校生,未来想要从事数据库工作成为数据库开发者,现在最应该具备的核心素质是什么?与过去相比发生了什么变化?

A:
在校生最应该具备的核心素质是数据库基础知识和系统编程能力,这一点与过去相比并没有发生变化。除此之外,我觉得学生们应该有“大胆尝试”的心态。开个玩笑:同学之间,一言不合,就给你写个系统看看。换句话说:不应该只是追随的心态,更应该洞察中国数字化转型中的新应用,解决新的挑战,做出好的创新。

Q:
国内其实一直很缺乏底层技术系统的数据库人才,在您看来,我们应该如何加速人才培养进程?

A:
这方面我特别同意华东师范大学周烜教授的看法“数据库人才培养除了要学习艰深的科技理论知识外,还需要去动手实践,一行一行地去理解代码,这样才能够编写出像样的数据库系统”。这里面关键的一句是“一行一行地去理解代码”,这个过程是比较枯燥的,希望高校和企业能够通过产教协同的形式帮助到学生。

高校可以设计更为合理的数据库系统实现课程,循序渐进地训练学生;企业通过类似 OceanBase 数据库大赛,更好地激励学生。更关键的是学术界和产业界如何更好地协同,建设良好的生态。

Q:
针对下一届数据库大赛,您有哪些建议和期待?以及对下一届参赛者有什么建议或鼓励?

A:
希望下一届大赛,可以吸引更多本科生同学参加,让学生更早了解真实场景数据库的发展方向,在日后学习中更有明确的目标。同时,也祝愿所有的参赛队伍,保持信心,大胆尝试,不轻言放弃!

关于 OceanBase 数据库大赛

「2021 OceanBase 数据库大赛」面向高校青年人才,自2021年8月开始报名,从初赛、复赛到最终总决赛历时 9 个月,吸引了国内外包括清华大学、北京大学、中国人民大学、南洋理工大学、美国哥伦比亚大学等 246 所知名高校在内的共 1179 支团队,近 2000 名数据库爱好者参赛,开创了国内分布式数据库领域产教融合的人才培养新模式。

经过总决赛激烈角逐及现场答辩,来自中国人民大学的 NoPassCET4 团队获得冠军,华东师范大学的东亚男儿、电子科技大学的 push_d_ 团队获得亚军,华东师范大学的 lying_flat、华东师范大学和青岛科技大学的 Honiitro19 团队、以及华中科技大学的两只老虎吃萝卜获得季军。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论