暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

讲讲他的故事:从职高到MIT计算机博士录取

879

“作为 DolphinDB 早期开发时的战友,信静身上体现出的品质令我钦佩。从一个职高学生到图灵奖得主的博士生,我没有看到逆袭,也没有看到天纵奇才。相反,我看到了一个年轻人的专注和执着,这才是我们普通人或者一个普通的聪明人值得学习的地方。”

                          —— 周小华博士

DolphinDB 创始人

本文经授权转载自新智元 
ID:AI_era
最近,专升本职高生周信静逆袭成 MIT 博士生的故事,再度刷爆互联网,冲上知乎热搜第一。

故事的主人公周信静出生在浙江一个小岛,初中毕业后上了一所职校。
随后,他用了11年,从职高->大专->专升本->考研到浙大,一路逆袭成 MIT 博士生。期间,不仅在各大数据库顶会顶刊上发表了多篇论文,担任审稿人,而且还在大会现场做了精彩的演讲。

翻开周信静的主页可以看到,他现在是 MIT 的一名博二学生,师从数据库领域现存的唯一图灵奖获得者 Mike Stonebraker

(图:周信静的主页)

据说,在周信静之前,Mike Stonebraker 已经好几年没有招过学生了。
(图:Mike Stonebraker-周信静的导师)
在这之前,他曾在杭电取得本科学位,在浙大取得硕士学位。如果仅看到这里,大多数人会觉得他和许多 AI 研究者的学业轨迹并无不同。
(图:周信静的学历轨迹)

我们恐怕很难想象到,周信静的学术生涯起点,是来自职校。

出生自寒门的他,早年对读书没有任何兴趣。初中毕业后,他经过了一年的打工生涯,进入了龙湾区职业技术学校计算机职专班。在职高读到第三年里,他发生了「顿悟」,觉得不该虚度此生,然后开始发奋学习,考上浙江经贸职业技术学院。这期间,周信静被老师带着参加省内的编程竞赛,受到了启蒙。同时,他靠着网上高质量的公开课,始终没有停下学习的脚步。

在大专二年级时,他写的项目就体现出了很高的代码水平,用 c++实现了一个raft core。

项目地址:https://github.com/zxjcarrot/raftcore

在就读大三时,raft 协议的文章刚出来不久,他对于系统领域产生了浓厚的兴趣,决定对此继续深耕。

通过专升本考试,他考入杭电就读本科。在杭电期间,计算机学院有600多人,而他的专业成绩排名第一,拿到了国奖。

本科毕业后,他通过考研进入浙大就读研究生。期间,他以一作身份,在数据库顶会 VLDB 2020上发表了 DPTree 的工作。
(论文地址:https://dl.acm.org/doi/10.14778/3372716.3372717)

完成这项工作期间,周信静遇到了不少困难:数据库、系统方面的论文极其复杂,很多工作都没有开放源代码。而他凭借极强的工作能力,竟把所有需要对比的工作都复现了出来。

此后,他还克服了许多障碍。第一次 review 结果不理想,他就想办法创造条件,把 NVM 模拟器上的实验,搬到了真实的硬件上,成果才终于得以发表在顶会。

随后,他入职腾讯。即使在大厂搬砖,他也始终坚持在晚上和周末挤时间做科研。最终,他在此期间参与的工作 SpitFire 被顶会 SIGMOD 2021接收。

(论文地址:https://dl.acm.org/doi/10.1145/3448016.3452819)

离开腾讯之后,周信静又来到了知名数据库公司 DolphinDB

(相关回答地址:https://zhuanlan.zhihu.com/p/360390223)

要知道,国内做数据库内核研发的人并不多,公司的要求一般就是有数据结构和C++功底,人很聪明就可以了。而周信静在面试时,展现出的对 raft 协议原理和实现细节的熟悉程度,甚至让面试官惊掉了下巴:

在30分钟的对话过程中,基本上捋了一遍如何使用 raft 协议实现一个分布式数据库,从客户端到服务端的框架设计。

对于这样不可多得的人才,公司非常重视。在入职之后,便直接让他以实习生的身份参与到了 DolphinDB 分布式时序数据库的内核研发当中。

期间,团队在用哈希方法来改进 SQL 引擎分组计算的性能时,遇到了瓶颈。在经过讨论之后发现,标准库的 HashMap 平衡了key在删除、新增和查询各方面的性能,但在 SQL 计算引擎中,却基本上用不到删除功能。因此,可以尝试从这个角度进行优化。于是,周信静差不多用了一个周末的时间,做出了一个IrremovableFlatHashmap 的原型,一试果然有效。

凭借着过硬的学术水平和实践能力,周信静最终成功申请到了 MIT 的计算机博士,并于2021年9月正式入学。

回顾这段经历时,周信静总结道:在 DolphinDB 实习时,自己发现了 Andy 的 DB 课程,被深深吸引。他希望能将经典的 idea 应用到 DB 系统里,甚至创造一些 idea。因此,他研究生入坑了 DB。

研究生快毕业时,周信静认识了 Joy Arulraj 老师,在远程交流中,他给了周信静很多帮助,也帮忙写了推荐信。在同一领域深耕多年的勤奋,加上老师、前辈、同学的交流和帮助,让周信静把人生写出了一段逆袭的传奇。

现在,周信静不仅已经有5篇论文被各大顶会、顶刊接收。而且还曾担任数据库顶会 SIGMOD 2021、VLDB 2021和 VLDBJ 2022的外审。


在今年1月举办的数据库顶会 CIDR 2023上,周信静还做了现场的演讲。从视频中可以看出,他的英文口语水平也是极佳。
(视频地址:https://www.youtube.com/watch?v=8e8KMnGKHwE)
在这项工作中,来自 MIT、威斯康星大学麦迪逊分校和谷歌的团队提出了一种2-Tree 结构,从而解决现有方法在管理大于内存的索引时存在的局限性。
(论文地址:https://www.cidrdb.org/cidr2023/papers/p57-zhou.pdf)
其中,热索引记录位于一个树中,冷记录位于另一个树中。热索引树块经常被访问,并可能保留在主内存中,从而提高了主内存利用率。

同时,作者还提出了一种高效的轻量级通用记录迁移协议,可在任意两个树结构之间双向运行。这两个树可以针对硬件差异进行单独配置。一个树为主内存进行优化,而另一个则利用二级存储。

此外,2-Tree 的思想也可以推广到多个存储层和/或设备。

结果显示,将2-Tree 应用到 B+树和 LSM 树上时,可以显著提高它们在高度偏斜工作负载下的内存利用率(分别提高15倍和20倍)。

与使用相同量级主内存的传统单一 B+tree 或 LSM-tree 相比,在 Zipfian 偏斜的 IO 受限工作负载上,吞吐量提高了高达1.7倍。而与现有的以降低范围扫描性能为代价来提高内存利用率的解决方案不同,2-Tree 拒绝做出这样的妥协。

他的经历一经曝出,也迅速掀起了广大网友讨论的热潮。比如经久不衰的话题“第一学历重要还是硕士学历重要?”

此前的这类传奇经历,还是从不知名三本逆袭到耶鲁大学博士全奖。而周信静则是以职、大专为起点,目前可以说是前无古人。

也有网友提出,这个励志故事也说明,目前的中考淘汰制对于某些晚熟的学生来说,也有漏洞。

也有人说,努力,其实也是一种极强的天赋。

《了不起的盖茨比》中说:“每当你想批评别人时,记住,并不是世界上所有人都有和你一样的优越条件。”

而周信静的故事告诉我们:开局拿到哪副牌,并不是你人生现状的借口。

参考资料:

https://www.zhihu.com/question/625797647

https://zxjcarrot.github.io/

文章转载自DolphinDB智臾科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论