
随着达梦数据顺利上市
外界对达梦充满了好奇:
达梦的复合增长率为什么这么高?
这种高速增长是否具备可持续性?
达梦为何能与同行拉开差距?
别急,答案来啦——
达梦数据副总经理冯源做客《鱼论》
对话ITPUB执行总编老鱼
你想知道的,这里都有
老鱼
大家好我是老鱼,欢迎关注鱼论。今天鱼论采访间邀请到的嘉宾是达梦副总经理冯源。
冯源
大家好,我叫冯源,是武汉达梦数据库股份有限公司的副总经理,今天非常开心来到鱼论,跟老鱼聊一聊,我们对数据库方面的见解。
老鱼
冯总,最开始的时候我觉得您还是先简单地介绍一下自己的一个情况,包括在公司里面负责的具体工作。
冯源
我叫冯源,我一毕业就来达梦工作。差不多是2005年进入达梦一直(到现在)。2005年进达梦一直在做技术方面的工作,我现在主要是负责达梦数据库的一个是产品测试方面,还有一个是和标准相关的一些工作,标准化。第三个呢,是一些前沿的技术课题申报或者是合作,跟我们的高校还有研究机构进行对接的一些工作。我记得当时您这边写过一篇文章我觉得挺好,我印象很深刻,所以说基本上跟您结缘啊,就是那次 DTCC 开始的。
Q
当时你在大学里面学的是什么专业?为什么出来就选择一个数据库公司去做?
冯源:我大学学的计算机,这个东西我觉得有一点随缘的感觉。有一次路过我们学校公寓和校区之间的一个图书城,刚好看到有一个海报说今天下午图书城有一个专场招聘会,后来就这么一路笔试啊面试啊进公司。所以说我觉得就是两个点吧:第一是有运气成分,或者说是机缘;第二个,我觉得这种工作和其它工作还是有一个本质的区别,就是它不管是数据库也好还是操作系统也好,它关注的其实更多的还是偏计算机学科比较共性的、偏基础的东西。
Q
那你觉得你们现在招人的话好招吗?因为我遇到很多的企业,大家都会抱怨人特别不好招,因为现在的这个市场里面有几百家,很卷,大家都在相互地挖人。之前跟清华大学的老师也去聊,其实现在这种模式也在慢慢地变化,从过去 怎么去用它到现在怎么去做它。
冯源:对,是的,我觉得这个就是相互促进吧。一方面,用人单位、公司他会提出需求,希望有什么样的人过来,另外一方面,高校他会改进他的培养方式,然后更符合我们这个市场的要求。
Q
那个时候做网站开发的薪酬和你去达梦的薪酬,哪个高哪个低?那时候达梦大概是一个什么情况?大概是多少人,现在大概是什么情况?

冯源:我找工作的时候基本没太去找偏应用的。2005年我刚进公司的时候,刚好遇到了我们是从DM3转到DM4。DM4开始,我们要从商业化的角度开始考虑,来构架一个更加工程化现代化的一个数据库源代码,我差不多是在那个时候进来的,刚好是在一个关键转型时间。

Q
数据库火其实是最近十年的事,可能前十年,其实数据库一直生存的很艰难,那个时候其实我觉得,包括达梦在内的很多国产数据库厂商,其实有一段时间,我觉得日子其实是特别不好过的,那个时候你那时候有没有犹豫过当时自己的选择?有没有想过放弃?就在最艰难的时候。
冯源:2010年的前后,我们有一个非常大的机遇,2008年当时不是做国家电网的选型嘛,国家电网要建灾备中心,每个省都要建。然后当时他们做的决定就是说,那灾备中心的数据库就选国产的,2008年到2010年有两年的时间,我们是感受到了真实的市场竞争的一个变化,我觉得这个是让我留下来的一个很重要的原因,那从2010年再往后到2012年、2013年,整个公司有很多类似的这种做抉择的机会,叫机会或者叫机遇或者挑战,其实是一个意思啊,这种节点是很多的,基本上就是我能够看到大家待在这个公司,他会朝着一个更好的方向去发展,然后我可以参与进来,我觉得这个是非常好的一件事情,所以我一直就五年五年五年的就留下来了。
Q
这18年了,你当时有没有自己想过,会看到达梦有一天能够做到上市甚至大家给达梦冠了一个国产数据库第一股的称号,这实际上变相地其实也是在认可达梦在这个市场的领导地位。
冯源:你看做国产数据库的这么多,然后这么十几年坚持下来,也不是只有达梦一家,你在今后的未来五年或者十年,然后这个市场变化会变成什么样子,如果你一直待在这里,如果你所在的团队发展壮大了,那当然你可以说是坚守的作用。但另一方面,也是一件风险其实是非常高的事情,你投入几十年,如果到最后这个没有做起来,那过去的几十年全部付诸东流。也不一定这么严重,但是这个确实有时候想想也挺残酷的。
Q
在达梦公司成立的时候,其实在这个同时期也还是有一些其他的公司成立,包括他们到现在为止也坚持下来了,但是实际上我看到的是大家的差距在慢慢地拉开,这个背后有哪些因素?在您看来达梦在某些方面做对了?或者说做得更好一点,然后让用户选择了我们?

冯源:我觉得过去十几年,你自己所做的一些工作其实是非常重要的,我们可以看到的一个结论就是,无外乎就指向这么几个方面:第一就是你的产品力够不够。
用户他做一个数据库的选择,肯定是一个理性选择,所以说在这个过程中,产品力本身好不好是非常重要的。那产品力又由什么构成呢,我想无外乎就是大家都能说到的:第一、稳定性好不好?可靠性好不好?性能好不好?兼容性好不好等等;第二就是保障能力。保障团队的建设,它可能是一个非常花成本的事情,但是你有了充足的保障团队,然后才能够给用户一个信心,我们是在这个服务保障团队的建设上面持之以恒地在做一些工作的。当然这个也得益于最初2008年国家电网的这个决定,因为你作为一个公司,你建立保障团队不是凭空拍脑袋定的,一定是已经有市场需求有客户了。
归纳下来,我觉得最核心的两点就是:一个是产品力本身,然后另外一个是保障的后勤的跟上。这两点,是让我们相对来说能够准备得充分一点,这样当机会来的时候,准备得更充分的人,他就会相对容易取得比较好的成绩。
Q
为什么达梦能够跟同期坚持下来的这些公司拉开差距?那客户他愿意为达梦产品买单的原因大概是什么?
冯源:达梦能够让客户选择达梦的产品,那就是在一次一次的 PK 中 P 出来的,我们的触角伸得非常灵敏,我们在一次一次 PK 中非常敏锐的捕获到了一个关键或者说用户的一个需求,就是你一定得把兼容性做好,到用户那边去做移植、做 PK,P 的多了我们的技术服务人员就会反馈需求,我们通过比较灵敏的一线人员反馈的信息,我们很快地给自己的产品做了策略的调整。
我们要符合事实标准,用户用的是事实标准不是国际标准,做产品策略的调整本身是一件很难的事情,深层次的问题不是这么简单的,比如说:用户用了大量的存储过程,现在希望你提供存储过程的调试,这个是兼容性能解决的吗?这不是一个简单的兼容性问题,他一定要去动数据库的内核,这个东西其实已经深入到 SQL、PLSQL 的执行层面的问题。也就是说,你要支持这个调试,你必须要去改你的 SQL 执行器嘛执行引擎嘛,所以说这个不是说我想做就可以做这个决定的,能做这个决定的前提是我能做。你如果对这个执行器做不到见微知著,那你很难做它,所以说很多需求,你快速调整你的产品策略的前提是这个东西。就像你手里的面团你想怎么揉捏就怎么揉捏,如果这个面团你揉捏不了,你就没办法做这个决定,或者说你有很多顾虑不敢去揉捏,那你就很难做这种快速的决定。
Q
您其实表达的意思是说,我对这个东西其实是完全掌控的。
冯源:对。所以我想怎么揉就怎么揉,我能 hold 得住。
Q
对,那您其实提到了很重要的一点,对 Oracle 的兼容性。网上也有另外一种传言说达梦的 Oracle 的兼容性做得特别好,是因为看到 Oracle 的源码,我觉得您可以在这说一说,澄清一下。
冯源:我觉得这个没什么澄清的必要。第一,这个言论有点瞧不起 Oracle。Oracle 的一整套源码,这么大一套、这么复杂一套的源代码,因为某个时间点泄露出来,我们自己读就读懂就掌握,我觉得这个想法太瞧不起 Oracle 了。从具体的技术人员的角度来说,去读别人的代码,其实是个非常痛苦的事情。另一个方面,对于我们自己来说,也瞧不起我们国内做数据库的团队,数据库这个东西,你说它难,确实技术门槛很高,但你要说做不出来也不至于。关系型数据库这个东西,你实现一个不是不可能,是完全有可能的。难的不在于说你能不能做出来一个东西,自己写出来一个不难,难的是你把它做成一个可用的、工业化强度的一个产品,这个是要大量的试错、大量的磨合,天时地利人和缺一不可,这个说法忽视了很多因素。
Q
这几年其实我们看到这种国际的局势,对于自主、可控的意识就变得比过去尤为强烈,在您看来的话,到底什么是自主、可控?真正的自主、可控,定义是怎么样的?
冯源:自主、可控是个很难界定的东西。我其实想举个例子啊,ClickHouse 您知道,你说 ClickHouse,你要是从起源论,那它是俄罗斯起源的,但是你说它最终可控吗?不可控对吧,它的商业运营交给了美国公司。你说怎么叫可控呢?如果是以这个这么极端的事例来看的话,有几点:第一就是技术可控,第二就是服务可控。To B 的软件是要持续维保持续服务的,你买软件只是第一步,那你后续上线使用过程中升级怎么办?维护怎么办?安全补丁要不要打?所以说如果拿这个来套的话,我们会发现:第一,你一定得自研;第二,你基于自己的自研,开源或不开源其实没有区别。就比如说甲骨文为例,他同时手里握着甲骨文和MySQL嘛。回过头来,如果说,假设我们中国有这么一个公司,他自己做了一个数据库,这套代码完全是自己做的,他可以选择用闭源的商业模式去做。也可以选择用开源的商业模式去做都OK,只要他保证说,这套核心代码是他自己写的,然后写他这套核心代码的技术能够传承下去。

Q
我想问一个具体的数值,就是到现在为止,达梦的研发团队大概是一个什么样的规模?之前大家讨论过,现在国内的数据库公司这么多,但是绝大部分的数据库公司可能是1-50人的这个规模,大家不认为这样的公司能够把一个数据库做好,所以说,我觉得这是一个能不能做好数据库可以参考的一个指标。
冯源:我们有几百人的研发队伍,而且我们一直在扩张。我们研发这边的队伍一直在膨胀规模,因为我们现在的产品要更稳健一些。因为我们服务的用户,从行业的角度来讲,开始有更多的关系到国计民生的行业。那这个产品的质量、架构稳健程度一定要保证,所以我们在这个方面一直在招人。
另外一方面,我们投人重点是这么几个方向:首先还是关系型数据库,关系型数据库是我们现在最重要的业务,所以说我们在这个方向上主要是固本。首先要固本,什么是固本?就是我们有很多客户,他比较看重的是共享存储集群的架构。我们在共享存储集群架构上要做到极致,做到最极致,能够满足用户的需求。另外一方面,是要发展。即便是关系型数据库,它也是有新趋势的嘛,上云也好,做分布式也好,都是不容忽视的新的方向。那尤其是现在,也确实有很多用户在做选型的时候,会明确地说希望去考虑分布式数据库。
你可能会发现,在关系型数据库我们的重点就是两个点,一个是集中式下面的共享存储集群的架构,另外一个,是分布式数据库的架构。但是我们长远来看,我们不太可能把这两个产品对立起来,达梦始终有一个理念,就是我们是统一内核,不管是分布式的也好还是集中式也好,我们只会维护一套代码,一个code base。在这个code base生成出的产品,它是具备分布式的能力的,也是具备集中式的能力。或者说在达梦这边,集中式和分布式是融合发展的,我们后面的目标,是会往这个方向去做的。

Q
2019年的时候达梦的营收是3.02亿,2020年的时候是4.5亿,那2021年就变成了7.43亿。这个年均的复合增长其实超过了50%,这种高速的增长是否具备可持续性?那未来达梦的增长空间在哪里?您觉得达梦在未来的战略规划里面,有哪些关键的措施可以去帮助达梦公司持续地发展和增长?
冯源:作为一个公司,应该是两条腿走路。第一条腿,现金流;第二条腿,未来的市场预期。我们一定要在关系型数据库继续保持产品的竞争力,然后保证我们有足够好的收益。第二,我们也要看到一些将来潜在的新市场,比如说图数据库,比如说分布式数据库等等。我们的未来可能就是集中在几个比较新兴的有潜力的数据库方向领域上。然后现在不是还有工业互联网以及智能制造,时序数据库也有可能也会是一个比较潜在的新的增长的点。所以说我们是在苏州成立子公司的目的就是提前布局去做一些工作,当这个市场发展起来了以后,我们可以有拿得出手的产品去应对。
总体上来说,我们的策略是围绕数据本身,不管是关系型的还是非关系型的,不管是事务的还是分析的,只要是数据处理本身的,我们都要关注起来,然后来做好这个潜在市场的跟踪。
Q
未来的,比如说三年五年,达梦的一个技术路线图大概是什么样的?
冯源:我们未来希望说,集中式数据库,也就是共享存储集群这个方向,我刚才提到一个是要做到极致,换句话说,我们的希望是在高可用上做到极致。第二,在分布式这边,我们是希望把它直接打造成HTAP型的分布式数据库,我们会让它在这种大规模的数据分析系统里面去用,然后我们也会有事务处理的系统去打磨。这个过程中我们会有一些技术攻关,去保证它在两种场景下都可以表现得更好,这个是我们对关系型(数据库)的规划。
如果说是在非关系型层面,首先是图数据库,我们一方面会是去完善产品,还有另外一个方面,就是我们如何去培育市场教育市场。那么除了图数据库,我们在成都,还有刚才在(前面)提到了在江苏,我们布局未来的这种面向工业场景的数据库。我们的第一步是现在做了一个键值型的数据库,我们在这个代码基础上,我们可以进一步去发展其它品类的数据库,文档型的也好,或者是时序型的也好,它是可以做到代码重用的。还有一个市场,就是数据库一体机,我们会从数据库厂商的角度来看这个一体机的设计,做出来这么一个一体机的产品。我们大体上来说,可以认为就说是,在数据库方向,就是关系型数据库,非关系型数据库,还有一体机。当然还有一些其它的挑战,比如说上云的问题啊,人工智能的问题,我们也都有对应的一些团队去进行对接。
Q
我最后一个问题其实是一个选型的问题。很多的企业在去选型的时候,他可能会面临着几个抉择。我们就以交易型数据库为例的话,他面临的抉择:一是我到底是用集中式还是用分布式;第二我到底是用开源的技术,还是用闭源的商业产品。我想知道您是怎么看的?
冯源:我其实觉得大部分场景,用集中式是可以支撑的。对于这些,用集中式就好了。有一部分小量的场景,集中式确实无法承担的,那可以用分布式。用集中式显然成本是更低的,因为分布式,它的架构决定了它的能效一定不高,它一定会带来这个通信同步的成本,更多的运维负担,这个是必然的。所以说我理解,分布式是属于一种叫作屠龙之技,就是说当杀鸡刀杀牛刀解决不了问题的时候,那就把屠龙宝刀拿出来去屠龙。
另外我其实是有一个更宏观一层面的考虑,我认为现在绝大多数数据库厂商是没有这个能力做好运维保障的,因为分布式目前还不是一个可以批量复制的一个标准化产品的东西,分布式的应用确实是点状的,它可能可以讲说我在某一个案例做得很成功,但是你很难,目前来看,很难看到它这个成功的案例是可复制、可批量化地铺开的。但是集中式的产品这么多年这么成熟,它是可复制、可批量替换的,它是一个产品思路。站在用户的角度去选型的时候,那可能用户你要考虑一下,你的这个业务系统,或者你给分布式数据库厂商所付的费用,是不是足以支撑他把你来当VIP,而不是把别人当VIP。你要上分布式,他也要上分布式,但是我的研发、派驻研发现场可能只能支撑我在一个用户现场去派人,这种情况下,你的分布式的需求还能不能按照你原先计划的进度走下去,因为他的规模,他的研发人员的数量可能没那么多。那如果说他能够支撑,他厂商规模比较大,他能支撑三家同时派驻现场人员,当第四家第五家找过来,他还能做得了吗?我觉得这个其实是从宏观层面角度考虑的话,有这么一个必然存在的瓶颈。
Q
那您的意思是说,就目前分布式这方面,它的产品化、标准化和它的生态,不足以支撑更大的规模?
冯源:对,这就是为什么达梦一定要把分布式和集中式融合的原因,它就是一个达梦数据库产品,你是以分布式的形态使用它,还是以集中式的形态使用它,不影响你的应用开发体验。如果做到这种程度,那么可以说这个分布式,它就具备了比较好的可复制的产品化的能力了。这个时候它就是可推广、可复制的。这个时候我觉得,才能缓解分布式目前遇到的这个瓶颈。就现阶段而言,大部分的场景用集中式是可以搞得定的。分布式呢,是确实集中式搞不定的时候再来考虑。开源闭源我觉得要看,闭源当然没有问题了。如果是开源的话,要看这个开源它是跟随模式还是自主模式。如果说它是基于原始的PG或者MySQL,那你为什么不直接去用PG或者MySQL,然后找一个运维厂商保障一下。然后如果是他有很强大的自研能力,研发出来一套产品然后开源,然后拿来使用,我觉得是可以的。
Q
谢谢冯总接受我的采访。
冯源:谢谢。

内容|品牌宣传部
编辑|杨小脸
校对|饭小闲
视频丨ITPUB





