9月8日,“地心引力 · 2023 DolphinDB 年度峰会”在杭州举办。DolphinDB 创始人、CEO 周小华博士进行了“引领数字金融时代的基础软件创新”主题演讲。

周博士讲述了自己的创业故事,从时代发展视角为大家分享选择金融领域基础软件进行创业的初衷。DolphinDB 作为一款基于高性能时序数据库,支持复杂分析和流数据处理的实时计算平台,其根本定位始终是开放的企业级基础软件。与金融行业深度融合的差异化策略,让 DolphinDB 在短短六七年的发展时间中,收获了大量用户的认可。
以下是周博士在峰会分享的全文内容:

大家早上好!欢迎大家来到杭州参加 DolphinDB 2023年度用户峰会!
我今天要分享的题目是,”引领数字金融时代的基础软件创新“。
DolphinDB 是国内为数不多的,针对金融领域的业务需求而研发的基础软件。未来我们也会继续深耕金融领域,为大家提供优质高效的基础软件,不断提升金融行业的生产力。
01
创业故事

2016年的时候,我们三人全职投入到了 DolphinDB。2018年底的时候,我们收获了第一个付费客户。截至8月份,我们已经有超过130位员工,付费客户超过100个,国内外社区用户的数量以每周300多的人数在快速增加,DB-ENGINES 时序数据库榜单的排名也上升到了国际第6,国内第1。DolphinDB 的快速成长,离不开国内大资管行业规模的高速增长,更离不开在座的各位用户对 DolphinDB 的支持与厚爱, 谢谢大家!
02
选择基础软件创业
在过去几十年里,国内金融行业的 IT 供应商,层出不穷,百花齐放,很多应用系统都达到了很高的水平。唯独在基础软件,尤其是针对金融行业的数据库、计算引擎、实时计算引擎方面,没有一家出色的厂商。而这些恰恰是一个金融机构差异化竞争的 IT 基础。

首先,不断增长的海量数据需要一套高性能数据库;其次,不断变化的业务逻辑需要快速开发的能力;再次,永无止境的对性能的追求要求高性能的批计算系统与低延时的流计算系统。
如果我们的系统可以做好这三点,我们相信,这个系统就可以为金融领域数据分析相关的业务提供一个良好的基座来进行开发,让用户把精力聚焦于核心业务。
03
DolphinDB自画像:三位一体的
自主式实时计算平台
DolphinDB 是一个企业级的基础软件,是一个基于高性能时序数据库,支持复杂分析与流处理的实时计算平台,赋予用户强大的自主开发的能力。
3.1 DolphinDB的定位:基础软件

3.2 企业级基础软件
DolphinDB 定位一个企业级的基础软件,可以作为整个机构的基础设施。首先,DolphinDB 可以纳入一个机构IT部门全局的用户管理体系、应用监控体系、安全监控体系以及运维管理体系。其次,DolphinDB 可以融入企业的数据治理体系,数据安全策略,以及弹性的存储和计算资源管理体系。再次,DolphinDB 可以满足一个大型机构海内外分支机构的部署需要,以及异地多中心的部署。最后,一个企业级的基础软件,必须配套企业级的服务。DolphinDB 正在建设一个全方位的从生态、售前、售中到售后的专业的技术支持体系。DolphinDB 也正在完善从用户手册、教程案例、白皮书,最佳实践到用户问答的多层次的文档体系,并提供统一的搜索界面。我们也在和第三方合作开发私有的垂直大模型,在不久的将来提供更智能化、更高效的服务体系。

3.3 赋予用户自主开发能力

04
DolphinDB 解决了什么问题?
DolphinDB 比其它国产的基础软件得到了金融机构更多的认可,最核心的原因在于 DolphinDB 团队对金融业务有深刻的认识,充分理解金融IT的价值点。
4.1 差异化策略,“对着钉子造锤子”
我们从设计产品的第一天开始,就明确一定要把基础软件与金融行业的需求深度的融合起来,真正去释放金融 IT 的生产力。有人是拿着锤子到处找钉子,我们是对着钉子造锤子。我还记得当年团队讨论的一些结论:一定要充分利用金融数据的时序特性来提升存储效率,一定要做高可用来解决金融可靠性的强需求。一定要强化计算来提升业务价值,一定要提供丰富的函数库来适配金融业务,一定要有编程语言来满足金融计算的复杂性要求,一定要做流式增量计算来降低实盘业务的时延。

4.2 数据驱动业务的本质,数据-投研-生产
随着大数据和人工智能的发展,越来越多的金融业务开始启用数据驱动业务的模式。譬如量化交易、算法交易、做市业务、衍生品定价、风险控制、指标计算等都采用了这种模式。虽然具体业务不同,但本质上都是遵循了 数据-投研-生产 这个模式:收集和清洗大量历史数据,用历史数据建模,最后在生产实盘中进行模型推理和决策。这个模式背后对应的技术,则分别是数据库,批计算和流计算。与其它的基础软件只关注存储不同,DolphinDB 理解存储和计算并重对金融的重要性。DolphinDB 把这三个技术糅合在一个系统里,可以大大提升金融业务推进的效率。

4.3 不断拥抱新技术,提升系统开发和运行效率
金融 IT 非常关注两个效率:系统开发效率与运行效率。DolphinDB 提拱了很多技术,来提升这两种效率。我们先来看 DolphinDB 如何提升系统开发效率:DolphinDB 引入了多范式编程语言,向量式、函数式、SQL 编程可以大大缩短开发时间;流批一体的技术,也可以大大缩短从研发到生产的时间。我们即将推出的 Python Parser,可以让用户将存量的 Python 代码无缝切换或稍加修改后快速切换到 DolphinDB 平台。

DolphinDB 希望通过提升系统开发效率来提升金融机构在行业中的竞争优势,提升运行时效率赢得实盘博弈中的领先优势。
05
DolphinDB 给金融行业 IT 带来了什么变化?
5.1 从各自为政到形成行业最佳实践

这种正向的交流和积累,对一个行业来说非常重要。DolphinDB 愿意继续做好这个中间角色,后面推出更多的线下交流活动,让行业中的各位大咖有更多火花碰撞的机会。
5.2 把宝贵的精力聚焦到业务上来

原先业务人员使用 Python 其实也是这个逻辑,因为 Python 简单易学,技术门槛低。但是 Python 的性能不够好,不能满足大数据处理或生产环境的需要。DolphinDB 出色的性能弥补了 Python 的短板,能兼顾到业务方和技术方的需求。
5.3 大数据分析更简单更高效

在 DolphinDB 之前,金融行业的大数据分析大致有3个生态,DolphinDB 与之相比,至少在性能、功能和易用性中的某一个维度有了大幅提升。Python 是用的最多的一个生态。Python 的 pandas 和 numpy 能够满足金融复杂数据分析的功能要求,但处理大数据时性能不够高,DolphinDB 的性能通常超越Python 1~2个数量级。第二个生态使用类似 Hadoop、ClickHouse 等大数据工具来解决。这类方案的主要是缺点是运维和部署的复杂度较高,对金融业务的适配比较有限。第三个生态主要来自于早期的量化私募。他们直接将金融数据存为私有的二进制文件格式,然后直接写 C++ 程序实现每一个数据分析。这种方式的缺点非常明显,开发和调试的成本太高;优点是性能优异。但在很多 PoC 测试过程中我们也发现,这些定制的分析程序,性能上并没有超越 DolphinDB 这种通用化的方案。
06
一起创造未来
6.1 培养行业IT人才

6.2 孵化插件市场
一个好的生态需要大量优质的应用。在 DolphinDB 上开发一个好的应用就是开发一个插件。DolphinDB 内部有专门的插件开发团队,帮助我们的客户开发在行业内有共同需要的插件。截至8月份,这个团队已经帮客户开发了近百个各种类型的插件,现在平均每周新推出一个插件。

6.3 工程化落地

寄语
产品和服务是 DolphinDB 的生存之本,为行业客户创造价值是 DolphinDB 的一贯目标。我们将始终如一为大家提供高质量的产品和服务,共同前进,希望一如既往的得到您的支持! 谢谢!




