周末在DTC听了戴明明老师现场分享的语言大模型和数据库运维的实践,并且他做了一个预言,在不远的未来,大概是两三年后,生成时AI将会成为DBA们的好帮手。这个观点我是非常认同的,AI和DB本身就是互相成就的关系,没必要分个你我。除了这些,AI还能在哪些领域获得应用,我自己也做了一些猜想。
1. 数据脱敏
在金融行业,数据脱敏始终是一个老大难。监管要求下,数据的脱敏,是一个刚需,这不是60分和100分的问题,而是0和1的问题。只有做与不做,没有做多少的问题。1万个客户数据,有1条没有做好,那么整个脱敏工作就是不合格。在过往的工作中,有时候甚至还要人工去做最后校验,实际上是一个非常麻烦的问题。脱敏脚本写的如果比较粗糙,又会出现雷同的尴尬,比如之前某个供应商提供的脱敏脚本,甚至出现了两个不同客户信息在脱敏的时候某些字段信息脱敏成一模一样的事情。业务部门拿来做测试发现,怎么算都算不对,追溯源头发现,那个对应字段包含在聚合查询条件里,影响了结果。
而如果生成式AI能够根据学习结果,去做好脱敏,那么其实是一个非常高效的方式。既不用再担心有哪些数据出现重复,也不会担心有某些脱敏的数据形式和实际业务脱节。现在已经有一些厂商开始去探索,也许很快就有成熟的产品问世。
2. 数据生成
和脱敏不同的是,随机生成的数据需要有一个合理的范围区间,这里面有很多组合和复杂的条件,而且现实生活中,真实的数据背后不仅仅是几个字段的组合,还与地域、习惯、民族、家庭有着千丝万缕的关系。生成的数据之所以经不起推敲,就是在这些背后看不见的地方,生成工具没有考虑到。很难完全通过工具或者脚本做好数据的适当性管理,所以就会出现90岁夫妇有3岁双胞胎孩子或者只卖奶茶的店铺一个月进了1200只白羽鸡这种匪夷所思的场面。
这些规律实际上通过AI是可以尽可能去学习模拟这些背后的逻辑,让合理性趋近于实际生活和实际业务。而单纯的数据生成工具想要模拟,还不如找个游戏npc引擎去生成更合适一些。毕竟游戏npc引擎是经过更多打磨才有的结果。
3. 变更管理
以前在业务变更高峰期的时候,上百个系统一个月下来能提上百个的变更申请,全靠人工审核。各个系统开发人员大家水平不一,习惯各异,提的变更申请和变更内容也是参差不齐。有的可读性极差,光看文字描述看好几遍都看不明白为什么要提这个变更。更别说实际的变更内容以及影响范围。往往到这时候,我电话和聊天工具都经常被项目经理拉爆,这个问我怎么还没审核通过,那个跟我说业务催得紧能不能插队。然而流程上,就我一个人有权限,只能按照编号和系统内填写的紧急度一个一个来。AI也许可以通过对诸多变更管理内容的学习,去快速总结学习,让审核人员一眼就能确定变更内容、变更原因、影响范围以及最佳停机窗口。
当然,甚至可以把一部分审核权也交给AI,从而解放DBA自己。但是永远记住,审核的结果自己一定要清楚,否则真的出了问题,锅是你自己的,AI可不能帮你背这个锅。
4. 述职材料
写到这里,把自己主持DTC分会场中的几个脑洞就算都总结完了。实际上分会场里,大家分享的更多的是纯技术,对于AI技术怎么真正和工作相结合,仍然还需要我们不停探索。在印度神话中,毗湿奴用三步跨越了三界,丈量出世界的维度,才有了躺在阿南塔上沉睡的后续,梵天在他睡梦中开始创造万物。我们对AI的使用和探索,也许还只是毗湿奴的第一步,创造万物还在更后面。




