暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

天云数据:软件2.0时代将由数据编写代码,数据驱动模型生产

天云大数据 2021-11-05
769

2019年世界人工智能大会,特斯拉创始人兼首席执行官埃隆-马斯克 (Elon Musk)在提及AI的发展时表示:人类最后的工作是写软件,之后AI就可以自己写软件。

2019年,谷歌大脑就在论文上提出:让神经网络来代替程序员源代码编辑的工作。

为了能够达到这个目的,谷歌的研究人员收集了上千个开发者的源代码,并用这些源代码构建了一个大型的编辑序列数据集,由此模拟出了一个模型,从而实现让AI写代码。

亚马逊创始人杰夫·贝索斯(Jeff Bezos),2018致股东信:在过去的几十年里,计算机被广泛用于完成自动化任务,后者往往是被清晰的规则和算法描述的。如今,机器学习技术允许我们在难以精确描述规则的边界内完成同样的任务。

软件1.0时代

程序员的水平决定了软件的上限

众所周知,软件1.0时代,所有的软件都是由人编程实现。

软件由数据结构和算法构成。在软件1.0时代,数据结构包括栈、队列、二差堆、列表、链表、哈希表、二叉树、B+树、数组、矩阵等;算法包括排序、搜索、回溯、匹配、递归、规划、流等。可以概述为,程序员智力+最佳实践+复用封装=软件1.0时代。

代码表达的是一种程序规则和逻辑结构,计算机通过运行代码逻辑来执行程序指令,每一个产品功能都是有一系列的程序指令构成的。

代码是工程师对逻辑的理解和表达,同样功能的系统,两个工程师写出来的代码完全不一样的。可以说在软件1.0时代,程序员的水平决定了软件的上限。

软件2.0时代

将由数据编写代码,数据驱动模型生产

在软件2.0时代,数据结构开始基础设施化,高精尖的算法学习流水线化。

首先,数据结构基础设施化。数据机构变成了File system、 分布式文件系统、RelationDB、 关系型数据库、Search Engine、搜索引擎、NoSQL KV、GraphDB 图数据库、HTAP融合数据库。

其次,高精尖的算法学习流水线化。在Data Modeling:ADG数据探查、FE 特征工程;在Algorithm Modeling:模型训练、模型评估、推理服务发布。


在软件2.0时代,软件工程逐步由程序员个体脑力劳动生产,转向数据驱动的算法应用自动生产,软件将进入AI规模化生产阶段。

现在市场很流行说“业务中台”和“数据中台”。简单理解业务中台是流程驱动,逻辑复用;数据中台是数据驱动,模型复用

但技术的市场千变万化,首先在算法上摩尔定律失效,大规模分布式大规模协同算力开始产生新的变化;其次,互联网带来数据实时性的需求,爆发第三波数据红利;最后,算法重构重构世界,在今天的数字经济中,很多基于我们经验规则流程的商业实践,甚至一些物理的公理定理,都开始让位于数据和算法所训练生成的新的知识。

因此流程驱动的业务就像“乐高玩具”,可以拼凑出来的一双运动鞋,就像Java代码可复用。IT时代构建好系统以后,输出数据和程序得到商业结果。比如办公软件,OA、ERP、BOSS、MIS、财务管理、计费 ……

乐高玩具

而数据驱动的业务更像是“3D打印”鞋的生产,3D扫描脚的形态以后打印出一双鞋,DataML面向目标ML。DT时代是输入输出一体化,将数据、程序和商业结果一起输入,通过智能化系统来生产出程序,比如推荐系统、打车系统、无人驾驶、金融定价……

3D打印

软件定义世界,数据驱动未来

今天的社会,算法正日益渗透社会生活的各个方面。

在人们的信息获取中,推荐算法已成为信息过滤的一种重要手段。无论是商品信息的获取,还是新闻或知识性信息的获取。推荐算法对于人们认知的影响,也将进入深层。而人们在各种平台阅读的内容,很多是由算法驱动下的机器自动完成。算法正在成为信息环境建构的重要力量。

在未来十年,我们相信最重要的软件将由深度学习创造。

深度学习可以利用数据编写软件,因为深度学习是学习样本数据的内在规律和表示层次,它具有无限的计算能力。

数据AI “可解释”的突破不在AI技术本身,在于它面向的问题能否突破传统认知参照系。第一次工业革命以机器代替手工劳动,是一次技术变革,也是对人类认知的突破。

2020年时,在某大型股份制商业银行项目实践中,天云数据普通员工就可写上千个数据流程知识包,释放捆绑在代码上机械脑力劳动的智力工作者。

该银行想智能解读各项政策,支持企业极简政策匹配与精准补贴测算。但企业应用APP原有更新流程,从功能定义至用户可下载更新版本,耗时以周计,应用更新速度难以匹配业务变革速度;当多种多样的政策补贴业务出现时,难以及时通过电子渠道生成申请界面。

通过应用天云数据Gaea专家决策引擎,由业务人员通过决策引擎配置方式将最新的政策补贴场景需求转化为知识包,实现对企业符合政策的极简匹配精准测算,并通过数据包推送的方式热发布至客户端,免去应用更新的繁琐审批流程,快速就绪新业务服务。通过OCR、NLP技术和深度学习算法抽取政策核心要素,利用智能模型将政策文本(5000+)转化为可执行策略,并形成知识包上线,当新政策入库时,业务人员就可操作,最快30min即可进行热发布,而且政策知识包可继承可复用

关于天云数据

天云数据,成立于2015年,是国内能够同时提供数据基础设施和数字原生全产业服务链的科技公司。秉承“数据+智能”的理念致力于AI-Native数据库和人工智能软件的研发与创新,推动企业向数字原生迈进,赋能产业数字化转型。

硬核技术厂商:专注技术研发,所获专利、软著百余项;天云数据CEO雷涛荣获国家级AI最高奖项—吴文俊人工智能科学技术发明奖;入选Forrester机构PAML报告,人工智能认知层第一象限公司。

是“双新企业”:国家高新技术企业、中关村高新技术企业;是首批中关村前沿科技企业重点计划的企业;入选中科院发布的“人工智能企业百强榜”;

是国家级专精特新“小巨人”企业:国家级专精特新“小巨人”企业;北京市专精特新“小巨人”企业;北京市专精特新中小企业;

截至目前,天云数据已经为超过50+家五百强及上市公司提供服务,涉及金融、科技、石油、电力、生物医药等多领域。

最后修改时间:2021-11-05 09:44:00
文章转载自天云大数据,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论