暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
chatGPT学习笔记.pdf
142
11页
0次
2023-02-10
100墨值下载
爆红出圈的 AI 聊天机器人 chat GBT 背后的研究实验室 OpenAI,正在以收购邀约
形式出售现有股份,估值高达 290 亿美元,在没有收入和利润的情况下,成为最值
钱的美国出场公司之一。我们认为这一个事件可能是 AI 时代资本定价的一个标杆事
件,商业价值已经获得了全球资本的高度认可。
Q:拓尔思公司发展的背景和场景应用?
A:公司曾于 1993 年成立是全球的中文检索的创始者,公司成立之初,主要的技术方
向围绕着中文全文检索,第一批用户主要是媒体用户。 1997 年获得过国家科技进步
二等奖,电子部科技进步一等奖。2000 年到 2011 年阶段,公司核心技术是基于检
索技术,开发智能内容的管理。2007 年我们启动了核高机的非结构化数据系统的研
专项。
拓尔思是作为第一家大数据公司上A 股,公司持续在自然语言处理技术上做研究。
语音智能是公司的核心技术的发展场景。NLP 自然语言处理的技术在各个场景中的应
用上,我们不断进行深入的拓展。治安语言处理在整个搜索引擎、智能客服,舆情分
析还有内容处理方面。通过持续的打造,形成了我们每个板块深度应用场景,同时打
造了一批属于公司专属的软件平台,这一块是我们业务收入的增长,基于我们对各个
场景应用的熟悉,为用户输出了大量的、有时效的应用效果。
拓尔思公司所有的人工智能应用来自于公司对各种算法模型的积累。在 A 股市场横向
比较,在诸多的公司里,我们真正掌握了大量数据资产。2000 多台服务器分布在全国
的三个数据中心,每天日增 1 亿条的开源的互联网的数据,公司已经积累了将近 1300
亿条的开源的数据资产。因为有了数据资产,我们才能做各种各样的训练模型,才能
够积累算法。
公司已经积累了 300 种以上的算法,并且对每个场景,如知识图谱的展现、知识库
的建立档案、包括前期数据采集、数据的标引,关于数据要素的环节,我们都有自己
以完全知识产权的软件平台。搜索引擎是公司自然语言处理的核心应用技术,公司 30
年以来坚持这方面的积累。在全国大量企业级的搜索都在用 ELSG 的设计 spark 开源
软件的时候,公司完全做到了自主可控,应用到政府、金融,包括媒体等诸多行业。
公司数字经济研究院目前主要研究方向是人机对话,公司近几年在智能问答,围绕着
像中国中医科学院的中医中文问答,中国标准化研究院的国家标准的问答,人民卫星
出版社的小 a 机器人,时代经济出版社的审计问答、吉林政务的小机智能机器人等。
除此之外,公司围绕着知识图谱事件分析,包括机器人自动写作、智能内容创作,我
们都有多个成功的案例
公司研究人员对于整个 OpenAI 过去、现在和未来进研究。结合公司的技术沉淀的事
实和对场景应用研究,未来的展望,我们做了系统的梳理。ChatGPT 领了数字劳动
力时代,它将是生产力的第五次革命,在新的一经济时代,用工模式将会快速演变。
目前人员用工模式有全职员工、外包员工、兼职员工三大传统的用工模式。现在出现
了第四种用工模式,即数字化的劳动力,打破了人与机器的边界,依托人工智能技
术,包括 NLP 相关技术,自主完成或者协助人类完成各种工作,比如前端对客或者
工文案的工作等。或者中后台运营协同的等工作。在传统劳动力跟数字劳动力的结合
下,通过 NLP 技术赋能,让传统劳动力爆发出更高效增长力。根据麦肯锡统计到
2030 年,数字化,劳动力市场规模可以达 1.73 万亿水平。chat GPT 的火爆,加
速推动这个事件。
劳动数字化全面转变核心在于劳动力它的大脑、认知能力跟分析能力决定了数字劳动
力是否能够准确的理解人类的任务指令,是否能够高效准确完成任务。chatGPT 基于
人类反馈的强化学习,经过千亿规模的模拟训练,能够有非常好的模型表现,可以融
合世界的知识跟规则,使得认知能力跟沟通能力能够取得接近人的水平。chatGPT
火爆将增强大众对于对话式的 AI 的信心。我们会有更多的研究来加入行列,推动整
个对话式的 AI 的发展。
对话式 AI 方向大概分成四类,一类是信息查询类的,用户可查询企业相关信息,相当
of 11
100墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜