暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

cc

原创 kayla 2023-03-16
281

GPT-4在许多专业测试中表现出超过绝大多数人类的水平。GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。

离发布仅仅四个多月,在ChatGPT展现了惊人的实力之后,OpenAI又扔下了一颗核弹:GPT-4发布了。

在今天的博文中,OpenAI写到:

我们创建了GPT-4,这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,提供文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平。

好像和上一代还是差不多?放心,这是OpenAI谦虚了。

在随后YouTube上进行的Live Demo中,OpenAI的总裁和联合创始人Greg Brockman展示了GPT-4的真正实力——总结文章、写代码、报税、写诗……GPT-3.5做不到的, GPT-4轻松拿下。

但这仅仅是表面,GPT再一次进化,虽然可能不是你想的那样。

新的模型:迭代优化

怎么样证明一个人比另外一个人更厉害?考试。

那怎么证明一个AI模型比另外一个更厉害?同样是考试。

OpenAI让GPT-4在参加了许多项人类的通用考试,结果证明,它在许多测试和基准测试中的表现比前一代确实大大提高:

根据他们的测试结果,GPT-4的SAT分数增加了150分,现在能拿到1600分中的1410分; 

它能通过模拟律师考试,分数在应试者的前10% 左右,相比之下,GPT-3.5的得分在倒数 10% 左右;

在SAT阅读考试中和SAT数学考试中,GPT-4的成绩都能达到领先的排名…… 

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论