cc

原创 kayla 2023-03-16

281

GPT-4在许多专业测试中表现出超过绝大多数人类的水平。GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。

离发布仅仅四个多月，在ChatGPT展现了惊人的实力之后，OpenAI又扔下了一颗核弹：GPT-4发布了。

在今天的博文中，OpenAI写到：

我们创建了GPT-4，这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型（接受图像和文本输入，提供文本输出），虽然在许多现实世界场景中的能力不如人类，但在各种专业和学术基准上表现出人类水平。

好像和上一代还是差不多？放心，这是OpenAI谦虚了。

在随后YouTube上进行的Live Demo中，OpenAI的总裁和联合创始人Greg Brockman展示了GPT-4的真正实力——总结文章、写代码、报税、写诗……GPT-3.5做不到的， GPT-4轻松拿下。

但这仅仅是表面，GPT再一次进化，虽然可能不是你想的那样。

新的模型：迭代优化

怎么样证明一个人比另外一个人更厉害？考试。

那怎么证明一个AI模型比另外一个更厉害？同样是考试。

OpenAI让GPT-4在参加了许多项人类的通用考试，结果证明，它在许多测试和基准测试中的表现比前一代确实大大提高：

根据他们的测试结果，GPT-4的SAT分数增加了150分，现在能拿到1600分中的1410分；

它能通过模拟律师考试，分数在应试者的前10% 左右，相比之下，GPT-3.5的得分在倒数 10% 左右；

在SAT阅读考试中和SAT数学考试中，GPT-4的成绩都能达到领先的排名……

chatgpt

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者