暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

9名AI 考生闯高考谁能超越人类一本线?

yangyidba 2024-06-26
277

有媒体让9家AI挑战 2024年高考难度最高的新课标Ⅰ卷:河南卷

最终四个考上一本,ChatGPT第一,国内字节豆包第一,  一本率 44%。

整体表现:

  1. 9个AI,4个过了一本线,河南高考一本线(文科521分,理科511分),GPT4o最高分达562分,超一本线41分,排名第一,豆包542.5排名第二,位居国内模型第一

  2. 大模型文科表现优异,理科较差,数学全都不及格。文科最高分为562分(GPT-4o),理科最高分为478.5分(文心4.0)(数学诚不欺我,不会就是不会,原来AI也怕数学)

科目表现:

  1. 语文、英语:语言类优势明显,甚至古诗文也能拿到90%得分率。
  2. 数学:在简单推理题上表现较好,但做不好复杂推导和证明类题目,逻辑能力还有待提高。
  3. 文理综合:文综里最像理科的地理最差,多数得分不到60%,
  4. 理综里最像文科的生物最好,半数模型能做对一半以上题目。物理最高分仅有两家过50。有意思的是 GPT-4o政治最强,拿到了夸张的 91.5 分。GPT-4o 的政治觉悟比本地的还高?

考生名单:

GPT-4o(OpenAI)
豆包(字节跳动)
文心 4.0(百度)
百小应(百川智能)
通义千问 2.5(阿里巴巴)
Kimi 智能助手(月之暗面)
元宝(腾讯)
智谱清言(智谱 AI)
海螺 AI(MiniMax)

  AI和人比究竟能力如何,高考测试算是从侧面交出了一份答卷。

文章转载自yangyidba,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论