暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
gemini技术报告_中文版_LangugeX.docx
36
77页
2次
2023-12-11
免费下载
双子座:一系列高能力多模态模型
 团队,
本报告介绍了一种新的多模态模型家 它在图像、音频、视频和文本理解方面具有卓
越的能力。 系列包括   三种尺寸,适用于从复杂的推理任务到设备
广 
 个基  个中的水在经究的
 上实现人类专家性能的模型,并在我们检查的  个多模态基准测试中的每一个中提高
最先进的水平。我们相  模型在跨模态推理和语言理解方面的新能力将能够实现各种用
例,并且我们讨论了我们负责任地向用户部署它们的方法。
1. 介绍
我们在  发了一系列高性能的多模态模型 我们通过图像、音频、视频和文本数
据共同训练了 ,目的是构建一个在各个模态中具有强大的通用能力以及在各个领域中具有
尖端的理解和推理性能的模型。
,我们的第一个版本,有三种尺寸: 用于高度复杂的任务 提供增
性能和可扩展性,适用于大规模部署, 适用于设备上的应用程序。每个尺寸都经过特别设计
以满计算求。  在广、编码、和多
务上进行了全面的内部和外部基准测试。
  
 年; !"#" 等人,$! 等人, 年),
图像理解(%& 等人 '( 等人 )*+*,% 等人。从中学和高中数学
竞赛(-. 基准)中抽取的难度增加的数学问题中观察到类似的积极趋势  模型
表现优于所有竞争对手模型, / 次提示下达 0准确率。 于等人, 年)
 .*&***
1!"#"   
),理解%&  '( 等人 于序
23*,+ 等人)。/ 于神学习的历4'3
 2- 5( '("(%
0 6,7 "83% 9)
),使大规模培训成为可能。
我们最强大的模型  在我们报告的  基准测试中,  个基准测试中取得了
最新最先结果其中  行的和推基准试中  $ 像理基准
$ 6 6 0 0
 --4 "%&,*
 : : $

--- 基准;3 人, ,其包括多学务上图像问题大学
的学知识
请参阅贡献致谢部分以完整的作列表。件至 ::<&
=所有
Gemini:
A
Family
of
Highly
Capable
Multimodal
Models
2
通过知识和深思熟虑的推理, 实现了 6/的最新技术水平,超过了之前模型
超过 0 。它为视频问和音频理解基准测试提供了一的性能提
定性评估展示印象的跨模态推理能力,使模型能够地理解和推理音频、图像
文本的输入序列( 0 )。以 所示教育环境例。一位老师了一个理问题,
版,别学的具然后出一经过求解题的
开了们相  的多力在
域具有大应用。
问题的解模型能够确识别所有手验证理。除了理解
图像中的文本外,它还要理解问题的设遵循指示以 4.>?
('" ('"48" 
 理程序,它将  的推理能力与搜索和工具使用相结,以在解竞争性编程问
方面('" '"#&* 名前 0,相
排名前 0的最新技术前身有了大的改进(4 等人) 年)。
@
of 77
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜