暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

GPT-4o对比GPT-4-turbo实测,确实强!

IT周瑜 2024-05-14
41

昨晚,Open AI发布了新的产品GPT-4o
,o表示"omni",全能的意思,GPT-4o
可以实时对音频、视觉和文本进行推理,响应时间平均为320毫秒,和人类之间对话相当,也就是,以后跟你进行文字聊天、语音聊天、视频聊天的都可能是AI,当然,这样强大的模型,应用场景肯定不止聊天。

如何使用GPT-4o
呢?目前可以通过API的方式来使用GPT-4o
,但也只能使用到它的文字生成和图像理解能力,我这里给大家对比一下GPT-4o
GPT-4-turbo
两个模型的图像理解能力,我使用的提示词为:

{
  "role""user",
  "content": [
    {"type""text""text""这张图片里有什么?"},
    {
      "type""image_url",
      "image_url": {
        "url""图片url地址",
      },
    },
  ],
}

图片一,来自openai的官方demo「GPT-4o」:这张图片展示了一条木板路,通向一片开阔的草地。周围长满了绿草和一些灌木,远处可以看到一些树木。天空晴朗,蓝天上有一些白云,整个场景显得非常宁静和自然

「GPT-t-turbo」:这张图片展示了一条穿过绿色草地的木板路。图片背景是广阔的蓝天和些许白云,木板路两旁是高高的草丛和散布的灌木。整个景象给人一种平静和自然的感觉。这是一个很好的户外散步或自然探索的场所。

图片二,我的形象照「GPT-4o」:这张图片中的人物穿着古代武将的盔甲和帽子,看起来像是一个游戏或动画中的角色。他头戴红色的头盔,肩上披着一条蓝色的披肩,身上则穿着白色的战袍。

「GPT-4-turbo」:这张图片展示了一个动漫风格的男性角色。他戴着一顶装饰性的头盔,头盔顶部有类似羽毛的蓝色装饰。他的脸部表情坚定,眼神聚焦。角色穿着传统的东亚风格服装,颜色丰富,包括蓝色和紫色,以及一些绿色和金色的细节。整体上,这幅图像给人一种英勇和古典的感觉。

图片三,我的下一辆车「GPT-4o」:图片里是一辆蓝绿色的汽车,车牌上写着“Xiaomi SU7。” 汽车正在一条沿海公路上行驶,背景是海洋和远处的山丘。在晴朗的天气下,天空中有一些云。在车旁边还有一条护栏。整张图片给人一种宁静和速度的感觉。

「GPT-4-turbo」:这张图片展示了一辆深蓝绿色的汽车在沿海公路上行驶。这辆车是一款现代的轿车,具有流线型的设计和光滑的车身。图片中的背景是一个晴朗的天空和宽阔的海洋,远处有山的轮廓。整个场景给人一种清新和自由的感觉,同时突出了汽车的动感和高性能特征。

对比来看,个人觉得,「GPT-4o」的效果确实更胜一筹,另外,在我用代码测试的过程中,发现「GPT-4o」的生成速度也比「GPT-4-turbo」更快,所以「GPT-4o」确实强大,而且等到它开放了音视频接口后,势必又会掀起一波浪潮,同学们、老板们,拥抱AI刻不容缓啊!

在我的AI精品课中,第一时间更新了GPT-4o模型的接入教程,对我的AI精品课程感兴趣的同学,可以联系我,下方课程海报中有联系方式,备注【大都督AI】,记得「点赞、分享」哦,我是大都督周瑜,下期见。


文章转载自IT周瑜,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论