传媒互联网行业大模型进程焦点:OpenAI春季发布会及谷歌开发者大会要点归纳-240516-信达证券-11页.pdf

传媒互联网行业大模型进程焦点:OpenAI春季发布会及谷歌开发者大会要点归纳-240516-信达证券-11页.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

[Table_Title]

证券研究报告大模型进程焦点:OpenAI春季发布会及谷歌

行业研究开发者大会要点归纳

[Table_ReportType]

行业事项点评

[Table_ReportDate]2024年5月16日

[Table_StockAndRank]

[Table_Summary]

投资评级事件:北京时间5月14日凌晨,OpenAI发布了必威体育精装版模型GPT-4o,GPT-4o

(“o”代表“omni”)接受文本、音频和图像的任意组合作为输入,并生

上次评级成文本、音频和图像的任意组合输出。它可以在短至232毫秒的时间内响

应音频输入,平均为320毫秒,与人类的响应时间相似。它在英语文本和

[Table_Author]

冯翠婷传媒互联网及海外首席分析

代码上的性能与GPT-4Turbo的性能相匹配,在非英语文本上的性能显著

提高。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。

执业编号:S1500522010001

联系电话

邮箱:fengcuiting@

GPT-4o的文本和图像功能5月14日已经开始在ChatGPT中推出。OpenAI

正在免费套餐中提供GPT-4o,并向Plus用户提供高达5倍的消息限制,

未来几周将在ChatGPTPlus中推出新版语音模式GPT-4o的alpha版。开

发人员现在还可以在API中访问GPT-4o作为文本和视觉模型。与GPT-4

Turbo相比,GPT-4o速度提高2倍,价格降低一半,速率限制提高5倍。

OpenAI计划在未来几周内在API中向一小部分值得信赖的合作伙伴推出对

GPT-4o新音频和视频功能的支持。

在OpenAI发布会上,团队展示了GPT-4o的多个功能。包括实时语音交流

能力,几乎无延迟,达到真人聊天的水平;可以识别用户的语音情绪,语音

有情感;可以使用不同语言(英语、意大利语)和多人同时交互;在语音的

同时可以与视频实时交互;实时交流,协助阅读代码,指导编程;实时视频

聊天,并识别情绪等。

北京时间5月15日凌晨,GoogleI/O开发者大会正式开幕。公司更新了

Gemini1.5Pro,引入了1.5Flash较小型号的Gemini版本,同时也增加了两

个新的Gemma模型。Gemini1.5Pro:普通版本配备了100万token上下

文窗口,而Gemini1.5Pro将在GoogleAIStudio或适用于GoogleCloud

客户的VertexAI中的候补名单中拥有200万个代币上下文窗口。在智能

[Table_OtherRe

您可能关注的文档

文档评论(0)

std85 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档