大模型行业竞争态势研究报告.pptx

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大模型行业竞争态势研究报告

0102海外龙头轮番抢占第一宝座,比拼整体性能和多模态交互国内大模型逆袭之路:聚焦长文本,降价迭代提升竞争力目录CONTENTS

301海外龙头轮番抢占第一宝座,比拼整体性能和多模态交互高速迭代,海外龙头轮番占领大模型之巅大模型高地争夺:多模态的理解和响应,原生多模态技术比拼比较维度升级:从模型到叠加终端,跨设备的使用效果体验

4OpenAI、Google、Antropic三大厂商竞相轮换大模型第一宝座:自23年初GPT-4发布以来,在1年左右时间内基本稳定处于大模型最强位置。2024年海外大模型迭代速度有所加快,龙头竞争格局悄然发生变化。1)5月,OpenAI发布新的旗舰模型GPT-4o,实现跨模态即时响应,相比GPT-4Turbo,刷新SOTA实现性能飞跃。2)5月,Google发布Gemini1.5Pro进阶版,实现200万tokens上下文,具备更强大的推理和理解能力。3)6月,Antropic发布Claude3.5Sonnet,具备更强的代码和视觉能力,基准测试结果全方位碾压Gemini1.5Pro和Llama-400b,大部分优于GPT-4o,一定程度上暂时代表着当前大模型性能最高水平。资料来源:APPSO微信公众号,Antropic官网等,德邦研究所图表:海外龙头竞相抢占大模型第一宝座1.1高速迭代,海外龙头轮换占领大模型之巅

5资料来源:OpenAI官网,德邦研究所(注:Llama3400b还在训练中)1.1.1初代:GPT-4o自我革命,持续刷新综合性能在传统基准测试中,GPT-4o在文本、推理和编码智能方面实现了GPT-4Turbo级别的性能,同时在多语言、音频和视觉功能上达到了新的高水位线。文本推理:GPT-4o在0-shotCOTMMLU(常识问题)上创下了88.7?的新高分。此外,在传统的5-shotno-CoTMMLU上,GPT-4o创下了87.2?的新高分。相较于GPT-4Turbo而言,GPT-4o文本推理能力有一定提升。多语言识别:与Whisper-v3相比,GPT-4o在多种语言的识别中表现优异,尤其是资源匮乏的语言。音频翻译:GPT-4o在音频翻译表现上达到新的高水准,且在MLS基准测试中优于Whisper-v3。图表:与Whisper-v3相比,GPT-4o在多种语言 图表:GPT-4o在音频翻译表现上达到新的高水准的识别中表现优异(越低值越优异)图表:GPT-4o文本推理相较GPT-4Turbo有一定提升

6资料来源:OpenAI官网,德邦研究所(注:所有视觉评估都是0-shot)图表:在M3Exam基准测试中,GPT-4o比GPT-4强M3Exam测试:M3Exam基准测试既是多语言评估也是视觉评估,由来自其他国家标准化测试的多项选择题组成,有时还包括图形和图表。在所有语言的基准测试中,GPT-4o都比GPT-4更强。视觉理解:GPT-4o在视觉感知基准上实现了最先进的性能。具体来看,GPT-4o在MMMU测试中分数达到69.1,而GPT-4Turbo、Gemini1.0Ultra、Gemini1.5Pro、ClaudeOpus分别为63.1、59.4、58.5、59.4。GPT-4o多模态能力范围显著拓展:除了文本、图像等常用功能,GPT-4o还支持3D物品合成、文本转字体等多样化功能。GPT-4oAPI性价比有所提升:与GPT-4Turbo相比,GPT-4o速度提升2倍、成本却降低了50?,且速率限制提升5倍。图表:GPT-4o实现3D物品合成图表:GPT-4o在视觉感知基准上实现了最先进的性能1.1.1初代:GPT-4o自我革命,持续刷新综合性能

7请务必阅读正文之后的信息披露及法律声明。资料来源:Google《Gemini1.5:Unlockingmultimodalunderstandingacrossmillionsoftokensofcontext》,德邦研究所图表:进阶版Gemini1.5Pro在基准测试中性能整体超越前代1.1.2二代:谷歌Gemini更极限的上下文理解、更低延时图表:Gemini1.5Pro理论上下文极限为1000万tokens(高性能)进阶版Gemini1.5Pro:谷歌5月发布,上下文窗口翻倍、具备更强大的推理与理解能力。上下文:过往Gemini1.5Pro支持100万tokens上下文,升级后可支持200万tokens(理论极限为1000万tokens),意味着可输入分析2小时视频、22小时音频、超过6万行代码或者140多万单词。这使得Gemini1.5Pro能处理更大量的复杂信息,生成更准确、

您可能关注的文档

文档评论(0)

138****4948 + 关注
实名认证
内容提供者

电子信息工程师持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月10日上传了电子信息工程师

1亿VIP精品文档

相关文档