大模型行业竞争态势研究报告.pptx

下载文档

0
0
约1.86万字
约 37页
2024-08-01 发布于北京
举报
版权申诉
保障服务

大模型行业竞争态势研究报告.pptx

1、本文档共37页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

大模型行业竞争态势研究报告

0102海外龙头轮番抢占第一宝座，比拼整体性能和多模态交互国内大模型逆袭之路：聚焦长文本，降价迭代提升竞争力目录CONTENTS

301海外龙头轮番抢占第一宝座，比拼整体性能和多模态交互高速迭代，海外龙头轮番占领大模型之巅大模型高地争夺：多模态的理解和响应，原生多模态技术比拼比较维度升级：从模型到叠加终端，跨设备的使用效果体验

4OpenAI、Google、Antropic三大厂商竞相轮换大模型第一宝座：自23年初GPT-4发布以来，在1年左右时间内基本稳定处于大模型最强位置。2024年海外大模型迭代速度有所加快，龙头竞争格局悄然发生变化。1）5月，OpenAI发布新的旗舰模型GPT-4o，实现跨模态即时响应，相比GPT-4Turbo，刷新SOTA实现性能飞跃。2）5月，Google发布Gemini1.5Pro进阶版，实现200万tokens上下文，具备更强大的推理和理解能力。3）6月，Antropic发布Claude3.5Sonnet，具备更强的代码和视觉能力，基准测试结果全方位碾压Gemini1.5Pro和Llama-400b，大部分优于GPT-4o，一定程度上暂时代表着当前大模型性能最高水平。资料来源：APPSO微信公众号，Antropic官网等，德邦研究所图表：海外龙头竞相抢占大模型第一宝座1.1高速迭代，海外龙头轮换占领大模型之巅

5资料来源：OpenAI官网，德邦研究所（注：Llama3400b还在训练中）1.1.1初代：GPT-4o自我革命，持续刷新综合性能在传统基准测试中，GPT-4o在文本、推理和编码智能方面实现了GPT-4Turbo级别的性能，同时在多语言、音频和视觉功能上达到了新的高水位线。文本推理：GPT-4o在0-shotCOTMMLU（常识问题）上创下了88.7?的新高分。此外，在传统的5-shotno-CoTMMLU上，GPT-4o创下了87.2?的新高分。相较于GPT-4Turbo而言，GPT-4o文本推理能力有一定提升。多语言识别：与Whisper-v3相比，GPT-4o在多种语言的识别中表现优异，尤其是资源匮乏的语言。音频翻译：GPT-4o在音频翻译表现上达到新的高水准，且在MLS基准测试中优于Whisper-v3。图表：与Whisper-v3相比，GPT-4o在多种语言图表：GPT-4o在音频翻译表现上达到新的高水准的识别中表现优异（越低值越优异）图表：GPT-4o文本推理相较GPT-4Turbo有一定提升

6资料来源：OpenAI官网，德邦研究所（注：所有视觉评估都是0-shot）图表：在M3Exam基准测试中，GPT-4o比GPT-4强M3Exam测试：M3Exam基准测试既是多语言评估也是视觉评估，由来自其他国家标准化测试的多项选择题组成，有时还包括图形和图表。在所有语言的基准测试中，GPT-4o都比GPT-4更强。视觉理解：GPT-4o在视觉感知基准上实现了最先进的性能。具体来看，GPT-4o在MMMU测试中分数达到69.1，而GPT-4Turbo、Gemini1.0Ultra、Gemini1.5Pro、ClaudeOpus分别为63.1、59.4、58.5、59.4。GPT-4o多模态能力范围显著拓展：除了文本、图像等常用功能，GPT-4o还支持3D物品合成、文本转字体等多样化功能。GPT-4oAPI性价比有所提升：与GPT-4Turbo相比，GPT-4o速度提升2倍、成本却降低了50?，且速率限制提升5倍。图表：GPT-4o实现3D物品合成图表：GPT-4o在视觉感知基准上实现了最先进的性能1.1.1初代：GPT-4o自我革命，持续刷新综合性能

7请务必阅读正文之后的信息披露及法律声明。资料来源：Google《Gemini1.5:Unlockingmultimodalunderstandingacrossmillionsoftokensofcontext》，德邦研究所图表：进阶版Gemini1.5Pro在基准测试中性能整体超越前代1.1.2二代：谷歌Gemini更极限的上下文理解、更低延时图表：Gemini1.5Pro理论上下文极限为1000万tokens(高性能)进阶版Gemini1.5Pro：谷歌5月发布，上下文窗口翻倍、具备更强大的推理与理解能力。上下文：过往Gemini1.5Pro支持100万tokens上下文，升级后可支持200万tokens（理论极限为1000万tokens），意味着可输入分析2小时视频、22小时音频、超过6万行代码或者140多万单词。这使得Gemini1.5Pro能处理更大量的复杂信息，生成更准确、

您可能关注的文档

文档评论（0）

138****4948 + 关注: 实名认证

内容提供者

电子信息工程师持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2023年05月10日上传了电子信息工程师

1亿VIP精品文档

更多 >

大模型行业竞争态势研究报告.pptx