- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大模型行业竞争态势研究报告
0102海外龙头轮番抢占第一宝座,比拼整体性能和多模态交互国内大模型逆袭之路:聚焦长文本,降价迭代提升竞争力目录CONTENTS
301海外龙头轮番抢占第一宝座,比拼整体性能和多模态交互高速迭代,海外龙头轮番占领大模型之巅大模型高地争夺:多模态的理解和响应,原生多模态技术比拼比较维度升级:从模型到叠加终端,跨设备的使用效果体验
4OpenAI、Google、Antropic三大厂商竞相轮换大模型第一宝座:自23年初GPT-4发布以来,在1年左右时间内基本稳定处于大模型最强位置。2024年海外大模型迭代速度有所加快,龙头竞争格局悄然发生变化。1)5月,OpenAI发布新的旗舰模型GPT-4o,实现跨模态即时响应,相比GPT-4Turbo,刷新SOTA实现性能飞跃。2)5月,Google发布Gemini1.5Pro进阶版,实现200万tokens上下文,具备更强大的推理和理解能力。3)6月,Antropic发布Claude3.5Sonnet,具备更强的代码和视觉能力,基准测试结果全方位碾压Gemini1.5Pro和Llama-400b,大部分优于GPT-4o,一定程度上暂时代表着当前大模型性能最高水平。资料来源:APPSO微信公众号,Antropic官网等,德邦研究所图表:海外龙头竞相抢占大模型第一宝座1.1高速迭代,海外龙头轮换占领大模型之巅
5资料来源:OpenAI官网,德邦研究所(注:Llama3400b还在训练中)1.1.1初代:GPT-4o自我革命,持续刷新综合性能在传统基准测试中,GPT-4o在文本、推理和编码智能方面实现了GPT-4Turbo级别的性能,同时在多语言、音频和视觉功能上达到了新的高水位线。文本推理:GPT-4o在0-shotCOTMMLU(常识问题)上创下了88.7?的新高分。此外,在传统的5-shotno-CoTMMLU上,GPT-4o创下了87.2?的新高分。相较于GPT-4Turbo而言,GPT-4o文本推理能力有一定提升。多语言识别:与Whisper-v3相比,GPT-4o在多种语言的识别中表现优异,尤其是资源匮乏的语言。音频翻译:GPT-4o在音频翻译表现上达到新的高水准,且在MLS基准测试中优于Whisper-v3。图表:与Whisper-v3相比,GPT-4o在多种语言 图表:GPT-4o在音频翻译表现上达到新的高水准的识别中表现优异(越低值越优异)图表:GPT-4o文本推理相较GPT-4Turbo有一定提升
6资料来源:OpenAI官网,德邦研究所(注:所有视觉评估都是0-shot)图表:在M3Exam基准测试中,GPT-4o比GPT-4强M3Exam测试:M3Exam基准测试既是多语言评估也是视觉评估,由来自其他国家标准化测试的多项选择题组成,有时还包括图形和图表。在所有语言的基准测试中,GPT-4o都比GPT-4更强。视觉理解:GPT-4o在视觉感知基准上实现了最先进的性能。具体来看,GPT-4o在MMMU测试中分数达到69.1,而GPT-4Turbo、Gemini1.0Ultra、Gemini1.5Pro、ClaudeOpus分别为63.1、59.4、58.5、59.4。GPT-4o多模态能力范围显著拓展:除了文本、图像等常用功能,GPT-4o还支持3D物品合成、文本转字体等多样化功能。GPT-4oAPI性价比有所提升:与GPT-4Turbo相比,GPT-4o速度提升2倍、成本却降低了50?,且速率限制提升5倍。图表:GPT-4o实现3D物品合成图表:GPT-4o在视觉感知基准上实现了最先进的性能1.1.1初代:GPT-4o自我革命,持续刷新综合性能
7请务必阅读正文之后的信息披露及法律声明。资料来源:Google《Gemini1.5:Unlockingmultimodalunderstandingacrossmillionsoftokensofcontext》,德邦研究所图表:进阶版Gemini1.5Pro在基准测试中性能整体超越前代1.1.2二代:谷歌Gemini更极限的上下文理解、更低延时图表:Gemini1.5Pro理论上下文极限为1000万tokens(高性能)进阶版Gemini1.5Pro:谷歌5月发布,上下文窗口翻倍、具备更强大的推理与理解能力。上下文:过往Gemini1.5Pro支持100万tokens上下文,升级后可支持200万tokens(理论极限为1000万tokens),意味着可输入分析2小时视频、22小时音频、超过6万行代码或者140多万单词。这使得Gemini1.5Pro能处理更大量的复杂信息,生成更准确、
您可能关注的文档
- 2024年低空经济行业研究报告.pptx
- 2024年中国算力基础设施研究报告.pptx
- 大模型+有哪些信誉好的足球投注网站——AI有哪些信誉好的足球投注网站行业深度研究报告.pptx
- 人形机器人关键零件减速器产业研究报告.pptx
- 数字化驱动智能汽车发展研究报告.pptx
- 卫星互联网核心环节-运载火箭行业研究报告.pptx
- 统编版(部编版)语文二年级上册《狐假虎威》教学设计.docx
- 北师大版小学数学三年级上册《时间表》教学设计.docx
- 北师大版小学数学三年级上册《文具店》教学设计.docx
- 北师大版小学数学三年级上册《能通过吗》教学设计.docx
- 北师大版小学数学三年级上册《寄书》教学设计.docx
- 统编版(部编版)语文二年级上册《雪孩子》教学设计.docx
- 统编版(部编版)语文二年级上册《八角楼上》教学设计.docx
- 北师大版小学数学三年级上册《长方形周长》教学设计.docx
- 北师大版小学数学三年级上册《丰收了》教学设计.docx
- 统编版(部编版)语文二年级上册《夜宿山寺》教学设计.docx
- 统编版(部编版)语文二年级上册《风娃娃》教学设计.docx
- 统编版(部编版)语文二年级上册《朱德的扁担》教学设计.docx
- 统编版(部编版)语文二年级上册《难忘的泼水节》教学设计.docx
- 统编版(部编版)语文二年级上册《纸船和风筝》教学设计.docx
最近下载
- 建材市场物业服务方案.pdf VIP
- 质子泵抑制剂临床应用指导原则2020版.pptx VIP
- 执行民主集中制方面存在不足范文四篇.pdf VIP
- 贵州省贵阳市2023-2024学年高三11月质量监测生物试题(解析版).docx
- 2024年山东省“大学习、大培训、大考试”专项行动(工贸行业)考试题库资料(含答.pdf
- 2025-2028年青年教师三年培养计划及实施方案.docx
- 法理学(西南政大)中国大学MOOC 慕课 章节测验 期末考试答案.docx
- 新教材 高中生物选择性必修一 稳态与调节 复习提纲 知识总结.doc
- T_CECS 1240-2023 弃土场工程技术规程(OCR).pdf
- 许林芳《薪酬绩效》私房课笔记.pdf VIP
文档评论(0)