网站大量收购闲置独家精品文档,联系QQ:2885784924

计算机行业AI与专题系列点评:国内大模型全面升级,坚定看好AI应用.docx

计算机行业AI与专题系列点评:国内大模型全面升级,坚定看好AI应用.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目 录

TOC\o1-1\h\z\u一、豆包大模型1.5效果领先,性能表现卓越 4

二、DeepSeek-R1性能显著上升,API成本更低 6

三、Kimik1.5模型刷新SOTA,性能大幅增加 8

四、讯飞星火大模型迎来全面升级 9

五、MiniMax模型架构取得突破性创新 11

图表目录

图表1 豆包实时语音大模型与测试人员沟通 4

图表2 Doubao-1.5-pro综合性能评估 4

图表3 Doubao-1.5-lite权威测评表现 5

图表4 Doubao-1.5-vision-pro视觉理解基准评估 5

图表5 DeepSeek-R1模型推理能力 6

图表6 蒸馏小模型基准测试 6

图表7 OpenAIo1与DeepSeek-R1性价比优势 7

图表8 Kimik1.5short-CoT模式表现 8

图表9 Kimik1.5long-CoT模式表现 8

图表10 讯飞星火X1能力表现 9

图表11 讯飞星火4.0Turbo七大能力表现 9

图表12 科大讯飞首发混域知识有哪些信誉好的足球投注网站技术 10

图表13 星火语音同传大模型效果对比评价 10

图表14 MiniMax-Text-01长文本学习能力表现 11

一、豆包大模型1.5效果领先,性能表现卓越

模型实现端到端语音对话,突破真人级语音对话能力限制。2025年1月20日豆包实时语音大模型正式推出,该模型是一款语音理解和生成一体化的模型,相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。外部真实众测结果表示,对标GPT-4o,豆包实时语音大模型整体满意度更高。

图表1豆包实时语音大模型与测试人员沟通

资料来源:豆包大模型团队公众号

2025年1月22日豆包大模型1.5正式发布。全新Doubao-1.5-pro模型综合能力显著增强,综合得分优于GPT-4o、Claude3.5Sonnet等业界一流模型,模型效果达到全球领先水平。同时在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩。

图表2 Doubao-1.5-pro综合性能评估

资料来源:火山引擎公众号

轻量版语言模型方面,Doubao-1.5-lite处于全球一流水平,在综合、推理、数学、专业知识权威测评指标持平或超越GPT-4omini、Cluade3.5Haiku。

图表3 Doubao-1.5-lite权威测评表现

资料来源:火山引擎公众号

视觉理解模型方面,Doubao-1.5-vision-pro在多个权威测评基准上取得全球领先表现,同样击败GPT-4o、Claude3.5Sonnet等一众模型。

图表4 Doubao-1.5-vision-pro视觉理解基准评估

资料来源:火山引擎公众号

二、DeepSeek-R1性能显著上升,API成本更低

2025年1月20日DeepSeek-R1正式发布。模型推理能力得到了极大的提升,在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。

图表5 DeepSeek-R1模型推理能力

资料来源:DeepSeek公众号

DeepSeek-R1团队同步开源模型权重,模型开源License统一使用MIT,并且产品协议上明确可“模型蒸馏”。通过DeepSeek-R1输出的蒸馏小模型在多项能力上实现了对标OpenAIo1-mini的效果。

图表6 蒸馏小模型基准测试

资料来源:DeepSeek公众号

API输出输入成本降低,凸显性价比优势。DeepSeek-R1上线API,对用户开放思维链输出。API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,对标OpenAIo1类推理模型,API性价比显著上升。

图表7 OpenAIo1与DeepSeek-R1性价比优势

资料来源:DeepSeek公众号

三、Kimik1.5模型刷新SOTA,性能大幅增加

多模态思考模型推理能力显著增强。2025年1月20日k1.5多模态思考模型正式发布,在基准测试中,模型实现了SOTA级别的多模态推理和通用推理能力。short-CoT模式下,Kimik1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude3.5Sonnet的水平,领先达到550%。

图表8Kimik1.5short-

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档