计算机行业AI与专题系列点评：国内大模型全面升级，坚定看好AI应用.docx

下载文档

1
0
约3.04千字
约 10页
2025-02-13 发布于北京
举报
版权申诉
保障服务

计算机行业AI与专题系列点评：国内大模型全面升级，坚定看好AI应用.docx

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

TOC\o1-1\h\z\u一、豆包大模型1.5效果领先，性能表现卓越 4

二、DeepSeek-R1性能显著上升，API成本更低 6

三、Kimik1.5模型刷新SOTA，性能大幅增加 8

四、讯飞星火大模型迎来全面升级 9

五、MiniMax模型架构取得突破性创新 11

图表目录

图表1 豆包实时语音大模型与测试人员沟通 4

图表2 Doubao-1.5-pro综合性能评估 4

图表3 Doubao-1.5-lite权威测评表现 5

图表4 Doubao-1.5-vision-pro视觉理解基准评估 5

图表5 DeepSeek-R1模型推理能力 6

图表6 蒸馏小模型基准测试 6

图表7 OpenAIo1与DeepSeek-R1性价比优势 7

图表8 Kimik1.5short-CoT模式表现 8

图表9 Kimik1.5long-CoT模式表现 8

图表10 讯飞星火X1能力表现 9

图表11 讯飞星火4.0Turbo七大能力表现 9

图表12 科大讯飞首发混域知识有哪些信誉好的足球投注网站技术 10

图表13 星火语音同传大模型效果对比评价 10

图表14 MiniMax-Text-01长文本学习能力表现 11

一、豆包大模型1.5效果领先，性能表现卓越

模型实现端到端语音对话，突破真人级语音对话能力限制。2025年1月20日豆包实时语音大模型正式推出，该模型是一款语音理解和生成一体化的模型，相比传统级联模式，在语音表现力、控制力、情绪承接方面表现惊艳，并具备低时延、对话中可随时打断等特性。外部真实众测结果表示，对标GPT-4o，豆包实时语音大模型整体满意度更高。

图表1豆包实时语音大模型与测试人员沟通

资料来源：豆包大模型团队公众号

2025年1月22日豆包大模型1.5正式发布。全新Doubao-1.5-pro模型综合能力显著增强，综合得分优于GPT-4o、Claude3.5Sonnet等业界一流模型，模型效果达到全球领先水平。同时在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩。

图表2 Doubao-1.5-pro综合性能评估

资料来源：火山引擎公众号

轻量版语言模型方面，Doubao-1.5-lite处于全球一流水平，在综合、推理、数学、专业知识权威测评指标持平或超越GPT-4omini、Cluade3.5Haiku。

图表3 Doubao-1.5-lite权威测评表现

资料来源：火山引擎公众号

视觉理解模型方面，Doubao-1.5-vision-pro在多个权威测评基准上取得全球领先表现，同样击败GPT-4o、Claude3.5Sonnet等一众模型。

图表4 Doubao-1.5-vision-pro视觉理解基准评估

资料来源：火山引擎公众号

二、DeepSeek-R1性能显著上升，API成本更低

2025年1月20日DeepSeek-R1正式发布。模型推理能力得到了极大的提升，在数学、代码、自然语言推理等任务上，性能比肩OpenAIo1正式版。

图表5 DeepSeek-R1模型推理能力

资料来源：DeepSeek公众号

DeepSeek-R1团队同步开源模型权重，模型开源License统一使用MIT，并且产品协议上明确可“模型蒸馏”。通过DeepSeek-R1输出的蒸馏小模型在多项能力上实现了对标OpenAIo1-mini的效果。

图表6 蒸馏小模型基准测试

资料来源：DeepSeek公众号

API输出输入成本降低，凸显性价比优势。DeepSeek-R1上线API，对用户开放思维链输出。API服务定价为每百万输入tokens1元（缓存命中）/4元（缓存未命中），每百万输出tokens16元，对标OpenAIo1类推理模型，API性价比显著上升。

图表7 OpenAIo1与DeepSeek-R1性价比优势

资料来源：DeepSeek公众号

三、Kimik1.5模型刷新SOTA，性能大幅增加

多模态思考模型推理能力显著增强。2025年1月20日k1.5多模态思考模型正式发布，在基准测试中，模型实现了SOTA级别的多模态推理和通用推理能力。short-CoT模式下，Kimik1.5的数学、代码、视觉多模态和通用能力，大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude3.5Sonnet的水平，领先达到550%。

图表8Kimik1.5short-