- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
目 录
TOC\o1-1\h\z\u一、豆包大模型1.5效果领先,性能表现卓越 4
二、DeepSeek-R1性能显著上升,API成本更低 6
三、Kimik1.5模型刷新SOTA,性能大幅增加 8
四、讯飞星火大模型迎来全面升级 9
五、MiniMax模型架构取得突破性创新 11
图表目录
图表1 豆包实时语音大模型与测试人员沟通 4
图表2 Doubao-1.5-pro综合性能评估 4
图表3 Doubao-1.5-lite权威测评表现 5
图表4 Doubao-1.5-vision-pro视觉理解基准评估 5
图表5 DeepSeek-R1模型推理能力 6
图表6 蒸馏小模型基准测试 6
图表7 OpenAIo1与DeepSeek-R1性价比优势 7
图表8 Kimik1.5short-CoT模式表现 8
图表9 Kimik1.5long-CoT模式表现 8
图表10 讯飞星火X1能力表现 9
图表11 讯飞星火4.0Turbo七大能力表现 9
图表12 科大讯飞首发混域知识有哪些信誉好的足球投注网站技术 10
图表13 星火语音同传大模型效果对比评价 10
图表14 MiniMax-Text-01长文本学习能力表现 11
一、豆包大模型1.5效果领先,性能表现卓越
模型实现端到端语音对话,突破真人级语音对话能力限制。2025年1月20日豆包实时语音大模型正式推出,该模型是一款语音理解和生成一体化的模型,相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。外部真实众测结果表示,对标GPT-4o,豆包实时语音大模型整体满意度更高。
图表1豆包实时语音大模型与测试人员沟通
资料来源:豆包大模型团队公众号
2025年1月22日豆包大模型1.5正式发布。全新Doubao-1.5-pro模型综合能力显著增强,综合得分优于GPT-4o、Claude3.5Sonnet等业界一流模型,模型效果达到全球领先水平。同时在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩。
图表2 Doubao-1.5-pro综合性能评估
资料来源:火山引擎公众号
轻量版语言模型方面,Doubao-1.5-lite处于全球一流水平,在综合、推理、数学、专业知识权威测评指标持平或超越GPT-4omini、Cluade3.5Haiku。
图表3 Doubao-1.5-lite权威测评表现
资料来源:火山引擎公众号
视觉理解模型方面,Doubao-1.5-vision-pro在多个权威测评基准上取得全球领先表现,同样击败GPT-4o、Claude3.5Sonnet等一众模型。
图表4 Doubao-1.5-vision-pro视觉理解基准评估
资料来源:火山引擎公众号
二、DeepSeek-R1性能显著上升,API成本更低
2025年1月20日DeepSeek-R1正式发布。模型推理能力得到了极大的提升,在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。
图表5 DeepSeek-R1模型推理能力
资料来源:DeepSeek公众号
DeepSeek-R1团队同步开源模型权重,模型开源License统一使用MIT,并且产品协议上明确可“模型蒸馏”。通过DeepSeek-R1输出的蒸馏小模型在多项能力上实现了对标OpenAIo1-mini的效果。
图表6 蒸馏小模型基准测试
资料来源:DeepSeek公众号
API输出输入成本降低,凸显性价比优势。DeepSeek-R1上线API,对用户开放思维链输出。API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,对标OpenAIo1类推理模型,API性价比显著上升。
图表7 OpenAIo1与DeepSeek-R1性价比优势
资料来源:DeepSeek公众号
三、Kimik1.5模型刷新SOTA,性能大幅增加
多模态思考模型推理能力显著增强。2025年1月20日k1.5多模态思考模型正式发布,在基准测试中,模型实现了SOTA级别的多模态推理和通用推理能力。short-CoT模式下,Kimik1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude3.5Sonnet的水平,领先达到550%。
图表8Kimik1.5short-
您可能关注的文档
- 货币市场机构行为系列:资金为什么松?又为什么紧?.docx
- 机构行为观察之五:2025理财规模可期,收益难寻.docx
- 机器人行业2025年度策略:算力提效、全球共振、产品迭代.pptx
- 基础化工行业深度报告:乙二醇,跬步已积,行将致远.docx
- 基础化工行业深度-印度化工:崛起的新势力?.docx
- 基础化工行业专题研究报告:周期与成长共振,建议关注涨价和新材料方向.docx
- 基金选品系列研究之二:十问透视主动权益基金四季报重要变化.docx
- 基金选品系列研究之一:ETF之外,投资双创还有哪些选择?.docx
- 基金转债持仓分析:24Q4转债基金仓位创新高,增配光伏顺周期.docx
- 基金转债持仓季度点评:24Q4基金转债持仓的纠结与逻辑.docx
文档评论(0)