- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
行业深度报告
正文目录
一、DeepSeek开源模型能力对标OpenAIo14
二、DeepSeek核心技术创新解析5
1、DeepSeek-V3通过算法创新和工程优化实现大幅降本5
(1)MLA提升推理效率6
(2)DeepSeekMoE提升模型性价比7
(3)MTP、FP8精度训练、并行优化进一步提升效率8
2、DeepSeek-R1探索RL可能性,开源能力追平o19
(1)R1-Zero展示纯RL训练给LLM带来的潜力9
(2)R1补充了带有对用户友好的冷启动数据的强化学习10
(3)模型蒸馏显著提升小模型推理能力11
3、DeepSeekJanus-Pro——统一多模态开源模型,仅使用少量算力训练...12
三、模型降价提效推动AI生态繁荣12
1、DeepSeek进一步驱动高质量模型平价化12
2、DeepSeek直接拉高模型能力下限,将驱动AI应用进展13
3、AI行业迭代速度加快14
四、投资建议15
五、风险提示15
图表目录
图1:DeepSeek-R1性能对齐OpenAI-o1正式版4
图2:蒸馏小模型超越OpenAIo1-mini4
图3:DeepSeekJanus-Pro发布4
图4:DeepSeekJanus-Pro性能对比4
图5:应用发布N天后日活用户数对比5
图6:DeepSeek-V3模型架构示意图6
图7:DeepSeek-V3训练成本测算6
图8:MLA与其他注意力机制的优劣对比7
图9:DeepSeek-V3MoE架构示意8
图10:DeepSeekMoE与传统MoE架构比较8
2
行业深度报告
图11:R1-Zero性能随RL推进呈现稳定持续提升10
图12:R1-Zero学会了用更长的思考时间来解决推理任务10
图13:DeepSeek-R1训练流程示意图10
图14:DeepSeek-R1测评结果11
图15:DeepSeek-R1蒸馏出的小模型部分能力可超越现有大模型11
图16:DeepSeekJanus-Pro模型架构12
图17:DeepSeekJanus-Pro性能对比12
图18:模型价格持续降低13
图19:DeepSeekAPI价格与OpenAI对比13
图20:华为云宣布上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务14
图21:DeepSeek-R1已正式加入AzureAIFoundry和GitHub模型目录14
图22:DeepResearch回答语言学专家级问题15
图23:DeepResearch在人类的最后一次考试测试中准确率大幅高于现有模型15
3
行业深度报告
一、DeepSeek开源模型能力对标OpenAIo1
1月20日,DeepSeek-R1模型发布,使用低廉的训练成本直接训练出了不输
OpenAI推理模型o1的性能。发布后仅一天时间,DeepSeek团队公布在GitHub
上的论文就获得5000多收藏,相关话题在YC、Reddit和X等平台的互动量已
经过万。DeepSeek-R1在Web和App端可完全免费使用,模型均开源,多领
文档评论(0)