DeepSeek深度解析：DeepSeek推动高性能AI普惠，AI生态繁荣发展.pdf

下载文档

12
0
约1.4万字
约 15页
2025-02-12 发布于北京
举报
版权申诉
保障服务

DeepSeek深度解析：DeepSeek推动高性能AI普惠，AI生态繁荣发展.pdf

1、本文档共15页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

行业深度报告

正文目录

一、DeepSeek开源模型能力对标OpenAIo14

二、DeepSeek核心技术创新解析5

1、DeepSeek-V3通过算法创新和工程优化实现大幅降本5

（1）MLA提升推理效率6

（2）DeepSeekMoE提升模型性价比7

（3）MTP、FP8精度训练、并行优化进一步提升效率8

2、DeepSeek-R1探索RL可能性，开源能力追平o19

（1）R1-Zero展示纯RL训练给LLM带来的潜力9

（2）R1补充了带有对用户友好的冷启动数据的强化学习10

（3）模型蒸馏显著提升小模型推理能力11

3、DeepSeekJanus-Pro——统一多模态开源模型，仅使用少量算力训练...12

三、模型降价提效推动AI生态繁荣12

1、DeepSeek进一步驱动高质量模型平价化12

2、DeepSeek直接拉高模型能力下限，将驱动AI应用进展13

3、AI行业迭代速度加快14

四、投资建议15

五、风险提示15

图表目录

图1：DeepSeek-R1性能对齐OpenAI-o1正式版4

图2：蒸馏小模型超越OpenAIo1-mini4

图3：DeepSeekJanus-Pro发布4

图4：DeepSeekJanus-Pro性能对比4

图5：应用发布N天后日活用户数对比5

图6：DeepSeek-V3模型架构示意图6

图7：DeepSeek-V3训练成本测算6

图8：MLA与其他注意力机制的优劣对比7

图9：DeepSeek-V3MoE架构示意8

图10：DeepSeekMoE与传统MoE架构比较8

行业深度报告

图11：R1-Zero性能随RL推进呈现稳定持续提升10

图12：R1-Zero学会了用更长的思考时间来解决推理任务10

图13：DeepSeek-R1训练流程示意图10

图14：DeepSeek-R1测评结果11

图15：DeepSeek-R1蒸馏出的小模型部分能力可超越现有大模型11

图16：DeepSeekJanus-Pro模型架构12

图17：DeepSeekJanus-Pro性能对比12

图18：模型价格持续降低13

图19：DeepSeekAPI价格与OpenAI对比13

图20：华为云宣布上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务14

图21：DeepSeek-R1已正式加入AzureAIFoundry和GitHub模型目录14

图22：DeepResearch回答语言学专家级问题15

图23：DeepResearch在人类的最后一次考试测试中准确率大幅高于现有模型15

行业深度报告

一、DeepSeek开源模型能力对标OpenAIo1

1月20日，DeepSeek-R1模型发布，使用低廉的训练成本直接训练出了不输

OpenAI推理模型o1的性能。发布后仅一天时间，DeepSeek团队公布在GitHub

上的论文就获得5000多收藏，相关话题在YC、Reddit和X等平台的互动量已

经过万。DeepSeek-R1在Web和App端可完全免费使用，模型均开源，多领

您可能关注的文档

文档评论（0）

535600147 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6010104234000003

1亿VIP精品文档

更多 >

DeepSeek深度解析：DeepSeek推动高性能AI普惠，AI生态繁荣发展.pdf