网站大量收购闲置独家精品文档,联系QQ:2885784924

DeepSeek深度解析:DeepSeek推动高性能AI普惠,AI生态繁荣发展.pdf

DeepSeek深度解析:DeepSeek推动高性能AI普惠,AI生态繁荣发展.pdf

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

行业深度报告

正文目录

一、DeepSeek开源模型能力对标OpenAIo14

二、DeepSeek核心技术创新解析5

1、DeepSeek-V3通过算法创新和工程优化实现大幅降本5

(1)MLA提升推理效率6

(2)DeepSeekMoE提升模型性价比7

(3)MTP、FP8精度训练、并行优化进一步提升效率8

2、DeepSeek-R1探索RL可能性,开源能力追平o19

(1)R1-Zero展示纯RL训练给LLM带来的潜力9

(2)R1补充了带有对用户友好的冷启动数据的强化学习10

(3)模型蒸馏显著提升小模型推理能力11

3、DeepSeekJanus-Pro——统一多模态开源模型,仅使用少量算力训练...12

三、模型降价提效推动AI生态繁荣12

1、DeepSeek进一步驱动高质量模型平价化12

2、DeepSeek直接拉高模型能力下限,将驱动AI应用进展13

3、AI行业迭代速度加快14

四、投资建议15

五、风险提示15

图表目录

图1:DeepSeek-R1性能对齐OpenAI-o1正式版4

图2:蒸馏小模型超越OpenAIo1-mini4

图3:DeepSeekJanus-Pro发布4

图4:DeepSeekJanus-Pro性能对比4

图5:应用发布N天后日活用户数对比5

图6:DeepSeek-V3模型架构示意图6

图7:DeepSeek-V3训练成本测算6

图8:MLA与其他注意力机制的优劣对比7

图9:DeepSeek-V3MoE架构示意8

图10:DeepSeekMoE与传统MoE架构比较8

2

行业深度报告

图11:R1-Zero性能随RL推进呈现稳定持续提升10

图12:R1-Zero学会了用更长的思考时间来解决推理任务10

图13:DeepSeek-R1训练流程示意图10

图14:DeepSeek-R1测评结果11

图15:DeepSeek-R1蒸馏出的小模型部分能力可超越现有大模型11

图16:DeepSeekJanus-Pro模型架构12

图17:DeepSeekJanus-Pro性能对比12

图18:模型价格持续降低13

图19:DeepSeekAPI价格与OpenAI对比13

图20:华为云宣布上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务14

图21:DeepSeek-R1已正式加入AzureAIFoundry和GitHub模型目录14

图22:DeepResearch回答语言学专家级问题15

图23:DeepResearch在人类的最后一次考试测试中准确率大幅高于现有模型15

3

行业深度报告

一、DeepSeek开源模型能力对标OpenAIo1

1月20日,DeepSeek-R1模型发布,使用低廉的训练成本直接训练出了不输

OpenAI推理模型o1的性能。发布后仅一天时间,DeepSeek团队公布在GitHub

上的论文就获得5000多收藏,相关话题在YC、Reddit和X等平台的互动量已

经过万。DeepSeek-R1在Web和App端可完全免费使用,模型均开源,多领

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档