网站大量收购闲置独家精品文档,联系QQ:2885784924

计算机行业AIGC系列报告之DeepSeek深度解析:DeepSeek推动高性能AI普惠,AI生态繁荣发展.docx

计算机行业AIGC系列报告之DeepSeek深度解析:DeepSeek推动高性能AI普惠,AI生态繁荣发展.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

正文目录

一、DeepSeek开源模型能力对标OpenAIo1 4

二、DeepSeek核心技术创新解析 5

1、DeepSeek-V3通过算法创新和工程优化实现大幅降本 5

MLA提升推理效率 6

DeepSeekMoE提升模型性价比 7

MTP、FP8精度训练、并行优化进一步提升效率 8

2、DeepSeek-R1探索RL可能性,开源能力追平o1 9

R1-Zero展示纯RL训练给LLM带来的潜力 9

R1补充了带有对用户友好的冷启动数据的强化学习 10

模型蒸馏显著提升小模型推理能力 11

3、DeepSeekJanus-Pro——统一多模态开源模型,仅使用少量算力训练 12

三、模型降价提效推动AI生态繁荣 12

1、DeepSeek进一步驱动高质量模型平价化 12

2、DeepSeek直接拉高模型能力下限,将驱动AI应用进展 13

3、AI行业迭代速度加快 14

四、投资建议 15

五、风险提示 15

图表目录

图1:DeepSeek-R1性能对齐OpenAI-o1正式版 4

图2:蒸馏小模型超越OpenAIo1-mini 4

图3:DeepSeekJanus-Pro发布 4

图4:DeepSeekJanus-Pro性能对比 4

图5:应用发布N天后日活用户数对比 5

图6:DeepSeek-V3模型架构示意图 6

图7:DeepSeek-V3训练成本测算 6

图8:MLA与其他注意力机制的优劣对比 7

图9:DeepSeek-V3MoE架构示意 8

图10:DeepSeekMoE与传统MoE架构比较 8

图11:R1-Zero性能随RL推进呈现稳定持续提升 10

图12:R1-Zero学会了用更长的思考时间来解决推理任务 10

图13:DeepSeek-R1训练流程示意图 10

图14:DeepSeek-R1测评结果 11

图15:DeepSeek-R1蒸馏出的小模型部分能力可超越现有大模型 11

图16:DeepSeekJanus-Pro模型架构 12

图17:DeepSeekJanus-Pro性能对比 12

图18:模型价格持续降低 13

图19:DeepSeekAPI价格与OpenAI对比 13

图20:华为云宣布上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务14

图21:DeepSeek-R1已正式加入AzureAIFoundry和GitHub模型目录 14

图22:DeepResearch回答语言学专家级问题 15

图23:DeepResearch在人类的最后一次考试测试中准确率大幅高于现有模型15

一、DeepSeek开源模型能力对标OpenAIo1

1月20日,DeepSeek-R1模型发布,使用低廉的训练成本直接训练出了不输OpenAI推理模型o1的性能。发布后仅一天时间,DeepSeek团队公布在GitHub上的论文就获得5000多收藏,相关话题在YC、Reddit和X等平台的互动量已

经过万。DeepSeek-R1在Web和App端可完全免费使用,模型均开源,多领域性能比肩OpenAIo1。

DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。此外,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。

图1:DeepSeek-R1性能对齐OpenAI-o1正式版 图2:蒸馏小模型超越OpenAIo1-mini

资料来源:DeepSeek官网、 资料来源:DeepSeek官网、

DeepSeek开源多模态模型Janus-Pro发布,能做到使用简短提示提供更稳定的输出,具有更好的视觉质量、更丰富的细节以及生成简单文本的能力。1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的

Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的DALL-E3和StabilityAI的StableDif

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档