- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DeepSeek自学手册
从理论(模型训练)到实践(模型应用)
作者:@ai呀蔡蔡(全平台同名)
03
DeepseekR1
四大使用技巧
06
Deepseek替代方案(在线本地部署)
02
DeepseekR1后提示词的变与不变
05
Deepseek
实际应用场景
01
Deepseekv3和R1是怎么训练出来的
04
13个Deepseek官方提示词样例
注:当前手册的信息更新截至2025年2月10日
目录
Contents
Deepseekv3是什么?
DeepSeekV3是一个强大的MoE语言模型(非推理型模
型)。它在数学、代码等任务上吊打其它开源模型,甚至能和闭源大佬GPT-4o、Claude-3.5-sonnet掰手腕,但训练花的钱还不到600万美元。
注:MoE,全称是Mixture-of-Expe比s,翻译成中文就是“混合专家。你可以把它想象成一个团队,这个团队里有很多专家,每个专家都有自己的专长。当遇到一个问题时,不是所有专家都一起上,而是根据问题的类型,选择最合适的几个专家来解决。这样不仅提高了效率,还提升了性能。
初识Deepseekv3
数据、图表源自:DeepSeek-V3TechnicalRepo比
无额外损耗的负载均衡
前面DeepSeekMoE中提到的多项创新,其中就包括V3才推出的无额外损耗的负载均衡。
简单来说,在训练过程中,DeepSeekMoE会监控每个专家的工作量,进而动态调整
专家使用频率,避免某些专家过劳或
躺平。
DeepseekMOE
V3基础架构之一,同样在DeepSeekV2已经验证有效。
DeepSeekMoE在传统MoE的基础上进行
了多项创新和优化,比如更精细的专家分
工、共享专家等,适配复杂任务,进而提升模型的性能和计算效率。
Multi-HeadLatentAttention(MLA)
V3基础架构之一,在DeepSeekY2已经验证有效。
MLA翻译成中文就是多头潜在注意力,传统模型推理时需缓存大量数据,MLA通过压缩键值对(类似精简笔记)减少内存占用
可以让模型在处理长文本时更高效。
多Token预测(MTP)策略
V3架构创新之一。
传统模型一次预测1个词,DeepSeekV3时预测多个词(类似预判下一步)
升数据利用效率,还能加速生成
Deepseekv3架构
同提
Deepseekv3训练步骤和数据使用
无标注数据集预训练大模型基础大模型通
用精调模型
基于规则的奖励模型:对于可以通
规则进行判别的任务(例如数学题、编程题),采用基于规则的奖励模型
基于模型的奖励模型:对于难以通过规则进行判别的任务(例如开放式问答、
创意写作),则采用基于模型的奖励模型
推理数据:对于数学、代码、逻辑推速零确要复杂推理过程的任务,V3采用了基于R1生成的高质量推理数据
非推理数据:对于创意写作、角色扮演、简单问答等非推理类任务,则用Y2.5生成响应,并由人工标注和校验
训练数据:相比V2,V3提高了数学和编程样本的比例,同时扩展了除英语和中文之外的多语言覆盖范围
预训练
(无监督学习)
精调
(监督学习)
精调
(强化学习)
Menchrarka
·Shet
DeepSeekV2Base
|Qwen25728Bae
LLMA314258Base
DeepSnVSBme
Ardikture
MoE
Dmse
Dmse
MoE
ActiratadParam
21B
728
4258
7B
otalParams
2368
78
4358
6718
English
Pletet
0606
0638
0.542
0548
BBHm
3het
70
78
829
875
MMU
SHhet
784
50
4
871
MMUFedu
5ht
76
832
83
2
MMLUP
OKO
ARC-ay
5shet 3-het5-that
51.4
80.4
563
6
4
528
60
4
64.4
.0
5
ARCCleg
5sho
922
45
453
953
HellSwg
10-sho
67.1
4.8
92
88
PKQAa
het
09
26
5.9
847
WincGrande
Shet
63
23
85
您可能关注的文档
- DeepSeek培训课件入门宝典:第2册 开发实战篇 .pdf
- DeepSeek培训课件-清华大学-DeepSeek模型本地部署与应用构建.pdf
- DeepSeek培训课件-清华大学-DeepSeekJ用场景智能化应用白皮书.pdf
- DeepSeek培训课件-清华大学-DeepSeek+DeepResearch应用报告.pdf
- DeepSeek培训课件-清华大学DeepSeek+DeepResearch-让科研像聊天一样简单.pdf
- DeepSeek培训课件-开发实战篇-DeepSeek入门宝典.pdf
- DeepSeek培训课件-技术解析篇-DeepSeek入门宝典.pdf
- DeepSeek培训课件-行业应用篇-DeepSeek入门宝典.pdf
- DeepSeek培训课件个人使用篇-DeepSeek入门宝典.pdf
- DeepSeek培训课件-大模型在办公方向的实践与思考.pdf
- 2025年市总工会党组书记、市委组织部部长生活会“四个带头”个人对照检查发言材料2篇(含上年度整改+个人情况、个人事项+典型案例).docx
- 2025年部编版小学六年级下册《道德与法治》第四单元 让世界更美好第10课 我们爱和平教学课件.pptx
- 公司领导班子2025年围绕“四个带头”主题检视问题整改落实方案与组织生活会批评意见(20条)2篇文.docx
- 教育系统党组班子2025年对照“四个带头”含意识形态、以典型案例举一反三解析检视材料【2篇文】.docx
- 2025年国有企业领导班子、学校副校长生活会“四个带头”方面对照个人检视发言材料2篇文(附:上年度整改情况、典型案例解析).docx
- 2025年生活会“四个带头”个人对照检查材料2篇文(含对其他领导批评意见,个人公开事项申报、意识形态).docx
- 2025年国有企业党委书记、领导班子生活会“四个带头”方面对照检查发言材料2篇文(上年度整改情况).docx
- 乡镇领导班子、市委组织部常务副部长2025年对照“四个带头”含违纪行为为典型案例的剖析与反思检视剖析材料{2篇文}.docx
- 市委社会工作部2025年生活会领导班子对照检视发言材料2篇文(含以案为鉴,深刻反思存在问题、反面典型案例举一反三解析、其他需要说明情况).docx
- 2025年民主生活会、组织生活会批评意见(20条)与市直单位领导班子“四个带头”对照检查材料【含上年度查摆问题整改落实情况】2篇文.docx
最近下载
- 公司管理提升方案.docx
- 江西高职院校单招《职业适应性测试》近年考试真题题库资料汇总(含答案).pdf
- IA32架构软件开发人员手册第3卷:系统编程指南(中文版部分)(可编辑).doc
- 2022-2023年临床“三基”-医学临床三基(医师)考试题库8(含答案).docx VIP
- 2025届全国高考真题模拟英语专项训练:写作(附答案).docx
- 人教版高中地理第二章《地表形态的塑造》测试题(含答案) .pdf VIP
- Unit 4 Time to celebrate Understanding ideas(说课稿)-2024-2025学年外研版(2024)七年级英语上册.docx VIP
- 2022-2023年临床“三基”-医学临床三基(医师)考试题库10(含答案).docx VIP
- 北京市海淀区2024-2025学年八年级上学期期末考试数学试卷(含答案).pdf
- 第四章 控制及其设计-2022年高中通用技术学业水平考试综合复习(粤科版2019)必修 技术与设计2.docx VIP
- 资料网上有哪些信誉好的足球投注网站整理 + 关注
-
实名认证服务提供商
资料网上有哪些信誉好的足球投注网站整理,资料网上有哪些信誉好的足球投注网站整理,资料网上有哪些信誉好的足球投注网站整理。
文档评论(0)