- 1、本文档共64页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据资产全过程管理
——解锁DeepSeek智能引擎
演讲嘉宾:林建兴时间:2025年2月5日
混合专家(MoE)架构
DeepSeek-V3拥有6710亿参数,但在实际运行中,每个输入仅激活370
亿参数,这种选择性激活的方式大大降低了计算成本,同时保持了高性能
↓
高效的训练框架01多头潜在注意力(MLA)
采用HAI-LLM框架,支持16-way该架构在DeepSeek-V2中已经得到
PipelineParallelism(PP)、64-way验证,能够实现高效的训练和推理
ExpertParallelism(EP)和ZeRO-10502
DataParallelism(DP),并通过多种
优化手段降低了训练成本
多tokens预测训练目标0403无辅助损失的负载平衡策略
该策略提升了模型的整体性能这一策略旨在最小化因负载平衡
对模型性能产生的负面影响
技术高性能和低成本
用户增长DeepSeek在全球140个市场的
下载量排名第一
开源策略开源策略也使其在技术竞争中占据优势
DeepSeek支持文本、图像、语音等多
多模态学习
种模态的数据融合和学习
展示中国AI技术的能力,扩大中国在全
全球化视野
球AI领域的影响力
DeepSeek确保所有用户都能平等地访
引领认知变革
问和使用AI技术,掀起认知革命
技术穿透力数据资产运营商的
从底层算法到顶层应用的端到
端技术栈,破解数据资产化中01
的技术断点
DeepSeek的
差异化价值
02
场景适配力合规护航力
文档评论(0)