- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
内容目录
1DeepSeeko11
推出对标开源模型,国产大模型攻城略地
2DeepSeekAI3
与国产算力:形成打破海外垄断的合力
3AI应用:AI普惠化趋势下,产品大规模落地可期3
4投资建议6
5风险提示8
图目录
图1:DeepSeek-R1性能指标对比1
2DeepSeek-R11
图:输入输出价格对比
3DeepSeek-R1-ZeroAIME2
图:在训练期间的准确性
图4:DeepSeekDAU趋势图2
图5:昇腾社区上线DeepSeek系列模型3
6AGI5
图:层级划分
7AI5
图:不同层级中的能力
表目录
表1:海外部分AI应用端公司动态4
26
表:重点关注公司及盈利预测
1DeepSeek推出对标o1开源模型,国产大模型攻城略地
定价低廉+性能比肩全球顶尖模型+开源,DeepSeek引起全球关注。
2025年1月20日,DeepSeek正式发布DeepSeek-R1模型,并同步开源模
型权重。该模型在后训练阶段大规模使用了强化学习技术,在数学、代码、
自然语言推理等任务上,性能比肩OpenAI的o1正式版。API定价方面,
DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓
存未命中),每百万输出tokens16元;约是OpenAI-o1对应定价的1.8%/3.6%
和3.7%。
图1:DeepSeek-R1性能指标对比图2:DeepSeek-R1输入输出价格对比
数据来源:DeepSeek官网,数据来源:DeepSeek官网,
技术路径上,传统大模型训练依赖监督微调(如人工标注数据),而
DeepSeekR1-zeroRL
是完全依赖强化学习()训练的大语言模型,能够在
无监督环境下通过自我反思和环境交互优化策略,提升了模型的推理性能,
证明了模型仅通过RL就能够实现有效学习和泛化的能力。例如,当
AIME基准测试采用多数表决时,DeepSeek-R1-Zero的性能从71.0%上
升到86.7%,超过了OpenAI-o1-0912的性能。
1
图3:DeepSeek-R1-Zero在训练期间的AIME准确性
数据来源:DeepSeek-AI:《DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsvia
ReinforcementLearning》
您可能关注的文档
- 米奥会展外展龙头领航制造业出海.pdf
- 汇川技术公司深度报告:工控龙头领跑行业,多元化布局助力穿越周期.pdf
- DeepSeek固收赋能系列:转债篇.pdf
- 轻工制造行业月报:家装厨卫“焕新”启动,期待政策落地效果.pdf
- 1949-2024年度中国各省份财政收入排名变迁.pdf
- 医疗器械行业月度点评:国务院创新药械支持文件出台,政策红利有望进一步释放.pdf
- 挖掘消费空间系列三:如何应对透支,“国补”扩围至服务消费补贴.pdf
- 计算机行业一季度全面科技自信.pdf
- 策略深度报告:ETF主观配置策略月报,关注小盘股及强产业趋势品种ETF.pdf
- 新材料行业产业研究点评之二:AI数据中心拉动燃气轮机需求,铬盐、高温合金、热障涂层产业链需求增长可期.pdf
文档评论(0)