- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
内容目录
TOC\o1-2\h\z\uDeepSeek多款模型出圈,激活AI大应用燎原之势 4
AI平权时代,Agent/终端/智驾/机器人多点开花 6
大模型推理能力更强、成本更低,Agent应用需求或将井喷 6
小模型推动AI向端侧转移,智能终端的全新革命 7
特斯拉FSD入华在即,比亚迪入局或推动智驾普及 8
机器人产业落地速度加快,或为AgentNetwork的终极载体 10
投资建议 12
风险提示 12
图表目录
图1:DeepSeekV3性能媲美GPT-4o和ClaudeSonnet3.5 4
图2:DeepSeekV3API超低价格向用户开放 4
图3:DeepSeekR1性能比肩o1 5
图4:DeepSeekR1相比同类推理模型价格显著下降 5
图5:通过DeepSeekR1蒸馏的小模型性能对标o1-mini 5
图6:DeepSeek通过优化算法架构大幅降低算力成本 6
图7:蒸馏等技术支持下,低参数成为2025年大模型重要特征 8
图8:AI处理重心正在向端侧转移 8
图9:中国AI终端占比预测 8
图10:特斯拉自动驾驶技术展示 9
图11:秦LDM-i智驾版实车 10
图12:中国智能网联汽车市场规模及增速 10
图13:宇数科技春晚登台人形机器人 10
图14:特斯拉弗里蒙特工厂开放人形机器人岗位 11
图15:我国智能机器人市场规模(亿美元)及增速 11
表1:千行百业AIAgent陆续涌现 6
表2:接入DeepSeek的国内AI应用公司 7
DeepSeek多款模型出圈,激活AI大应用燎原之势
DeepSeek近期开源系列大模型,通过算法的系列创新提升算力利用率,以成本、低价、性能等特征显著出圈,或标志着国内大模型向国际第一梯队大模型的快速迁移,孕育着2025年AI大应用的燎原之势。
2024年12月,深度求索推出的DeepSeek-V3以极低的训练成本,实现了与GPT-4o和ClaudeSonnet3.5等顶尖模型相媲美的性能。通过671B的总参
数量,在每个token激活37B参数的精准控制下,DeepSeek-V3用14.8万亿高质量多样化token,构建出了一个能够超越所有开源模型,直逼GPT-4和Claude-
3.5的AI巨人。根据开发方深度求索的技术报告,DeepSeek-V3合计正式训练成本仅为557万美元(假设H800GPU的租金为每GPU小时2美元),不包括与架构、算法或数据相关的先前的研究或精简实验的成本,在2048个H800GPU的集群上需要3.7天;Anthropic的CEO达里奥·阿莫迪曾表示,GPT-4o模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元,未来三年内,AI大模型的训练成本将上升至100亿美元甚至1000亿美元。
通过算法改进提升硬件使用效率,DeepSeek以开源方式加速追赶闭源模型,API低价提供践行AI普惠原则。V3针对分布式推理做了创新的优化,进而显著提升了分布式MoE模型的负载分配效率,不只是从算法上,而是从整个系统上为
未来更大规模的模型提供了新的可扩展性框架的可能。此外,基于RL,还使用了辅助损失自由负载均衡策略、多Token预测目标(MTP)、FP8+BF16+FP32混合等方式大幅降低了算力消耗。随着性能更强、速度更快的DeepSeek-V3更新上线,V3API服务定价调整至每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元;而GPT-4oAPI定价为每百万输入tokens1.25美元(缓存命中,约为9.11元,按2月7日美元兑人民币汇率7.29,下同)/2.5
美元(缓存未命中,约为18.23元),每百万输出tokens10美元(约为72.9元)。
图1:DeepSeekV3性能媲美GPT-4o和ClaudeSonnet3.5 图2:DeepSeekV3API超低价格向用户开放
DeepSeek微信公众号,所 DeepSeek微信公众号,所
2025年1月,DeepSeek推出推理模型DeepSeekV1,再次以高性能和低价点燃AI应用热情。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数
您可能关注的文档
- 宏观专题研究-复工观察:节奏后置,结构分化.docx
- 互联网行业互联网大厂如何受益于DeepSeekR1“破圈”?.docx
- 华测检测内生外延穿越周期,检测龙头行稳致远.docx
- 华创交运行业低空60系列深度:群雄逐鹿到一超数强——低空经济数字化领域的格局推演,建议重点关注莱斯信息等先发企业.docx
- 华康股份功能糖醇行业领先企业,舟山新项目开启第二成长曲线.docx
- 化工关注涨价白马;新材料重视DS及机器人相关材料机会.docx
- 环保及公用事业行业生物航煤行业深度报告:政策驱动需求增长,行业产能加速释放.docx
- 黄金框架新思辨:黄金穿越千年的价值与魅力.docx
- 汇川技术公司深度报告:工控龙头领跑行业,多元化布局助力穿越周期.docx
- 汇率基本功:解剖跨境支付,理解黄金和比特币.docx
最近下载
- 低空经济装备项目商业计划书.docx VIP
- 自由贸易区背景下海南绿色港口发展研究.docx VIP
- .STANDARD HX270操作说明书.pdf VIP
- 形容词、副词、系动词高频考点-2025年中考英语专项复习(上海专用)(原题版).pdf VIP
- 自由贸易区背景下海南绿色港口发展研究.pdf VIP
- 英语二必考500词.docx VIP
- 长沙农商银行招聘试题及答案解析.pdf VIP
- 个人简历模板空白表格-表格个人简历.docx VIP
- 高三英语二轮复习阅读理解-传统文化专题 Traditional Culture(选自China Daily).docx VIP
- 铁路货运员业务学习资料.docx
文档评论(0)