人工智能技术产业观察与展望.docxVIP

下载本文档

0
0
约2.88千字
约 8页
2025-02-27 发布于宁夏
举报
版权申诉

人工智能技术产业观察与展望.docx

1、本文档共8页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

人工智能技术产业观察与展望

近期，中国信通院人工智能研究所所长魏凯在中国信通院2025深度观察报告会上发表主题为“人工智能技术产业观察与展望”的演讲，梳理2024年人工智能技术产业进展，展望未来发展趋势。以下是该演讲的核心观点。

一、基础模型能力快速提升，在新方向上延续规模扩展

目前以大模型为主线的人工智能技术创新非常活跃，潜力巨大。头部企业和实验室沿着规模定律一路扩张，不断刷新基础大模型的能力上限。无论以任何一种基准测试的得分为指标，梳理一年来前沿模型的进展，都会呈现出一条陡峭向上的曲线。根据中国信通院必威体育精装版一期的大模型基准测试结果，基础语言模型的综合得分一年来提升了30%。

2024年下半年以来，大语言模型在预训练阶段的扩展将遇瓶颈已成为行业共识。在此背景下，OpenAIo1等深度推理模型的推出，为大语言模型开辟了新的扩展方向，使得扩展定律在另外一条路上继续前行。与此同时，语言基座模型的进步，以及视觉编码器、模态连接器等模块能力的提升，推动多模态理解模型逐渐成熟，正在打开机器认知和理解世界的全新通道。基础模型越来越大，同时也在变得更小，2024年出现了很多只有几十亿参数的小模型，在某些方向上性能可以达到以往千亿甚至万亿参数的水平，小模型能力更聚焦，算力成本大大降低，有望加速私有化部署和应用，助推边缘与端侧AI普及。

二、大模型训练成本激增，推理需求崛起推动智算供需结构变化

在训练算力方面，据估计前沿大模型的训练成本已经高达10亿美元，一年增长了近9倍。由于预训练算力需求的持续走高，国内外万卡十万卡大规模智算集群建设如火如荼。但随着国内外预训练大模型研发主体的逐步收敛，以及预训练阶段算力投入的边际效应递减，未来超大规模训练集群的需求增速或将放缓。

与此相对的是，随着应用普及和推理侧扩展，预计推理算力需求将得到激发，智算算力的需求结构将发生变化，据IDC预测我国AI服务器负载中，推理负载将从2023年的41%提升至2027年的73%。推理算力的需求多样，头部互联网企业都在加大定制推理芯片力度。总体来看，未来芯片、网络等硬件与框架、算法等软件的深度协同是推动大规模训练效能提升、降低推理成本的关键。

三、训练数据作用凸显，三方面举措助力突破“数据墙”

有很多观点认为，大模型规模定律放缓，与“数据墙”有关。一方面，大模型数据投入密度持续增强，2024年发布的Qwen2的数据量/参数量的比值是2021年发布的GPT3的97.2倍。另一方面，研究显示全球可公开获取的互联网数据已接近天花板，包括Web数据、代码、书籍、学术出版物、社交媒体、公开可用音视频在内的全球大模型可用公开数据总量约4.47*10的14次方Tokens。训练数据预计将在2028年前后耗尽。

未来突破“数据墙”有三条途径：一是激活沉睡数据，研究显示，CommonCrawl可爬取的数据仅占全网数据的6%～9%，企业内部大量非结构化数据目前缺乏供给的机制和技术手段。二是发展合成数据，目前，英伟达Nemotron-4340B指令模型依靠98%合成数据训练，OpenAI计划使用o1模型合成数据来训练即将推出的Orion模型。三是推动数据精标。国外ScaleAI公司瞄准高质量数据标注市场，面向专业场景提供数据精标服务，成为炙手可热的独角兽。我国数据资源总量丰富，在全球遭遇数据墙的情况下，充分发挥我国数据资源优势，加快培育高水平的人工智能数据产业，前景巨大。

四、工程化是AI技术形成生产力的关键环节，生态培育仍需加强

基础模型只是整个人工智能应用架构中的一部分，甚至只是一小部分。2024年，围绕大模型的工程化体系不断成熟，AI原生应用的架构实践往前迈出了一大步。检索增强生成（RAG）、智能体，甚至多智能体工作流等工程化技术得到了快速发展。如果把大模型比作操作系统，那么智能体就像是APP。智能体以大模型为智能中枢，融合规划、记忆和工具调用等能力，在众多领域初步展现出巨大潜力。

人工智能的工程化技术从表面上看技术含量不高，实际上至关重要，是联接前沿技术和用户实际场景的桥梁，在降低幻觉、提升应用效果的同时，能显著降低用户使用大模型的门槛。国内外互联网大厂纷纷推出了MaaS服务和智能体开发平台。但总体上看，人工智能应用服务领域的企业仍然不够多、不够强，但反过来看，这也为很多软件企业转型进入人工智能赛道提供了巨大机会。我们正在与头部企业合作，积极培育大模型服务提供商生态。

五、应用赋能在价值链两端率先启动，重点行业走深向实

基座模型不断进步和工程化持续成熟，为人工智能+铺平了道路。2024年随着国家实施人工智能+行动，大力推动人工智能赋能新型工业化，大模型在工业领域的应用案例越来越多。我们对大模型应用案例的统计发现，从流程上看，工业大模型在“微笑曲线”两端率先发力，符合赋能新

您可能关注的文档

文档评论（0）

150****5147 + 关注: 实名认证

文档贡献者

二级建造师持证人

分享知识，传播快乐！

咨询Ta 进入空间

领域认证该用户于2024年03月19日上传了二级建造师

1亿VIP精品文档

更多 >

人工智能技术产业观察与展望.docxVIP