AI行业跟踪46期：英伟达发布Cosmos，CES大会芯片厂激烈角逐.docx

下载文档

16
0
约7.25千字
约 10页
2025-01-22 发布于北京
举报
版权申诉
保障服务

AI行业跟踪46期：英伟达发布Cosmos，CES大会芯片厂激烈角逐.docx

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

索引

内容目录

HYPERLINK\l_TOC_250012一、AI行业重点事件点评 3

HYPERLINK\l_TOC_250011英伟达发布世界基础模型开发平台Cosmos，技术报告内容公开 3

HYPERLINK\l_TOC_2500102025年CES大会亮点总结 5

HYPERLINK\l_TOC_250009二、AI行业动态一览 7

HYPERLINK\l_TOC_250008国外行业动态 7

HYPERLINK\l_TOC_250007AI大模型 7

HYPERLINK\l_TOC_250006应用 8

HYPERLINK\l_TOC_250005国内行业动态 8

HYPERLINK\l_TOC_250004AI大模型 8

HYPERLINK\l_TOC_250003应用 9

HYPERLINK\l_TOC_250002三、AI行情回顾：A股PCB板块领涨，美股表现分化 9

HYPERLINK\l_TOC_250001四、投资建议：持续关注AI应用和算力基础设施 10

HYPERLINK\l_TOC_250000五、风险提示 10

图表目录

图1：WFM预训练模型 3

图2：CosmosVideo数据处理过程 3

图3：Continuoustokens 4

图4：Discretetokens 4

图5：Cosmos世界基础模型1.0版本 4

图6：Cosmos防护流程概览 5

图7：英伟达主题演讲 6

图8：海信“三维控色液晶显示技术” 6

图9：雷鸟V3产品宣传图 6

图10：海信“三维控色液晶显示技术” 7

图11：联想AIPCThinkBookPlusGen6 7

图12：A股AI行业细分板块周涨跌幅对比（01.06-01.10） 9

图13：美股AI行业细分板块周涨跌幅对比（01.06-01.10） 9

一、AI行业重点事件点评

英伟达发布世界基础模型开发平台Cosmos，技术报告内容公开

美国拉斯维加斯当地时间1月6日晚，英伟达创始人兼CEO黄仁勋在2025国际消费电子展（CES）舞台上发布了Cosmos世界基础模型（WFM）平台。该平台拥有一系列开源、开放权重的视频世界模型，参数量从4B到14B不等，旨在为机器人、自动驾驶汽车等物理世界运行的AI系统生成大量基于物理的合成数据，解决数据不足问题。平台一次发布8个模型，分为扩散和自回归两类，支持文本生成视频和文本+视频生成视频两种方式，已在2000万小时视频数据上训练，吸引了包括1X、AgileRobots等公司成为首批用户。

图1：WFM预训练模型

资料来源：NVIDIA，

技术报告概览：

数据处理：涵盖数据集收集、视频分割、过滤、标注、去重和分片等步骤，以提升数据质量，适应模型训练需求。根据开发视频数据pipeline，从2000万小时视频中提取约1亿个2-60秒的视频片段，并利用视觉语言模型标注，构建基于Ray的协调pipeline

提高吞吐量，同时利用多种预训练模型和现代GPU硬件进行视频编解码。

图2：CosmosVideo数据处理过程

资料来源：NVIDIA，

Tokenizer：将视觉数据转换为紧凑token，有连续和离散两种类型，CosmosTokenizer在二者性能上表现优异。CosmosTokenizer架构与训练基于注意力的编码器-解码器架构，含因果时间卷积和注意力层，采用联合训练策略和两阶段训练方案，在多数据集评估中表

现出色，编码解码速度快。

图3：Continuoustokens 图4：Discretetokens

资料来源：NVIDIA，资料来源：NVIDIA，

世界基础模型预训练：基于扩散和自回归模型构建，分别采用特定训练公式、架构设计和训练策略，利用大规模GPU集群训练。Cosmos针对两种模型分别采用多种内存优化和并行策略，在3D一致性和物理对齐等方面评估其性能，当前扩散模型生成质量更优。

图5：Cosmos世界基础模型1.0版本

资料来源：NVIDIA，

后训练世界基础模型：

相机控制应用：对特定模型后训练，在数据集上添加相机控制条件，使其能生成3D

导航视频，评估结果优于现有模型。

机器人操作应用：针对指令和动作两种任务在不同数据集上微调模型，在机器人操作视频生成任务中，评估指标优于基线模型。

自动驾驶应用：在内部驾驶数据集上微调模型构建多视图世界模

您可能关注的文档

文档评论（0）

535600147 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6010104234000003

1亿VIP精品文档

更多 >

AI行业跟踪46期：英伟达发布Cosmos，CES大会芯片厂激烈角逐.docx