网站大量收购独家精品文档,联系QQ:2885784924

AI行业跟踪46期:英伟达发布Cosmos,CES大会芯片厂激烈角逐.docx

AI行业跟踪46期:英伟达发布Cosmos,CES大会芯片厂激烈角逐.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

索引

索引

内容目录

HYPERLINK\l_TOC_250012一、AI行业重点事件点评 3

HYPERLINK\l_TOC_250011英伟达发布世界基础模型开发平台Cosmos,技术报告内容公开 3

HYPERLINK\l_TOC_2500102025年CES大会亮点总结 5

HYPERLINK\l_TOC_250009二、AI行业动态一览 7

HYPERLINK\l_TOC_250008国外行业动态 7

HYPERLINK\l_TOC_250007AI大模型 7

HYPERLINK\l_TOC_250006应用 8

HYPERLINK\l_TOC_250005国内行业动态 8

HYPERLINK\l_TOC_250004AI大模型 8

HYPERLINK\l_TOC_250003应用 9

HYPERLINK\l_TOC_250002三、AI行情回顾:A股PCB板块领涨,美股表现分化 9

HYPERLINK\l_TOC_250001四、投资建议:持续关注AI应用和算力基础设施 10

HYPERLINK\l_TOC_250000五、风险提示 10

图表目录

图1:WFM预训练模型 3

图2:CosmosVideo数据处理过程 3

图3:Continuoustokens 4

图4:Discretetokens 4

图5:Cosmos世界基础模型1.0版本 4

图6:Cosmos防护流程概览 5

图7:英伟达主题演讲 6

图8:海信“三维控色液晶显示技术” 6

图9:雷鸟V3产品宣传图 6

图10:海信“三维控色液晶显示技术” 7

图11:联想AIPCThinkBookPlusGen6 7

图12:A股AI行业细分板块周涨跌幅对比(01.06-01.10) 9

图13:美股AI行业细分板块周涨跌幅对比(01.06-01.10) 9

一、AI行业重点事件点评

英伟达发布世界基础模型开发平台Cosmos,技术报告内容公开

美国拉斯维加斯当地时间1月6日晚,英伟达创始人兼CEO黄仁勋在2025国际消费电子展(CES)舞台上发布了Cosmos世界基础模型(WFM)平台。该平台拥有一系列开源、开放权重的视频世界模型,参数量从4B到14B不等,旨在为机器人、自动驾驶汽车等物理世界运行的AI系统生成大量基于物理的合成数据,解决数据不足问题。平台一次发布8个模型,分为扩散和自回归两类,支持文本生成视频和文本+视频生成视频两种方式,已在2000万小时视频数据上训练,吸引了包括1X、AgileRobots等公司成为首批用户。

图1:WFM预训练模型

资料来源:NVIDIA,

技术报告概览:

数据处理:涵盖数据集收集、视频分割、过滤、标注、去重和分片等步骤,以提升数据质量,适应模型训练需求。根据开发视频数据pipeline,从2000万小时视频中提取约1亿个2-60秒的视频片段,并利用视觉语言模型标注,构建基于Ray的协调pipeline

提高吞吐量,同时利用多种预训练模型和现代GPU硬件进行视频编解码。

图2:CosmosVideo数据处理过程

资料来源:NVIDIA,

Tokenizer:将视觉数据转换为紧凑token,有连续和离散两种类型,CosmosTokenizer在二者性能上表现优异。CosmosTokenizer架构与训练基于注意力的编码器-解码器架构,含因果时间卷积和注意力层,采用联合训练策略和两阶段训练方案,在多数据集评估中表

现出色,编码解码速度快。

图3:Continuoustokens 图4:Discretetokens

资料来源:NVIDIA, 资料来源:NVIDIA,

世界基础模型预训练:基于扩散和自回归模型构建,分别采用特定训练公式、架构设计和训练策略,利用大规模GPU集群训练。Cosmos针对两种模型分别采用多种内存优化和并行策略,在3D一致性和物理对齐等方面评估其性能,当前扩散模型生成质量更优。

图5:Cosmos世界基础模型1.0版本

资料来源:NVIDIA,

后训练世界基础模型:

相机控制应用:对特定模型后训练,在数据集上添加相机控制条件,使其能生成3D

导航视频,评估结果优于现有模型。

机器人操作应用:针对指令和动作两种任务在不同数据集上微调模型,在机器人操作视频生成任务中,评估指标优于基线模型。

自动驾驶应用:在内部驾驶数据集上微调模型构建多视图世界模

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档