- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
索引
索引
内容目录
HYPERLINK\l_TOC_250012一、AI行业重点事件点评 3
HYPERLINK\l_TOC_250011英伟达发布世界基础模型开发平台Cosmos,技术报告内容公开 3
HYPERLINK\l_TOC_2500102025年CES大会亮点总结 5
HYPERLINK\l_TOC_250009二、AI行业动态一览 7
HYPERLINK\l_TOC_250008国外行业动态 7
HYPERLINK\l_TOC_250007AI大模型 7
HYPERLINK\l_TOC_250006应用 8
HYPERLINK\l_TOC_250005国内行业动态 8
HYPERLINK\l_TOC_250004AI大模型 8
HYPERLINK\l_TOC_250003应用 9
HYPERLINK\l_TOC_250002三、AI行情回顾:A股PCB板块领涨,美股表现分化 9
HYPERLINK\l_TOC_250001四、投资建议:持续关注AI应用和算力基础设施 10
HYPERLINK\l_TOC_250000五、风险提示 10
图表目录
图1:WFM预训练模型 3
图2:CosmosVideo数据处理过程 3
图3:Continuoustokens 4
图4:Discretetokens 4
图5:Cosmos世界基础模型1.0版本 4
图6:Cosmos防护流程概览 5
图7:英伟达主题演讲 6
图8:海信“三维控色液晶显示技术” 6
图9:雷鸟V3产品宣传图 6
图10:海信“三维控色液晶显示技术” 7
图11:联想AIPCThinkBookPlusGen6 7
图12:A股AI行业细分板块周涨跌幅对比(01.06-01.10) 9
图13:美股AI行业细分板块周涨跌幅对比(01.06-01.10) 9
一、AI行业重点事件点评
英伟达发布世界基础模型开发平台Cosmos,技术报告内容公开
美国拉斯维加斯当地时间1月6日晚,英伟达创始人兼CEO黄仁勋在2025国际消费电子展(CES)舞台上发布了Cosmos世界基础模型(WFM)平台。该平台拥有一系列开源、开放权重的视频世界模型,参数量从4B到14B不等,旨在为机器人、自动驾驶汽车等物理世界运行的AI系统生成大量基于物理的合成数据,解决数据不足问题。平台一次发布8个模型,分为扩散和自回归两类,支持文本生成视频和文本+视频生成视频两种方式,已在2000万小时视频数据上训练,吸引了包括1X、AgileRobots等公司成为首批用户。
图1:WFM预训练模型
资料来源:NVIDIA,
技术报告概览:
数据处理:涵盖数据集收集、视频分割、过滤、标注、去重和分片等步骤,以提升数据质量,适应模型训练需求。根据开发视频数据pipeline,从2000万小时视频中提取约1亿个2-60秒的视频片段,并利用视觉语言模型标注,构建基于Ray的协调pipeline
提高吞吐量,同时利用多种预训练模型和现代GPU硬件进行视频编解码。
图2:CosmosVideo数据处理过程
资料来源:NVIDIA,
Tokenizer:将视觉数据转换为紧凑token,有连续和离散两种类型,CosmosTokenizer在二者性能上表现优异。CosmosTokenizer架构与训练基于注意力的编码器-解码器架构,含因果时间卷积和注意力层,采用联合训练策略和两阶段训练方案,在多数据集评估中表
现出色,编码解码速度快。
图3:Continuoustokens 图4:Discretetokens
资料来源:NVIDIA, 资料来源:NVIDIA,
世界基础模型预训练:基于扩散和自回归模型构建,分别采用特定训练公式、架构设计和训练策略,利用大规模GPU集群训练。Cosmos针对两种模型分别采用多种内存优化和并行策略,在3D一致性和物理对齐等方面评估其性能,当前扩散模型生成质量更优。
图5:Cosmos世界基础模型1.0版本
资料来源:NVIDIA,
后训练世界基础模型:
相机控制应用:对特定模型后训练,在数据集上添加相机控制条件,使其能生成3D
导航视频,评估结果优于现有模型。
机器人操作应用:针对指令和动作两种任务在不同数据集上微调模型,在机器人操作视频生成任务中,评估指标优于基线模型。
自动驾驶应用:在内部驾驶数据集上微调模型构建多视图世界模
您可能关注的文档
最近下载
- 2025东方航空技术有限公司校园招聘笔试参考题库附答案解析.docx
- 2025届高考语文一轮复习专项:病句辨析修改课件.pptx
- 住院医师接诊病人考核评分.pdf
- 《串联电路和并联电路》精品课件.ppt VIP
- 《肥料基础知识》培训课件.pptx
- 2024年中考物理复习-----3.“速度综合计算”重难点突破及题型归类.docx VIP
- 《剪映:手机短视频制作 》-教案全套 第1--10章 短视频快速入门---手机短视频剪辑实训案例 .pdf
- 职工互助保障业务知识竞答题及答案(85题).docx VIP
- 思拓力RTK操作流程.docx
- 工程项目标书工程创优照片、录像拍摄计划及制作要点.docx
文档评论(0)