网站大量收购独家精品文档,联系QQ:2885784924

传媒:视频生成模型再迎突破.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2024年02月18日行业研究●证券研究报告

传媒行业快报

视频生成模型再迎突破

-A

投资评级领先大市维持

投资要点首选股票评级

事件:2月16日OpenAI发布文生视频模型Sora,其使用Transformer架

构,建立在DALL·E3和GPT模型之上,可以生成长达一分钟的有运动、多机

一年行业表现

位视频。相比业界水平,Sora将视频生成的时长一次性提升了15倍,直接迈

过了市面上所有短视频的时长要求。

视频生成模型范式的确定有望进一步推动多模态模型发展。模型层面:在文生

视频领域,目前模型思路有循环网络(RNN)、生成对抗网络(GAN)和扩

散模型(Diffusionmodels),Sora为一种扩散模型相较于GAN,扩散模型

的生成多样性和训练稳定性都要更好。生成表现:扩散模型在图片和视频生成

上有更高的天花板,GAN模型从原理上本质上是机器对人的模仿,而扩散模型

则更像是机器学会“成为一个人”。Sora基本框架:基于OpenAI大语言模型

思路,Sora采用Transformer架构(主流视频生成扩散模型较多采用U-Net

架构),同时开发视频压缩网络有效减小Transformer架构带来的计算量压资料来源:聚源

力。训练端:Sora文生视频模型,利用用DALL·E3的re-captioning功能,

给训练视频素材加上高质量文本描述。输入端:Sora并非基于用户输入提示升幅%1M3M12M

词直接生成,用户输入提示词后,GPT会先将用户输入的提示词进行精准扩

写,将扩写后的提示词交给Sora,生成较为精准视频。相对收益-12.24-15.86.67

绝对收益-8.04-21.49-9.92

模型多维度赋能视频制作或将影响行业生态。视频功能:1、模拟真实及虚拟

世界:能够模拟物理世界中的人、动物和环境的某些方面;可以生成摄像机动分析师倪爽

态运动的视频。随着摄像机的移动和旋转,人物和场景元素在3D空间中的移SAC执业证书编号:S0910523020003

动会保持一致。训练数据规模扩张或将成为开发物理、数字世界、元宇宙的高nishuang@

效模拟方式。2、视频连接功能:在两个输入视频之间逐步插值,并在主题、

相关报告

场景构成完全不同的视频之间创建无缝过渡。3、扩展生成视频:能向前或向

传媒:游戏AI大模型首次备案;进口游戏版

后多个维度扩展视频,(将同一生成的视频向不同视角延伸,视频开始都与其

号获批-华金证券-传媒-行业快报2024.2.3

他视频不同,但结尾保持一致)4、视频剪辑:在0拍摄的情况下,转换输入

您可能关注的文档

文档评论(0)

如此醉 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档