网站大量收购独家精品文档,联系QQ:2885784924

Sora模型横空出世 AI产业链变革加速.docx

Sora模型横空出世 AI产业链变革加速.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Sora模型横空出世AI产业链变革加速

人工智能在文生视频领域取得新突破。北京时间2月16日,OpenAI发布文生视频模型Sora,该模型可根据简单提示词,生成长达1分钟的高清短视频,虽然仍处于面向测试者开放的状态,但较此前行业视频长度大幅提升,文生视频进入新阶段。

受此消息刺激,在2月19日开盘后,AI板块相关股票持续大涨,中文在线、易点天下、果麦文化、当虹科技、因赛集团、博汇科技、万兴科技、海天瑞声、丝路视觉等以20%幅度涨停,虹软科技、昆仑万维、拓尔思、恒新东方、东方国信、数码视讯、读客文化等大涨逾10%。CPO概念、算力股也随之走强,中际旭创、天孚通信、新易盛和联特科技均以20%幅度涨停,太辰光、德科立、罗博特科、光库科技、博创科技和曙光数创等均涨超10%。

当然,在提供惊艳文生视频的同时,Sora也提供了一些翻车的案例,即便是惊艳的案例,细究之下,个别产品与真实世界也存在邏辑难以自洽的部分,有时其不足在于难以模拟现实世界中的物理规律,且对于事物发生的因果、时序和空间关系也理解不足,例如模型能够生成一个人咬一口饼干,但饼干可能没有咬痕;模型可能在某些视频中混淆左右,而且可能难以精确描述随着时间推移而发生的事件,例如跟踪特定的相机轨迹等,但不可否认其远超同行同类产品。

与Pika、Run、Runway等AI文生视频工具相比,Sora不仅具有完成视频向前扩展、视频拼接等更加复杂的任务的能力,还能通过多镜头等方式带来更加生动的多视角视频,同时在生成视频的时长、流畅度和逻辑性等方面优势显著。

国投证券认为,Sora生成的内容在视频尺寸和时长、多模拟的视频生成能力、灵活扩展和真实模拟能力等方面均实现了超越。

Sora能够制作各种尺寸的视频,从宽屏的1920×1080到竖屏的1080×1920,同时携有更好的构图效果,生成时间也从其他模型的4秒提升至最高的60秒;其次,除了文生视频外,Sora还能图生视频、视频生视频等,具备丰富的多模态视频生成能力;再次,Sora还能将视频沿时间线向前或向后扩展,Demo中的视频都是从一个视频片段开始,向时间线的过去延伸,尽管开头各自不同,但最终都会汇聚于同一个结尾;最后,Sora可以创造出带有动态视角变化的视频,让人物和场景元素在三维空间中的移动看起来十分自然。

Sora基于扩散模型,并且在其中使用了Transfoumer架构,将视频和图像分解为Patch小数据单元,这些Patch类似于GPT中的Token,用于在Transfoumer模型中进行训练和生成,同时OpenAI将DALL.E3引入到Sora里,使得Sora能够精准地还原用户的文本提示,生成高质量的长视频。

基于强大的GPT和DALL.E模型,Sora在训练过程中完成了文本和视频模态的“对齐”,从而能够理解提示中的词汇含义,并能够将其对应到视频中的事物上,大大提升了生成视频的准确性。

中泰证券认为,OpenAI采用的合成数据方式在大幅提升模型效果的同时,相似风格的文本prompt也能够提升Sora与GPT、DALL.E的联动效果,使得Sora更接近一个“全能”的多模态模型。

在下游应用端,文生视频的突破将对文字、影视及游戏等娱乐行业带来巨大的变化。

Sora模型推出带来视频内容供给领域生产力的跃升,传统视频制作往往需要投入大量人力、物力和时间成本,通过利用Sora模型,创作者可以快速、高效的生成视频,极大降低产出成本。另一方面,Sora的编辑和扩展能力为创作者的灵活提供了空间,将进一步提高内容产出的创新性和多样性。

此外,IP版权公司积累的IP形态以文字、卡通人物形象等为主,文生视频模型可帮助此类公司迅速产出终端视频,业务范围将得到极大扩展,运营效率将发生极大跃升。考虑到Sora模型的可得性,文生视频的应用会最先在海外落地,Sora强大的视频生成能力将助力IP版权、出海广告营销等公司快速制作符合国际时长的视频内容,吸引海外用户,实现海外业务扩张并增厚业绩表现。

太平洋证券认为,AI多模态技术突破将降低文字、图片、音视频和游戏内容空间相互转化的门槛,提高AI工具辅助内容生产的比例,内容资产价值有望得到重估。

最低维的内容形式即文字类内容,且拥有内容数量多及质量高的公司弹性最大。文字作为最低维的内容升维空间最大,有望全面受益于内容资产价值重估,而网络文学的娱乐性足,因此其商业化空间最大;图片、音视频和游戏类资产也需要关注,图片类资产主要包含视觉内容和形象IP,音视频资产主要包含动漫、影视作品等。

华泰证券认为,“Sora+影视”预计能明显降低制作门槛及成本,且可以极大程度丰富影视的创造性及风格,Sora的出现将重塑影视行业,预计拥有核心导演或创意人才及IP资源的公司更受益;“Sora+营销”预计将提升广告相关视频的创造效率,提供灵感、增

文档评论(0)

ZC强 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档