- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Sora深度:功能优势、发展现状、算力测算、
行相关影响及相关公司深度梳理
业
研
究2024年2月16日,OpenAI发布首个视频生成模型Sora。Sora继承DALL·E3的画质和遵循指令能力,
能生成长达1分钟的高清视频。Sora的出现对AI行业的发展具有里程碑意义。从中短期看Sora作为一
报款具有强劲性能的视频生成模型,将提升视频生成的质量和效率,对影视和游戏等相关行业具有变革作
用;从长期看Sora有望成为一款世界模拟器的视频生成模型,为未来发展理解和模拟真实世界的模型
告
奠定基础。
围绕Sora,下面我们从其实现功能、技术路径、算法实现等基本信息入手,了解Sora功能优势及局限;
梳理文本视频大模型发展历程及当前代表性文生模型并与其对比,对Sora进行算力预估并对其未来发
展影响进行展望,方便读者深入了解这一大模型。
目录
一、Sora概述1
二、Sora功能优势及局限6
三、文生视频大模型发展现状13
四、代表性文生视频模型梳理及比较15
五、Sora对算力网络需求拉动测算17
六、Sora将如何改变传媒各细分赛道19
七、相关公司20
八、参考研报27
一、Sora概述
慧1.OpenAI发布首个视频生成模型Sora
博
智2月16日,OpenAI发布了推出了一款能根据文字指令即时生成短视频的模型,命名为Sora。
能
投
研
1/27
根据介绍,Sora使用扩散模型技术,完美继承了DALL·E3的画质和遵循指令能力,能够从文本说明中
生成长达60秒的视频,并能够提供具有多个角色、特定类型的动作和详细背景细节的场景。借助GPT
的能力,Sora能够实现对语言的深入理解,使其能够准确地解释提示词,并生成引人注目的字符来表达
充满活力的情感。Sora还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。
2.实现功能
2/27
OpenAI表示,通过让模型一次生成多帧画面,Sora解决了一个具有挑战性的问题,即:即使生成的主
体暂时离开视线内,也能确保主体不变。
除文生视频外,Sora还具有更多功能:1)根据图像生成动画;2)在时间上向前或向后扩展视频;3)
编辑输入的视频;4)在两个输入视频之间逐渐进行插值,从而在具有完全不同主题和场景构成的视频
之间创建无缝过渡;5)根据文字生成图像。
3.技术路径
Sora取法Tokens文本特征标记,是基于Patches视觉特征标记的DiffusionTransformer模型。
OpenAI研究团队从LLM中汲取灵感,认为LLM范式的成功在一定程度上得益于Tokens的使用,
Tokens统一了代码、数学和各种自然语言的文本模式。类似于LLM范式下的Tokens文本标记,Sora
创新性地使用了Patches(apartofsomethingmarkedoutfromtherestbyaparticularcharacteristic;
视觉特征标记)。
鉴于Patches之前已被证明是视觉数据模型的有效表示,OpenAI研究团队进一步研发发现Patches是
一种高度可扩展且有效的表示,可以被用于在不同类型的视频和图像上训练生成模型:
3/27
WUFUxOtOmPrQqOmP
您可能关注的文档
- Product Ident GmbH:2024出海有方白皮书-跨境有方 简化合规 一键入海.pdf
- sora+openai技术文档总结+中英对照原稿.pdf
- TD产业联盟:5G产业和市场发展报告(2023Q4).pdf
- 爱立信-移动市场报告:2024年商业评论版.pdf
- 集团党委书记在2024年度总结表彰暨拼抢一季度、实现“开门红”动员部署会上的讲话.docx
- 2024年民主生活会筹备工作情况报告.docx
- 在2025年全省文旅局长会议上的讲话.docx
- 2024年度组织生活会领导班子对照检视发言材料.docx
- 2024年度党支部组织生活会对照检查发言材料(支委班子).docx
- 区长在2025年全区推进数字城市建设工作会议上的讲话.docx
- 2024年度党员干部民主生活会班子对照检查材料.docx
- 公司党委领导班子2024年度民主生活会对照检查材料4个带头方面.docx
- 市府办(政府办)领导班子2024年民主生活会会后综合情况报告.docx
- 在2025年市司法局信息宣传工作推进会上的讲话.docx
- 在2025年全省文化旅游高质量发展推进会上的讲话.docx
- 在2025年全区工业、住建大规模设备更新推进会上的讲话.docx
- 党支部2024年组织生活会民主评议党员情况总结报告_1.docx
- 2024年度组织生活会个人对照检查剖析材料.docx
- 镇党委书记2024年度民主生活会对照检查材料1.docx
- 党支部2024年组织生活会民主评议党员情况总结报告.docx
最近下载
- 日本日立变频器sj300系列调试参考手册.pdf
- 苏教版三年级下册含有小括号的混合运算教学设计.docx
- 施工安全管理员工培训.pptx VIP
- 禽流感课件(共23张PPT)《动物疫病防治》.pdf VIP
- 在2024年度组织生活会和民主评议党员会上的点评讲话+民主评议党员会议议程.doc VIP
- 天然苏打水标准.pdf VIP
- 理光MPC3004 3504 4504 6004SP维修手册.pdf VIP
- 部编版四年级下册语文5琥珀ppt课件设计 (3).ppt
- 第六节:隋唐统一多民族国家的发展.ppt VIP
- 兴文县2025年第一次公开考调公务员 (参照管理人员)(30人)笔试模拟试题及答案解析.docx
文档评论(0)