- 1、本文档共71页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
基于多视角的人体视角合成长期以来都是计算机视觉和计算机图形学领域一个重要的研
究问题,旨在通过人体的多视角图像或视频合成出人体的任意视角图像或视频。目前,相关
技术已经被应用于增强现实/虚拟现实、体育赛事转播、游戏以及电影产业等领域。相比采用
稠密的阵列相机系统或者深度传感器进行人体视角合成或三维重建,从稀疏的多视角图像或
者视频完成此任务应用范围更广、成本更低,但也更具有挑战性。近些年来,随着深度学习
技术的快速发展以及计算设备性能的不断提升,以神经渲染技术为主导的方法推陈出新,正
在逐步弥补传统的方法存在的不足。其中,基于神经辐射场(Neuralradiancefields,NeRF)
的方法因其令人惊叹的效果引起了广泛地关注。
目前,基于NeRF的人体自由视角合成依然面对诸多挑战,其中主要包括如下问题:动态
人体的自由视角合成问题、新的人体的自由视角合成问题、人体重建问题。本文针对上述三
个问题进行研究,利用多人蒙皮线性模型(ASkinnedMulti-PersonLinearModel,SMPL)作
为人体的先验信息改进现有基于NeRF的方法,并以多视角相机采集系统制作的数据集和公
开数据集验证提出方法的可行性。具体的研究内容如下:
(1)针对动态人体的自由视角合成缺乏纹理细节问题,本文提出一种动态人体神经辐射
场模型。该模型利用SMPL的纹理图和顶点提供人体的先验外观信息。首先,利用SMPL模
型的纹理图生成可以使不同的人体姿态共享的纹理特征图;然后,在SMPL模型的顶点上放
置表征人体外观和形状的隐代码,利用三维稀疏卷积网络SparseConvNet扩散隐代码到三维
空间;最后,通过NeRF的体积渲染术合成出人体的图像。实验结果表明,该方法在训练过
以及未训练过的人体姿态相比于其他先进算法具有更好的视角合成结果。
(2)针对人体的自由视角合成泛化能力差问题,本文提出了一种以几何模型引导的可泛
化神经辐射场模型。该模型在利用SMPL模型作为先验几何模型的基础上,增加人体的稀疏
视角图像信息和深度信息作为额外输入,从而可以合成新的人体的图像,即未训练过的人体
的图像。首先,借助深度信息设计可判断遮挡的颜色融合模块以聚合多视角的图像信息,从
而获取人体的外观;然后,利用SMPL模型提供的稀疏点云和多视角一致性特征推断人体的
几何形状;最后,通过体积渲染术合成出人体的图像。实验结果表明,该方法不仅能够渲染
新的目标人体图像,而且有效地处理了稀疏视角图像输入情况人体自遮挡问题。与其他先进
方法相比,该方法具有更强的泛化能力。
(3)针对三维人体重建几何细节差的问题,本文提出了一种基于表面场和辐射场的人体
重建模型。该模型利用表面场的符号距离函数表达取代了辐射场的体密度表达。首先,利用
人体的运动将观察空间的采样点变换到标准空间;然后,利用多视角图像融合的信息计算变
换到标准空间的采样点相对人体表面的偏移量;最后,利用神经网络存储标准空间人体模型
的几何信息和颜色信息,借助体积渲染技术合成图像以及MarchingCubes算法重建出人体的
三维模型。实验结果表明,此方法相对于基于辐射场体密度的重建方法效果更好。
关键词:人体自由视角合成,人体重建,神经辐射场,SMPL模型
Abstract
Humanfreeviewsynthesisbasedonmulti-viewsinputshaslongbeenanimportantresearchissue
inthefieldofcomputervisionandcomputergraphics.Itaimstosynthesizethearbitraryviewimage
orvideoofthehumanfrommulti-viewimagesorvideos.Atpresent,ithasbeenappliedtoAR/VR,
sportseventbroadcasting,games,filmindustryandotherfields.Comparedwiththeuseofadense
arrayofcamerassystem
您可能关注的文档
最近下载
- 2025年小学美术_地下王国教学设计学情分析教材分析课后反思 .pdf VIP
- 2025入党积极分子预备党员考试精选题库(含答案).pdf VIP
- 双重预防体系试题含答案.docx VIP
- 2024至2030年全球及中国化妆品中的脂质体行业深度研究报告.docx
- 金凤花姑娘和三只小熊-Goldilocks and the three bears.ppt
- 宠物饲料项目可行性研究报告.doc
- HGT20570-95工艺系统工程设计技术规定.pdf
- 医疗器械经营售后服务培训.pptx
- 2024年山东高考化学真题试题(原卷版+含解析).doc
- EN 15227-2020铁路设施 — 铁路车辆的防撞性要求(中文版).doc
文档评论(0)