- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CVPR机器学习论文阅读报告-基于3D的大姿态人脸对齐方法
CONTENTS
03
结论
什么是人脸对齐(alignment)?
人脸对齐,即面部特征点定位,在人脸上找出需要的特征点的位置,比如鼻子左侧,鼻孔下侧,瞳孔位置,上嘴唇下侧等等点的位置。下图中白色点的位置。定位了这些点的位置就可以进行下一步的的检测(detection)或识别(identification)。
相关背景
基于2D的最小二乘法:通过最小化训练图像(input image)和形变模型(morphable model)的均方误差来获得特征点位置。对于偏转角度小45度的中小姿态应用良好,但计算代价比较大。
基于CNN(卷积神经网络):大多数应用CNN的方法,计算性 能获得了提高,但仅检测较少的标注点(landmarks),限制了 对面部形状的描述能力。
大姿态下的人脸校准的相关文献仍然比较少,多视角2D方法(multi-viewframework)如TSPM和CDM利用不同角度人脸上的标注点来获得数据,计算代价(cost)比较高。其他基于3D的大姿态方法如3DMM要每张图片1min的计算代价,效率比较低。
现有对齐方法及局限性
本文需要解决的问题:
1、极端姿态下(如侧脸,偏转角度为90),一些特征点变了不可见。
2、不同姿态下的人脸表观(expressions)(仰头、大笑)也存在巨大差异,这些问题都导致大姿态下面部特征点定位任务极具挑战性
相关背景
侧脸
yaw45°
不同表观
3D密集人脸对齐(3DDFA):首先利用PNCC方法建立3D模型,然后用级联的卷积神经网络(cascaded CNN)系统去匹配模型。它通过估计模型参数能找到所有的顶点(Vertexes),所以是dense。
cascaded CNN:CNN通常分为卷积层、池化层、全连接层等几个部分。卷积层:通过局部感知和参数共享的方法降低参数数量,识别并提取输入数据的特征。
相关概念
下图中,不同颜色表明不同的卷积核。每个卷积核都会将图像生成为另一幅图像。比如两个卷积核就可以将生成两幅图像,这两幅图像可以看做是一张图像的不同的通道,又可以作为下一层卷积层的输入。
相关概念
下图展示的是四个通道上的卷积操作,有两个卷积核,生成两个通道,四个通道上每个通道对应一个卷积核,只看w1,那么在w1的某位置(i,j)处的值,是由四个通道上(i,j)处的卷积结果相加然后再取激活函数值得到的。
相关概念
池化层:将卷积得到的特征进行聚合,得到区域上某个特定特征的平均值或最大值,这种聚合操作就叫做池化。
经过多层卷积和池化,获得较多局部特征,然后再经过全连接层就可以获得全局图像特征。
相关概念
PNCC:投影归一化坐标码(Projected Normalized Coordinate Code
),首先将3D人脸的坐标归一化,则每个点的坐标就称为NCC,对经过投影的NCC利用Z-buffer着色就得到了PNCC.
相关概念
算法输入为100x100的RGB图像和PNCC (Projected Normalized Coordinate Code) 特征,PNCC特征的计算与当前形状相关,可以反映当前形状的信息;算法的输出为3D人脸形状模型参数;
使用卷积神经网络拟合从输入到输出的映射函数,网络包含4个卷积层,3个pooling层和2个全连接层。通过级联多个卷积神经网络直至在训练集上收敛,PNCC特征会根据当前预测的人脸形状更新,并作为下一级卷积神经网络的输入;
3DDFA算法核心思想
此外,卷积神经网络的损失函数(WPDC方法)也做了精心的设计。引入权重W, 反映的是错误估计模型参数所产生的误差,形状变化 会产生较大的Δp值,从而产生较大的W,网络就会优先拟合重要的形状参数,如尺度、旋转和平移;当人脸形状接近ground truth时,形状参数的W会比较小,此时再考虑拟合其他形状参数。经过3次以上迭代之后,发现这种WPDC方法比其他方法的误差显著要小。
3DDFA算法核心思想
此外,卷积神经网络的损失函数也做了精心的设计,通过引入权重,让网络优先拟合重要的形状参数,如尺度、旋转和平移;当人脸形状接近ground truth时,再考虑拟合其他形状参数;
由于参数化形状模型会限制人脸形状变形的能力,作者在使用3DDFA拟合之后,抽取HOG特征作为输入,使用线性回归来进一步提升2D特征点的定位精度。
3DDFA算法核心思想
训练3DDFA模型,需要大量的多姿态人脸样本。为此,作者基于已有的数据集如300W,利用3D信息虚拟生成不同姿态下的人脸图像,核心思想为:先预测人脸图像的深度信息,通过3D旋转来生成不同姿态下的人脸图像,如下图所示:(a)为原始图像,(b,c,d)为生成的虚拟样本,偏
您可能关注的文档
- 03-热浇道回收再使用的效益评估与关键因素.pdf
- 04-5-第5章-恒定电流-电磁学-大学物理-海南大学.pdf
- 05_生产与服务设施的选址与布置.pdf
- 05—河南省--强化农化服务与机械施肥 促进测土配方施肥大发展_ppt [兼容模式].-.2012724105211.pdf
- 11第十一章-电子政务1.ppt
- 01-整车控制器基础.ppt
- 03-第3章-市场调查的基本方法.ppt
- 1-电器的发热201609.ppt
- 2-2马克思主义科学技术观(对技术本质的追问).pdf
- 1_公路桥梁抗震设计专题.pdf
- 幼儿园防诱拐PPT课件.pptx
- 幼儿园防诱拐课件PPT.pptx
- 2025年上海国际港务(集团)股份有限公司校园招聘模拟试题附带答案详解参考答案.docx
- 黑龙江省齐齐哈尔市2024-2025学年高一上学期12月月考地理试卷含答案.docx
- 2025年上海国际港务(集团)股份有限公司校园招聘模拟试题附带答案详解一套.docx
- 幼儿园防诈骗课件学生.pptx
- 2025年上海国际港务(集团)股份有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库.docx
- 春节演讲稿范文(精选11篇) .pdf
- 2025年上海国美电器有限公司校园招聘模拟试题附带答案详解附答案.docx
- 2025年上海国际港务(集团)股份有限公司校园招聘模拟试题附带答案详解推荐.docx
最近下载
- IEC 61730-1 2023 必威体育精装版版中文标准.doc
- 论融资管理中存在问题与对策以格力电器为例_.docx
- 配置管理程序(ISO20000-1:2018).docx VIP
- 德国柏曼年品牌策划.ppt
- 《内科护理》4第四节 糖尿病病人的护理 教学课件.ppt VIP
- 云南白药股份有限公司财务报表分析.doc VIP
- APPROACHES AND METHODS IN LANGUAGE TEACHING教师专业发展.pdf
- 生鲜农产品冷链物流配送中心选址研究——以西安市为例.docx
- 陕西专升本英语3500词汇与高频词组.pdf VIP
- 2025年海南省公务员省考《行测》真题(含答案).pdf VIP
文档评论(0)