CVPR机器学习论文阅读报告-基于3D的大姿态人脸对齐方法.ppt

下载文档 降价啦

130
0
约2.66千字
约 19页
2018-02-21 发布于湖北
举报
版权申诉
保障服务

CVPR机器学习论文阅读报告-基于3D的大姿态人脸对齐方法.ppt

1、本文档共19页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

CVPR机器学习论文阅读报告-基于3D的大姿态人脸对齐方法

CONTENTS 03 结论什么是人脸对齐（alignment）？人脸对齐，即面部特征点定位，在人脸上找出需要的特征点的位置，比如鼻子左侧，鼻孔下侧，瞳孔位置，上嘴唇下侧等等点的位置。下图中白色点的位置。定位了这些点的位置就可以进行下一步的的检测（detection）或识别（identification）。相关背景基于2D的最小二乘法：通过最小化训练图像（input image）和形变模型（morphable model）的均方误差来获得特征点位置。对于偏转角度小45度的中小姿态应用良好，但计算代价比较大。基于CNN（卷积神经网络）:大多数应用CNN的方法，计算性能获得了提高，但仅检测较少的标注点（landmarks）,限制了对面部形状的描述能力。大姿态下的人脸校准的相关文献仍然比较少，多视角2D方法（multi-viewframework）如TSPM和CDM利用不同角度人脸上的标注点来获得数据，计算代价（cost）比较高。其他基于3D的大姿态方法如3DMM要每张图片1min的计算代价，效率比较低。现有对齐方法及局限性本文需要解决的问题： 1、极端姿态下（如侧脸，偏转角度为90），一些特征点变了不可见。 2、不同姿态下的人脸表观（expressions）（仰头、大笑）也存在巨大差异，这些问题都导致大姿态下面部特征点定位任务极具挑战性相关背景侧脸 yaw45° 不同表观 3D密集人脸对齐（3DDFA）：首先利用PNCC方法建立3D模型，然后用级联的卷积神经网络（cascaded CNN）系统去匹配模型。它通过估计模型参数能找到所有的顶点（Vertexes）,所以是dense。 cascaded CNN:CNN通常分为卷积层、池化层、全连接层等几个部分。卷积层：通过局部感知和参数共享的方法降低参数数量，识别并提取输入数据的特征。相关概念下图中，不同颜色表明不同的卷积核。每个卷积核都会将图像生成为另一幅图像。比如两个卷积核就可以将生成两幅图像，这两幅图像可以看做是一张图像的不同的通道，又可以作为下一层卷积层的输入。相关概念下图展示的是四个通道上的卷积操作，有两个卷积核，生成两个通道，四个通道上每个通道对应一个卷积核，只看w1，那么在w1的某位置（i,j）处的值，是由四个通道上（i,j）处的卷积结果相加然后再取激活函数值得到的。相关概念池化层：将卷积得到的特征进行聚合，得到区域上某个特定特征的平均值或最大值，这种聚合操作就叫做池化。经过多层卷积和池化，获得较多局部特征，然后再经过全连接层就可以获得全局图像特征。相关概念 PNCC:投影归一化坐标码（Projected Normalized Coordinate Code ），首先将3D人脸的坐标归一化，则每个点的坐标就称为NCC，对经过投影的NCC利用Z-buffer着色就得到了PNCC. 相关概念算法输入为100x100的RGB图像和PNCC （Projected Normalized Coordinate Code）特征，PNCC特征的计算与当前形状相关，可以反映当前形状的信息；算法的输出为3D人脸形状模型参数；使用卷积神经网络拟合从输入到输出的映射函数，网络包含4个卷积层，3个pooling层和2个全连接层。通过级联多个卷积神经网络直至在训练集上收敛，PNCC特征会根据当前预测的人脸形状更新，并作为下一级卷积神经网络的输入； 3DDFA算法核心思想此外，卷积神经网络的损失函数(WPDC方法)也做了精心的设计。引入权重W，反映的是错误估计模型参数所产生的误差，形状变化会产生较大的Δp值，从而产生较大的W，网络就会优先拟合重要的形状参数，如尺度、旋转和平移；当人脸形状接近ground truth时，形状参数的W会比较小，此时再考虑拟合其他形状参数。经过3次以上迭代之后，发现这种WPDC方法比其他方法的误差显著要小。 3DDFA算法核心思想此外，卷积神经网络的损失函数也做了精心的设计，通过引入权重，让网络优先拟合重要的形状参数，如尺度、旋转和平移；当人脸形状接近ground truth时，再考虑拟合其他形状参数；由于参数化形状模型会限制人脸形状变形的能力，作者在使用3DDFA拟合之后，抽取HOG特征作为输入，使用线性回归来进一步提升2D特征点的定位精度。 3DDFA算法核心思想训练3DDFA模型，需要大量的多姿态人脸样本。为此，作者基于已有的数据集如300W，利用3D信息虚拟生成不同姿态下的人脸图像，核心思想为：先预测人脸图像的深度信息，通过3D旋转来生成不同姿态下的人脸图像，如下图所示：（a）为原始图像，（b,c,d）为生成的虚拟样本，偏