基于多个线性分类器的快速人脸检测方法.ppt

下载文档 降价啦

3
0
约1.49千字
约 35页
2018-06-03 发布于重庆
举报
版权申诉
保障服务

基于多个线性分类器的快速人脸检测方法.ppt

1、本文档共35页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于多个线性分类器的快速人脸检测方法

基于多分类器综合的快速人脸检测方法梅林 2002/8/29 问题描述问题的特殊性人脸检测问题—特殊的两类问题：待区分的两类物体（人脸、非人脸）的先验概率差别很大： P(人脸) P(非人脸) 时域卷积 = 频域相乘！只要事先将图象变换到频域，相乘后，再反变换回时域即可。快速傅立叶变换算法（FFT）— 将原本是N*N的计算量减少到了N/2*log2N，使得信号在频域和时域中的转换变得十分快速。 * Face (target) Detector 输入图像 Comments: 灰度→彩色人脸 vs. 物体 Face Finder 检测结果输入图像分类器对每层、每个位置取L×L的窗口解决方法：Scale-Position 对源图像按1:f的比例构造不同尺度的金字塔 f=1.2 存在的问题对图像金字塔的每一层、每一位置都要取一L×L的窗口，然后判断该窗口是人脸的可能性。有哪些信誉好的足球投注网站代价很大，对1000× 2000的图像,光是有哪些信誉好的足球投注网站一层就要进行 2×106 次窗口计算！影响速度的因素还有：每一窗口的计算量解决思路问题的背景—特殊性由粗到精的检测策略粗检阶段分类器的设计细检阶段分类器的设计问题背景人脸 ? 非人脸 ? 40×40 40×40的灰度图像所能表示的物体（样本）空间范围是： 25640×40！个彩色图像？范围更广！这样大的空间分布表示着我们的世界，而人脸在其中只占很少的一部分 Q：人脸的分布在这样的空间里是怎样的？高维空间，描述困难，但直观上应该是这样的分布：特点：很大一部分空间可以快速排除！人脸非人脸解决思路由粗到精、逐步细化的检测策略在开始阶段使用快速的检测方法，尽可能多地缩小候选区域范围初始阶段的分类器应具有这样的原则： —算法简单（线性分类器） —有快速算法经过粗检应能排除掉80％以上的候选区域，然后再构造更细致的分类器（SVM...）对剩下的候选点进行二次检测，依此，还可进行三次、四次……检测以保证精度。检测流程 Why 线性分类器？计算简单 ★线性分类→感知器→投影→卷积 x为d＝L2维的样本向量，w为权向量：由训练样本，学习得到权值 w, w0 （缺点：容易陷于局部最优，而得不到全局最优解，GA？）感知器模型线性不可分问题多层感知器（MLP）其它类型神经网络缺点：过学习问题（推广能力不强），原因？问题的要求好在我们的问题并不要求设计一个分类器就能解决很多问题一个分类器：可以把精度训练得很高，但推广性差多个分类器：针对不同的阶段训练不同的分类器，更灵活，既可以解决速度问题，又可以保持很高的精度，还能把虚警降至最低。训练策略非人脸人脸抛去部分占全部非人脸最大线性分类器1 抛去部分占第一次所剩非人脸最大线性分类器2 。。。。最后，得到训练非线性分类器！ → 线性鉴别分析(LDA) 类间散布矩阵类内散布矩阵 Fisher准则 d维样本空间（投影）→一维样本空间： SVM K：(2rx+1)×(2ry+1) 二维卷积（2D Convolution） Matlab里：conv2, filter2 技巧训练数据：人脸—CMU 2429 + 自建 2263＝4692 非人脸—CMU 4548 + 自建 22844＝27392 规一化 → 19×19 实验结果 * * * * *