- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于多个线性分类器的快速人脸检测方法
基于多分类器综合的快速人脸检测方法 梅 林 2002/8/29 问题描述 问题的特殊性 人脸检测问题—特殊的两类问题:待区分的两类物体(人脸、非人脸)的先验概率差别很大: P(人脸) P(非人脸) 时域卷积 = 频域相乘! 只要事先将图象变换到频域,相乘后,再反变换回时域即可。 快速傅立叶变换算法(FFT)— 将原本是N*N的计算量减少到了N/2*log2N,使得信号在频域和时域中的转换变得十分快速。 * Face (target) Detector 输入图像 Comments: 灰度→彩色 人脸 vs. 物体 Face Finder 检测结果 输入图像 分类器 对每层、每个位置取L×L的窗口 解决方法:Scale-Position 对源图像按1:f的比例构造不同尺度的金字塔 f=1.2 存在的问题 对图像金字塔的每一层、每一位置都要取一L×L的窗口,然后判断该窗口是人脸的可能性。 有哪些信誉好的足球投注网站代价很大,对1000× 2000的图像,光是有哪些信誉好的足球投注网站一层就要进行 2×106 次窗口计算! 影响速度的因素还有:每一窗口的计算量 解决思路 问题的背景—特殊性 由粗到精的检测策略 粗检阶段分类器的设计 细检阶段分类器的设计 问题背景 人脸 ? 非人脸 ? 40×40 40×40的灰度图像所能表示的物体(样本)空间范围是: 25640×40!个 彩色图像?范围更广! 这样大的空间分布表示着我们的世界,而人脸在其中只占很少的一部分 Q:人脸的分布在这样的空间里是怎样的? 高维空间,描述困难,但直观上应该是这样的分布: 特点:很大一部分空间可以快速排除! 人脸 非人脸 解决思路 由粗到精、逐步细化的检测策略 在开始阶段使用快速的检测方法,尽可能多地缩小候选区域范围 初始阶段的分类器应具有这样的原则: —算法简单(线性分类器) —有快速算法 经过粗检应能排除掉80%以上的候选区域,然后再构造更细致的分类器(SVM...)对剩下的候选点进行二次检测,依此,还可进行三次、四次……检测以保证精度。 检测流程 Why 线性分类器? 计算简单 ★线性分类→感知器→投影→卷积 x为d=L2维的样本向量,w为权向量: 由训练样本,学习得到权值 w, w0 (缺点:容易陷于局部最优,而得不到全局最优解,GA?) 感知器模型 线性不可分问题 多层感知器(MLP) 其它类型神经网络 缺点:过学习问题(推广能力不强),原因? 问题的要求 好在我们的问题并不要求设计一个分类器就能解决很多问题 一个分类器:可以把精度训练得很高,但推广性差 多个分类器:针对不同的阶段训练不同的分类器,更灵活,既可以解决速度问题,又可以保持很高的精度,还能把虚警降至最低。 训练策略 非人脸 人脸 抛去部分占全部非人脸最大 线性分类器1 抛去部分占第一次所剩非人脸最大 线性分类器2 。。。。 最后,得到 训练非线性分类器! → 线性鉴别分析(LDA) 类间散布矩阵 类内散布矩阵 Fisher准则 d维样本空间(投影)→一维样本空间: SVM K:(2rx+1)×(2ry+1) 二维卷积(2D Convolution) Matlab里:conv2, filter2 技 巧 训练数据: 人脸—CMU 2429 + 自建 2263=4692 非人脸—CMU 4548 + 自建 22844=27392 规一化 → 19×19 实验结果 * * * * *
文档评论(0)