计算机视觉24 12.1 第十二章 目标识别.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机视觉24 12.1 第十二章 目标识别

基于eigenfaces/fisherfaces的识别 训练: - 根据训练图像,利用PCA或Fisher方法确定投 影矩阵 - 将每个训练图像投影到子空间(eigenspace或fisherspace)。 识别: - 将测试图像投影到eigenspace或fisherspace。 - 子空间中距离测试图像最近的训练图像对应的类别为识别结果。 Boosting Example Boosting Example Boosting Example Boosting Example Boosting Example Adaboost 学习目标:选择能够最有效地区分人脸与非人脸的矩形特征及其阈值 Adaboost 组合弱分类器(weak learners),得到更为精确的集成分类器(ensemble classifier)。 弱分类器:性能仅比随机分类稍好 根据矩形特征定义弱分类器: Adaboost算法步骤 初始给每个训练样本以同等权重 循环执行以下步骤: 根据当前加权训练集,选择最佳弱分类器 提升被当前弱分类器错分的训练样本的权重 按照各弱分类器分类精度对其加权,然后将各个弱分类器形成线性组合,得到最终分类器。 Viola-Jones算法中的AdaBoost 每一次boosting迭代如下: 评价每一个样本上的每一种矩形特征 为每一种矩形特征选择最佳分类阈值 选择最优的矩形特征及其阈值组合 改变样本权重 计算复杂度: O(MNT) M:特征数,N:样本数, T:阈值数 级联分类器(Cascading Classifiers) 训练级联分类器 Viola-Jones检测算法-总体流程 用5K正样本,350M反样本学习 得到38层(共使用6060个特征)级联分类获得实时性 Viola-Jones人脸检测结果 Viola-Jones人脸检测结果 Viola-Jones人脸检测结果 2. 人脸识别(face recogntion) Zhao et al., Face Recogniton: a literature survey. ACM Computing survey, 2003 Face Recognition: 2-D and 3-D 图像 = 像素的集合 将由n个像素构成的图像视为n维空间中的点 最近邻分类器 Eigenfaces 使用主成分分析技术(Principle Component Analysis, PCA)减少维数 主成分分析(PCA, K-L变换) 降低特征向量的维数 获得最主要特征分量,减少相关性; 避免维数灾难 主成分分析(PCA, K-L变换) 主成分分析(PCA, K-L变换) Eigenfaces 学习 1. 计算训练图像的均值和协方差矩阵. 2. 计算协方差矩阵的特征值,取前k个最大特 征值对应的特征矢量. 3. 将图像投影到k-维特征空间 (Eigenspace)。 识别 1. 将测试图像投影到Eigenspace. 2. 在特征图像上执行分类. Eigenfaces: 训练图像 Eigenfaces PCA方法的不足 可能损失重要的细节信息 方差最小的方向也可能是重要的 没有考虑判别任务 希望得到最具判别能力的特征 但判别能力最佳并不等同于方差最大 Fisherfaces:类特定的线性投影 PCA Fisher的线性判别函数 PCA Fisher的线性判别函数 Fisherfaces示例(ORL Database) 第十二章 目标识别 Lecture 12 Object Recognition 目标识别 怎样识别图像中物体,如汽车、牛等? 目标识别的应用 人脸检测与识别 难点之一: 如何鲁棒识别? 类内差异(intra-class variability) 类间相似性(inter-class similarity) 难点之二:计算量大 一幅图像中像素个数多,目前每秒约产生30G像素的图像/视频数据。 - Google图片有哪些信誉好的足球投注网站中已有几十亿幅图像 - 全球数字照相机一年产生180亿张以上的图片(2004年) - 全球一年销售约3亿部照相手机(2005) 人的物体识别能力是强大的 - 灵长类动物约使用大脑皮层的一半来处理视觉信息 [Felleman and van Essen 1991] - 可以识别3,000-30,000种物体 - 物体姿态可允许30度以上的自由度。 难点之三:如何在小样本条件下学习 物体识别方法 检测(detection)vs. 不检测 表示(representation) - 颜色、纹理、边缘、梯度、局部特征、深度、运动等等。 分类(classification or categorization) -

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档