单目摄像机实现的注视方向估计研究-计算机应用技术专业论文.docx

单目摄像机实现的注视方向估计研究-计算机应用技术专业论文.docx

  1. 1、本文档共131页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
单目摄像机实现的注视方向估计研究-计算机应用技术专业论文

Classified Index: TP391.41 U.D.C.: 681.39 Dissertation for the Doctoral Degree in Engineering RESEARCH ON GAZE ESTIMATION BASED ON ONE MONOCULAR CAMERA Candidate: Ge Hongzhi Supervisor: Prof. Chen Xilin Academic Degree Applied for: Doctor of Engineering Specialty: Technology of Computer Application Affiliation: School of Computer Science and Technology Date of Defence: Feb, 2011 Degree-Conferring-Institution: Harbin Institute of Technology - - I - 摘要 摘要 注视方向估计是计算机视觉和模式识别研究的热点问题之一,具有重要 的理论意义和应用价值。对注视方向估计技术的系统研究能够推动这些领域 的发展,在人机交互、心理学研究等领域具有重要的应用前景。近年来,虽 然侵入式的注视方向估计取得了很大进展,但非侵入式的注视方向估计尚不 成熟。要实现真正鲁棒、实用的非侵入式的自动视线估计和跟踪系统还需要 解决大量的关键问题,尤其需要研究高效的人眼描述特征,以及实现头部自 由动作的视线方向估计算法。 本文研究了以单摄像机作为信息获取手段的非侵入式注视方向估计的相 关问题,包括基于单摄像机的数据获取与基准数据(ground truth)的自动标 注、眼部表观特征的表示、头部自由运动的注视方向估计等问题。概括而 言,本文的主要研究工作包括: 1.设计了一种同步采集注视方向、头部姿态数据和面部图像的方法, 并实现了相应的装置。在基于统计学习的算法中,系统的性能依赖于大量标 注的训练数据。因此,标注的数据集是注视方向估计研究的基础和前提。本 文设计的这种数据采集方法,能够在复杂环境下,同步采集图像、姿态、注 视方向以及各个目标间的空间位置关系。其采集的数据为后续实验的训练和 测试提供了保障。 2.提出一种基于方向二值模式特征的注视方向估计方法。随着注视方 向的改变,在眼窝中巩膜和虹膜位置之间的相对位置也随着改变。这些改变 可以看作是虹膜横向和纵向运动,这种运动会引起眼部图像纹理的相应变 化。针对虹膜纵向和横向的移动变化特点,提出方向二值模式(Directional Binary Pattern, DBP)的表示方法。通过计算四个方向上差分信息,使 DBP 特征不仅包含局部纹理信息,同时还包含特定方向的二值差分信息。因此, DBP 特征适合解析虹膜相对运动而引起眼部图像的纹理变化。同时 DBP 特 征对光照变化具有鲁棒性,能减少因光照影响而引起的计算误差。 3.提出了一种基于混合特征的注视方向估计方法。混合特征由模型特 征和表观特征组成。模型特征提取特征点间的几何向量;表观特征是从眼睛 图像提取基于 Gabor 特征的方向二值模式(Gabor Directional Binary Pattern, GDBP)。本文将两种特征通过支持向量回归(Support Vector Regression, SVR) 算法融合起来, 从而获得某一确定的头部姿态下的注视方向。将方向二值模 哈尔滨工业大学工学博士学位论文 哈尔滨工业大学工学博士学位论文 - - II - 式(DBP)用于编码图像的 Gabor 幅值特征,从而表示表观特征,并取得了较 好的性能。基于混合特征的方法具有如下特点:(1)根据不同的计算方向对 眼部图像进行二值化;(2) 成功地将 DBP 算子和 Gabor 幅值特征进行结 合,最后提取空间直方图特征作为判别特征;(3)既利用了表观特征较好的 统计特性,也得益于模型特征在对光照变化的鲁棒性。 4.提出一种头部自由动作的注视方向估计方法。对基于图像特征的注 视方向估计研究而言,包含两个重要的问题:头部姿态和眼睛注视方向。目 前,头部自由动作的注视方向估计方法多数通过先确定头部姿态,后估计注 视方向的方法实现。本文提出一个分布式算法实现头部可动作的注视方向估 计,分别估计头的姿态和眼睛的注视方向。在此基础上,提出了一种基于人 脸和眼睛特征层级融合的注视方向估计方法。实验验证了该方法的有效性。 通过上述工作,本文对基于单摄像机的注视方向估计涉及的一些相关问 题进行了研究。结果表明:眼部图像的模型特征和表观特征从不同角度描述 了注视方向的信息,高效地对二者进行融合,可以取得更为稳定的估计结 果。另外,本文基于

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档