用于说话人识别的实时唇线提取方法.docVIP

用于说话人识别的实时唇线提取方法.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用于说话人识别的实时唇线提取方法.doc

用于说话人识别的实时唇线提取方法 第32卷 VoL32 第5期 №s 计算机工程 ComputerEngineering 2006年3月 March2O06 ? 人工智能及识别技术?文章鳙号z1000----3428(2006)05--0202--03文献标识码,A中圈分类号ITP391.41 用于说话人识别的实时唇线提取方法 周晔.刘万春.朱玉文 (北京理工大学视觉与模式识别实验室,北京100081) 擅要:实现了+种用于说话人识别的实时唇线提取方法.该方法首先将原始图像变换到CIELAB颜色空间,然后对所得阻像的L和a分 量分别进行直方图统计.根据图像特性,L和a坐标轴的意义等先验知识,直接快速地计算出用于分割出唇区域和嘴内区域的阈值,达到 较准确的唇定位.然后采用新的能量函数指导变形模板法提取出唇线.实验表明,该方法简单快速,能够在一定程度上适应光照变化,以 及由于不同人所带来的肤色,唇色不同的影响. 关t词:CIELAB;唇线定位;图像分割;变形模板;直方图 RealTimeLipContourExtractionforSpeakerIdentification ZH0UYeLIUWanchun,ZHUYuwen (ComputerVisionandPatternRecognitionLab,BeijingInstituteofTechnology,Beijing100081) [Abstract]Thispaperpresentsflnewmethodofrealtimelipcontourextractionformultimodalspeakeridentification.Firstly,ittumstheoriginal imageintoCIELABcolorspace,thencomputeshistogramsofLandaseparately.Accordingtothecharacteristicoftheoriginalimageandthe meaningofLandacoordinates,thepapercanworkoutthethresholdforsegmentinginnerlipareaandliparea.Thenlipcontourisextractedusing improveddeformabletemplate.Thismethodissimpleandfast.ItturnsouttoberobusttOilluminationandspeakerindependentasexperiments show. [KeywordslCIELAB;Lipcontourlocation;Imagesegmentation;Deformabletemplate;Histogram 历年来在语音识别和说话者识别技术研究中,人们往往 只利用语言感知的听觉特性,而忽略了视觉特性,使得在噪 声环境或多说话者环境中得不到理想的识别效果.近年来, 在多模态识别思想的指导下,人们开始在单纯对语音信息处 理的基础上融入视觉信息.初步研究结果表明,将唇读与语 音进行融合,能有效改善识别率….也有研究已经证实了利 用盾动视觉特征进行身份识别的可行性J. 人说话的过程中,主要运动局限在嘴部及其以下的脸部 区域,而嘴部的变化包含了最重要的信息,所以如何快速, 精确地提取唇线是后续工作的重要一步.目前已有的唇定位 方法主要有:(1)模板匹配方法,这种传统的方法通过训练 已有图像来得到定位脸部各位置的模板,此方法精度高,但 计算复杂;(2)脸部灰度图像投影法,这种方法只利用了灰 度信息,抗光线变化的能力差.(3)用分类的方法确定每一 个像素是否是唇上点.(4)对彩色图像进行颜色空间变换或 颜色处理的方法,这些方法较为简单和快速. 奉系统实现了一种用于说话人识别的赏时唇线提取方 法.该方法首先将原始图像变换到CIELAB牢问,然后对L 和a分量图像进行直方图统计,根据直方图的分布特征来确 定用于分割唇区域的阈值,然后对二值化后的图像采用改进 后的变形模板法定位出唇线.该方法简单直接,计算速度快, 能够适应光照,唇色等条件的变化. 1基于LAB颜色空间的闽值确定 由于要尽量提取更多的嘴部动态特征,因此本系统中, 将拍摄的图像控制在人脸下半部分.图像规格为320×240像 素.由于只摄取了人脸的下半部分,因此没有相对位置信息 可以利用,只能通过区分人脸的肤色与唇色来定位唇区域. 但图像具有如下特点:半部分人脸主要是皮肤,唇,胡须, 一 202一 牙齿,以及舌,其中皮肤区域最大. 1.1CIELAB颜色空间 CIELAB颜色空间¨J,也称ClE1976La(简写为CIE Lab)颜色空间,它的三基色值是用CIE定义

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档