用于说话人识别的实时唇线提取方法.docVIP

下载本文档

3
0
约6.91千字
约 11页
2018-06-02 发布于江西
举报
版权申诉

用于说话人识别的实时唇线提取方法.doc

1、本文档共11页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

用于说话人识别的实时唇线提取方法.doc

用于说话人识别的实时唇线提取方法第32卷 VoL32 第5期 №s 计算机工程 ComputerEngineering 2006年3月 March2O06 ? 人工智能及识别技术?文章鳙号z1000----3428(2006)05--0202--03文献标识码,A中圈分类号ITP391.41 用于说话人识别的实时唇线提取方法周晔.刘万春.朱玉文 (北京理工大学视觉与模式识别实验室,北京100081) 擅要:实现了+种用于说话人识别的实时唇线提取方法.该方法首先将原始图像变换到CIELAB颜色空间,然后对所得阻像的L和a分量分别进行直方图统计.根据图像特性,L和a坐标轴的意义等先验知识,直接快速地计算出用于分割出唇区域和嘴内区域的阈值,达到较准确的唇定位.然后采用新的能量函数指导变形模板法提取出唇线.实验表明,该方法简单快速,能够在一定程度上适应光照变化,以及由于不同人所带来的肤色,唇色不同的影响. 关t词:CIELAB;唇线定位;图像分割;变形模板;直方图 RealTimeLipContourExtractionforSpeakerIdentification ZH0UYeLIUWanchun,ZHUYuwen (ComputerVisionandPatternRecognitionLab,BeijingInstituteofTechnology,Beijing100081) [Abstract]Thispaperpresentsflnewmethodofrealtimelipcontourextractionformultimodalspeakeridentification.Firstly,ittumstheoriginal imageintoCIELABcolorspace,thencomputeshistogramsofLandaseparately.Accordingtothecharacteristicoftheoriginalimageandthe meaningofLandacoordinates,thepapercanworkoutthethresholdforsegmentinginnerlipareaandliparea.Thenlipcontourisextractedusing improveddeformabletemplate.Thismethodissimpleandfast.ItturnsouttoberobusttOilluminationandspeakerindependentasexperiments show. [KeywordslCIELAB;Lipcontourlocation;Imagesegmentation;Deformabletemplate;Histogram 历年来在语音识别和说话者识别技术研究中,人们往往只利用语言感知的听觉特性,而忽略了视觉特性,使得在噪声环境或多说话者环境中得不到理想的识别效果.近年来, 在多模态识别思想的指导下,人们开始在单纯对语音信息处理的基础上融入视觉信息.初步研究结果表明,将唇读与语音进行融合,能有效改善识别率….也有研究已经证实了利用盾动视觉特征进行身份识别的可行性J. 人说话的过程中,主要运动局限在嘴部及其以下的脸部区域,而嘴部的变化包含了最重要的信息,所以如何快速, 精确地提取唇线是后续工作的重要一步.目前已有的唇定位方法主要有:(1)模板匹配方法,这种传统的方法通过训练已有图像来得到定位脸部各位置的模板,此方法精度高,但计算复杂;(2)脸部灰度图像投影法,这种方法只利用了灰度信息,抗光线变化的能力差.(3)用分类的方法确定每一个像素是否是唇上点.(4)对彩色图像进行颜色空间变换或颜色处理的方法,这些方法较为简单和快速. 奉系统实现了一种用于说话人识别的赏时唇线提取方法.该方法首先将原始图像变换到CIELAB牢问,然后对L 和a分量图像进行直方图统计,根据直方图的分布特征来确定用于分割唇区域的阈值,然后对二值化后的图像采用改进后的变形模板法定位出唇线.该方法简单直接,计算速度快, 能够适应光照,唇色等条件的变化. 1基于LAB颜色空间的闽值确定由于要尽量提取更多的嘴部动态特征,因此本系统中, 将拍摄的图像控制在人脸下半部分.图像规格为320×240像素.由于只摄取了人脸的下半部分,因此没有相对位置信息可以利用,只能通过区分人脸的肤色与唇色来定位唇区域. 但图像具有如下特点:半部分人脸主要是皮肤,唇,胡须, 一 202一牙齿,以及舌,其中皮肤区域最大. 1.1CIELAB颜色空间 CIELAB颜色空间¨J,也称ClE1976La(简写为CIE Lab)颜色空间,它的三基色值是用CIE定义