- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用于说话人识别的实时唇线提取方法.doc
用于说话人识别的实时唇线提取方法
第32卷
VoL32
第5期
№s
计算机工程
ComputerEngineering
2006年3月
March2O06
?
人工智能及识别技术?文章鳙号z1000----3428(2006)05--0202--03文献标识码,A中圈分类号ITP391.41
用于说话人识别的实时唇线提取方法
周晔.刘万春.朱玉文
(北京理工大学视觉与模式识别实验室,北京100081)
擅要:实现了+种用于说话人识别的实时唇线提取方法.该方法首先将原始图像变换到CIELAB颜色空间,然后对所得阻像的L和a分
量分别进行直方图统计.根据图像特性,L和a坐标轴的意义等先验知识,直接快速地计算出用于分割出唇区域和嘴内区域的阈值,达到
较准确的唇定位.然后采用新的能量函数指导变形模板法提取出唇线.实验表明,该方法简单快速,能够在一定程度上适应光照变化,以
及由于不同人所带来的肤色,唇色不同的影响.
关t词:CIELAB;唇线定位;图像分割;变形模板;直方图
RealTimeLipContourExtractionforSpeakerIdentification
ZH0UYeLIUWanchun,ZHUYuwen
(ComputerVisionandPatternRecognitionLab,BeijingInstituteofTechnology,Beijing100081)
[Abstract]Thispaperpresentsflnewmethodofrealtimelipcontourextractionformultimodalspeakeridentification.Firstly,ittumstheoriginal
imageintoCIELABcolorspace,thencomputeshistogramsofLandaseparately.Accordingtothecharacteristicoftheoriginalimageandthe
meaningofLandacoordinates,thepapercanworkoutthethresholdforsegmentinginnerlipareaandliparea.Thenlipcontourisextractedusing
improveddeformabletemplate.Thismethodissimpleandfast.ItturnsouttoberobusttOilluminationandspeakerindependentasexperiments
show.
[KeywordslCIELAB;Lipcontourlocation;Imagesegmentation;Deformabletemplate;Histogram
历年来在语音识别和说话者识别技术研究中,人们往往
只利用语言感知的听觉特性,而忽略了视觉特性,使得在噪
声环境或多说话者环境中得不到理想的识别效果.近年来,
在多模态识别思想的指导下,人们开始在单纯对语音信息处
理的基础上融入视觉信息.初步研究结果表明,将唇读与语
音进行融合,能有效改善识别率….也有研究已经证实了利
用盾动视觉特征进行身份识别的可行性J.
人说话的过程中,主要运动局限在嘴部及其以下的脸部
区域,而嘴部的变化包含了最重要的信息,所以如何快速,
精确地提取唇线是后续工作的重要一步.目前已有的唇定位
方法主要有:(1)模板匹配方法,这种传统的方法通过训练
已有图像来得到定位脸部各位置的模板,此方法精度高,但
计算复杂;(2)脸部灰度图像投影法,这种方法只利用了灰
度信息,抗光线变化的能力差.(3)用分类的方法确定每一
个像素是否是唇上点.(4)对彩色图像进行颜色空间变换或
颜色处理的方法,这些方法较为简单和快速.
奉系统实现了一种用于说话人识别的赏时唇线提取方
法.该方法首先将原始图像变换到CIELAB牢问,然后对L
和a分量图像进行直方图统计,根据直方图的分布特征来确
定用于分割唇区域的阈值,然后对二值化后的图像采用改进
后的变形模板法定位出唇线.该方法简单直接,计算速度快,
能够适应光照,唇色等条件的变化.
1基于LAB颜色空间的闽值确定
由于要尽量提取更多的嘴部动态特征,因此本系统中,
将拍摄的图像控制在人脸下半部分.图像规格为320×240像
素.由于只摄取了人脸的下半部分,因此没有相对位置信息
可以利用,只能通过区分人脸的肤色与唇色来定位唇区域.
但图像具有如下特点:半部分人脸主要是皮肤,唇,胡须,
一
202一
牙齿,以及舌,其中皮肤区域最大.
1.1CIELAB颜色空间
CIELAB颜色空间¨J,也称ClE1976La(简写为CIE
Lab)颜色空间,它的三基色值是用CIE定义
您可能关注的文档
最近下载
- 第三单元(整体教学设计)-2024-2025学年七年级语文上册大单元教学名师备课系列(统编版2024).docx
- 2017高考物理动量守恒定律10个模型必威体育精装版模拟题精选训练.doc
- IATF16949标准培训教材课件.pptx VIP
- 13、人生价值观完整版.ppt
- 南京市建设工程消防设计审查、验收、备案常见申报问题解答V2.0(2023).pdf
- 日立LF货梯电梯故障代码表.pdf
- 作物雄性不育系的鉴定.DOC
- 中国民用机场协会团体标准工作发展规划(2020-2024).pdf
- 控制阀企业防造假专项方案技术标准范例.docx VIP
- 新教材苏教版四年级数学上册教案表格式全册集体备课.doc
文档评论(0)