- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第1章 语音信号处理绪论
4.4 说话人识别技术(Speaker Recognition) 定义:说话人识别技术是以话音对说话人进行区分,从而进行身份鉴别与认证的技术,通过说话人识别可以利用人本身的生物特征进行身份鉴别。 通过分析人的发声和听觉,为每个人建立一个数学模型,然后由计算机对模型和实际输入的语音进行精确的匹配,根据匹配的结果便人说话人是谁。 应用:公安部门进行语音验证,为一般的用户提供防盗门开启功能,语音拨号,电话银行,电话购物,语音E-mail,信息服务等. 语音分析工具: MATLAB, PRAAT, SFS SFS:Speech Filing System 5.语音信号处理技术的发展(一) 语音信号处理是许多信息领域应用的核心技术之一,是目前发展最为迅速的信息科学研究领域中的一个。语音信号处理是目前极为活跃和热门的研究领域,其研究涉及一系列前沿科研课题,且处于迅速发展之中;其研究成果具有重要的学术及应用价值。 5.语音信号处理技术的发展(二) 1940年前后Duley的声码器和Potter等人的可见语音开始; 1952贝尔实验室首次研制成功能识别是个英语数字的实验装置; 1956年Olson等采用8个带通滤波器组提取频谱参数作为语音的特征,研制成一台简单的语音打字机; 20世纪60年代,Faut等奠定了语音生成的理论基础,在此基础上语音合成的研究得到了扎实的进展; 20世纪60年代数字信号处理技术的发展成为语音信号处理理论和技术基础; 语音信号处理技术的发展(二) 1970年单词识别机装置开始实用化;声纹识别及说话人识别的研究开展起来; 1971年美国ARPR主导的“语音理解系统”的研究计划开始起步; 20世纪70年代中期LPC(线性预测技术)和HMM(隐马尔可夫法)应用于语音信号处理; 20世纪70年代末矢量量化技术用于语音编码获得了成功; 语音信号处理技术的发展(三) 20世纪80年代,矢量量化、隐马尔可夫模型、人工神经网络等相继被用于语音信号处理,使得语音信号处理技术产生了突破性的进展; 20世纪90年代,语音识别逐渐由实验室走向实用化;语音合成已在自动报时、报警、报站、电话查询服务等方面得到了广泛应用;语音编码取得了迅速发展;说话人识别和语种辨识研究的重点装箱参数处理和新的模式匹配方法上;语音信号的情感信息的计算机处理,是90年代兴起的一个新的语音信号处理研究领域;抗噪声技术取得了新的进展; 6. 语音信号处理的应用及新方向 1)语音识别(传统方向) 基本任务:语音→文本或命令 应用前景: A、声控应用,计算机识别语音内容,并实施相应的动作。典型系统:声控电话转换、声控语音拨号、声控智能玩具、信息网络查询、银行、家庭服务等; B、听写系统,以口授方式将文字输入计算机; C、自动口语翻译,将一种语言翻译成另一种语言,如中科院开展的CSTAR计划; D、人机交互; E、移动计算设备语音输入; F、说话人识别,安全加密、法庭取证、银行信息电话查询、公安机关破案等。 语音信号处理的应用及新方向(续) 2)语音合成(传统方向) 应用:公共交通自动报站,各种场合的自动报时、自动告警等,文本校对中的语音提示,电话查询服务; 应用新领域:与Internet结合,有声EMAIL,网上信息的有声获取、语音聊天等;与机器翻译技术结合的语音翻译;与图象、视频技术结合的视觉(visual speech) 语音。 研究方向:高质量、高清晰度自然语音合成,以及表达人类的情感语音。 语音信号处理的应用及新方向(续) 3)语音编码(传统方向) 应用:数字通信、移动通信、必威体育官网网址语音通信; 呼叫服务(数字录音电话、语音信箱等); 方向:低码率高质量的音频编码方案。 4)基于语音的信息检索(新发展方向) 动机:网络技术和数字图书馆技术; 方向:基于语音内容的信息检索 语音信号处理的应用及新方向(续) 5)基于语音识别的广播新闻的 自动文摘技术、自动誊写技术(新发展方向) 6)IP电话技术(新发展方向) 研究领域:研究网络环境下的语音识别,即对网络上以数据包形式传输的语音进行识别。 应用领域:电子商务、国防,移动计算 7)语音训练与校正技术(新发展方向) CALL系统:Computer-Aided Language Learning 应用:辅助教学、发音校正。 语音信号处理的应用及新方向(续) 8)语种识别(新发展方向) 通过分析一个语音片段来判别其所属语言的种类,属语音识别范畴。 9)基于语音的情感处理研究(新发展方向) 人机非言语交流方式的研究,包括感情、情绪和态度等已有的非言语研究(基于视觉):面部表情,手势识别 10)数字语音安全性、完整性研究(新发展方向) 11)音频作品安全性、完整性研究(新发展方向) *
文档评论(0)