- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第1章绪论1.1概述11.2语音信号处理的发展1.3语音信号处理的应用及新方向31.4语音信号处理过程的总体结构41.5MALTAB在数字语音信号处理中的应用52*ppt课件1实质:利用数字信号处理技术对语音信号进行处理。2目的:①通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。②通过对语音信号进行某种运算以达到某种要求。3学科基础:以语音语言学和数字信号处理为基础,与心理学、生理学、计算机科学、通信与信息科学、模式识别和人工智能等学科均有密切的关系。1.1概述*ppt课件语音信息的交换大致上可以分为三大类:(1)人与人之间的语言通信:包括语音压缩与编码、语音增强等。(2)第一类人机语言通信问题:语音合成,机器讲话、人听话的研究。(3)第二类人机语言通信问题:语音识别和理解:人讲话、机器听话的情况。*ppt课件突破进展系统论述语言产生的声学理论语谱图仪问世语谱图语音,语音合成1.2语音信号处理的发展计算机1贝尔电话的发明3用声学方法对元音和歌唱进行了研究2第一个声码器1876年1939年19世纪60年代420世纪40年代1948年67基础研究方面技术应用领域5*ppt课件1.2语音信号处理的发展1语音合成3语音编码2语音识别语音编码*ppt课件1.2.1语音合成用专用的硬件设备或是计算机再现人能够听懂的语音信号,即根据输入的语音符号产生出具有一定音质和可懂度的语音来。*ppt课件1.2.1语音合成以语言信息压缩、存储为主要目的对语音信号数字模型进行研究,同时研究音素、音节、词组与句子的发音规则。最终恢复出自然流畅的语音来。例如文语转换系统(Text-to-speech)。语音分析与合成将赋予计算机说话的功能,也是进行话音编码、语音识别研究的基础。*ppt课件1.2.2语音编码编码:用预先规定的方法将文字、数字或其他对象编成数码,或将信息、数据转换成规定的电脉冲信号。语音编码的目的:在保证一定语音质量的前提下,尽可能降低编码比特率,以节省频率资源。*ppt课件1.2.2语音编码语音编码与文本到语音转换两个主要区别一、前者是人与人之间的话音交流,要保留说话人的声音特征。后者是文本到声音的转换即计算机发声。它可以是标准播音员或其它声音。二、前者不仅对压缩率和音质有要求,而且要求较低的编、解码延迟。而后者对处理帧长没有什么太严格的限制。*ppt课件1.2.3语音识别研究如何使计算机能够听懂人类的语言。以汉语语音为例:汉语约有400个音节,加上声调约1200个音调节,把这些语音信号的特征存储到计算机内,并与计算机接收到的汉语发音进行比较,找到特征相同的音节或音调节,这个过程就是语音识别。将识别出的音节序列转换成文字,就是语言理解。许多算法将理解过程溶入到识别中来提高识别的准确性。因此可以将语音识别与理解归入同一类应用。*ppt课件语音识别研究领域包括:(1)根据对说话人说话方式的要求,可以分为孤立字语音识别系统,连接字语音识别系统以及连续语音识别系统。(2)根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。(3)根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。*ppt课件1.3语音信号处理的应用及新方向主要指语音技术的应用。语音技术包括语音识别、说话人的鉴别和确认、语种的鉴别和确认、关键词检测和确认、语音合成、语音编码等。1、语音信号处理的应用*ppt课件1)说话人识别技术的应用——安全加密、银行信息电话查询服务;——公安机关破案和法庭取证方面。在声控应用中,识别输入的语音内容,并根据内容来执行相应的动作,这包括了声控电话转换、声控语音拨号系统、声控智能玩具、信息网络查询、家庭服务、宾馆服务、旅行社服务系统、医疗服务、股票查询服务和工业控制等。*ppt课件2)语音合成的应用公交汽车上的自动报站、各种场合的自动报时、自动报警、手机查询服务和各种文本校对中的语音提示、在电信声讯服务:如股票、售后服务、车站查询等信
文档评论(0)