- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
南京邮电大学通信与信息工程学院第1章语音信号处理绪论
为什么要学习这门课程语音信号处理发展概况本课程知识体系架构
1.1为什么要学习这门课程语音信号处理的定义:语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科语音信号处理需要数字信号处理和语音学两方面的知识作为基础。语音学是研究言语过程的一门科学,它包括:发音语音学、声学语音学和听觉语音学三大分支。
1.1为什么要学习这门课程言语过程的五个阶段:想说、说出、传输、接受、理解。
1.1为什么要学习这门课程语音处理技术的应用极其广泛,包括:工业、军事、交通、医学、民用等各个领域。语音识别具有十分广泛的应用:①可以进行声控应用;②VoiceActivatedDialing(VAD)语音拨号;③可以用于自动口语翻译(实现不同语言之间的直接通信);④可以将语音识别与语音合成技术相结合,构成一种超低比特率的语音通信系统。
1.1为什么要学习这门课程说话人识别已在安全加密、银行信息电话查询服务等方面得到了应用,此外在公安机关破案和法庭取证方面可以应用。语种辨识在军事情报工作、国家安全事务中有重要应用。语音合成技术的一个应用实例,是计算机语声应答系统。语音编码技术的根本作用是使语音通信数字化。语音增强系统的基本应用是去混响,或去回声,消除噪声,或从潜水员使用的氦氧混合气体下的发音中恢复出可懂的语音等。
1.1为什么要学习这门课程1.语音是人类最重要、最有效、最常用和最方便的交换信息的方式;2.语音信号处理技术已在办公、交通、金融、公安、商业、旅游等行业得到了广泛应用,并已成为当前主流操作系统和应用程序中人机交互的重要手段。3.语音信号技术始终与当时信息科学中最活跃的前沿学科保持密切的联系,并且一起发展。
1.1为什么要学习这门课程1.语音是人类最重要、最有效、最常用和最方便的交换信息的方式;2.语音信号处理技术已在办公、交通、金融、公安、商业、旅游等行业得到了广泛应用,并已成为当前主流操作系统和应用程序中人机交互的重要手段。3.语音信号技术始终与当时信息科学中最活跃的前沿学科保持密切的联系,并且一起发展。
为什么要学习这门课程语音信号处理发展概况本课程知识体系架构
1.2语音信号处理技术发展概况20世纪40年代~60年代(萌芽阶段)(1)可追溯到1940年前后Dudley的声码器,其从语音中提取参数加以传输,在收端重新合成语音。即,产生“语音参数模型”了思想;(2)1952年贝尔实验室研制成功能识别10个英文数字的实验装置;(3)1956年Olsen等人采用8个带通滤波器组提取频谱参数,研制成功最早的语音打字机;(4)数字信号处理技术(数字滤波器,FFT等)快速发展,成为语音信号处理理论和技术的基础。
1.2语音信号处理技术发展概况20世纪70年代~80年代(信号分析与处理阶段)(1)1971年,美国ARPA主导的“语音理解系统”研究计划开始启动,促进了语音识别研究的兴起;(2)70年代初,动态时间规整技术(DTW)用于语音识别;(3)70年代中期,线性预测技术(LPC)技术用于语音信号分析;(4)70年代末,矢量量化技术(VQ)用于语音编码。(5)80年代,Baum等提出隐马尔可夫模型(HMM),后被Baker等用于语音识别中,取得巨大成功。
1.2语音信号处理技术发展概况20世纪90年代(向传统人工智能过渡阶段)(1)语音识别逐渐由实验室走向实用化:对声学语音学统计模型研究逐渐深入,讲者自适应/听觉模型/语言模型也备受关注;(2)以PSOLA为代表的波形拼接语音合成方法得到广泛应用;(3)出现了4~8kbit/s的波形与参数混合语音编码器;(4)以找出包含在语音信号中的说话人个性因素以及情感因素的说话人识别方法,语音信号的情感信息处理等方向开始兴起。(5)语音增强与去噪技术,盲分离技术受到关注。
1.2语音信号处理技术发展概况2000年~2020年(以深度学习为代表的人工智能主导阶段)(1)2006年,Hinton等人提出了深度学习技术;(2)2010年,深度学习技术首先被应用于语音识别系统,在各项任务上大幅提升了识别准确率;(3)2010年后,卷积神经网络、循环神经网络、注意力机制、生成对抗网络、Transformer等深度学习技术进一步发展;(4)深度学习技术已应用于语音识别、语音合成、语音编码、语音情感信息处理等各个方向上,均取得了很好的效果。
1.2语音信号处理技术发展概况2020年后(多模态语音信号处理阶段)(1)文本、图像、视频、触觉、运动、生理等数据采集手段丰富,上述模态信息与语音信号深度融合;(2)将其他模态信息引入语音信号处理各方向、各任务中
您可能关注的文档
- 电工电子技术 1模块一 直流电路 习题答案.docx
- 电工电子技术 2模块二 单相正弦交流电 习题答案.docx
- 电工电子技术 3模块三 三相正弦交流电 习题答案.docx
- 电工电子技术 4模块四 磁路、变压器及异步电动机习题答案.docx
- 电工电子技术 5模块五 半导体器件及应用 习题答案.docx
- 电工电子技术 6模块六 负反馈与集成运放习题答案.docx
- 电工电子技术 7模块七 逻辑门电路及其应用 习题答案.docx
- 电工电子技术 8模块八 组合逻辑电路习题答案.docx
- 电工电子技术 9模块九 时序逻辑电路习题答案.docx
- 语音信号处理 第4版 课件 第3章:语音信号处理的常用算法.pptx
文档评论(0)