语音信号处理第3版——第1讲讲述.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课程简介 总学时:48,理论课学时:38,实验课学时:10,学分:3 适用于通信工程、电子信息工程等专业 先修课程:信号与系统、数字信号处理、概率统计 期末考试 (开卷,占80%) 实验考核(实验完成情况、实验报告撰写情况,占10%) 平时考核(课堂表现、自主学习情况,占10%) 课程考核方式 语音信号处理是一门综合性学科,涉及的领域非常广泛:声学、语音学、信号处理、数学、人工智能、模式识别,甚至心理学、生物学等。 教材及主要参考资料 教材:赵力. 语音信号处理(第3版), 北京:机械工业出版社, 2016.5 主要参考资料: 张雪. 数字语音处理及MATLAB仿真, 北京:电子工业出版社, 2010 何强 何英. MATLAB扩展编程, 北京:清华大学出版社, 2002 主要软件及工具箱 MatLab, Cool Editor, Visual Studio 2008/2010 Voice Box, HTK, Speech SDK等工具箱 主要研究机构 国外:卡耐基梅隆大学,剑桥大学,爱丁堡大学,谢菲尔德大学,华盛顿大学,加州大学,哥伦比亚大学,麻省理工学院,帝国理工学院,IBM,微软、Nuance等 国内:科大讯飞,清华大学,中科院声学所和自动化所,哈工大,东南大学,华南理工大学等 本课程的主要内容 绪论 2 语音信号处理基础知识 2 矢量量化技术 2 语音信号分析 4 语音信号特征提取技术 4 语音增强 4 语音识别 4 说话人识别 4 语音编码 4 语音合成与转换 4 语音信息隐藏 4 1.1 概述 1.2 语音识别发展概况 1.3 语音编码发展概况 1.4 语音合成发展概况 1.5 语音处理的其他分支 第1章 绪论 噪声环境下语音处理系统性能急剧下降 说话人发音方式、口音变化等将导致系统性能下降 训练和测试数据差异较大时,系统性能将下降 …… 车载语音:汽车导航、空调、车窗、影音等的语音控制 呼叫中心:交互式语音应答的补充、服务质量评估、增强安全性等 移动终端:语音秘书、语音播报、语音输入法、语音听写系统 教育和娱乐:语音教具、语音(普通话)评测、智能语音家电和玩具 公共安全及服务:语音监听与跟踪、家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等 卡耐基梅隆大学、剑桥大学、爱丁堡大学、华盛顿大学、清华大学、中科大、中科院 等一直从事语音处理研究 2011年苹果公司推出Siri (Iphone4S的语音控制功能) 2010年科大讯飞推出新一代“语音云”平台 2011年腾讯公司推出QQ云语音面板 Nuance, Google, 微软, IBM, 百度, 盛大,华为等也投入巨资 为什么要学习和研究语音信号处理技术? 1.1 概述 语音是最自然、最有效、最方便的人机(人与人)交互手段 国内外各大公司(研究机构)一直从事语音信号处理研究 语音信号处理技术用途非常广泛 语音信号处理技术远未成熟,需进一步改进 语音信号处理技术始终与当时信息科学中最活跃的前沿学科保持密切的联系,并且一起发展 比如:机器学习、小波分析、模式识别、神经网络、人工智能等 人的言语过程 想说 说出 传输 接收 理解 语音合成 语音编码 语音识别 说话人识别 计算机 第1章 绪论 1.1 概述 语音识别和语音合成是实现人机语音通信,建立一个有听和说能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。 第1章 绪论 1.1 概述 语音信号处理的主要分支 语音识别 Speech Recognition 语音合成 Speech Synthesis 语音编码 Speech Coding 对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输。分为波形编码、参量编码(音源编码)和混合编码。 利用计算机和一些专门装置模拟人,制造语音的技术。TTS(文语转换)技术隶属于语音合成。 语音识别原理框图 让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。主要包括特征提取、模式匹配及模型训练技术。 语音信号处理发展概况:起步很早、尚未完全成熟 1791年,Wolfgang von Kempelen构建了语音机器 1835年,Charles Wheatstone改进了语音机器 B.H. Juang# Lawrence R. Rabiner. Automatic Speech Recognition – A

文档评论(0)

骨干 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档