语音信号处理综述1.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理综述1

课 程 综 述 课程名称 语音信号处理 任课教师 周泽华 班级 08电子(1班) 姓名 靳国 学号 0805070064 日期 2011年10月16日 目录 1.前言 2 2. 语音信号处理的概念 3 3. 语音信号处理的发展历史 3 4. 语音信号处理的应用 4 4.1 语音编码技术 4 4.2 语音合成技术 4 4.3语音识别技术 5 4.4语音理解技术 5 5. 语音信号处理的发展趋势 6 6.总结: 7 7.参考文献: 7       综述语音信号处理 1.前言 语音信号数字处理技术在国民经济、日常生活和军事领域有着极为重要的应用价值和极其广阔的应用空间。本文介绍在信息科学中的作用以及应用于科学领域的技术。众所周知,语音在人类社会中起了非常重要的作用。在现代信息社会中,小至人们的日常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年来,普通电话、移动电话和互联网已经普及到家庭。在这些先进的工具中中的语音编码和语音合成就有很大贡献。再进一步,可以预料到的口呼打字机(又称听写机,它能把语音转换为文字)、语音翻译机(例如输入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程上的研究工作了。 应用 .1 语音编码技术在语音信号数字处理过程中,语音编码技术是至关重要的,直接影响到话音存储、语音合成、语音识别与理解。语音编码是模拟语音信号实现数字化的基本手段。语音信号是一种时变的准周期信号,而经过编码描述以后,语音信号可以作为数字数据来传输、存储或处理,因而具有一般数字信号的优点。语音编码主要有三种方式:波形编码、信源编码(又称声码器) 和混合编码,这三种方式都涉及到语音的压缩编码技术。通常把编码速率低于64 kbps的语音编码方式称为语音压缩编码技术。如何在尽量减少失真的情况下,降低语音编码的比特数已成为语音压缩编码技术的主要内容。换言之,在相同编码比特率下,如何取得更高质量的恢复语音是较高质量语音编码系统的要求。 .2 语音合成技术语音合成技术就是所谓“会说话的机器”。它可分为三类:波形编码合成、参数式合成和规则合成。波形编码合成以语句、短语、词或音节为合成单元。合成单元的语音信号被录取后直接进行数字编码,经数据压缩组成一个合成语音库。重放时根据待输出的信息,在语音库中取出相应的合成单元的波形数据,将它们连接在一起,经解码还原成语音。参数式合成以音节或音素为合成单元。 .3语音识别技术语音识别又称语音自动识别(Automated Speech Recognition,ASR),语音识别基于模式匹配的思想,从语音流中抽取声学特征,然后在特征空间完成模式的比较匹配,寻找最接近的词(字)作为识别结果。 几十年来,语音识别技术经历了从特定人(Speaker Dependent,SD)中小词汇量的孤立词语和连接词语的语音识别到非特定人(Speaker Independent,SI) 大词汇量的自然口语识别的发展历程。尽管如此,语音识别技术要走出实验室、全面融入人们的日常生活还需假以时日。当使用环境与训练环境有差异时,如在存在背景噪声、信道传输噪声、说话人语速和发音不标准等情况下,识别系统的性能往往会显著下降,无法满足实用的要求。环境噪声、方言和口音、口语识别已经成为目前语音识别中三个主要的新难题。 .4语音理解技术语音理解又称自然语音理解(Natural Language Understanding,NLU),其目的是实现人机智能化信息交换,构成通畅的人机语音通信。 目前,语音理解技术开始使计算机丢掉了键盘和鼠标,人们对语音理解的研究重点正拓展到特定应用领域的自然语音理解上。一些基于口语识别、语音合成和机器翻译的专用性系统开始出现,如信息发布系统、语音应答系统、会议同声翻译系统、多语种口语互译系统等等,正受到各方面越来越多的关注。这些系统可以按照人类的自然语音指令完成有关的任务,提供必要的信息服务,实现交互式语音反馈。 语音是语言的声学表现形式,是最符合人类自然习惯的一种人际信息传播方式,具有便捷性、高效性、随机性、交互性等显著特点,是实现人机交互的一种重要通信方式。可以预见,随着计算机技术、数字信号处理技术和大规模集成电路的迅速发展,语音信号数字处理技术将成为信息化战争不可或缺的重要组成部分,并直接进入到信息化战争的前沿。 1

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档