浅谈语音识别技术的应用和发展.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

龙源期刊网

浅谈语音识别技术的应用和发展

作者:于大海孙建民

来源:《科技传播》2009年第22期

摘要语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令

的技术,其最终目标是实现人与机器进行自然语言通信。语音作为一个交叉学科,具有深远的研

究价值,近50年的研究发展,语音识别技术已经有了极大的发展。本文介绍了语音识别技术的基

本原理和应用,并且对语音识别技术的发展趋势进行了展望。

关键词语音识别;应用;发展

中图分类号TN912.34文献标识码A文章编号1674-6708(2009)08-0022-02

引言0

语音是人类互相之间进行交流时使用最多、最自然、最基本、最重要的信息载体。在高度

信息化的今天,语音处理的一系列技术及其应用已经成为信息社会不可缺少的组成部分。语音

的产生是一个复杂的过程,包括心理和生理等方面的一系列因素。当人们需要通过语音表达某

种信息时,首先是这种信息以某种抽象的形式表现在说话人的大脑里,然后转换为一组神经信号,

这些神经信号作用于发声器官,从而产生携带信息的语音信号。

语音识别的研究1历史及现状

在国外语音识别的研究工作可以追溯到上世纪50年代。1952年ATT贝尔实验室的

Audry系统是第一个可以识别十个英文数字的语音识别系统。

上世纪60年代末70年代初出现了语音识别方面几种基本思想,其中重要成果是提出了信

号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效的解决了语音信号特征提取和不等

长语音匹配问题,同时,还提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。

龙源期刊网

上世纪80年代语音识别研究进一步走向深入,其显著特征是隐马尔可夫模型(HMM)和人工

神经网络(ANN)在语音识别中的成功应用。上世纪90年代,在计算机技术、电信应用等领域飞

速发展的带动下,迫切的要求语音识别系统从实验室走向实际应用。具代表性的是IBM的Via

Voice和Dragon公司的DragonDictate系统,这些语音识别系统具有说话人自适应能力,新用户不

需要对全部词汇进行训练便可在使用中不断提高识别率[1]。

国内在语音识别研究上也投入了很大的精力,中科院的自动化所、声学所以及清华大学等

科研机构和高校都在从事语音识别领域的研究和开发。国家863智能计算机专家组为语音识别

技术研究专门立项,我国语音识别技术的研究水平已经基本上与国外同步。

语音识别系统的2分类

目前,语音识别的系统分类有孤立语音和连续语音识别系统,特定人和非特定人语音识别系

统,大词汇量和小词汇量语音识别系统,嵌入式/服务器模式等。

孤立2.1语音和连续语音识别系统

自然的语音,只在句尾或是文字需要加标点的地方必须间断,其它的部分可以连续不断地发

音。以前的语音识别系统,几乎都是以单字或单词为单位的孤立语音识别系统,但随着近年来的

研究和发展,连续语音识别技术渐趋成熟,这个最自然的说话方式,将成为语音识别系统的主流。

特2.2定人和非特定人语音识别系统

特定人和非特定人语音识别系统是按照声学模型建立的方式来划分。特定人系统是指系统

在使用前必须由用户输入大量的发音数据,并对其进行训练。非特定人系统则试图达到在系统

构建成功之后,用户不需要事先输入大量的训练数据,即可使用的目的。

大词汇2.3量和小词汇量语音识别系统

在语音识别技术的发展过程中,词汇量也正是从少到多不断积累的,随着词汇量的增大,对系

统各方面的要求也越来越高,该系统的成本也越来越高了。语音识别系统只是要为你在开车的

时候利用语音进行电话拨号,那它只要能听懂十个数字就可以了,属于小词汇量语音识别系统。

如果它是为你自动订飞机票,那么它就应该还会认识地名、时间等字和词,这属于中等词汇量语

音识别系统。如果它是为一个记者把口述的一篇报告转换成为文字,那它的词汇量就必须很大

才能胜任这样的工作,这属于大词汇量语音识别系统[2]。

龙源期刊网

嵌入式2

您可能关注的文档

文档评论(0)

tata1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档