- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
龙源期刊网
浅谈语音识别技术的应用和发展
作者:于大海孙建民
来源:《科技传播》2009年第22期
摘要语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令
的技术,其最终目标是实现人与机器进行自然语言通信。语音作为一个交叉学科,具有深远的研
究价值,近50年的研究发展,语音识别技术已经有了极大的发展。本文介绍了语音识别技术的基
本原理和应用,并且对语音识别技术的发展趋势进行了展望。
关键词语音识别;应用;发展
中图分类号TN912.34文献标识码A文章编号1674-6708(2009)08-0022-02
引言0
语音是人类互相之间进行交流时使用最多、最自然、最基本、最重要的信息载体。在高度
信息化的今天,语音处理的一系列技术及其应用已经成为信息社会不可缺少的组成部分。语音
的产生是一个复杂的过程,包括心理和生理等方面的一系列因素。当人们需要通过语音表达某
种信息时,首先是这种信息以某种抽象的形式表现在说话人的大脑里,然后转换为一组神经信号,
这些神经信号作用于发声器官,从而产生携带信息的语音信号。
语音识别的研究1历史及现状
在国外语音识别的研究工作可以追溯到上世纪50年代。1952年ATT贝尔实验室的
Audry系统是第一个可以识别十个英文数字的语音识别系统。
上世纪60年代末70年代初出现了语音识别方面几种基本思想,其中重要成果是提出了信
号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效的解决了语音信号特征提取和不等
长语音匹配问题,同时,还提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。
龙源期刊网
上世纪80年代语音识别研究进一步走向深入,其显著特征是隐马尔可夫模型(HMM)和人工
神经网络(ANN)在语音识别中的成功应用。上世纪90年代,在计算机技术、电信应用等领域飞
速发展的带动下,迫切的要求语音识别系统从实验室走向实际应用。具代表性的是IBM的Via
Voice和Dragon公司的DragonDictate系统,这些语音识别系统具有说话人自适应能力,新用户不
需要对全部词汇进行训练便可在使用中不断提高识别率[1]。
国内在语音识别研究上也投入了很大的精力,中科院的自动化所、声学所以及清华大学等
科研机构和高校都在从事语音识别领域的研究和开发。国家863智能计算机专家组为语音识别
技术研究专门立项,我国语音识别技术的研究水平已经基本上与国外同步。
语音识别系统的2分类
目前,语音识别的系统分类有孤立语音和连续语音识别系统,特定人和非特定人语音识别系
统,大词汇量和小词汇量语音识别系统,嵌入式/服务器模式等。
孤立2.1语音和连续语音识别系统
自然的语音,只在句尾或是文字需要加标点的地方必须间断,其它的部分可以连续不断地发
音。以前的语音识别系统,几乎都是以单字或单词为单位的孤立语音识别系统,但随着近年来的
研究和发展,连续语音识别技术渐趋成熟,这个最自然的说话方式,将成为语音识别系统的主流。
特2.2定人和非特定人语音识别系统
特定人和非特定人语音识别系统是按照声学模型建立的方式来划分。特定人系统是指系统
在使用前必须由用户输入大量的发音数据,并对其进行训练。非特定人系统则试图达到在系统
构建成功之后,用户不需要事先输入大量的训练数据,即可使用的目的。
大词汇2.3量和小词汇量语音识别系统
在语音识别技术的发展过程中,词汇量也正是从少到多不断积累的,随着词汇量的增大,对系
统各方面的要求也越来越高,该系统的成本也越来越高了。语音识别系统只是要为你在开车的
时候利用语音进行电话拨号,那它只要能听懂十个数字就可以了,属于小词汇量语音识别系统。
如果它是为你自动订飞机票,那么它就应该还会认识地名、时间等字和词,这属于中等词汇量语
音识别系统。如果它是为一个记者把口述的一篇报告转换成为文字,那它的词汇量就必须很大
才能胜任这样的工作,这属于大词汇量语音识别系统[2]。
龙源期刊网
嵌入式2
您可能关注的文档
- 高考语文总复习(知识框架+走进名人+演练提升)专题二十一(四)科普文章阅读(含解析).pdf
- 区域经济协调发展评价指标体系及评价模型构建.pdf
- 国际大豆市场背景下我国大豆贸易格局分析.pdf
- 浅谈学校后勤管理改革.pdf
- 债券估值系列.pdf
- 第五章-薪酬福利管理.pdf
- 新课改下高中地理学习方法.pdf
- 大众文化视域下舞蹈艺术的再思考.pdf
- 物流运输配送外包服务方案.pdf
- “互联网+健康医疗”:催化民生福祉进步.pdf
- 5.3.1函数的单调性(教学课件)--高中数学人教A版(2019)选择性必修第二册.pptx
- 部编版道德与法治2024三年级上册 《科技提升国力》PPT课件.pptx
- 2.7.2 抛物线的几何性质(教学课件)-高中数学人教B版(2019)选择性必修第一册.pptx
- 人教部编统编版小学六年级上册道德与法治9 知法守法 依法维权(第一课时)课件.pptx
- 三年级上册品德道德与法治《学习伴我成长》.pptx
- 部编版小学道德与法治六年级上册6 人大代表为人民 课件.pptx
- 部编版小学道德与法治六年级上册1感受生活中的法律第一课时课件.pptx
- 2.5.2圆与圆的位置关系(教学课件)-高中数学人教A版(2019)选择性必修第一册.pptx
- 2.5.1直线与圆的位置关系-(教学课件)--高中数学人教A版(2019)选择性必修第一册.pptx
- 14.1.1 同底数幂的乘法(教学课件)-初中数学人教版八年级上册.pptx
文档评论(0)