- 1、本文档共2页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
与
科研探索 知识创新
语音识别技术综述
□ 邢铭生 朱 浩 王宏斌
(郑州大学信息工程学院 河南 ·郑州 450001)
摘 要:语音识别是以语音为研究对象,让机器通过识别和理解过程把语音信号转变为相应的文本或命令,使
人机能自然地进行语音交流的技术。语音识别涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多
领域,甚至还涉及到人的体态语言,其最终目标是实现人与机器进行自然语言通信。随着时代的不断进步,语音
识别技术已经发展成一门综合人类智能各项研究的独立学科,现在正逐步成为信息技术中人机接口的关键技术。
关键词:语音识别 应用领域 热点 难点
中图分类号:TN9 12 文献标识码:A 文章编号:1007-3973 (20 10)03-062-02
1 应用领域 HMM 模型建立的语音识别系统性能相当,在很多系统中还被
如今,一些语音识别的应用已经应用到实际生活中,如 结合在一起使用以提高识别率及系统的鲁棒性。小波分析也
IBM 的Viavoice 、Microsoft 的Speech SDK 、Dragon 公司的 开始用于特征提取,但目前性能不理想,其研究还在进一步深
Dragon Dictate 系统等。语音识别的应用领域非常广泛,几乎 入中。
涉及到日常生活的方方面面。如语音拨号系统、、家庭服务、 现在语音识别系统已经开始从实验室走向实用,出现了
订票系统、声控智能玩具、医疗服务、银行服务、听写机、计算 比较成熟的已推向市场的产品。许多发达国家如美国、日本、
机控制、工业控制、语音通信系统等。预计在不远的将来,语 韩国以及IBM 、Apple 、Microsoft 、AT &T 等著名公司都为语
音识别技术将在工业、家电、通信、、医疗、家庭服务等各个领 音识别系统的实用化开发研究投以巨资。
域深刻改变人类现有的日常生活方式。语音识别听写机在一 3 研究的热点与难点
些领域的应用被美国新闻界评为 1997 年计算机发展十件大 目前语音识别领域的研究热点包括:稳健语音识别(识别
事之一。很多专家都认为语音识别技术是2000 年至2010 年 的鲁棒性)、语音输入设备研究、声学HMM 模型的细化、说话
间信息技术领域十大重要的科技发展技术之一。 人自适应技术、大词汇量关键词识别、高效的识别(有哪些信誉好的足球投注网站)算法
2 发展历史 研究、可信度评测算法研究、ANN 的应用、语言模型及深层次
语音识别的研究工作开始于50 年代,Bell 实验室实现了 的自然语言理解。
第一个可识别十个英文数字的语音识别系统—Audry 系统。 目前研究的难点主要表现在:(1)语音识别系统的适应性
但真正取得实质性进展,并将其作为一个重要的课题开展研 差。主要体现在对环境依赖性强。(2)高噪声环境下语音识别
究则是在60 年代末70 年代初。60 年代,提出了动态规划(DP) 进展困难,因为此时人的发音变化很大,像声音变高,语速变
和线性预测分析技术(LP),其中后者较好地解决了语音信号 慢,音调及共振峰变化等等,必须寻找新的信号分析处理方法。
产生模型的问题,极大地促进了语音识别的发展。70 年代,动 (3)如何把语言学、生理学、心理学方面知识量化、建模并有效
态时间归正技术(DTW)解决了语音特征不等长匹配问题,对 用于语音识别,目前也是一个难点。(4 )由于我们对人类的
特定人孤立词语音识别十分有效,在语音识别领域取得了突 听觉理解、知识积累和学习机制以及大脑神经系统的控制机
破。在此期间还提出了矢量量化 (VQ)和隐马尔可夫模型 理等方面的认识还很不清楚,这必将阻碍语音识别的进一步
(HMM)理论。 发展。
80 年代语音识别研究进一步深入,HMM 模型和人工神 4 语音识别系统
( )
经网络 ANN 在语音识别中成功应用。1988 年,FULEE Kai 一个典型的语音识别系统如图所示:
等用
文档评论(0)