语音识别技术的应用及发展.pdfVIP

下载本文档

0
0
约4.26千字
约 9页
2024-09-18 发布于河南
举报
版权申诉

语音识别技术的应用及发展.pdf

1、本文档共9页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音识别技术的应用及发展

语音识别是以语音为研究对象，通过语音信号处理和模式识

别让机器自动识别和理解人类口述的语言。语音识别技术就是让

机器通过识别和理解过程把语音信号转变为相应的文本或命令

的高技术。语音识别是一门涉及面很广的交叉学科，它与声学、

语音学、语言学、信息理论、模式识别理论以及神经生物学等学

科都有非常密切的关系。语音识别技术正逐步成为计算机信息处

理技术中的关键技术，语音技术的应用已经成为一个具有竞争性

的新兴高技术产业。

1、语音识别的基本原理

语音识别系统本质上是一种模式识别系统，包括特征提取、

模式匹配、参考模式库等三个基本单元，它的基本结构如下图所

示：

未知语音经过话筒变换成电信号后加在识别系统的输入端，

首先经过预处理，再根据人的语音特点建立语音模型，对输入的

语音信号进行分析，并抽取所需的特征，在此基础上建立语音识

别所需的模板。而计算机在识别过程中要根据语音识别的模型，

将计算机中存放的语音模板与输入的语音信号的特征进行比较，

根据一定的有哪些信誉好的足球投注网站和匹配策略，找出一系列最优的与输入语音匹配

的模板。然后根据此模板的定义，通过查表就可以给出计算机的

识别结果。显然，这种最优的结果与特征的选择、语音模型的好

坏、模板是否准确都有直接的关系。

2、语音识别技术的发展历史及现状

1952年，ATTBell实验室的Davis等人研制了第一个可

十个英文数字的特定人语音增强系统一Audry系统1956年，

美国普林斯顿大学RCA实验室的Olson和Belar等人研制出能

10个单音节词的系统，该系统采用带通滤波器组获得的频谱参

数作为语音增强特征。1959年，Fry和Denes等人尝试构建

音素器来4个元音和9个辅音，并采用频谱分析和模式匹配进

行决策。这就大大提高了语音识别的效率和准确度。从此计算机

语音识别的受到了各国科研人员的重视并开始进入语音识别的

研究。60年代，苏联的Matin等提出了语音结束点的端点检测，

使语音识别水平明显上升；Vintsyuk提出了动态编程，这一提

法在以后的识别中不可或缺。60年代末、70年代初的重要成果

是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)

技术，有效地解决了语音信号的特征提取和不等长语音匹配问

题；同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。

语音识别技术与语音合成技术结合使人们能够摆脱键盘的束缚，

取而代之的是以语音输入这样便于使用的、自然的、人性化的输

入方式，它正逐步成为信息技术中人机接口的关键技术。

、语音识别的方法3

目前具有代表性的语音识别方法主要有动态时间规整技术

（DTW）、隐马尔可夫模型（HMM）、矢量量化（VQ）、人

工神经网络（ANN）、支持向量机(SVM)等方法。

动态时间规整算法（DynamicTimeWarping，DTW）是

在非特定人语音识别中一种简单有效的方法，该算法基于动态规

划的思想，解决了发音长短不一的模板匹配问题，是语音识别技

术中出现较早、较常用的一种算法。在应用DTW算法进行语音

识别时，就是将已经预处理和分帧过的语音测试信号和参考语音

模板进行比较以获取他们之间的相似度，按照某种距离测度得出

两模板间的相似程度并选择最佳路径。

隐马尔可夫模型（HMM）是语音信号处理中的一种统计模

型，是由Markov链演变来的，所以它是基于参数模型的统计

识别方法。由于其模式库是通过反复训练形成的与训练输出信号

吻合概率最大的最佳模型参数而不是预先储存好的模式样本，且

其识别过程中运用待识别语音序列与HMM参数之间的似然概

率达到最大值所对应的最佳状态序列作为识别输出，因此是较理

想的语音识别模型。

仍不足以刻画诸如语音信号这种时间序列的动态特性。由于

ANN不能很好地描述语音信号的时间动态特性，所以常把ANN

与传统识别方法

您可能关注的文档

文档评论（0）

177****5884 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

语音识别技术的应用及发展.pdfVIP