关于LVCSR的关键词检测技术的研究.pdf

下载文档

3
0
约1.39万字
约 5页
2017-07-18 发布于湖北
举报
版权申诉
保障服务

关于LVCSR的关键词检测技术的研究.pdf

1、本文档共5页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于LVCSR的关键词检测技术的研究廖序1.z李成裘1，麒以公爹， (1中国科学院自动化研究所，北京100080 2中国科学院研究生院，北京 100080) E-mail:(wchen,lichjtpu}@hitic.ia.ac.cn 摘要正确率比较高就能尽可能的满足用户的需求。由于用户对关键部分的发音通常都是完整和符合语法的，因此从语音流中本文研究了基于大词汇量连续语音识别 (LVCSR)的仅仅识别关键部分显然比识别整个句子的所有发音要容易关键词的检测方法，分析和比较了常用的关键词检测的两种很多，而且还不会对句子的语义理解造成较大损失。关键词方法，重点对基于连续语音识别的关键词检测方法进行了检测系统不需要对非关键词发音和句子的句法做出假设，理研究，给出了一些提高关键词检出率的方法。论上允许输入无限量的词语和噪音，因此系统中可以使用自关攫浮关键词识别;连续语音识别;Filler模型然的对话语音。 1.引言 2.连续语音识别引攀自从20世纪80年代以来，大词汇量、非特定人、连续当前语音识别的主流方法是基于隐马尔可夫模型语音识别己经成为语音识别领域的研究重点，随着矢量量化 (HMM)和统计语言模型(SLM)的统计识别方法。其基本原理技术、隐马尔可夫模型和人工神经元网络在语音识别中的成如下: 功应用，统计语言模型也开始应用到语音识别中。目前，人们对连续语音识别的研究已经取得了很大的进展。汉语语将待识别的一段语音记做S，经过语音前端处理后得音识别相对来说起步较晚，但在国家863高科技计划、中科院八五攻关计划以及国家973计划的大力支持下，国内的一到一个对应的语音特征序列O，记做批科研院所 (如中科院自动化所、声学所，清华大学，北京 0=101,02,... 大学等)进行了汉语大词汇量连续语音识别的研究，取得了 ,OT},s对应的句子可以看作是由许多词许多研究成果，使得汉语语音识别取得了快速的发展。组成的一个词串，记做然而，连续语音识别目前并不能满足使用的需要。连续邢=WteW2,.. 一Wn(Wi“V,1_i_n)。语音识别器的语音识别系统要求准确地给出一句话中每个字的确切标音，然后通过句话和语义分析来尝试判断这句话的含义。显然由任务就是根据已知的语音特征序列O，求出最可能的词串于系统所需要完成的任务非常复杂，不可避免的会出现计算量大，速度慢等缺点，而且，现有的连续语音识别技术还不 W。用形式化的表述就是:寻找满足以下表达式的W 完美，字错误率较高，目前世界上最好的基于电话信道的连使得续语音识别系统的字错误率也在20%以上，系统的识别精度远没有达到让用户满意的程度口而且，若以自然的、非限制 W=argmaxP(W}O) (2.1) 性的说话方式使用系统，则说话人在生活语言中频繁出现的不规则语法现象 (如停顿、犹