关于LVCSR的关键词检测技术的研究.pdf

关于LVCSR的关键词检测技术的研究.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于LVCSR的关键词检测技术的研究 廖序1.z李成裘1,麒以公爹, (1中国科学院自动化研究所,北京100080 2中国科学院研究生院,北京 100080) E-mail:(wchen,lichjtpu}@hitic.ia.ac.cn 摘要 正确率比较高就能尽可能的满足用户的需求。由于用户对关 键部分的发音通常都是完整和符合语法的,因此从语音流中 本文研究了基于大词汇量连续语音识别 (LVCSR)的 仅仅识别关键部分显然比识别整个句子的所有发音要容易 关键词的检测方法,分析和比较了常用的关键词检测的两种 很多,而且还不会对句子的语义理解造成较大损失。关键词 方法,重点对基于连续语音识别的关键词检测方法进行了 检测系统不需要对非关键词发音和句子的句法做出假设,理 研究,给出了一些提高关键词检出率的方法。 论上允许输入无限量的词语和噪音,因此系统中可以使用自 关攫浮 关键词识别;连续语音识别;Filler模型 然的对话语音。 1.引言 2.连续语音识别引攀 自从20世纪80年代以来,大词汇量、非特定人、连续 当前语音识别的主流方法是基于隐马尔可夫模型 语音识别己经成为语音识别领域的研究重点,随着矢量量化 (HMM)和统计语言模型(SLM)的统计识别方法。其基本原理 技术、隐马尔可夫模型和人工神经元网络在语音识别中的成 如下: 功应用,统计语言模型也开始应用到语音识别中。目前,人 们对连续语音识别的研究已经取得了很大的进展 。汉语语 将待识别的一段语音记做S,经过语音前端处理后得 音识别相对来说起步较晚,但在国家863高科技计划、中科 院八五攻关计划以及国家973计划的大力支持下,国内的一 到一个对应的语音特征序列O,记做 批科研院所 (如中科院自动化所、声学所,清华大学,北京 0=101,02,... 大学等)进行了汉语大词汇量连续语音识别的研究,取得了 ,OT},s对应的句子可以看作是由许多词 许多研究成果,使得汉语语音识别取得了快速的发展。 组 成 的 一 个 词 串 , 记 做 然而,连续语音识别目前并不能满足使用的需要。连续 邢=WteW2,.. 一Wn(Wi“V,1_i_n)。语音识别器的 语音识别系统要求准确地给出一句话中每个字的确切标音, 然后通过句话和语义分析来尝试判断这句话的含义。显然由 任务就是根据已知的语音特征序列O,求出最可能的词串 于系统所需要完成的任务非常复杂,不可避免的会出现计算 量大,速度慢等缺点,而且,现有的连续语音识别技术还不 W。用形式化的表述就是:寻找满足以下表达式的W 完美,字错误率较高,目前世界上最好的基于电话信道的连 使得 续语音识别系统的字错误率也在20%以上,系统的识别精度 远没有达到让用户满意的程度口而且,若以自然的、非限制 W=argmaxP(W}O) (2.1) 性的说话方式使用系统,则说话人在生活语言中频繁出现的 不规则语法现象 (如停顿、犹

文档评论(0)

00625 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档