- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于LVCSR的关键词检测技术的研究
廖序1.z李成裘1,麒以公爹,
(1中国科学院自动化研究所,北京100080 2中国科学院研究生院,北京 100080)
E-mail:(wchen,lichjtpu}@hitic.ia.ac.cn
摘要 正确率比较高就能尽可能的满足用户的需求。由于用户对关
键部分的发音通常都是完整和符合语法的,因此从语音流中
本文研究了基于大词汇量连续语音识别 (LVCSR)的
仅仅识别关键部分显然比识别整个句子的所有发音要容易
关键词的检测方法,分析和比较了常用的关键词检测的两种
很多,而且还不会对句子的语义理解造成较大损失。关键词
方法,重点对基于连续语音识别的关键词检测方法进行了
检测系统不需要对非关键词发音和句子的句法做出假设,理
研究,给出了一些提高关键词检出率的方法。
论上允许输入无限量的词语和噪音,因此系统中可以使用自
关攫浮 关键词识别;连续语音识别;Filler模型 然的对话语音。
1.引言 2.连续语音识别引攀
自从20世纪80年代以来,大词汇量、非特定人、连续 当前语音识别的主流方法是基于隐马尔可夫模型
语音识别己经成为语音识别领域的研究重点,随着矢量量化 (HMM)和统计语言模型(SLM)的统计识别方法。其基本原理
技术、隐马尔可夫模型和人工神经元网络在语音识别中的成 如下:
功应用,统计语言模型也开始应用到语音识别中。目前,人
们对连续语音识别的研究已经取得了很大的进展 。汉语语 将待识别的一段语音记做S,经过语音前端处理后得
音识别相对来说起步较晚,但在国家863高科技计划、中科
院八五攻关计划以及国家973计划的大力支持下,国内的一 到一个对应的语音特征序列O,记做
批科研院所 (如中科院自动化所、声学所,清华大学,北京
0=101,02,...
大学等)进行了汉语大词汇量连续语音识别的研究,取得了 ,OT},s对应的句子可以看作是由许多词
许多研究成果,使得汉语语音识别取得了快速的发展。 组 成 的 一 个 词 串 , 记 做
然而,连续语音识别目前并不能满足使用的需要。连续 邢=WteW2,..
一Wn(Wi“V,1_i_n)。语音识别器的
语音识别系统要求准确地给出一句话中每个字的确切标音,
然后通过句话和语义分析来尝试判断这句话的含义。显然由 任务就是根据已知的语音特征序列O,求出最可能的词串
于系统所需要完成的任务非常复杂,不可避免的会出现计算
量大,速度慢等缺点,而且,现有的连续语音识别技术还不 W。用形式化的表述就是:寻找满足以下表达式的W
完美,字错误率较高,目前世界上最好的基于电话信道的连
使得
续语音识别系统的字错误率也在20%以上,系统的识别精度
远没有达到让用户满意的程度口而且,若以自然的、非限制 W=argmaxP(W}O)
(2.1)
性的说话方式使用系统,则说话人在生活语言中频繁出现的
不规则语法现象 (如停顿、犹
文档评论(0)