一种基于马尔可夫模型的汉语语音识别后处理中的音字-中文信息学报.PDF

下载文档 降价啦

5
0
约1.61万字
约 7页
2018-10-26 发布于天津
举报
版权申诉
保障服务

一种基于马尔可夫模型的汉语语音识别后处理中的音字-中文信息学报.PDF

1、本文档共7页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

一种基于马尔可夫模型的汉语语音识别后处理中的音字-中文信息学报

中　文　信　息　学　报第 11 卷第 4 期 JOURNAL OF CHINESE INFORMATION PROCESSING vol . 11 No. 4 一种基于马尔可夫模型的汉语语音识别后处理中的音字转换方法梅　勇　徐秉铮华南理工大学无线电系　广州 5 1064 1 【摘要】　为了提高汉语语音识别率 , 本文根据一种基于马尔可夫模型的统计语言模型去实现汉语音字转换 , 在实现过程中 , 提出了它的简化模型 , 该模型不仅保证了实时性 , 而且也为以后的工作打下伏笔 ; 同时对训练文本的稀疏问题提出了一种新的解决方案。利用以上模型的模拟实验表明 , 前向- 后向的马尔可夫模型具有较好的识别性能 ; 且以词为输出单元的模型识别性能优于以字符为输出单元的模型。关键词 : 语音识别 , 后处理 , 马尔可夫模型一、引言目前图像识别在人机界面上的应用已有了很大进展 , 国内外研制的中英文印刷体识别系 ( ) ( ) 统 OCR 已进入实用阶段如清华文通 OCR 等。手写体文字识别走向实用 , 而相对来说语音输入系统还未达到实用阶段。语音输入被视为当今第五代计算机和多媒体计算机的重要特征 , 是今后信息输入的主要方向之一。而实现的关键技术是语音识别技术。每个人的语音特征都不同 , 不同的年龄、性别、地区的人说话时语音特征都有明显的差异 , 它的不确定性和不稳定性使得语音识别很困难。虽然国内外已有一些较好的语音识别系统 ,【1 ,2 】, 但从词汇量、识别率和识别速度的综合指标来看 , 仍未达到商品化的要求。另外 , 语音声学识别率达到一个阀值后 , 通过改进模型或算法再提高些许都很困难。所以, 此后最可靠的办法是进行识别后处理 , 即改进音字转换方法。音字转换部分的主要功能是 : 通过考察每个待识别音的很多候选字 , 并利用文法规则和自然语言的一些统计规律 , 得到正确的汉字序列 , 且纠正一些拼音识别的错误。为了对每一个音节确认出正确的字符 , 我们需要先根据输入的拼音序列 , 组成所有可能国家、广东省自然科学基金资助项目　本文于 1997 年 3 月 11 日收到 — 66 — 的字符假设或单音节、多音节的词假设。这里 , 以输入序列 “增进记忆力”为例 , 其对应的拼音序列为 [zeng - 1 , j in - 4 , j i - 4 , yi - 4 , li - 4 ] 。对于音节 [zeng - 1] 和 [j in - 4 ] , 尽管有很多同音异义字。但只有一个多音节词 “增进”。类似的 , 对于音节 [j i - 4 ] , [yi - 4 ] , 只有一个多音节词 “记忆”。我们可以通过用词典中的多音节词匹配的方式来得到上述多音节词。然而 , 虽然通过这种方式可直接得到一些多音节词 , 但是还是存在一些问题。首先 , 日常汉语中单音节词频繁出现。上例中 , 如 [li - 4 ] 对应于单音节词。由于这些音节不组成多音节词 , 每一音节对应于许多同音异义字。它们所代表的字符或词不能用上述方法得到。更困难的是这些音节可以和相邻的音节组合而形成不正