蒙古文整词输入法重码词智能化选择输出方法与技术研究进展.PDF

蒙古文整词输入法重码词智能化选择输出方法与技术研究进展.PDF

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
蒙古文整词输入法重码词智能化选择输出方法与技术研究进展.PDF

第 期 中 国 科 学 基 金 ! -. ·成果简介· 蒙古文整词输入法重码词智能化选择输出 方法与技术研究进展 ·苏雅拉图 白双成 六 月 ( (内蒙古社会科学院 研发中心,呼和浩特 ) )*+ [关键词] 蒙古文,词语组合,知识表示,人工智能,重码词选择,输入输出 在国家自然科学基金的资助下,“蒙古文整词输 立软件公司的各种产品中已得到广泛应用,正在取 入法重码词智能化选择输出方法与技术”研究项目 得良好的技术效益)的框架体系结构,提出了重码词 取得了很大进展。 复杂特征知识的表示方法。复杂特征具体给出方 法:在“蒙古语框架知识库”已有的属性字段上再增 ! 研究成果 加新的属性字段,实现了重码词复杂特征知识的表 !’! 逐步建立和形成了庞大的蒙古文语料库 示。在“蒙古语框架知识库”中新增加的字段具体包 [] 用课题组已有的《蒙古文整词输入法》输入完成 括:多变体附加成分! 字段(嵌入后台);短语结构字 的语料目前已可以满足各种不同目的的研究。按照 段;词类标注字段;句法成分字段;标点符号字段;施 文本文件计,语料库目前已达到几百种。按照不同 事受事字段;重码词后项搭配规则字段;重码词前项 语言语体计,语料库已达到几十种。按照整词字数 搭配规则字段等。通过这一方法,丰富了“蒙古语框 计,已接近几个亿。按照词条计,已接近几万词条。 架知识库”的知识含量,为知识库完成后可能承担的 !’ 重码词获取方法的研究成果 任务储备了新的知识资源。 由于蒙古文整词输入法发明采取的是“整词音 !’% 重码词选择方法的研究成果 节集合模糊编码方法”,所以产生重码词的概率较 通过研究,我们提出了词频概率关系选择方法、 高,平均为全词的,。重码词的概念是:输入码 多变体附加成分组合关系选择方法、短语结构关系 一致、输出值不同的词。为了获得所有的重码词,我 选择方法、句法组合关系选择方法、语义组合关系选 们研究实现了一个“重码词获取软件”,通过将其应 择方法等 种不同的重码词智能化选择方法。 # [] 用于蒙古文整词 输入法输入完成的大量文本文件 ()词频概率关系选择方法。这种方法是通过 数据(语料库)中,获得了所有的重码词,并按其不同 重码词概率统计器,对整词生成器生成出来的重码 的聚合值,编成了 本“重码词词典”。 词进行使用概率的统计计算,并根据计算结果对当 !’# 重码词搭配关系的研究成果 前的重码词进行使用概率排序后,将结果交给输出 [] 利用已获得的“重码词词典”,确定了重码词

文档评论(0)

tangtianbao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档