NiuTrans开源统计机器翻译系统技术分析.PDF

NiuTrans开源统计机器翻译系统技术分析.PDF

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
NiuTrans开源统计机器翻译系统技术分析

NiuTrans 开源统计机器翻译系统技术分析 李强,孙坤杰,刘卓,肖桐,朱靖波 (东北大学自然语言处理实验室,辽宁 沈阳 110819) 摘要:本文主要介绍了必威体育精装版版NiuTrans 开源统计机器翻译系统的技术特点。在必威体育精装版版的NiuTrans 中,包含 当前主流的统计机器翻译模型,即:基于短语的翻译模型,基于层次短语的翻译模型,基于句法(树到串/ 串到树/树到树)的翻译模型。与此同时,NiuTrans 包含中英文的数据预处理工具,以及自主开发的精简且 高效的语言模型工具。为方便机器翻译研究人员使用,NiuTrans 开发接口对用户开放。经实验证明,NiuTrans 系统在NIST 和CWMT 的多个翻译任务中表现出优异的翻译性能。 关键词:NiuTrans ;统计机器翻译;开源工具包 中图分类号:TP391 文献标识码:A Technical Analysis of NiuTrans Open Source Statistical Machine Translation System LI Qiang, SUN Kun-Jie, LIU Zhuo, XIAO Tong, ZHU Jing-Bo (Northeastern University NLP Lab, Shenyang, Liaoning 110819, China) Abstract: This paper introduces the technical features for the latest version of NiuTrans open source machine translation toolkit. The toolkit supports the state-of-the-art models in statistical machine translation, including the phrase-based model, the hierarchical phrase-based model, and various syntax-based models (tree-to-string/string-to-tree/tree-to-tree). Furthermore, NiuTrans supports a preprocessing module for Chinese/English, and a simple and fast language model. In order to make it easy to use for machine translation researchers, several interfaces are available for further development with NiuTrans. We evaluate the NiuTrans system on the NIST and CWMT translation datasets. Experiments show that NiuTrans exhibits the state-of-the-art translation performance. Key words: NiuTrans ;Statistical Machine Translation;Open Source Toolkit 1 简介 自1949 年美国人Weaver 发表Translation 备忘录并正式提出机器翻译思想以来,机器 翻译已经发展了六十四年。目前,性能优异的机器翻译方法不需要人工书写大量的翻译规则, 而是自动从大规模双语平行语料中统计翻译信息,在翻译的过程中从巨大的有哪些信誉好的足球投注网站空间中有哪些信誉好的足球投注网站 得到翻译结果,这种基于统计模型的翻译方法称之为统计机器翻译。在基于统计的机器翻译 [1][2] [3][4] 模型中,分为基于短语的翻译模型 ,基于层次短语的翻译模型 ,基于句法(树到串/ 串到树/树到树)的翻译模型[5][6][7][8][9] 。基于短语、层次短语的翻译模型不需要对源语言及 目标语言进行深入

文档评论(0)

l215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档