多策略的机器翻译.pdfVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多策略的机器翻译

多策略的机器翻译 王海峰 东芝(中国)研究开发中心 北京 100738 wanghaifeng@ 摘要:统计机器翻译方法由于其良好的数学模型、无指导的学习能力、良好的鲁棒性等优点而备受重 视。基于规则的机器翻译方法对语言规律良好的概括和描述能力以及基于实例的机器翻译方法对相似句子 相当精确的翻译也颇有价值。多种方法相融合的机器翻译策略正在成为机器翻译发展的重要方向。本文全 面介绍东芝对规则、实例、统计等各种机器翻译方法的研究,以及在融合各种方法方面的探索。 关键词:机器翻译,基于规则的机器翻译,基于实例的机器翻译,统计机器翻译,多策略机器翻译 Multi-Strategy Machine Translation Wang Haifeng Toshiba (China) Research Development Center Beijing 100738 wanghaifeng@ Abstract: Statistical Machine Translation (SMT) is very popular for its adequate mathematical model, unsupervised learning capacity, and robustness. Rule-Based Machine Translation (RBMT) and Example-Based Machine Translation (EBMT) methods are also valuable. Rules are good at modeling linguistic theory and phenomena. EBMT method is able to translate similar input very well. Multi-strategy machine translation becomes more and more important in the machine translation community. This paper introduces Toshibas efforts on RBMT, EBMT, SMT and the combination of the three methods. Keywords: Machine Translation, Rule-based Machine Translation, Example-based Machine Translation, Statistical Machine Translation, Multi-Strategy Machine Translation 1 引言 在三种主流机器翻译方法中,统计机器翻译方法正受到学术界更多的关注。一方面,在 具有广泛影响力的 NIST 机器翻译评测中1 ,统计机器翻译系统连连胜出;另一方面,在 ACL 等主流学术会议上,也是多数机器翻译方面的论文都集中在统计方法上。那么,是不 是基于规则的机器翻译方法和基于实例的机器翻译方法就已经江河日下,行将退出历史舞台 了呢?让我们首先关注一下规则方法和实例方法的现状。 规则方法虽然已经较少出现在主流学术会议上了,但一个有趣的现象是,目前真正为用 户所使用的机器翻译产品大多都是基于规则的。同时,规则方法也并不是停滞不前了,而是 仍有不断提高的潜力[1]。 目前来看,实例方法不如规则方法在产品中应用广泛,也不如统计方法在学术会议上广 受重视及在评测中胜出,但实例方法也依然活跃并富有潜力。在2005 年的机器翻译峰会(MT Summit X)上,实例方法仍然是与会学者大量讨论的话题,而且MT Summit X 还专门组织 1 /speech/tests/mt/ 了一个基于实例机器翻译的Workshop ,著名的机器翻译专业国际期刊“Machine Translation ” 也将在2006 年下半年发

您可能关注的文档

文档评论(0)

wannian118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档