- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器翻译研究进展与趋势
CCF 中文信息技术专委会
摘要
机器翻译实现自然语言之间的自动互译,是自然语言处理和人工智能领域的经典难题之
一。近年来,机器翻译受到越来越多的关注。一方面,机器翻译技术拥有迫切的社会需求,
并不完美的机器翻译技术在产业界的应用越来越广泛,实时语音翻译系统和在线翻译服务已
进入日常生活;另一方面,机器翻译一直是学术界研究的一个热点,关于机器翻译技术的研
究论文在数量上长期占据计算语言学(或自然语言处理)领域各大学术会议的头名。本文首
先简要介绍机器翻译研究的概况,着重阐述近年来国内外的相关研究现状和技术进展,然后
对机器翻译的发展趋势进行展望。
Abstract
Machine translation (MT) performs automatic translation between two natural languages and it is
one of the classic problems in the area of natural language processing and artificial intelligence. In
the recent years, MT has drawn more and more attention. On one hand, there are imperative
application demands and more and more imperfect MT systems appear in the industry, such as
real-time speech translation and on-line translation. On the other hand, MT is a hot research topic
and research articles focusing on MT account for the largest part in most top-tier conferences in
the area of computational linguistics or natural language processing. This article first briefly
introduces the history and status of MT, and then presents recent research work and progress on
MT in detail. Finally, we propose some future research directions for MT research and
development.
1. 引言
人们通常习惯于感知(听、看和读)自己母语的声音和文字,在与说外语的人交流或阅
读外语文本时,翻译(将外语翻译成母语)便成为一种自然的需求。打破语言障碍,实现准
确的机器自动翻译成为人类的一个美好梦想。计算机的出现为机器翻译思想的提出奠定了基
础。受到英国在第二次世界大战期间使用计算机成功破解德国英格玛(Enigma )密码的启
发,Warren Weaver 于1949 年正式提出了机器翻译的问题:外语只是母语的一种编码,我们
只需利用破解密码的方式将外语翻译成母语。由于这一比喻是如此形象,加之破解密码的成
功,人们好像看到了希望,对机器翻译的研究充满了期待。然而,60 多年的研究历程表明,
机器翻译的发展道路布满了曲折和艰辛。
基于双语词典的词汇替换方法和基于简单分析、转换与生成的规则方法是机器翻译早期
1
研究阶段的两种主流方法。由于当时这些方法相对粗糙,无法实现令人信服的自动翻译应用,
因此,在 1966 年美国国家科学院发布的ALPAC 报告的影响下,美国政府和军方对机器翻
译研究所投入的资助几乎都终止了,机器翻译研究在世界范围内陷入了低谷。
但是,并不是所有的机器翻译研究人员都放弃了希望,他们一直在基于规则的(rule-based )
理性主义思维的
文档评论(0)