- 1、本文档共56页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于规则的一类方法在机器翻译的发展中确实起了非常重要的作用,但是,随着研究的深入,研究者们发现人工确定的有限规则难以正确翻译大规模的现实语句。因此,人们不断地寻找新的方法,从而产生了基于语料库的一类方法。所谓语料库,就是把各类在现实当中使用的真实文本收集在一起,并不对原来的语句进行修饰润色,这样构成的集合称为语料库。显然,机器翻译只有对语料库中真实句子进行翻译研究,才有可能建立起满足现实要求的机器翻译系统。早期的语料库主要是为自然语言研究提供众多的实例,如用于词频统计,以后逐渐发展为对其进行大规模的语法信息标注,如词性标注、句法符号标注等。这样,对语料库进行收集、整理、加工的研究诞生了一门新的语言学分支,就称为语料库语言学。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 为机器翻译服务的语料库应该是源语言和目标语言双语对照的双语语料库,或者是多种自然语言对照的语料库。在研究中,一方面可以直接使用语料库进行机器翻译中的分析、转换和生成,另一方面可以间接使用语料库,将其作为获取翻译知识和统计知识的依据。 十多年来,对机器翻译的多方面研究使许多人认为,好的机器翻译系统应采用混合方法,因为就目前情况看,无论采用何种方法实现的机器翻译系统,都没有混合方法质量好。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 完全实例的翻译就是对待翻译的源语句通过翻译实例数据库检索出要翻译的目标语句,翻译的操作就是检索。 这种方法用已经存在的翻译实例(双语文本)作为知识源。 工作之初,选择了一些常用的双语翻译实例输入,构造成一个特别的模块(翻译实例数据库)。 4.2 基于实例的机器翻译改进方法 4.2.1 完全实例的翻译 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 例如:在汉译英翻译实例数据库中有 (1)源 语 句 水的热容量比沙大 目标语句 Water has a greater heat capacity than sand. (2)源 语 句 太阳离我们比其它任何恒星都更近一些 目标语句 The sun is closer to us than any of the other stars. (3)源 语 句 对于生物来说,没有什么东西比太阳更重要了。 目标语句 There is nothing more important to life than the sun. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 之后,不断积累已经译好的文本作为机器翻译的样本。当然,如果所要翻译的语言是由有限个常用句子构成,这种处理方法的实用性会大一些;但是,每一种自然语言都是由无限多个句子构成,计算机永远不可能完全存储,因此这种处理方法的实用性很小。 虽然我们对完全实例的翻译并不寄于厚望,但我们的翻译系统仍然建立了这一模块,收集的是一些成熟的、常用的双语翻译实例。 这样做的理由是, 完全实例的翻译处理方法省略了自动分词、词义消歧、句法分析、语义分析、译文转换等许多步骤。对具体待翻译的多个源语句来说,这种翻译(检索)即使部分成功,目的也达到了,因为它的译文是高质量的,与人工翻译一致;不成功,再采取二、三种处理方法。 当然,要这样做,还应该采用高效的映射式检索算法,才能保证机译速度. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.
文档评论(0)