机器翻译理论和技术.ppt

  1. 1、本文档共114页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器翻译理论和技术

句义表示与分析(2) --论旨角色与格语法 论旨角色(thematic role)或格角色(case role) 基于动词给出句子中其它成分与它的浅层语义关系,例如: The boy opened the door with a key. the boy: AGENT(施事格) the door: OBJECT(客体格) a key: INSTUMENT(工具格) 格语法 格语法由美国语言学家Charles J. Fillmore提出的用于对句法结构与语义之间关系进行描述的理论。 “Towards a modern theory of case”、“The case for case”、“Some problems for case grammar” 基本语义规则 S-M+P 一个句子(S)由情态(M)和命题(P)构成。 情态包括:时体态、语气以及否定等。 P-V+C1+C2+...+Cn 命题由动词(V)及若干格(C1~Cn)构成。 Ci-Ki+NPi 格短语由格标记(K)和名词短语(NP)组成。 提供从表层格到深层格的转换规则 格的种类: 施事格(Agentive):He laughed. 工具格(Instrumental):He cut the rope with a knife. 与格(Dative):He gives me a ball. 使成格(Factitive):John dreamed a dream about Mary. 方位格(Locative):He is in the house. 客体格(Objective): He bought a book. 受益格(Benefective): He sang a song for Mary. 源点格(Source): I bought a book from Mary. 终点格(Goal): I sold a car to Mary. 伴随格(Comitative): He sang a song with Mary. ......(有多少格?) 动词格框架 词典中对每个动词需给出: 它所允许的格包括它们的性质(必需、禁止、自由) 这些格的特征(附属词、中心词语义信息等) 基于格语法的语义分析 基于的信息 格标记体系 动词格框架 名词语义信息 分析过程 格短语及主动词识别 利用主动词格框架确定格短语的格。 分析结果:句子的格框架。 基于格语法的语义分析结果(例) In the room, he broke a window with a hammer. [BREAK [case-frame agentive: HE objective: WINDOW instrumental: HAMMER locative: ROOM] [modals time: past voice: active] ] 机器翻译 机器翻译历史 1947,Warren Weaver’s memo 1954,第一个公开展示的俄英MT原型系统 1966,美国科学院的ALPAC报告宣告机器翻译走入低谷 1970s,Systran(1970),Meteo(1976), Early 1980s,复苏,Eurotra、Mu、... Late 1980s~early 1990s,商品化系统投入市场,语音翻译和统计机器翻译(SMT)出现 Late 1990s,Internet加速了MT,MAT、EBMT技术出现 After 2000,SMT大行其道! I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need do is strip off the code in order to retrieve the information contained in the text 直译(Direct):从原文句子的表层(词、词组或短语)出发,直接转换成译文(必要的词序调整)。 转换(Transfer):对源语言进行分析,得到一个基于源语言的中间表示;然后,把这个中间表示转换成基于目标语言的中间表示;从基于目标语言的中间表示生成目标语言。 中间语(Interlingua):对源语言进行分析,得到一个独立于源语言和目标语言的、基于概念的中间表示;从这个中间表示生成目标语言。 机器翻译的基本策略 中间语言

文档评论(0)

busuanzi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档