机器翻译理论和技术.ppt

  1. 1、本文档共126页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 语料库:corpus(单数),corpora(复数) “1The 2dog 3saw 4Jack5”的测试与动作的处理流程 跟踪网络S 步骤 结点 位置 通过的边 寄存器集合 1 S 1 1(第一次调用NP) SUBJ:=NP(DET the,HEAD dog, AGR 3s ) AGR:=3s 5 S1 3 2({3s}∩{3s,3p}) MAIN-V:=saw, AGR:=3s 6 S2 4 3 (第二次调用NP) OBJ:=NP(NAME Jack,AGR 3s) 9 S3 5 pop S( SUBJ NP(DET the,HEAD dog, AGR 3s), MAIN-V saw, AGR 3s, OBJ NP(NAME Jack, AGR 3s) ) 第一次跟踪网络NP 步骤 结点 位置 通过的边 寄存器集合 2 NP 1 1 DET:=the, AGR:={3s,3p} 3 NP1 2 2({3s,3p} ∩{3s}) HEAD:=dog, AGR:= 3s 4 NP2 3 pop NP(DET the,HEAD dog, AGR 3s) 第二次跟踪网络NP 步骤 结点 位置 通过的边 寄存器集合 7 NP 4 3 NAME:=Jack, AGR:=3s 8 NP2 5 pop NP(NAME Jack, AGR 3s) “1The 2dog 3saw 4Jack5”的测试与动作的处理流程(续) 基于合一的语法 一个文法可以表示成一系列特征结构间的约束关系所组成的集合。这样的文法称为合一文法(Unification Grammar)。例如: 特征结构X0、X1和X2之间的约束关系: X0-X1 X2 (CAT0=S,CAT1=NP,CAT2=VP, AGR0=AGR1=AGR2,VFORM0=VFORM2) 它描述了基于特征的CFG中的一条规则: S-NP(AGR ?a) VP(AGR ?a) 合一文法为其它的基于特征的文法提供了一个形式描述基础 特征结构的合一运算构成了合一文法的基本操作,其作用有两个: 创建新的特征结构(规约的结果) 检查特征结构间的相容性以确定多个特征结构是否可以合并(规约) 合一运算 复杂特征集相容 α(f)表示复杂特征集α的特征f的值 若α、β为复杂特征集,则α和β相容,当且仅当: 若α(f)=a,β(f)=b,a、b都是原子,α和β是相容的当且仅当a=b 若α(f)、β(f)均为复杂特征集,α和β是相容的当且仅当α(f)与β(f)相容 复杂特征集合一运算∪: 如果a、b都是原子,若a=b,则a∪b=a,否则a∪b=Φ 若α、β均为复杂特征集,则 若α(f)=v,但β(f)未定义,则f=v属于α∪β 若β(f)=v,但α(f)未定义,则f=v属于α∪β 若α(f)=v1,β(f)=v2,且v1与v2相容,则f=(v1∪v2)属于α∪β,否则,α∪β= Φ 合一运算举例 (CAT V, ROOT cry)与(CAT V, VFORM pres) 可以合一为:(CAT V, ROOT cry, VFORM pres) (CAT V, AGR 3s)与(CAT V, AGR 3p)不能合一 (CAT N,ROOT fish, AGR {3s,3p})与(CAT N, AGR 3s) 可以合一为: (CAT N,ROOT fish, AGR 3s) 基于句法结构转换的翻译 递归地利用一组“树-树”的转换规则,把源语言的分析树转换成目标语言分析树,然后生成目标语言句子。 句法树转换的例 NP Det A N1 delicious soup Adj N NP NP tv(X) tv(Y) tv(X) tv(Y) NP Det Una N1 sopa deliciosa N Adj N1 tv(A) tv(B) Adj N N1 tv(B) tv(A) N Adj = = Det Una = SL Tree Tree-to-tree transformations TL Tree delicious = deliciosa soup = sopa Det A A delicious soup Una sopa deliciosa (English) (Spanish) 基于句法结构转换翻译面临的问题 翻译发散(Translation divergence) 两种语言在表达同一个意思的句法结构和语义分布上存在差别 翻译失配(Translation mismatch) 两种语言在概念表达方面存在差别(不存在直译) 翻译发散的种类 论旨发散(Thematic) 句子成分的语法作用发生变化,例如: En: You lik

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档