意念词典·语义词典·机器翻译-pku-北京大学.docVIP

意念词典·语义词典·机器翻译-pku-北京大学.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
意念词典·语义词典·机器翻译-pku-北京大学

意念词典·语义词典·机器翻译  易绵竹 薛恩奎 /解放军外国语学院  提 要 词典或词库建设是研制开发自然语言处理系统的一项重要基 础性工程,它区别于纸版辞书的特征是能存放在计算机系统中供语言信息处理程序使用,它 一般以CD—ROM(Compact Disc—Read Only Memory高密度盘只读存储器)为介质,登录构成 句子的词汇单位所负载的词法信息、句法信息、语用信息、概念信息及对译信息,这就是所 谓的机器可读词典(Machine Readable Dictionary,MRD)或电子词典。本文将讨论意念词典 、语义词典的性质和编纂原则以及它们在语言信息处理中的作用。 关键词 意念词典 语义词典 电子词典 机器翻译  1. 电子词典是机器翻译系统工程化的一个重要方面 据有关文献记载,前苏联工程师П.П.Троянский首次提出了机器翻译设想。1933年9月5日,他在莫斯科登记一项专利,其内容是要求保护“制造一台在从一种语言翻译成另一种语言或多种语言时能选择和打印词汇的机器”的专利,这实际上是一台查字典的机器,其思想已经使计算机介入了语言翻译环节。(ЭСЮФ 1984:214;吴蔚天等1994:224)1946年当世界上第一台电子计算机问世之时,就有人考虑将它应用到语言学研究中,并由此产生了“计算语言学”这一边缘性交叉学科。但是由于受计算机功能和程序设计环境上的制约,当时只能做词条索引及词语系统等方面的工作。1949年,美国工程师W.Weaver(韦弗)提出使用计算机可能“解决世界范围内的翻译问题”,其主要方法也是“查字典”:先为源语言中的每一个词查出一个目标语言中的等价词,再按照目标语言的语法规则来编排每一个词,从而达到翻译的目的。(林尧瑞等 1996:305)可见,词典在机器翻译的原初设想中占据重要地位。 在计算语言学文献中,电子词典亦称自动词典或机器词典,它被认为是语言工程的支柱和基石,构建信息含量大、功能齐全的电子词典应当成为民族语言现代化的一项基本建设。冯志伟先生正确指出:“机器翻译系统的基本信息都来自机器词典,语法语义规则利用来自机器词典中的各种静态信息,运算出表示话语语义特征的各种动态信息来。因此,我们可以说,机器词典是机器翻译的基础,没有好的机器词典,机器翻译就等于做无米之炊,是根本无法进行的。近年来,,机器词典的研制成为一种专门学问,叫做‘电子词典’(electronic dictionary)。电子词典是机器翻译系统工程化的一个重要方面。”(冯志伟1994:231)电子词典是服务于机器翻译的知识库(лингвистическая база знаний)的重要构件之一(另一重要构件是语法规则库),它构造的是知识库而不是数据库。电子词典的词条是具有完整意义的单词所代表的简单概念或词素(simple concept or lexeme)和具有完整意义的非自由短语(固定词组或句子)所代表的复合概念或句素(complex concept or phraseme/syntaxeme),而由这些概念所形成的层级化、秩序化的语义关系网络,能够充分揭示中外语言单位之间的内在逻辑联系,为计算机理解词义、句义及篇章义奠定基础。(姚天顺等1995:215216)众所周知,机器翻译的逻辑过程通常分为分析、转换和生成3个阶段,而对词汇的处理则贯穿机器翻译的全过程。在分析过程中,通过设置一定的语义限制,以便于从源语言一个词的多个义项中选择一个正确的词义,亦即排除词汇歧义:在生成过程中,源语言一个词义往往可用目标语言不同的词来表达,如何选择一个符合目标语言表达习惯的等价词则是选词模块的主要工作:而在转换过程中,主要涉及两种语言词汇的转换和语言表达结构的转换。 2. 意念词典的性质及编纂原则 2.1 什么是意念词典 确定于计算机语言信息处理的总词表或总词库,实际上就是构造某种语言的义类词典(тезаурс),而义类词典亦称意念词典或概念词典(идеологический,идеографический или юнцептуальный словари)И.М.Кобозева将义类词典确定为语言内容平面聚合关系结构的模式(тезаурус как модель парадигматической структруы плана содержания языка),并把它看作该语言的语义场系统。(И.M.Кобозева 2000:123124) 在各类辞书中,对义类词典或意念词典的译义大同小异,下面试列几条: (1)ТЕЗАУРУС(от греч.thesauros-сокровище,сокровищница) — 1)словарь,в к-ром максимально полно п

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档