- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
意念词典·语义词典·机器翻译-pku-北京大学
意念词典·语义词典·机器翻译
易绵竹 薛恩奎 /解放军外国语学院
提 要 词典或词库建设是研制开发自然语言处理系统的一项重要基
础性工程,它区别于纸版辞书的特征是能存放在计算机系统中供语言信息处理程序使用,它
一般以CD—ROM(Compact Disc—Read Only Memory高密度盘只读存储器)为介质,登录构成
句子的词汇单位所负载的词法信息、句法信息、语用信息、概念信息及对译信息,这就是所
谓的机器可读词典(Machine Readable Dictionary,MRD)或电子词典。本文将讨论意念词典
、语义词典的性质和编纂原则以及它们在语言信息处理中的作用。
关键词 意念词典 语义词典 电子词典 机器翻译
1. 电子词典是机器翻译系统工程化的一个重要方面
据有关文献记载,前苏联工程师П.П.Троянский首次提出了机器翻译设想。1933年9月5日,他在莫斯科登记一项专利,其内容是要求保护“制造一台在从一种语言翻译成另一种语言或多种语言时能选择和打印词汇的机器”的专利,这实际上是一台查字典的机器,其思想已经使计算机介入了语言翻译环节。(ЭСЮФ 1984:214;吴蔚天等1994:224)1946年当世界上第一台电子计算机问世之时,就有人考虑将它应用到语言学研究中,并由此产生了“计算语言学”这一边缘性交叉学科。但是由于受计算机功能和程序设计环境上的制约,当时只能做词条索引及词语系统等方面的工作。1949年,美国工程师W.Weaver(韦弗)提出使用计算机可能“解决世界范围内的翻译问题”,其主要方法也是“查字典”:先为源语言中的每一个词查出一个目标语言中的等价词,再按照目标语言的语法规则来编排每一个词,从而达到翻译的目的。(林尧瑞等 1996:305)可见,词典在机器翻译的原初设想中占据重要地位。
在计算语言学文献中,电子词典亦称自动词典或机器词典,它被认为是语言工程的支柱和基石,构建信息含量大、功能齐全的电子词典应当成为民族语言现代化的一项基本建设。冯志伟先生正确指出:“机器翻译系统的基本信息都来自机器词典,语法语义规则利用来自机器词典中的各种静态信息,运算出表示话语语义特征的各种动态信息来。因此,我们可以说,机器词典是机器翻译的基础,没有好的机器词典,机器翻译就等于做无米之炊,是根本无法进行的。近年来,,机器词典的研制成为一种专门学问,叫做‘电子词典’(electronic dictionary)。电子词典是机器翻译系统工程化的一个重要方面。”(冯志伟1994:231)电子词典是服务于机器翻译的知识库(лингвистическая база знаний)的重要构件之一(另一重要构件是语法规则库),它构造的是知识库而不是数据库。电子词典的词条是具有完整意义的单词所代表的简单概念或词素(simple concept or lexeme)和具有完整意义的非自由短语(固定词组或句子)所代表的复合概念或句素(complex concept or phraseme/syntaxeme),而由这些概念所形成的层级化、秩序化的语义关系网络,能够充分揭示中外语言单位之间的内在逻辑联系,为计算机理解词义、句义及篇章义奠定基础。(姚天顺等1995:215216)众所周知,机器翻译的逻辑过程通常分为分析、转换和生成3个阶段,而对词汇的处理则贯穿机器翻译的全过程。在分析过程中,通过设置一定的语义限制,以便于从源语言一个词的多个义项中选择一个正确的词义,亦即排除词汇歧义:在生成过程中,源语言一个词义往往可用目标语言不同的词来表达,如何选择一个符合目标语言表达习惯的等价词则是选词模块的主要工作:而在转换过程中,主要涉及两种语言词汇的转换和语言表达结构的转换。
2. 意念词典的性质及编纂原则
2.1 什么是意念词典
确定于计算机语言信息处理的总词表或总词库,实际上就是构造某种语言的义类词典(тезаурс),而义类词典亦称意念词典或概念词典(идеологический,идеографический или юнцептуальный словари)И.М.Кобозева将义类词典确定为语言内容平面聚合关系结构的模式(тезаурус как модель парадигматической структруы плана содержания языка),并把它看作该语言的语义场系统。(И.M.Кобозева 2000:123124) 在各类辞书中,对义类词典或意念词典的译义大同小异,下面试列几条:
(1)ТЕЗАУРУС(от греч.thesauros-сокровище,сокровищница) — 1)словарь,в к-ром максимально полно п
您可能关注的文档
- 聚合物纳米杂化材料的控制合成自组装及功能化-core.pdf
- 聚合物电老化击穿临界状态的试验验证.pdf
- 聚眈胶胶树状大分子与co2的相互作用.pdf
- 聚酰胺鄄胺型树枝状大分子及其衍生物在基因传递中的应用.pdf
- 聚乳酸与聚碳酸酯合胶之改质研究杨斯尧王晔东海大学化学工程与.doc
- 聚焦课改点燃学生课堂思维的火花--------点拨式教学之我见作者许裳.doc
- 聚谷氨酸基超分子水凝胶的制备和表征-openrepositoryofnational.pdf
- 广西大学继续教育远程教学平台需求方案-广西大学继续教育学院.doc
- 聚醚氨基硅油/丝素整理剂对.pdf
- 应用伦理学周三34节课题报告课题名称学术不端问题分析研究.doc
最近下载
- 《风电叶片用拉挤板 复合组件I型断裂韧性的测定》征求意见稿.pdf VIP
- ISO11607-1 -2006(中文)最终灭菌医疗器械的包装 第1部分-材料、无菌屏障系统、和包装系统要求.pdf
- “保险+期货”服务地方特色农产品发展的效应分析--以新疆麦盖提县红枣为例.pdf
- 大气压低温等离子体特性与应用研究现状.pptx VIP
- 白建娥语录测试题.docx
- 人教版(2024新版)八年级上册物理第六章《质量与密度》教学设计(共4节).docx
- 川教版可爱的四川7至8年级 主题一 第3课《雄伟的高原雪山》 教案.doc
- 廉洁诗歌朗诵四(1).docx
- 新北师大版-八年级数学上册-第四章一次函数知识点总结和典型例题分析.pdf VIP
- 工业园区控制性详细规划-说明书.doc
文档评论(0)