- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Journal of Chinese Language and Computing, 13 (2) 159-176 159
∗
现代汉语语义词典规格说明书
1 2 1
王惠 詹卫东 俞士汶
1 北京大学计算语言学研究所
2 北京大学中文系
whui@; yusw@; zwd@
Submitted on 8 March , 2003, Revised and Accepted on 16 May, 2003
摘 要
“现代汉语语义词典”(SKCC)是一部面向自然语言信息处理的语义知识库,它以数据
库文件形式收录了 6.6万余条汉语实词,不仅给出了每个词语所属的词类、语义类,
而且以义项为单位详细描述了它们的配价信息和多种语义组合限制,可以为包括机器
翻译在内的多种中文信息处理系统中的语义自动分析提供强有力的支持,同时,对于
汉语词汇语义学和计算词典学研究也具有重要的意义。本文概要介绍这部语义词典的
结构、内容,以及语义属性项目的填写规范。
关键词
语义知识库,语义类,配价信息,计算词典学,中文信息处理
1. 引言
随着语言处理技术的迅速发展,词义分析的重要性与迫切性也越来越突出。为了获取
足够的词义知识,克服目前普遍存在的“词义瓶颈”难题,从 80 年代中期开始,世
界上许多国家都大力投资开发机用语义词典,如:美国的 Wordnet (Fellbaum, 1998) 、
Mindnet (Richardson, 1998) 、Framenet (Fillmore, 1998) 、日本的EDR 概念词典、新加
∗ 本文有关研究得到了 973 项目(G1998030507-4,G1998030507-1)和 863 项目
(2002AA117010-08)的支持。
160 Hui Wang, Weidong Zhan, Shiwen Yu
坡的 SenseWeb 等。中国也陆续开展了汉语语义词典的研究与开发,如“905”项目“信
息处理用汉语语义词典” (陈力为, 袁琦, 1995)、“现代汉语述语动词机器词典”、“知网
(Hownet )” (董振东, 1999 )、“ 中文概念辞书 (CCD )” (于江生, 俞士汶, 2002 )等。
此外,不少计算语言学家还尝试着从机器词典中自动抽取词义知识(Chodorow 1985,
Ide 1993,黄居仁 1998 等)。但迄今为止,现有的规模较大的词义工程,基本上都是
采用词义分类的办法,有些再加上为数不多的属性描述。而国内外研究工作者建立义
类体系的方法,也基本上都是对词义进行静态的聚合分类,并没有把词义放到一定的
组合框架中去观察,所以,在自然语言处理系统中起的作用是有限的。
为了给计算机 自动分析提供更全面、深入的语义信息,我们应充分吸收现有的研究成
果,在语法知识库的基础上构建语义知识库。不仅要进行系统的语义分类,而且对词
义组合信息加以全面描述,进一步加强动态的语义组合知识的研究和总结,建立一个
与语言工程应用紧
文档评论(0)