- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
现代汉语类词缀的定量与定性研究3
现代汉语类词缀的定量与定性研究3曾立英提要 本文基于《现代汉语语法信息词典》8万词的词库对类词缀的构词频率进行了统计和分析同时也对类词缀的能产性、定位性以及虚化程度等构词特征进行了探讨并区分了类词缀与部件词。我们采用定量研究和定性研究相结合的方法对每一个类词缀从读音、义项、同形、词频、构词方式等方面进行全方位的考察共确立了现代汉语的单音节类前缀23个、类后缀53个。关键词 类词缀 定量研究 定性研究 一 引言随着越来越多的新词语的出现如“先导型、瑜伽热、舒适度、上班族、里程碑式”等引导我们思索现代汉语构词的规律。像“型、热、度、族、式”这一类的语素构词很有规律构成的词数量也多构成的词语不可能都收入词典比如1998年和2000年《人民日报》语料中有340个“XX型”的词语出现如“技能型、搬运型、板块型、闭合型、便捷型、标准型、参与型、成年型、城郊型”等等。为了解释现代汉语构词法中的这一类现象我们有必要引入语言学中的“类词缀”的概念。关于“类词缀”的定义、性质、范围和分类的探讨语言学界主要有赵元任1968、吕叔湘1979、汤廷池1992、陈光磊1994、马庆株1995、朱亚军2001、富丽2001、王洪君、富丽2005、冯敏萱等2006等。在汉语构词法著作和论文中对于词缀或类词缀一般只是列举性的说明少有穷尽性的研究本文基于北京大学计算语言学研究所的《现代汉语语法信息词典》8万词的词库对每一个词的构成进行分析穷尽性地考察类词缀。中文信息处理学界对于“词缀”和“类词缀”主要是从应用的角度去制订分词规则和词表如刘源等1994、中央研究院的?形拇手犊庑∽?996、吴赣1998、孙茂松等2001都谈到了对“词缀”“接头词”“接尾词”的处理但是各家所列的类词缀的范围都不一致需要进一步探讨类词缀的确立标准以期更加深人地了解其构词规律。57曾立英:现代汉语类词缀的定量与定性研究3本文为教育部人文社会科学研究青年基金项目07JC740016成果并获得第42批中国博士后科学基金及国家重点基础研究发展计划项目973项目2004CB318102的支持特别感谢导师王洪君的指导和《世界汉语教学》两位匿名审稿专家的意见。尚存错误文责自负。二 类词缀的定量研究关于类词缀的范围各家确立的内容都不一样。如吕叔湘1979针对“汉语里地道的语缀不很多”的现象提出了“类语缀”一说并列举了“可-、好-、难-、准-、类-、亚-、次-、超-”等18个类前缀和“-员、-家、-人、-民、-界、-物、-品、-度”等23个类后缀。汤廷池1992则列出了“阿、老、小、打、见、可、难、好、而、以、第、初、不、非、反”等15个词首以及“人、师、员、士、生、手、派、性、度”等48个词尾。朱亚军2001所列的词缀包括前缀22个指“阿、半、本、不、超、初、打、单、第、多、反、泛、非、分、副、该、可、见、老、所、总、准”后缀39个指“巴、处、达、得、度、儿、法、分子、鬼、汉、化、件、家、匠、角、界、具、率、论、迷、派、品、气、然、热、师、士、式、手、坛、腾、头、性、学、员、者、子、族、主义”。刘源等1994有“完全虚化的前后加成分”“部分虚化的前后加成分”以及“接头词和接尾词、不虚化或基本不虚化”之别采取了一种分层处理的方式共列了15个前加成分和22个接头词、32个后加成分和98个接尾词。台湾中研院则列举出了9个前缀和41个接头词、20个后缀和441个接尾词。《现代汉语语法信息词典》以下简称《语法信息词典》收录了前接成分11个后接成分43个前缀包括“阿、超、非、过、老、微、伪、小、以、之、准”等11个后缀包括“赛、办、式、边、长zhng、场、单、度、堆、儿、方、感、观、乎、化、机、计、家A、家B、界、老、狂、率、论、们、面、品、器、然、生、手、体、头、型、性、学、炎、业、仪、员、者、制、子”等43个。本文对于类词缀的研究是建立在定量研究的基础上定量研究选取的词库是北京大学计算语言学研究所开发的《现代汉语语法信息词典》数据库。《语法信息词典》1998年第1版收录了现代汉语词语5万多条2003年第2版增加至7.3万余条参见俞士汶等2003到目前增加至8万条。该词典采用关系数据库的文件格式。本文就是基于这个丰富的词库并结合1998年全年《人民日报》语料库对类词缀首先进行定量研究所以本文对类词缀的研究不是凭经验、凭语感的选取而是基于对语料库的统计和分析而得出的。按照王洪君、富丽2005在体词性的范围内词缀的核心搭配范围在单音字延展到了一部分双音词类词缀与单音字的搭配已不太自由其核心搭配已转移到了双音词并延展到了多音节词和类词。于是我们选取了词库中的三字词来穷尽性的调查类词缀。本文首先对《语法信息词典》80685个词进行切分分析切分过程中有一条原则就是对二字词不切分发现有很多三字词可以切分我们于是在8068
文档评论(0)