- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现代汉语的词分以下18个基本词类,括号中的拉丁字母是各个词类的代码。
名词(n),时间词(t),处所词(s),方位词(f),数词(m),量词(q),区别词(b),代词(r),动词(v),形容词(a),状态词(z),副词(d),介词(p),连词(c),助词(u),语气词(y),拟声词(o),叹词(e)。
这些基本词类可以合并为较大的词类。名词、时间词、处所词、方位词、数词、量词统称为体词,动词、形容词、状态词统称为谓词。有一部分代词属于体词,另一部分代词属于谓词。体词、谓词、区别词和副词又合称为实词。介词、连词、助词、语气词合称虚词。实词与虚词是汉语两大词类。此外还有拟声词与叹词,它们游离于这两大词类之外。
自然语言处理的常规技术要求庆自然语言处理系统中配备一部电子词典。对于计算机来说,可以认为作为电子词典的登录项的语言单位是“词”。基本中大部分肯定是语言学家认同的词,这也就是暗示了其中一部分不能看作“词”。从计算机处理实际文本的需要出发,从提高计算机处理效率的角度考虑,词典中另外包含了以下7类语言成分:
前接成分 (h):阿,老,非,超,单 后接成分 (k):儿,子,性,员,器 语素字 (g):民,衣,失,遥,郝 非语素字 (x):鸳,批,蚣 成语 (i):接部就班,八拜之交 习用语 (l):总而言之,由此可见 简称略语 (j):三好,全总 前4类是比“词”更小的单位,不成词。这些成分的数量是有限的,只要电子词典的规模允许,应当尽可能地将这些成分全部收入。后3类是比“词”更大的单位,词典中只能收一部分使用频率高的。本文将电子词典中登录的各种语言万分笼统地叫做“词语”。
以下行文中的“词类”是就前面的18个基本词类而言的,有时也讨论上述后7类语言成分。
2.词语分类的理论基础
2.1 分类的目的与依据
为了进行语法研究与信息处理,需要把语法功能相同的或者相近的词归成一类。这里包含两项工作。一项是要针对汉语词语的全集,按照某种标准,建立一个分类体系。第一章所介绍的就是面向信息处理的一种汉语词语分类体系。另一项工作是决定该全集中的每一个词语究竟属于哪一个词类,这项工作可以叫“归类”,不过人们习惯上也在“归类”的意义上使用“分类”这个术语。
如果面向人的语言研究,词语分类尚不十分迫切的话,那么面向计算机的语言研究,词语的语法分类及其代码化几乎是不可缺少的。词语分类实际上是将最重要的语法知识与语法规则条理化,从而为自然语言的分析与生成提供最重要的线索。
划分词类的本质根据只能是词的语法功能。所谓词的语法功能主要是指:(1).和某个或某类词语组合的能力;(2).在句法结构中充当句法成分的能力。例如,考察具有如下语法功能的词。a.可以用作主谓结构中的谓语,但不能带真宾语。如“个子高,教室安静”中的“高,安静”是谓语。象“高三公分,安静了两天”中的数量短语“三公分,两天”是准宾语,而不是真宾语。b.可以受“很”一类程度副词修饰,如“很高,挺安静,特别雄伟”。c.可以作述补结构中的补语,如“洗干净,捆得结实”中的“干净、结实”是补语。d.直接或加“地”后作状中结构中的状语,如“迅速提高,安全地转移”中的“迅速、安全”是状语。e.直接或加“的”后作定中结构的定语,如“漂亮小姐,挺拔的山峰”中的“漂亮、挺拔”是定语。f.可以用a +“不”+? a 的形式提问,如“硬不硬,痛苦不痛苦”。g.后可接语所词“着呢”,如“美着呢,痛快着呢”。
可将这样的词归成一类,起个名字叫“形容词”,并且一个代码“a”表示。这样,如果判明了一个词具有上述功能,则可以将它归入形容词;反之,如果能从电子词典查得某个词的词类代码是“a”,则知它很可能具有上述语法功能,除非电子词典对其中某些词的某些语法功能另有更准确的描述。
参照上述语法功能,可以将形容词同其它词类区分开。如名词不具备上述功能中的b,c,d,f,g,一般地说,也不具备功能 a。同时名词的语法功能中也有一些是形容词所不具备的。划分汉语词类的本质依据就是这些语法功能的异同。
划分词类的本质依据只能是词的语法功能,词的意义不能作为划分词类的依据,这与划分词类的目的是紧密相关的,因为表示同类概念的词的语法功能并不一定相同。例如,“战争”与“打仗”指的是同一个概念,可是“战争”是名词,“打仗”是动词。汉语不象印欧语那样有丰富的形态,也不能根据形态给汉语的词语分类。在第1章描述的分类体系中,有一些词类(如代词、数词、拟声词和叹词)不是严格根据它们的语法功能分布划分出来的。这种情况不会给词类划分理论造成困难。以代词为例,它是根据一个词是否具有指代功能划分出来的,这实际上是语义范畴的功能。如果严格按功能划分,不妨细分为体词性代词(过去叫代名词)和谓词性代词。现在仍将它们归入一类,是为了同传统的说法衔
文档评论(0)