信息处理用现代汉语词类及标记集.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息处理用现代汉语词类及标记集.doc

信息处理用现代汉语词类及标记集 一、基本标记集 目前设想的词类标记集包括以下25个标记: {T,S,F,M,Q,B,R,V,A,Z,D,P,C,U,O,E,H,K,G,X,I,L,J,W} 下面用一些具体的例子对每个标记进行说明: 1.N:名词,如人、山、书、导演、历史、心胸、中国、人口 NP:专有名词,如:中国、孙中山 NPF:人名 NPFF:姓 NPFS:名 NPL:地名 NPU:组织机构名 N0:非量名词,如车辆 2.T:时间词,如:今天、春节、宋朝、现在、春天、刚才、中旬 3.S:处所词,如:近郊、两侧、空中、高处、隔壁 4.F:方位词,如:上、下、前、后、左、右、东、西、南、北、里边、中间、外头、之后 FS:单纯方位词,如:上、下、左、右 FC:合成方位词,如:前面、中间、之后 5.M:数词,如:一、第一、百、零、百万、俩 MI:序列词,如:甲、乙、丙、丁 6.Q:量词,如:个、群、克、把、次、种、些、人次 QN:名量词 QV:动量词 7.B:区别词,如:男、女、金、银、慢性、微型、初级 8.R:代词,如:你、我、他们、这、那儿、哪儿、谁 9.V:动词,如:是、研究、跑、应该、想、进来、支持 VG:一般动词(非谓语中心动词且不带宾) VGO:谓语中心动词且不带宾 VGN:带名宾 VGV:带动宾 VGA:带形宾 VGS:带小句宾 VGD:带双宾 CGJ:带兼语 VA:助动词 VQ:趋向动词 VI:系动词 VY:是 VH:有 10.A:形容词,如:好、红、勇敢、危险、漂亮、突然 11.Z:状态词,如:亮堂堂、白花花、殷红、灰不溜秋 12.D:副词,如:不、很、都、忽然、最、刚刚 13.P:介词,如:以、于、对于、关于 PBA:把(将) PBEL:被(让、叫) PZAL:在 14.C:连词,如:和、跟、与、而且、或者、虽然、但是、只要、因为、否则 15.U:助词,如:的、地、得、了、着、过、所、呢、吗、啦、罢、了、之 US:结构助词 USDE:的 USDI:地 USDF:得 USSU:所 UT:时态助词 UTL:了 UTZ:着 UTG:过 UY:语气助词,如:了、的、呢、吗、罢了、啊 UYE:用在句末 UYL:同现语气词左部 UYR:同现语气词右部 16.O:拟声词,如:哗啦、唧哩咕咚、扑通通、滴答、轰轰 17.E:叹词,如:唉、哎呀、嗯、哼、喂 18.H:前接成分(前缀),如:老、阿、反、超、自、子 19.K:后接成分(后缀),如:儿、子、性、论、界 20.G:语素,如:柿、遥、抒、济、语 21.X:非语素词,如:琵、琶、葡、萄 22.I:成语,如:海市蜃楼、守株待兔 23.L:习用语,如:总而言之 24.J:简称略语,如:语委、人大、奥运会 25.W:标点符号 二、词类标记集中主要词类的分布特征描述 下面我们分别对标记集中属于词的那些标记(不包括比词大或比词小的单位)作分布特征方面的描述,在描述时句法成分功能在前,短语组合功能在后。 1.名词N: ⑴ 名词用来充当主语、宾语。 ⑵ 名词不能作状语 N+“地”作状语不视为名词作状语。如:“他本能地向后退了一步”,“深情地看了看他”,“我们要历史地看问题”。有极少数名词可以直接作状语,如“重点、集体、武装”等,这部分名词视为与副词兼类。 ⑶ 名词能直接作“有”的宾语 ⑷ 除非量名词之外名词能用数量词(组)修饰。少数名词不能受数量词(组)修饰,如:“大海、腹部、真空、源泉、词汇、笔者”等;极少数名词可以直接受数词修饰,如:“三兄妹”中的“兄妹”。 ⑸ 不能用“不、很”等副词修饰。 ⑹ 名词可以直接修饰名词,如:“人民中国”、“玻璃杯子”等。 ⑺ 名词有下面两个附类: ① 专有名词(NP):专有名词指人和事物的名称,包括人名(NPF)、地名(NPL)、机构名(NPV)等,专有名词一般不能用量词修饰。人名姓(NPFF)、人名名(NPSS)。 ② 非量名词(N0):不能用数量词修饰的名词。如车辆等。 2.时间词T:时间词是从名词中分化出来的词。 ⑴ 时间词可以充当主、宾、定、状语。除专有时间词(如:“宋朝”)不能作状语外,一般时间作状语很自由,如:“他明天离开这里”。 ⑵ 时间词能受数量词修饰。 ⑶ 时间词不能用否定副词修饰。 ⑷ 时间词能和介词组合。如“从现在开始”、“到明天为止”等。 ⑸ 普通时间词能修饰动词。如“他明天离开这里”、“他昨天谈起这件事”等。 ⑹ 可用“这(个)时候”、“那(个)时候”、“什么时候”指代。 3.处所词S: 处所词是从名词中分

文档评论(0)

书屋 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档