- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉语句子谓语中心词的自动识别
中文信息学报
PROCESSINGV01.17No.2
OFCHINESEINFORMATION
第17卷第2期J0uRNAL
文章编号:1003—0077(2003)02—0007—07
汉语句子谓语中心词的自动识别
龚小谨,罗振声,骆卫华
(清华大学人文学院计算语言学研究室,北京100084)
摘要:谓语中心词的识别是句法成分分析中的一十非常重要的部分。本文提出了一种规则和特征学习相
结合的谓语识别方法,将整个谓语识别的过程分为语片捆绑、谓语粗筛选和谓语精雌进三个阶段。在谓语粗
筛选中.利用规则过滤掉明显不能充当谓语的词,得到一个准谓语集;在精筛选阶段,选择请语的支持特征,根
据统计计鼻得到每个特征时谓语的支持度,然后利用准谓语在句子中的上下文出现的特征对准谓语集中的
词进行再农筛选,从而确定出句子曲谓语中心词。经过潮试表明。读方法是有效可行的。
美■词:计算机应用;中文信怠处理;谓语中·o词的识jq;基于规劓;特征遗择;粗筛选;精筛选
中冒分类号:TP391.4 文献标识码:A
thePredicateHeadofChineseSentences
Recognizing
GONGXiao-jin,LUOZhen-sheng,LUOWei-hua
(SchoolofHumamtie≈蒯Societies
Sci∽e,TsitlghuaUmverdty,删吣100084.C妇)
the headisan ofthe of
Abstract:RecognizingpIedi瑚te importantpart syntacticanalysisChinese麓men。曲.T}lis
pa.
per anevlr t0 the head nde-besedmethodwith
presentsapp工0且chre∞gnizepredicateautcrnaticaUy,which∞mbin话a
a
multi—featttre-basedmethod.Theof isbrokenintothree
processm∞尊Iizing subpttx-ms:pI耳m)c髑。coarse-filter
andflne-filter.Weusearule-basedmethodtOfilterthe that bethe of
may a链n锄ce.Inthe
qtmsi-predicate p∞dlcate
select
fine—filter.we diversityoffeattrresstatistic,then real
and∞lTlpllteagreat by u∞thesefeaturestOM∞咖the
of of
this∞t∞ce.ThereaultexOerimentsindicatesthat infeasibleandadvanced,
predicate this印田∞cll
Keyw埘血:oomputerapplication;ChineseinformationpID睫鼙in鲋re∞gni髭thepredica
文档评论(0)