- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第18卷第1期模式识别与人工智能V01.18No.1
2005年2月PRAIFeb2005
文本挖掘研究进展*
谌志群张国煊
(杭州电子科技大学计算机学院杭州310018)
摘要文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在
有用的模式的过程.本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖
掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的
分类与实现技术;最后介绍了几个文本挖掘产品.
关键词文本挖掘,数据挖掘,文本知识发现,自然语言处理,关联规则,文本聚类,趋势分析
中图法分类号TP391
AofText
SurveyMining
CHENGUO—Xuan
Zhi—Qun,ZHANG
(SchoolDianzi310018)
ofComputerScience,HangzhouUniversity,Hangzhou
ABSTRACT
as
Textknowntextdataortext
mining,alsominingknowledgediscovery,meansdiscovering
unknown,andusefulinamountsoftext.Inthis
implicit,previouslypotentiallypatternslarge
textisfirstintroduceditscharacteristics,andthe
miningdefinition,
paper,theincluding
withotherresearchfieldssuchasdata
relationshipmining,information
characteristics
etc.Then,textmodels,textextracting
extraction,computationallinguisticsmining
andintermediateandtheoftextclassificationand
forms,
representationtechnologymining’S
realizationaretextare
ofintroduced.
presented.Finally,someproductsmining
文档评论(0)