Web文本挖掘浅析.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《现代图书情报技术》2∞2年第6期信息检索技术总第97期

Web文本挖掘浅析

乇连军

(南京大学信息管理系南京210093)

【摘要】酋先If论web挖掘与w“信息检索的关系,然后重点分析w“文本挖掘,并提出web文本挖掘的力法.包括

冀奉特符表示、复本舟类和文本聚类。最后.楗出r和j用web挖搋技术实现web智能化服务和粒掘融擎的直甩。

5075G3弛

【关键词】web义奉挖掘文本分类文本聚类信息检索【分类号】G2

AnonWeb—BasedText

AnalysisMining

wangLianju“

210093,(、^fn)

(nP芦“一mP”f∥J,∥orm耐i伽^缸n。gPmPnf,Ⅳ“”加gU”iP柙i础,Ⅳdj却g

betweenweb—ba8edandinf。rmatlonweredl$cusscd,and

【Abstract】Th㈣Iatlonshipsnlini“gretrlevlng

o{Web—basedtextweTeonincludedcboicesoftextchaTacl}rs,忙xt

waysnnmngputemphasls.Theseways

textofWeb—basedtextwereoffered.

classlflca“onandclusterl“g.Finally,twoappIicationsmining

webTextTextclas51ficatlonTextInformation

【K。ywords】mini“gclusteri“gre”1evmg

在海量、异质的Web信息资源中,蕴含着具有巨大潜在语言学、信息学等多个领域。不同研究者从自身的领域出发,

价值的知识。人们迫切需要能够从web上快速、有效地发现对web挖掘的古义有着不同的理解.项目开发也各有其侧重

资源和知识的工具。信息检索界开发了许多有哪些信誉好的足球投注网站引擎.但是,点。从更为一般的角度出发,web挖掘可以被定义为:利用知

由于网络信息的爆炸式增长t其覆盖率有限.查全率低;同时t

一般的有哪些信誉好的足球投注网站引擎都是基于全文的检索,不能达到赋词标引的超级文本组成的万维网中发现知识,提供高精度和大覆盖面

效果,因此查准率较低。再者,绝大多数有哪些信誉好的足球投注网站引擎智能化水平有哪些信誉好的足球投注网站索引,改善Internet信息有哪些信誉好的足球投注网站效果的技术和方法的总称。

低,不能有效地提供个性化用户服务。最重要的一点是,有哪些信誉好的足球投注网站其目的是实现对web存取模式、web结构、规则和动态、web

内容的查找。根据其目的和对象的不同.web挖掘可以分为:

引擎的目的在于定位web上的资源,就web上的知识发现

而言,有哪些信誉好的足球投注网站引擎不能够胜任。为此,有必要开发比信息检索层web内容挖掘、web结构挖掘和web访问模式挖掘。

次更高的新技术。为了从海量数据中发现有效、新颖、潜在有web挖掘从数据挖掘发展而来.因此其定义与我们熟知

用、可最终理解的模式,数据库领域引入r数据挖掘(Data的数据挖掘定义相类似。但是tweb挖掘与传统的数据挖掘

Mlnlng)。但是,数据挖掘的主要对象是结构化的数据仓库

相比有许多独

您可能关注的文档

文档评论(0)

133****9720 + 关注
实名认证
内容提供者

物业管理师证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年04月23日上传了物业管理师证

1亿VIP精品文档

相关文档