Web数据挖掘技术在数字图书馆中应用探究.docVIP

下载本文档

4
0
约4.31千字
约 9页
2017-09-19 发布于福建
举报
版权申诉

Web数据挖掘技术在数字图书馆中应用探究.doc

1、本文档共9页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Web数据挖掘技术在数字图书馆中应用探究

Web数据挖掘技术在数字图书馆中应用探究摘要：随着信息技术的高速发展，人们积累的数据量也急剧增加，Web数据挖掘技术作为处理数据的专项技术，其优越性能在许多领域都有所体现。针对Web数据挖掘技术在数字图书馆中的应用进行研究，分别从Web数据挖掘的难点、XML在Web数据挖掘中的应用以及Web数据挖掘技术在数字图书馆个性化服务中的应用三个方面展开分析，以促进Web数据挖掘技术的不断完善，使它能够为数字图书馆提供更好的服务。关键词：XML；Web；数据库；数据挖掘；数字图书馆中图分类号：TP391文献标识码：A文章编号：1672-7800（2013）001-0131-03 0引言信息时代带动了网络技术的高速发展，随着人们对数据知识量需求的增大，图书馆的功能也逐渐趋向于多元化，数字图书馆是一种建立在传统图书馆基础上的信息环境。图书馆的信息化及网络化使得图书馆可以将知识和信息进行分布式储存，它除了具备传统图书馆的功能外还能向用户提供各种智能化的访问服务。分布数据存储是利用站点的存储功能，将数据信息储存在多个站点当中，用户只需利用网络的有哪些信誉好的足球投注网站功能就能实现信息的有哪些信誉好的足球投注网站。网络数据挖掘就是根据人们对网络信息服务需求的原理制作而成，它能为用户快速提供网络信息检索及信息服务等。 1Web数据挖掘的难点 1.1Web信息量大且更新迅速数据仓库中的数据相对其它数据而言更加稳定，随着网页信息容量的不断增大，信息的更新速度使得有哪些信誉好的足球投注网站引擎无法发挥其功能。尽管有哪些信誉好的足球投注网站引擎的规模在不断扩大，但仍无法适应网页的更新速度，在信息的跟踪、管理和收集上都存在一定的局限性。虽然网络带宽也在逐渐扩大，相关处理技术也不断更新，但在网页有哪些信誉好的足球投注网站引擎方面仍达不到快速、全面的要求，相对特定用户而言，绝大部分网络信息都属于垃圾信息，因此，对网页的数据挖掘应根据用户需求设定一个范围。 1.2Web信息获取困难早期的网页信息多以HTML文件的形式存在，简单的HTML文件使得Web挖掘工具能够轻而易举地获取到信息，且Web站点并未设置相关防护措施。随着数据库技术和语言的不断拓展，网络页面信息也从静态发展成动态，大部分信息和数据都是直接从数据库中调用，因此，网页抓取工具对网页的访问受到了限制。另外，还有部分站点可以对网页抓取工具进行分辨，一旦被认定为不友好的访问即禁止该工具的访问权限或转向其它页面。 1.3异构数据库环境相对数据仓库而言，可以将Web看成一个信息复杂且容量巨大的大型数据库，网页上的一个站点就相当于一个数据源，站点与站点之间的组织方式和信息各不相同，因此，Web就成了一个容量巨大的异构数据库环境。根据用户需求可对本地数据库的数据来源进行设置，但Web上的数据来源则无法实现统一，若要挖掘Web上的数据，首先应解决站点之间异构数据库环境的集成问题，只有集成站点数据才能统一数据来源。 2XML在Web数据挖掘中的应用 2.1实现异构数据的集成管理 XML是一种数据模型，它具有结构性，因而用户很容易就能将其与关系数据库的属性相互对应，所以在模型的查询和抽取方面都能进行精确的记录。针对站点之间的组织方式和信息的不同，XML都可以有效地解决，即使数据不具备结构性也不处于同一站点，XML也能将其规范到一个统一的数据库上。在中间层的服务处理器上安装软件代理，使得数据可以在后端数据库上集成。 2.2将大部分处理负载从Web服务器转到Web客户端无论是在数据挖掘过程中还是在Web挖掘过程中，数据处理都是一个很重要的环节。服务器端是对数据进行预处理的主要部分，其开发环境是参照传统的C/S模式，根据客户向服务器发送的请求，服务器进行处理后给予不同的响应，大量的数据处理使得服务器的负荷不断加重，同时也增加了网络管理者的工作量。显然，这种处理方式只适合简单的用户需求，一旦用户需求繁杂而多变，服务器端就可能陷入瘫痪状态。XML可让客户端根据自身需求选择相应的程序，用户在接收数据的同时，系统也解析了数据的含义与结构，使得分布式计算在图书馆中的运用成为可能。 2.3促进数据交换在Web数据挖掘中，结构不同的数据源之间通常需要传递业务数据，基于XML的数据自带描述功能，不需要借助系统内部的描述就能完成数据的交换与处理。借助XML用户对本地数据的计算和处理就更为简便，将数据用XML格式发送给用户，用户通过应用软件解析数据即可实现对数据的编辑和再处理。不同的数据具有不同的传递标准，而XML并没有具体的数据传递规范，因而XML具有自动理解功能。 2.4需要Web智能代理根据个人用户的需求裁减信息内容传统的HTML主要是通过对数据的外观进行描述，XML则是通过对数据的类别进行描述。XML具有选择数