- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
智能算法在图书管理系统中的应用
智能算法在图书管理系统中的应用研究
[摘 要] 智能算法在管理大型数据库及挖掘其中有效知识方面具有良好的性能,因此,众多研究人员将该类算法引入到提升图书管理系统性能的研究中。本文将介绍几类基于关联分析技术和基于聚类分析技术的智能算法,并展望未来智能算法在图书管理系统中的应用前景。
[关键词] 智能算法 图书管理系统 关联分析 聚类分析
1.引言
随着图书馆馆藏资源的不断增加,图书馆资源管理的难度也不断加剧。从上世纪八十年代图书馆管理的自动化变革开始到如今大多数图书馆自动化管理系统的使用时间均已超过15年。在15年间产生的各类历史数据如资源有哪些信誉好的足球投注网站记录、读者借阅记录、图书采购记录等,已变成一笔宝贵的财富,然而,受到现有管理系统功能的限制,这些数据仅能作简单的存储及查询,其无法进行开发利用。在对图书管理系统的多年开发和研究中,人们发现各类智能算法的数据挖掘能力将能够大大提升图书管理系统的管理能力及对数据的利用深度。本文将概括介绍近年来提到的一些智能算法在图书管理系统中的应用实例,并展望智能算法在图书管理系统中的应用前景。
2.智能算法在图书管理系统中的应用
智能算法是指在各类复杂问题中,能够从大量复杂、模糊、随机的应用数据中找出数据产生规律,并对其进行自我启发式优化的计算机算法。通过智能算法从各类大型管理系统的数据库中挖掘出来的规律和知识可以用在查询响应、决策支持、信息管理等许多方面。通过研究人员多年的研究,该类算法在图书馆系统中的应用研究已取得一定成果,本部分将着重介绍几类经常被提到的算法利用方式及实验效果。
2.1 关联分析算法
关联规则挖掘技术由r.agrawal于1993年提出,其强大的数据挖掘能力,在金融业、工业领域及图书管理系统等大型数据库中得到充分运用[1]。
关联规则分析技术算法的主要思想是首先寻找给定数据集中的频繁项集,然后通过频繁项集生产强关联规则[2]。在针对图书管理系统的应用研究中,其主要包含三个步骤:第一步:将相关读者数据经过预处理形成读者数据事务库;第二步,迭代识别事务数据库中所有支持度不低于用户设定阀值min_sup的频繁项集;第二步,在频繁项集中构造所有满足最小置信度阀值min_conf的关联规则,得到相应的读者行为规律。算法的复杂度主要受到项数、事务数、事务平均宽度等因素限制,因此在实际应用中存在以下缺陷:频繁扫描数据库、不适用于稠密集的关联规则挖掘、可能生成的关联规则过于庞大等。针对这些缺陷,近年来不少学者提出了改进策略,如基于逆向运算的优化策略、基于哈希表的优化策略、基于划分的优化策略等[3]。在关于将关联分析算法应用到图书管理系统的研究中,主要包括以下几类:
(1)2009年鲍静提出了一类基于数据预处理技术和经典关联分析方法apriori算法的读者借阅挖掘工具,并利用该工具对安徽省图书馆图书流通数据进行关联挖掘,仿真实验结果表明,通过引入兴趣度对挖掘出的关联规则进行分析,证明该读者借阅挖掘工具可以实现对读者兴趣度的分析,从而帮助图书馆馆员为读者提供个性化服务[4];
(2)2010年陈康提出利用改进的eclat算法设计图书推荐系统,该改进算法源自zaki提出的一种比较典型的深度优先有哪些信誉好的足球投注网站和交叉计数的频繁模式挖掘算法。改进算法充分利用了垂直数据表示和交叉技术的高效优势,直接在垂直数据表示的数据集上通过广度优先有哪些信誉好的足球投注网站和交叉计数产生频繁项集。仿真实验结果表明该算法可以在大数据量的情况下实现关联规则的高效挖掘,产生的知识库在图书推荐系统中取得了良好的应用效果[5];
(3)2011年林郎蝶、王灿辉提出了一类基于划分优化策略的改进apriori算法——l-apriori算法,该算法利用《中国图书馆分类法》将图书按分类号信息进行分类形成子图书馆,算法首先在各子图书馆中进行关联规则的挖掘,再将所挖掘到的关联规则进行整合,从而得到最终的挖掘结果[3]。该算法的优势在于通过划分优化后,l-apriori算法的空间复杂度仅为apriori算法的1/n,其中n为子图书馆的个数。
2.2 聚类分析算法
聚类分析(cluster analysis)是数据挖掘技术中的一种典型方法,该类算法可在要划分的类未知的情况下,将数据对象分组成不同的类。聚类的基本方法在建立基于分析对象的数据矩阵或相异度矩阵中,通过计算对象之间的距离来衡量对象之间的相似性或相异性,从而对数据对象进行分类。由于该技术仿真了一个无监督的学习过程,因此被广泛应用于各类大型数据库中。现有的聚类技术种类很多,主要有层次方法、划分方法、基于密度的方法、基于网格的方法、基于模型的方法等[2]。目前,在针对图书管理系统的研发中,研究人员尝试将多种基于聚类分析技术的算法使用在图书管理系统中,并在仿真实验中取得了一些成果。下面内容将具体介绍几类算法。
(1
文档评论(0)