- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
?
?
依托“大数据”技术,再现“读书系列活动”魅力
?
?
黄海云袁立强靳红张屹牛晓艳刘平
1?引言
随着信息技术的飞速发展和知识的大量累积,大数据技术得到广泛应用,图书馆传统的服务内容和服务方式已不能满足新时代的需求,需要不断创新来寻找更有效的服务途径。大学生,尤其是新生面对海量的图书,需要更精准的阅读指导。为此,河北科技大学图书馆(以下简称“我馆”)依托大数据技术进行了一系列有效尝试。根据十年来开展读书系列活动的经验,我馆不断完善活动形式与内容,并分析读者的借阅数据和借阅习惯,开发了读者兴趣预测软件,筛選出有共同爱好的读者群,有针对性地开展活动和推荐书目,从而吸引了更广泛的读者关注和参与。
近十年来,我馆陆续开展了“好书月月谈”“名家讲座”“文化之旅”“好书推荐”等系列活动,从历年的活动经验中发现,虽然开展的阅读推广与辅导活动不断更新,但仍存在着很多“局限性”,例如:参与活动的读者缺乏广泛的代表性;聘请专家、学者进行讲课和交流会受到时间、地点等因素的制约;陈旧的活动形式,使读者的积极性逐渐淡化,以点带面的作用不大,因此难以实现图书馆服务和读者需求有效的衔接。这就迫切需要图书馆工作人员创新工作思路,不断更新活动方式。我馆在这一背[LL]景下,利用贝叶斯网络技术预测读者的需求,为读者借阅提供更精确的指导;针对有共同爱好的读者群体开展相应的活动,提升读者阅读兴趣;秉承从读者的需求出发,再服务到读者中去的理念,提高阅读推广服务水平,培养读者的读书习惯;把读书活动方式从被动服务逐步转变到有针对性的主动服务上去,提升服务效能。
2?案例背景
随着读者信息需求水平的提高,我馆开展的阅读推广与辅导活动已不能满足不同类型的读者需求,必须从大数据技术入手,从海量数据中挖掘出有价值的信息来提高服务水平。我馆通过分析历年借阅数据和读者信息数据,开发了读者兴趣预测软件,预测出“阅读倾向”相同的读者群体,结合馆藏图书资源,分批分类地精准推送读者所需的书籍,并且有针对性地对这些群体开展他们喜闻乐见的读书系列活动。
3?实施步骤
3.1?整合读者信息和借阅数据
数据来源于我馆2011-2017年度读者的个人信息和借阅记录信息。其中,读者个人信息包括:借书证ID、性别、所属院系、办证时间、读者类别;借阅记录包括:图书的馆藏信息、读者类型信息、所借书号、借还书日期等。通过整合出有用信息,为开发软件做好充分的前期准备工作。
3.2?统计分析相关数据
(1)首先对河北科技大学男女读者各类图书的人均借阅次数统计。从统计结果可知,男性读者对于数理化和工技类等方面书籍平均借阅量明显高于女性,而对于语言、文学、艺术、史地类书籍则是女性读者平均借阅量要高于男性读者。
(2)对各个学院所借各类书籍的人均借阅量进行对比统计。结果发现所有学院的读者借阅语言、文学类图书都比较多;除了影视、外语、文法、艺术等几个学院外,其他学院借阅数理化方面的图书也比较多;理学院的学生对于哲学和经济类图书也很感兴趣,而影视和艺术学院对于文学类图书的兴趣没有理科学生的兴趣高。
(3)对各类读者的人均借阅次数做了统计。从统计结果看,本科生借阅量最大,理工学院和研究生借阅量相对较少;理工学院的读者对于数理化方面的图书借阅兴趣不高,而对于文学和工技类的图书借阅量稍高些;研究生对于工程技术类图书借阅量最多。
(4)最后对不同年级的读者借阅各类书籍的人均借阅次数统计。发现大一、大三学生借阅量相对小,大四和准备考研的学生借阅量比较大。各届学生对于文学类图书借阅仍然是最多的。利用这些数据开发出能预测有共同爱好的读者群体,是我们开发软件的初衷。
3.3?开发和使用软件
以上述统计出来的数据作为训练集,训练贝叶斯软件模型,编制出预测行为软件,把读者兴趣预测软件安装在体验机上,读者输入四个选项的信息,就会弹出该生预借的图书类别比例。
4?活动效果
图书馆工作人员统计出有共同偏好的读者,对他们有针对性地开展活动。我们根据统计出来的数据信息开展了两期阅读推广活动:一期是以“科幻”为主题,围绕作者刘慈欣的作品展开评论;另一期是以“明史”为主题,以时间为轴线展开讨论。因为参加者有相同的爱好,所以发言踊跃,各抒己见,达到了理想的预期效果,同时借阅量也有了明显的提升。经过多年不断的创新、探索,终于有了“破茧成蝶”的发展。从统计表1来看,很多相关种类的书籍,月平均借阅量呈现总体上升的趋势。
5?总结
目前我们开发的预测软件可以挖掘不同专业、性别、年级和不同类型的读者对于各类书籍的借阅偏好。图1是我们对于目前咨询软件的一个改进思路:全贝叶斯网络A可以根据读者个人信息推导出书籍的借阅概率。分层贝叶斯网络B可根据读者的查询词集及同义词推导出书籍的
借阅概率。两者结合可实现更精准的借阅咨询。
?
-全文完-
文档评论(0)