图书馆大数据模型.docxVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?

?

图书馆大数据模型

?

?

摘要:本文在对大数据定义与特点的基础上,重点对大数据在图书馆的应用进行了探讨。目前大数据的研究和应用仍处于一个起步阶段,图书馆作为信息资源收集整理及为社会提供信息服务的资源中心,在大数据研究、应用方面十分薄弱,在大数据的服务竞争中,图书馆如何发挥自身优势,突破技术劣势,为己所用是本文的讨论重点。

关键词:大数据;图书馆;知识服务

“大数据(BigData)”是继Web2.0之后和云计算一起被媒体最关注的词汇组合,并正在引起信息科技领域越来越多的关注热潮。IBM、EMC、Oracle、Microsoft等IT巨头几乎都已投身到了大数据的软硬件技术整合、大数据信息处理的技术供应研究开发之中,力求在新一轮的信息竞争环境中占据主动,并抢得战略先机与技术制高点。图书馆作为社会的知识信息服务中心,使得社会对图书馆所提供的服务要求更为苛刻,潜在的知识挖掘、知识评价、数据分析等增值服务需求已经开始显现。利用大数据技术去挖掘、识别、组织与分析隐含在读者行为中的结构化、半结构化数据信息,寻找他们的隐形诉求进而改进图书馆的服务,达到图书馆资源、服务与读者需求的双向理想控制已成为大数据时代图书馆提高服务体系的组织水平、推动行业发展与制度建设的捷径之一。

一、大数据概念

(一)大数据的定义

维基百科的定义是:“大数据(BigData),或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。”[1]也就是说,由于所涉及的数据规模巨大,以至于利用目前的主要软件工具,在可允许的时间范围内,达到查询检索、下载获取、加工处理、数据管理,并有效的整理成为对用户有用的数据资源已经变的非常困难。美国互联网中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据都是近几年产生的。大数据时代最大的转变就是人们放弃对事物因果关系的渴求,取而代之的是更加关注相关关系,对人类的认知方式和与世界交流的方式都提出了全新的挑战。在大数据时代,数据就是资产已经成为人们的共识。

(二)大数据的特点

分析员道格.莱尼(DougLaney)曾在麦塔集团(METAGroup,现为高德纳)的一份研究报告中指出大数据的三个特点:量(Volume,数据大小)、速(Velocity,数据输入输出的速度)与多变(Variety,多样性),合称“3V”。另外,以IDC为代表的业界认为满足“4V”(Volume、Velocity、Variety、Value,即种类多、流量大、容量大、价值高)指标的数据才可称为大数据。但无论是“3V”还是“4V”,其本质都是对大数据中的“大”的理解与阐释。

大数据的单条数据并无太多价值,但汇集庞大的单条数据集则蕴含着巨大的财富,将已有結构化(如关系型数据库、面向对象数据库中的数据),半结构化数据与非结构化数据(如文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等)进行融合和分析后,会挖掘出很多新的业务信息。

二、图书馆大数据

(一)图书馆的大数据类型

进行大数据分析首先要拥有大数据,图书馆本身拥有的大数据主要包括:

1.图书馆的数字化资源。经过数字图书馆的多年建设,图书馆拥有大量的数据库资源、电子书资源纸质图书电子化的数字资源,以及各种音频、视频资源,这些资源在总量上很大而且增长速度也比较快,它们是图书馆大数据的重要组成部分。[2]

2.社交网络时代出现的大量非结构化数据。在门户网站、有哪些信誉好的足球投注网站引擎时代之后,社交网络时代已经到来。随之而来产生了大量的非结构化数据,通过大数据分析技术可以将这些数据进行收集分析,得出读者的兴趣偏好。伴随着社交网络、移动图书馆、物联网等概念的兴起,今后来自读者的各种信息将越来越多,我们将在读者使用图书馆服务的过程中收集读者的地理位置、有哪些信誉好的足球投注网站历史、有哪些信誉好的足球投注网站时间等信息,这些很多是非结构化和半结构化的数据,挖掘读者偏好,为其提供最有用的信息。

3.读者使用历史所形成的非结构化数据。在图书馆里不管是各种数据库资源,还是纸质资源,以及各种学生的信息都是我们的大数据。但是这些并不是大数据的全部,只是其中的一部分。比如他们对于数据库的检索历史、浏览历史、数据使用方向及使用方法等信息。伴随着移动互联时代的到来,将从手机、平板电脑、笔记本等诸多移动终端中收集到读者的个人信息、方位信息、浏览信息等各种不同的数据,这才真正构成了图书馆完整的大数据采集。

(二)图书馆大数据的几个主要来源

1.RFID射频数据:RFID嵌入到图书馆相关资源中,实现资源的跟踪及分析。比如图书芯片和借阅卡芯片的相关数据,来优化图书布局和馆藏结构。什么资源使用的多,哪个时段流通更频繁,资源的处理效率如何等,都对图书馆资源的利

文档评论(0)

188****0089 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档