- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据时代信息文献资源共建共享创新和发展
大数据时代信息文献资源共建共享创新和发展 [摘 要] 大数据时代下,电子书刊等电子资源的积累、云计算和社交网络等信息技术的发展、高速网络和智能手机的普及,为信息文献资源提供了广泛的数据来源。如何更好地管理、利用大数据成为现今的热点话题。本文首先介绍了大数据的特征、概念和应用情况;然后以我省为例讲述信息文献资源共建共享目前的情况为例;最后,以经典案例为契机,探讨了大数据时代下信息文献资源共建共享的创新模式。
[关键词] 大数据;信息文献资源;共建共享
[中图分类号] G250 [文献标识码] A 文章编号:1671-0037(2014)-48-1.5
1 引言
随着博客、社交网路、物联网等新型技术的兴起,大数据时代的到来,学术界、工业界、政府机构都开始关注大数据问题。2008年,《Nature》推出了Big Data专刊。
2 大数据的特征、概念及应用
大数据不仅仅指数据量的庞大和数据规模的庞大,依据大数据所具有的规模性、多样性、高速性、价值性、真实性等特征,大数据具有3V和4V定义,维基百科对大数据的定义[1]为:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过了可容忍时间的数据集。
大数据的典型应用有:科学计算、金融、社会网络、移动数据、网络数据、多媒体等,其中所用数据量均在GB级以上,大数据给人们带来便利的同时也给传统的数据管理方式带来了极大的挑战,详见表1。
目前,大数据的处理以云计算为基础,有流处理和批处理[2]两种模式。表1给出了大数据集成、大数据分析、大数据隐私、大数据能耗、大数据处理与硬件的协同问题、大数据管理的易用性、性能的测试基准等大数据目前所面临的问题及其子问题。
3 信息文献资源共建共享的现状
以河南省高等教育文献保障系统(HALIS)为例,HALIS以中国教育科研网(CERNET)为依托,配合CALIS,联合河南省各高校图书馆,实现了全省高校信息文献资源的有效开发和利用;黄河金三角“示范区”[3]中的6所高校,建立学校联盟,调配资源,优势互补,逐步推进区域性资源共建共享。
表2描述了以HALIS为平台,高校图书馆对超星电子图书、电子版《四库全书》、CSSCI数据库、CCC数据库、中文科技期刊数据库的订购情况,最高的是超星电子图书96.67%,而最低的CCC数据库只有36.67%,可见,河南省高校图书馆的共建共享服务情况并不理想。
4 大数据时代下信息文献资源共建共享创新发展
大数据对信息文献资源的冲击不可避免,本文以数据这项基础性资源为出发点,分别从大数据时代下信息文献资源共建共享创新层面、创建虚拟图书共建共享社区、创建区域性总分馆模式三个方面对大数据时代下信息文献资源共建共享创新方法进行阐述。
4.1 大数据时代下信息文献资源共建共享创新层面
本节从管理层次、技术层次、人员建设、服务模式四个层面对大数据时代下的信息文献资源共建共享进行简单的分析。
大数据建设是一项系统工程,需具备良好的运作机制:
4.1.1 在管理层次,应完善数据管理措施,建立数据管理部门,负责数据的获取、管理、使用、分析、协调等工作,如美国的MIT、康奈尔大学图书馆成了专门的“研究数据管理服务工作组(RDMSG)”,负责如元数据标准、数据重用、数据共享、处理数据版权等数据管理工作。
4.1.2 大数据技术是解决大数据问题的核心,搭建合理的大数据技术架构是基础性同时也是全局性工作。大数据架构,自底向上,第一层即底层是大数据的采集工作,即对结构化、半结构化、非结构化数据、科学数据、课件、数据库、论文、邮件、社交网络、微博等的处理;大数据架构的第二层是大数据的存储工作,可以采用云存储、NoSQL、Hadoop、HDFS、Mapduce、HBASE等技术;大数据架构的第三层是大数据处理工作,即大数据的集成、数据抽取、数据建模、重复数据删除、聚合与关联、网格计算、数据加密、数据容灾等工作;大数据架构的第四层即大数据的应用,包括信息检索、资源发现、数据挖掘、数据可视化、相关应用软件、推荐服务、学科化服务、知识服务等。
4.1.3 在人员建设上,应具有一批懂技术、通管理的人员队伍。美国国家科学委员会(NSB)提出的“数据科学家(Data Scientist)”中,包含学科专家、信息科学家、数据处理员、计算机科学家、图书馆员等。
4.1.4 由于信息已经从“纸质”向“数字”进行转变,原有的服务方式、模式也应当做适当的调整。首先,应当收集、整理、编辑数据,其次,应当对信息进行分析、认知、推理,然后,发现、获取、应用知识,最后,对知识进行积累、预见形成智慧(Wisdom),通过这四层对信息的处理模式,最终将有效的信息提供
您可能关注的文档
最近下载
- 小学二年级上册道德与法制 道法 备课 学历案.docx VIP
- 基于“双高”背景下高职院校一流师资队伍建设的思考-来源:现代职业教育(高职高专)(第2020030期)-山西教育教辅传媒集团有限责任公司.pdf VIP
- DG_TJ08-2062-2017:住宅工程套内质量验收规范.pdf VIP
- 第二届全国数字化机房安装技能竞赛(电气设备安装工赛项)考试题库资料-下(多选、判断题汇总).pdf
- 北京-威旺M20-产品使用说明书-威旺M20 A12-BJ6443V4SMB-M20使用说明书V22015-01-29.pdf
- 春花秋月何时了G调正谱.pdf
- 急性心肌梗死及PCI术d 护理查房ppt课件.ppt
- 颅内压增高与治疗培训ppt课件.pptx VIP
- 公司关于“精益管理年”宣传工作的方案.pdf VIP
- 钻孔灌注桩试桩技术要求.docx
文档评论(0)