- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代高校数字档案资源管理研究.pdf
大数据时代高校数字档案资源管理研究★
石峻峰 周俐霞 樊泽恒 王丽
(南京航空航天大学档案馆,江苏南京210016)
摘要:高校在校园信息化过程中产生和积累的数据已经具备了大数据特征,从海量数据中提取出有价值的信息归
档保存和提供利用具有重要的意义。该文站在档案信患资源角度概述了大数据管理的必威体育精装版研究成果。从大数据4V
特征出发,分析了高校大数据来源的主要渠道,厘清数据与档案之间的关系,构建基于大数据生命周期管理模型。
文中从观念转变、组织协调、战略制定、数据采集、清洗、聚合等方面着手,做好数据管理和重要数据归档工作。
如何对大数据进行有效管理已经成为大数据发展的重要课题,高校尤其是档案部门作为主管历史记录和信息资源
的职能机构,更应抓住机遇,履行对数字档案资源管理的职能。
关键词:大数据;高校;数字档案;数据采集;聚合分析;数据归档;数据存储
【中图分类号】G40-057【文献标识码】A【论文编号】10∞—8∞7(2015)01—∞lp_06
引言
随着物联网、移动互联网、云计算等信息技术的飞速发展,整个社会已经迈入了大数据时代,
高校亦不例外。近年来,高校在人才培养、科学研究及社会服务过程中产生的数据以指数级的速
度增长,这些数据体量巨大、种类多样,给高校管理部门,尤其是作为主管历史记录和信息资源
的档案部门带来了挑战,传统的数字档案管理模式和方法已经无法适应大数据管理要求。如何从
纷繁复杂的海量数据中提取出有价值的信息归档存储,并确保若干年后都能被有效地读取和利用,
这将成为档案部门无法规避的责任。面对大数据的挑战,高校档案部门应站在数据资源角度积极
应对,转变工作方式和思路,掌握大数据相关技术,迎接大数据的曙光。
201
的专题研究报告指出:数据是一种生产资料,大数据是下一个创新、竞争、生产力提高的前沿,
可以为世界经济创造重要价值,提高企业和公共部门的生产率和竞争力,并为消费者创造大量的
经济剩余。2011年世界经济论坛发布报告认定大数据为新财富,价值堪比石油。关于大数据概念,
众说纷纭。麦肯锡川定义:大数据是指无法在一定时间内用传统数据库软件工具对其内容进行采
式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[21。
IDC(IntemetDataCenter,即互联网数据中心)定义:满足种类多、流量大、容量大、价值高的
数据称为大数据。虽然对于大数据IT界各持己见,目前还未有一个明确的权威定义,但都力图
19
万方数据
XEF妇隘
一个V,因为各个国家制定的大数据战略其主要目的也是为了实现数据的价值。除了上述4V外,
和Vicinity(邻近性)特征[61。
从大数据特征来考量,作为信息资源的最终“栖息地”,档案馆需要管理的数字档案资源在
目前已经具有了大数据特征[71。王兰成、刘晓亮[8】认为网上各类档案大数据信息正成为开发和利
用的新型资源,探讨大数据知识挖掘相关技术问题,为开展网上数字档案大数据的分析挖掘提供
了启示与参考。周枫【9】从档案馆资源维度出发,认为在大数据时代数字档案已经具有一定的大数
据特征,一是档案馆数据资源总量庞大且增长迅速,二是数据资源种类繁杂,结构多样。张倩[10】
深入分析“大数据”技术的内核要义、技术特性和发展走势,探究“大数据”技术对高校档案信
息服务的应用价值,提出运用“大数据”技术创新高校档案智能信息服务的策略与方法。综上所
述,由于大数据一方面涉及很多专业技术知识,是多种学科的交叉整合;另一方面,大数据概念
新颖,相关技术还在不断发展,一些专家和学者对大数据仍处于初步探讨阶段,介绍了一些大数
据的基本概念、特征和相关技术,依然缺乏系统理论和实证研究。
二高校大数据来源
在大数据背景下,高校学生的学籍、选课、成绩、借书、上网、论坛、微博以及教师的基本
信息、上课课件和视频、远程教育课程等都会产生大量数据,同时还有设备、机房和图书信息等
也会产生大量数据【11】。除了在人才培养方面会产生大量数据外,高校管理活动、科学研究、社会
服务等方面都会产生大量数据,这些数据体量巨大,结构多样,来源分布较广,明显具备了大数
据特征。以南京航空航天大学(简称南航)为例,分析数据来源的主要渠道:(1)各类网站。南
航现有1个学校主页站点,46
文档评论(0)