网络信息资源保存研究.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

网络信息资源保存研究

作者:杨威

来源:《企业文化·中旬刊》2012年第09期

【摘要】本文根據目前网络信息资源存在的流失现状,分析网络信息资源保存的需求,

提出了保存网络信息的措施及其实现方法。

【关键词】网络资源;信息资源;信息保存

随着计算机技术和信息通信技术的飞速发展,网络已成为现代社会的重要组成部分,人们

时时刻刻都在网络上发布、浏览、查询信息。这种信息的形式是多样的,内容是复杂的,容量

是庞大的。这些信息是文化的痕迹,在一定时间间隔内它的价值是不可估量的。但由于网络信

息的动态性特点,这种信息的生命周期却是十分短暂的,据相关机构统计,一个网页的平均生

命周期仅有44天,如何高质高效安全稳定的保留这些具有潜在价值的网络信息已经越来越受

到国内外相关领域的重视。

一、网络信息资源保存的需求分析

网络信息虽然形式多样、内容繁杂,但它仍是一种数字信息,同数字信息一样必须依赖众

多技术、方法、工具和管理机制才能为人们所利用,所以在保存网络信息自身数据的同时,与

其相关的技术、方法、工具和管理机制也应一并保存。这样网络信息资源的长期保存就必须满

足以下需求:

网络信息1.原始数据的保存。网络信息的生命周期短和存储量庞大的特点,限定了网络信

息资源的保存必须采用冗余备份的方式保存。由于现在网页的内容是多种多样的,有文字、图

片、声音、图像等内容,其数据模式又大多是服务器/客户端模式,许多内容多是采用服务器

请求调用的方式获取,很容易在保存的过程中,只是保存了信息的绝对连接或服务器请求命

令。当再次打开保存后数据时很可能就会无法显示。这就要求在保存信息过程中必须将不同类

型的信息完整的采集下来,并保证保存信息能被准确完好地读取。

网络信息2.动态联系特征的保存。网络信息具有传统信息所没有的动态性特点,网络信息

从类型角度看,多是由脚本数据,表单数据,函数公式,链接数据,数学模型组成,其功能和

表现形式多为导航,工具选项,交互式表格等。其显示的内容多根据访问网页第一时间浏览者

的需求由服务器动态生成的,并非传统数据一成不变的。换句话说不同的人在网络上查询相同

的信息可能得到的结果是完全不同的,但又都是正确的,它反映了信息与信息之间的联系,而

这些信息正是现代网络信息的关键所在,比原始信息更重要的不是内容而是信息之间的联系。

这种联系的保存是网络信息的难点,而这些信息的丢失将导致网络信息的灵魂消失。

网络信息属性的保存。网络信息的属性包括:出处,时间,作者,来源,性质,类别,3.

关键字等等。通过这些信息的保存能追溯相关信息的来源与历史,确认信息的真实、可信和完

整性。同时,可通过此种方式针对现代网络信息进行信息查重、内容校验、身份认证、版本演

变、知识产权认定。所以,保存网络信息的属性,对于真实、完整地保存网络信息是十分必要

的。

信息类型与处理标准的保存。随着网络技术的不断发展,新技术,新标准,新类型,新4.

模型不断涌现,同时,旧的标准也在不断被替代,由于网络信息资源的多样性,在进行保存的

过程当中,不同时期的网络信息中的信息编码、字符格式、网络标记、体系结构、压缩方式、

加密算法等方面的技术标准是不同的,要确保在一定时间跨度上不同网络信息的可识别和解

析,就必须记录保存当时网络信息资源的信息类型和处理标准。

网络信息5.管理机制的保存。虽然,网络信息被保存了,但这些信息的使用原则是不相同

的,这决定于网络信息的属性以及与之相对应的管理机制,比如:知识产权管理机制、信息安

全机制、必威体育官网网址等级机制、屏蔽原则等等。这些是网络信息鉴别分析、合法使用的前提,是网络

信息资源存储的可持续进行的基础。

二、网络信息资源保存过程

网络信息资源的1.采集。面对庞大的网络信息资源的采集,首先要划定信息收集的范

围。通常情况下各国采集与本国有关的重要信息,范围条件包括:服务器的物理地址在本国;

由本国组织、公民创作拥有;国家顶级域名;使用本国官方语言;研究价值;公众的关注度

等。根据范围条件通过专门的采集软件对网络资源综合地进行采集。此外网络信息是在不断变

化的,这就要求对于已采信息一段时间间隔后需要重新采集,以保证数据的连贯性。实践中可

以发现有的网站内容更新较稳定,很少时时更新,更新周期较长;而有些网站特别是新闻网

站,跟新速度极高。所以针对于不同的网络信息资源信息更新的时间概率应采用不同的间隔标

准。

)1收到信息的甄别

文档评论(0)

151****0413 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档