- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据时代数据管理技术研究综述论文
篇1:大数据时代数据管理技术讨论综述论文
大数据时代数据管理技术讨论综述论文
随着计算机技术和网络的快速进展,半结构化和非结构化等类型数据成几何倍增长,学习和使用大数据管理技术顺应时代进展潮流。本文从数据管理技术的进展进程动身,介绍了人工管理方式、文件系统管理方式、数据库管理方式三种阶段的管理方式。然后具体介绍了关系数据库和NoSQL非关系数据库,并且将两者从三种角度进行了对比。最终对将来大数据时代信息管理方式作出了展望。
引言
随着计算机和网络技术的快速进展,移动互联、社交网络、电子商务、云计算等各种新兴服务的兴起,极大拓展了互联网的疆界和应用领域,随之产生的是海量的数据,这些数据不仅来源的渠道多样,并且数据规模和数据种类也是快速的增长,大数据时代已经来临。大数据时代,无法将海量数据存储和管理在一台或者有限数目的服务器内,更无法借助有限的计算机去处理和管理大数据。因此,如何利用现有的资源应对当前数据量的快速增长,实现对大数据的有效、便捷、平安的管理,是当前国内外关于数据管理和数据分析亟需解决的问题。
1数据管理技术的进展
数据管理是指对各种类型的数据进行采集、存储、分类、计算、加工、检索和传输的过程。随着计算机和网络技术的不断进展和改进,数据库管理技术也在不断的更新换代。到目前阶段为止,数据管理技术主要进展历程经受了以下阶段:人工数据管理方式、文件系统管理方式和数据库系统管理方式。
1.1人工数据管理方式
20世纪50年月中期,计算机初期被应用于科学计算方面,因此,早期的数据处理都是手工完成的。数据存储只有磁带、卡片和纸带等低速存储设备。既没有操作系统,也没有管理数据的特地软件,此阶段管理的数据,不能进行共享,且没有独立性,数据纯粹面对应用,服务于应用。
1.2文件系统管理方式
20世纪60年月中期,随着计算机进一步的进展,不仅用于科学计算,而且更多地用于信息处理。对于数据存储,有了磁盘、磁鼓等存储设备。操作系统和高级语言的消失为文件系统管理供应了可能。此阶段的文件系统,是根据相应的规章将数据组织成一个独立的命名文件。这一时期的数据特点是:数据可以长期存储在磁盘上、有特地的软件进行管理维护、数据不再独立存在,数据不止服务于应用,在肯定程度上,数据的共享性得到了提高。
1.3数据库系统管理方式
20世纪60年月后期,数据库系统管理方式渐渐形成并具有肯定的规模。由于磁盘技术的不断进步和进展,低成本、高速的硬盘占据了市场,为新的数据管理技术供应了产生的必要条件。对应的软件技术也有肯定的进展。数据库系统是由计算机的软硬件资源共同组成,实现了数据的动态、有规章、独立存储。如图1所示。
2大数据管理技术
大数据是指无法在可承受的时间范围内用常规软件工具进行捕获、管理和处理的数据集合。归结为四个特点就是四“V”,即大量(Volume)、高速(Velocity)和多样性(Variety)和价值(Value)。大数据首先体现在数据量上:全球闻名询问机构IDC(国际文献资料中心)在估量全世界产生的数据量是0.18ZB(1ZB=100万PB),而截至这个数字已经提升了一个数量级,达到1.8ZB。这种数据产生的速度仍在增长,估计将达到8ZB。随着数据量的增长,得到浩大的数据源和样本数据后,人们并不能容忍对于这些浩大的数据处理响应时间。因此,大数据需要在数据量提高的前提下,数据的处理和响应力量进行提高,从而确保数据延迟可以在人们的接受范围之内。因此数据处理要得到有效的保证,那如何存储和组织管理这些海量数据,值得我们去探究和讨论。
2.1关系型数据库(RDBMS)
2.1.1关系数据库的提出
20世纪70年月初,IBM工程师Codd发表了一篇论文“ARelationalModelofLargeSharedDataBanks”,随之关系数据库时代宣告到来。关系数据库管理系统(RelationalDatabaseManagementSystem,简称RDBMS)就是基于上述的论文而被设计出来的。在关系数据库之前的系统主要有基于层次模型的层次数据库、基于网状模型的网状数据库等。以上几种数据库的主要不足是数据模型是很难被用户所理解,并且编写的软件与数据模式依靠性比较高。Codd提出的关系数据模型是基于表格、行、列、属性等基本概念,将现实世界中的各类实体及其关系映射到表格上,并且还为关系模型建立了关系代数运算。
2.1.2关系数据库的应用
关系数据库系统最初主要是应用于事务处理领域。随着数据的不断积累增长,人们需要对数据进行分析操作,提取出有用的信息以支持决策等等。这些分析操作主要包括简
您可能关注的文档
- 《童年》读书心得感想及收获.docx
- GPA2.7能申请香港留学吗?.docx
- 本科自学考试自我鉴定-本科自学自我鉴定.docx
- 表示谦虚的名言名句.docx
- 参观宿舍的心得体会.docx
- 沉默的大多数读后感.docx
- 初二-新学期班级工作计划.docx
- 初三备战中考寄语.docx
- 初中生共青团申请书.docx
- 初中生开学第一周周记.docx
- 2023-2024学年广东省深圳市龙岗区高二(上)期末物理试卷(含答案).pdf
- 2023-2024学年贵州省贵阳市普通中学高一(下)期末物理试卷(含答案).pdf
- 21.《大自然的声音》课件(共45张PPT).pptx
- 2023年江西省吉安市吉安县小升初数学试卷(含答案).pdf
- 2024-2025学年广东省清远市九校联考高一(上)期中物理试卷(含答案).pdf
- 广东省珠海市六校联考2024-2025学年高二上学期11月期中考试语文试题.pdf
- 2024-2025学年语文六年级上册第4单元-单元素养测试(含答案).pdf
- 2024-2025学年重庆八中高三(上)月考物理试卷(10月份)(含答案).pdf
- 安徽省安庆市潜山市北片学校联考2024-2025学年七年级上学期期中生物学试题(含答案).pdf
- 贵州省部分校2024-2025学年九年级上学期期中联考数学试题(含答案).pdf
文档评论(0)