网站大量收购独家精品文档,联系QQ:2885784924

《大数据存储技术与应用》 课件 项目六_任务一 走进非结构化存储技术.pptxVIP

《大数据存储技术与应用》 课件 项目六_任务一 走进非结构化存储技术.pptx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

《大数据存储技术与应用》

大数据存储技术与应用

项目六解析非结构化数据存储

任务一走进非结构化存储技术

回顾

什么是半结构化数据?

什么是Redis?

什么是ElasticSearch?

ElasticSearch的应用场景?

INFORMATION/COMMUNICATION/TECHNOLOGY

GlusterFileSystem是一款自由软件,

主要由ZRESEARCH公司负责开发,十几名开发者,最近非常活跃。文档也比较齐全,不难上手。

■任务引入-GlusterFileSystem

INFORMATION/COMMUNICATION/TECHNOLOGY

任务描述:

本节任务对非结构化数据进行探讨,结合非结构化数据特性剖析非结构化数据存储特点。

任务教学目标:

1.了解非结构化存储技术的概念。

2.掌握非结构化数据存储的特点。

■任务概要

INFORMATION/COMMUNICATION/TECHNOLOGY

非结构化数据概述

二非结构化数据存储特点

INFORMATION/COMMUNICATION/TECHNOLOGY

知识点一

非结构化数据概述

INFORMATION/COMMUNICATION/TECHNOLOGY

非结构化数据是数据结构不规则或不完整,

没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。

非结构化数据其格式非常多样,标准也是多样性的,而且在技术上非结构化信息比结构化信息更难标准化和理解。

(一)非结构化数据概述

INFORMATION/COMMUNICATION/TECHNOLOGY

(二)非结构化数据优势

1.体量大

非结构化数据可以是公司内部的邮件信息、聊天记录以及搜集到的调查结果,也可以是个人网站上的评论、客户关系管理系统中的评论或者是从个人应用程序中得到的文本字段。还可以是公司外部的社会媒体、社交论坛以及来自于一些感兴趣的话题的评论。

INFORMATION/COMMUNICATION/TECHNOLOGY

(二)非结构化数据优势

2.价值高

非结构化数据中蕴藏着大量的价值信息,

利用非结构化数据分析能够帮助企业快速地了解现状、分析趋势并且识别新出现的问题。

INFORMATION/COMMUNICATION/TECHNOLOGY

(二)非结构化数据优势

3.可分析

数据分析不需要一个专业性很强的数学家或数据科学团队,终端用户有能力、也有权利和动机去改善商业实践,并且视觉文本分析工具可以帮助他们快速识别最相关的问题,及时采取行动,而这都不需要依靠数据科学家。

INFORMATION/COMMUNICATION/TECHNOLOGY

INFORMATION/COMMUNICATION/TECHNOLOGY

知识点二

非结构化数据存储特点

非结构化数据存储特点

针对非结构化数据体积大、增长快、格式标准多样化的特点,非结构数据存储技术必须具备以下能力:

一、能够快速地对大体积的非结构化数据进行读/写操作;

二、存储容量能根据需要适应非结构化数据的快速增长,能进行动态弹性的扩容;

三、能存储多种格式或标准的非结构化数据。

INFORMATION/COMMUNICATION/TECHNOLOGY

任务小结

本节介绍了非结构化数据的特点,非结构化数据存储技术,包括非结构化数据的采集、存储和管理,并为非结构化数据的分析、挖掘及应用提供支撑。

非结构化数据有体量大、价值高、可分析等优势,非结构数据存储技术必须具备三个能力。

INFORMATION/COMMUNICATION/TECHNOLOGY

独立学习GLUSTER官方文档

因为Gluster可以以不同的方式用于不同的任务,所以很难同时解释所有的事情。我们建议您首先遵循快速入门指南。通过使用大量虚拟机,您将创建一个功能测试设置来学习基本概念。这样,您就可以更好地阅读更详细的安装指南。通过官网学习:快速入门指南-如果您是Gluster新手,请从这里开始!

安装指南介绍了先决条件,并提供了在各种操作系统上安装GlusterFS的分步说明。会议和峰会上与Gluster相关的演讲。

■拓展训练

INFORMATION/COMMUNICATION/TECHNOLOGY

1.什么是非结构化数据?

2.非结构化数据存储需要具备哪三种能力?

■作业

INFOR

您可能关注的文档

文档评论(0)

乐毅淘文斋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8121131046000040

1亿VIP精品文档

相关文档