数据的分类APP.pptxVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据的分类APP

小组成员:王彬 曹相洋 江国军 周旋01数据的定义数据定义数据是什么?声音文字图像动画图形符号网络日志、视频、地理位置信息等等数据定义:数据就是数值,也就是我们通过观察、实验或计算得出的结果。数据有很多种,最简单的就是数字。数据也可以是文字、图像、声音等。数据可以用于科学研究、设计、查证等。数据定义古语云:三分技术,七分数据,得数据者得天下。先不论谁说的,但是这句话的正确性已经不用去论证了。1、Google如何利用人们的有哪些信誉好的足球投注网站记录挖掘数据二次利用价值,比如预测某地流感爆发的趋势;2、Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;3、Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;4、Target?超市以20多种怀孕期间孕妇可能会购买的商品为基础,将所有用户的购买记录作为数据来源,通过构建模型分析购买者的行为相关性,能准确的推断出孕妇的具体临盆时间,,这样Target的销售部门就可以有针对的在每个怀孕顾客的不同阶段寄送相应的产品优惠卷。过渡页 TRANSITION PAGE 02 数据的生命周期数据的定义数据的分类数据的特征2.1 数据的分类方式按性质数据的分类按记录方式按表现形式2.2 按性质分类如各种坐标数据;如表示事物属性的数据(居民地、河流、道路等);100%100%100%100%定位的定量的定性的定时的反映事物数量特征的数据,如长度、面积、体积等几何量或重量、速度等物理量;反映事物时间特性的数据,如年、月、日、时、分、秒等。2.3 按表现形式分类由连续函数组成,是指在某个区间连续变化的物理量。①图形数据(如点、线、面)②符号数据 ③文字数据④图像数据等,如声音的大小 温度的变化等 如各种统计或量测数据。数字数据在某个区间内是离散的值[1];模拟数据数字数据1、童应学,吴燕?.计算机应用基础教程?:华中师范大学出版社?,2010.8?:211?.2.4 按记录方式一、结构化数据 一般指存储在数据库中,具有一定逻辑结构和物理结构的数据,最为常见的是存储在关系数据库中的数据,用二维表结构表示。企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等。二、非结构化数据,一般指结构化数据以外的数据,不方便用数据库二维逻辑表来表现的数据即称为非结构化数据。具体到典型案例中,像是医疗影像系统、教育视频点播、视频监控、国土GIS、设计院、文件服务器(PDM/FTP)、媒体资源管理等具体应用,这些行业对于存储需求包括数据存储、数据备份以及数据共享等。视频音频图片各类报表文本所有格式的办公文档图像 举一个半结构化的数据的例子,比如存储员工的简历。不像员工基本信息那样一致每个员工的简历大不相同。有的员工的简历很简单,比如只包括教育情况;有的员工的简历却很复杂,比如包括工作情况、婚姻情况、出入境情况、户口迁移情况、党籍情况、技术技能等等。还有可能有一些我们没有预料的信息。通常我们要完整的保存这些信息并不是很容易的,因为我们不会希望系统中的表的结构在系统的运行期间进行变更。三、半结构化数据 它是结构化的数据,但是结构变化很大。因为我们要了解数据的细节所有不能将数据简单的组织成一个文件按照非结构化数据处理,由于结构变化很大也不能够简单的建立一个表和他对应。如HTML、XML。03数据的特征3.1计算机内部流动的数据特征:不管是文字、符号、图片还是视频,都必须要转换成数字,在计算机内部流动,然后由计算机硬件来进行翻译和执行。3.2调研分析的数据特征:①连续性:其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个/view/3627588.htm数值. 其数值只能用测量或计量的方法取得.②离散型:其数值只能用自然数或/view/71484.htm整数单位计算的则为/view/2650458.htm离散变量。③可整合性:其变量值是/view/858832.htm定性的,表现为互不相容的类别或属性,是用来描述某一个群体与其他群体的区别。(地理位置和人口信息的对比,看似不相容的两者,但是通过比较和分析,是可以得出我们想要的结论的。)④时效性:是指数据的发生和运用要有个有效期,过了这个时期,就将失去价值。⑤分散性:一是数据的发生没有固定的时间和地点,需要从多个渠道去收集数据;二是虽然是分布的,但是确实联系和关联的。04 数据的生命周期1.数据的价值随时间波动数据 无论是人、生态系统,还是技术和企业,在各自的生命周期内,都要经历从出生到成熟再到衰退的不同阶段。本图选自美国EMC公司《信息生命周期管理》2. 数据的生命周期各个阶段数据生命周期 各阶段数据创建阶段数据保护阶段数据的访问阶段数据的迁移阶段数据的归档阶段数据的回收阶段本

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档