教学课件1:数据采集基础.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
正版课件 内容可修改;概述;1;1、理解数据 什么是数据? 只要承载了一定的信息,这些数字、图片、文本、声音等都可以认为是数据。没有承载信息的数字是不能作为数据的,认识清楚这个问题,是踏入大数据之门的第一步。 数据从哪里来? 从微观层面看,我们每个人都在生产着数据:早上8点,你使用支付宝购买了早餐;上午10点,你给100086打一次电话咨询话费余额;下午六点,你乘坐的公共交返回家中。然后,支付宝获取了你的使用习惯和消费能力,时时向你推荐花呗等应用;10086获取了你的咨询需求,推出了自助话费查询功能;公共交通将你的信息提供给了保险公司,就有了后来的“先生/女士,现向你推荐一款公共交通安全险.....” ;数据从哪里来? 从宏观层面看,各种行业以几何倍数爆发增长的速度在制造着数据,比如互联网(社交,有哪些信誉好的足球投注网站,电商)、移动互联网(微博)、物联网(传感器)、医学影像、安全监控、金融(银行,股市,保险)电信(通话,短信)都在疯狂的产生着数据,已经不能用G或T来衡量,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。;数据来源和格式;数据来源和格式;数据来源和格式;数据来源和格式; 数据来源和格式;数据来源和格式;数据来源和格式;数据来源和格式;数据来源和格式;教学内容;数据采集的相关概念;数据采集的相关概念;数据采集的相关概念;数据采集的相关概念;数据采集的相关概念;数据采集的相关概念;数据采集的相关概念;数据采集的相关概念;教学内容;数据清洗的相关概念;数据清洗的相关概念;数据清洗的相关概念;数据清洗的相关概念;数据清洗的相关概念;教学内容;数据采集与清洗的流程和场景;现在各行各业都在收集自己的相关数据,数据采集应用领域非常广泛: 工业领域 工业生产中,涉及到多种环境因素,且这些因素会影响到产品的生产过程和参与生产过程的安全: 设备的电能消耗数据采集 生产场所的温湿度、气压的数据采集 农业领域 农作物生产分不同的阶段,不同阶段需采集不同的数据: 种植准备的阶段:采集土壤数据 种植和培育阶段:采集温度、湿度、CO2等???据 农作生长阶段:采集环境信息、养分信息和病虫情况等 ;金融领域 大数据在金融领域的应用,一般认为有精准营销和大数据风控两个方面: 基于行为数据去预测用户的偏好和兴趣 大数据风控的两个应用,信用风险和欺诈风险 电商领域 网络电商平台 电商APP 用户信息;在数据分析的时候常常会涉及数据清洗,使用场景非常广泛,例如: 工业领域 工业产生的数据非常巨大,采集的数据非常多,但是采集的数据不一定直接可用,需要进一步清洗: 机器运行数据 产品统计量 农业领域 农产品的产量 土壤的数据量;健康数据 身体指标 血液检测指标 运动数据 天气数据 气温 湿度 空气成分 ;小结:;

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5342120324000033

1亿VIP精品文档

相关文档