- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
人工智能采集和分析基础(Python版)
学习单元—Python数据操作
学习单元二NumPy和Pandas数据处理与分析
学习单元三Requests网页访问
学习单元四XPath和re内容解析
学习单元五Scrapy网页数据采集
学习单元六Matplotlib可视化数据分析
学习单元=心thon数据操作
,卜
任务1数据采集基础
任务2数据处理基础
任务3数据分析基础
学习单元一Python数据操作
任务1数据采集基础
学习单元一Python数据操作
姿【任务描述】
数据是数据操作的前提,只有存在数据,才有操作数据的可能。本任务将对数据采集相关内容
进行介绍,主要内容如下:
(1)数据采集概念;
(2)数据采集分类。
【知识准备】
—
、数据采集简介
数据采集,又称数据获取,是利用—种装置从系统外部采集数据并输入到系统内部的—个接口
的过程。数据采集技术广泛应用在各个领域。采集的数据是已被转换为电信号的各种物理量,如温
度、水位、风速、压力等,它们可以是模拟量,也可以是数字量。
学习单元一Python数据操作
在互联网行业快速发展的今天,随着数据量的不断增长,数据采集已经被广泛应用于互联网及
分布式领域。
新时代的数据采集是从传感器和智能设备、企业在线系统、企业离线系统、社交网络和互联网
平台等获取数据的过程。数据包括RFID数据、传感器数据、用户行为数据、社交网络交互数据及移
动互联网数据等各种结构化、非结构化及半结构化的海噩数据。
1.结构化数据
结构化数据最常见,是指具有某种模式的数据,如图1-1所示。
idnameagegender
1LiuYi20male
2ChenEr35female
3ZhangSan29male
学习单元一Python数据操作
2.非结构化数据
非结构化数据是指结构不规则或不完整,没有预定义模式的数据,包括所有格式的办公文档、
文本、图片、HTML、各类报表、图像和音频/视频信息等,如图1-2所示。
person
nameA/na.me
agel3age
genderfemalegende
文档评论(0)