人工智能采集和分析基础(Python版)课件 学习单元二 NumPy和Pandas数据处理与分析.pptx

人工智能采集和分析基础(Python版)课件 学习单元二 NumPy和Pandas数据处理与分析.pptx

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

任务1NumPy数据处理和分析

任务2Pandas数据处理和分析;任务1NumPy数据处理和分析;使用NumPy实现学生成绩数据统计、数据处理以及分析,要求实现所有学生语文、数学、英语成绩的分析,并取得其平均成绩、最低成绩、最高成绩、方差、标准差。然后将这些学生的总成绩排序输出。此操作过程可分为三个步骤去实现,主要内容如下:

(1)安装NumPy,并引入NumPy的库文件。

(2)定义一个数组,统计全班学生的成绩。

(3)调用NumPy当中的库函数,实现对数据的统计和处理。

一、NumPy简介及安装

NumPy的全称是NumericalPython,它是Python语言的一个扩展程序库,支持大量的维度数;组与矩阵运算,并针对数组运算提供大量的数学函数库。NumPy的图标如图2-1所示。

NumPy的前身为Numeric,最早由JimHugunin与其他协作者共同开发。2005年,TravisOliphant在Numeric中增加了一个同性质的程序库Numarray,并加入了独有的特点,由此开发了NumPy。NumPy不仅开放源代码,而且由许多协作者共同维护开发。

Python不提供数组功能。列表虽然可以完成基本的数组功能,但不能保证在数据量较大时高速读取数据。为此,NumPy提供了真正的数组功能,以及能够进行数据快速处理的多种函数,并且NumPy内置函数处理数据的速度是C语言级别的,因此在编写程序的时候,应当尽量使用内置函数,避免出现效率瓶颈现象。

;NumPy具有许多显著的特征,在这些特征的帮助下,NumPy成为速度最快和功能强大的数学计算库。NumPy的常见特性如下所示。

(1)具有一个强大的N维数组对象ndarray。

(2)支持广播功能函数。

(3)整合C/C++/Fortran代码的工具。

(4)支持线性代数、傅里叶变换、随机数生成等功能。

NumPy属于Python的第三方框架,可以使用pip安装、wheel安装和源码安装等安装方式。使用pip安装NumPy的步骤如下所示。

第一步:在Windows中,NumPy安装与普通的第三方库安装一样,可以通过Python的包管理工具pip安装,命令如下所示。;第二步:安装完成后,可以使用简单的Python代码进行测试,代码如下所示。

效果如图2-2所示。

二、ndarray对象

ndarray对象是NumPy最重要的特性。ndarray对象是一系列同类型数据的集合,集合中元素的???引从0开始,并且ndarray中存放的每个元素在内存中都有相同大小的存储空间。

ndarray对象由指针对象、数据类型、表示数组形状的元组和跨度元组四个模块组成。

(1)指针对象,即指向数据,也可以说是指向内存或内存映射文件中的一块数据。

;(2)数据类型,即dtype,包括np.int32、np.float32等。

(3)表示数组形状的元组,表示各维度大小的元组,比如arr[3][3]就是一个二维数组。

(4)跨度元组,即stride,其中的整数指的是为了前进到当前维度下一个元素需要“跨过”的字节数。这里的跨度可以取负值。

在NumPy中创建ndarray,需要调用array()函数来实现。该方法接受列表格式的参数后即可返回一个包含参数内容的ndarray对象,代码如下所示。

效果如图2-3所示。;在NumPy中,每一个线性的数组称为一个轴(axis),也就是维度(dimension)。二维数组本质上是以数组作为数组元素的数组,每个元素是一个一维数组。所以,一维数组就是NumPy中的轴(axis),第一个轴相当于底层数组,第二个轴是底层数组里的数组。通常可以对axis进行声明。axis=0,表示沿着第0轴进行操作,即对每一列进行操作;axis=1,表示沿着第1轴进行操作,即对每一行进行操作。除了数组的维度和秩,还有一些常见的信息可通过ndarray提供的属性进行查询。NumPy的数组的常用属性如表2-1所示。

下面使用ndarray.ndim获取数组a的维度,代码如下所示。

效果如图2-4所示。;三、NumPy数组创建

NumPy创建数组时,除了使用array()方法外,还可以使用empty()、zeros()、ones()等方法。详细说明如表2-2所示。

语法格式如下所示。;下面分别使用empty()、zeros()、ones()进行数组的创建,代码如下所示。

结果如图2-5所示。;四、NumPy数组操作

在数据采集与分析的过程中,数据的处理尤为重要,比如数据筛选过滤、数据变换、数据去重等操作都必须以数组的操作为基础。

在NumPy当中包含了许多函数,用来支持数组的操作,这些操作大致可以分为修改数组形状、翻转数组、修改数组维度、连接数组、分割数组

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档