网站大量收购闲置独家精品文档,联系QQ:2885784924

Python数据分析及应用 课件汇总 徐娟 第7--11章 Pandas数据分析 --- Python机器学习 .pptx

Python数据分析及应用 课件汇总 徐娟 第7--11章 Pandas数据分析 --- Python机器学习 .pptx

  1. 1、本文档共250页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;目录;(1)知识目标:掌握Pandas的两种数据结构及其基本操作、掌握DataFrame数据的基本操作,即数据的查改增删、掌握Pandas的数据导入与导出操作、掌握数据分析前的常用预处理操作、掌握Pandas中的数据分组、聚合以及统计操作、掌握Pandas中数据透视表和交叉表的创建方法。

(2)技能目标:具备一定的数据分析和处理能力,能够运用Pandas高效地处理数据集、能够利用Pandas进行数据统计分析,如描述性统计、分组统计等,为数据分析和数据挖掘提供有力支持;具备一定的问题解决能力,面对实际的数据处理问题时,能够迅速分析并找到解决方案,利用Pandas工具集进行实践。

(3)素质目标:保持对新技术和新方法的关注,持续学习;在处理复杂数据时,能够保持清晰的逻辑思维,有条理地进行数据分析和处理;数据处理工作往往繁琐且需要高度细致,能够保持耐心和细心,确保数据处理???准确性和完整性。

;销售数据如同一面镜子,清晰地映射出顾客需求、市场变化以及经营策略的有效性。为提升顾客满意度,增强市场竞争力,对销售数据进行分析显得很重要。本章将围绕小型商店的近期销售数据,通过pandas的数据分析技术,分析哪些商品受顾客青睐、每天的销售总额、每类商品的售出数量有何变化等。

通过本章的学习,您将掌握如何使用Pandas轻松应对各种数据处理挑战,系统地学习Pandas的基础知识,从核心数据结构DataFrame和Series的创建与操作开始,逐步深入到数据的导入与导出、清洗与转换、聚合与筛选、排序与索引等高级功能。

;Pandas主要提供了两种数据类型:Series和DataFrame,Series是一维数据结构,DataFrame是二维数据结构。

在程序中要使用Pandas,首先需要导入该库,同时为方便使用,在导入时通常为该库起别名为“pd”,命令为:

importpandasaspd

在jupyternotebook中,可根据需要设置数据显示的行列数,通过调用pandas的set_option()方法来实现,如以下命令可设置在jupyternotebook中最多显示10行8列数据,超出部分使用省略号替换。

pd.set_option(display.max_rows,10)

pd.set_option(display.max_columns,8)

;Pandas中的Series类似于一维数组或列表,但功能更为强大。Series对象由索引(index)和数据(data)两部分组成的,索引也称为数据标签。索引用于标识数据的位置,可以是自动生成的整数,也可以是自定义的字符串等任意数据类型。数据部分则存储了Series的实际值,可以是数值、字符串、布尔值等任意数据类型。

;可以使用pandas的Series()函数创建Series对象,其基本语法为:

pd.Series(data,index=None)

data是必要参数,指要放入Series中的数据,可以是列表、数组、字典等。index是可选参数,能够自定义Series对象的索引,如果没有指定索引,pandas会自动创建从0开始的整数索引。

;通过index属性可以获取Series对象的索引,values属性可以获取Series对象的数据值。同时,与字符串、列表等数据类型一样,Series也支持索引和切片操作,可以通过索引来选择或修改数据,也可以通过切片获取一段范围内的数据,得到一个新的Series数据对象。

;DataFrame是类似于二维数组或表格(如excel)的对象,它包含一组有序的列,每一列的数据类型是相同的,但不同列可以是不同的值类型(字符串、数字、日期时间等)。DataFrame既有行索引,又有列索引,可以看作由Series组成的字典。DataFrame包括3个基本要素,分别是索引、列、数据。在DataFrame的许多操作中,都使用了axis这一参数,用于指定操作是应用于行的方向还是列的方向,axis=0指操作应用于行,而axis=1指操作应用于列。

;DataFrame的创建可以通过多种方式实现,最常用的是通过字典、列表、文件导入创建。

使用字典创建DataFrame时,字典的键成为列名,字典的值(通常是列表或数组)成为对应列的数据。使用列表创建DataFrame时,实际上是通过列表的列表,即二维列表来创建,并通过使用columns属性指定列名。

;;;;本节将介绍对DataFrame数据的提取、增加、删除、修改、条件检索等内容,使用相同的DataFrame进行操作,创建数据的代码为:

importpandasaspd

data={ID:[001

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档