- 1、本文档共250页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;目录;(1)知识目标:掌握Pandas的两种数据结构及其基本操作、掌握DataFrame数据的基本操作,即数据的查改增删、掌握Pandas的数据导入与导出操作、掌握数据分析前的常用预处理操作、掌握Pandas中的数据分组、聚合以及统计操作、掌握Pandas中数据透视表和交叉表的创建方法。
(2)技能目标:具备一定的数据分析和处理能力,能够运用Pandas高效地处理数据集、能够利用Pandas进行数据统计分析,如描述性统计、分组统计等,为数据分析和数据挖掘提供有力支持;具备一定的问题解决能力,面对实际的数据处理问题时,能够迅速分析并找到解决方案,利用Pandas工具集进行实践。
(3)素质目标:保持对新技术和新方法的关注,持续学习;在处理复杂数据时,能够保持清晰的逻辑思维,有条理地进行数据分析和处理;数据处理工作往往繁琐且需要高度细致,能够保持耐心和细心,确保数据处理???准确性和完整性。
;销售数据如同一面镜子,清晰地映射出顾客需求、市场变化以及经营策略的有效性。为提升顾客满意度,增强市场竞争力,对销售数据进行分析显得很重要。本章将围绕小型商店的近期销售数据,通过pandas的数据分析技术,分析哪些商品受顾客青睐、每天的销售总额、每类商品的售出数量有何变化等。
通过本章的学习,您将掌握如何使用Pandas轻松应对各种数据处理挑战,系统地学习Pandas的基础知识,从核心数据结构DataFrame和Series的创建与操作开始,逐步深入到数据的导入与导出、清洗与转换、聚合与筛选、排序与索引等高级功能。
;Pandas主要提供了两种数据类型:Series和DataFrame,Series是一维数据结构,DataFrame是二维数据结构。
在程序中要使用Pandas,首先需要导入该库,同时为方便使用,在导入时通常为该库起别名为“pd”,命令为:
importpandasaspd
在jupyternotebook中,可根据需要设置数据显示的行列数,通过调用pandas的set_option()方法来实现,如以下命令可设置在jupyternotebook中最多显示10行8列数据,超出部分使用省略号替换。
pd.set_option(display.max_rows,10)
pd.set_option(display.max_columns,8)
;Pandas中的Series类似于一维数组或列表,但功能更为强大。Series对象由索引(index)和数据(data)两部分组成的,索引也称为数据标签。索引用于标识数据的位置,可以是自动生成的整数,也可以是自定义的字符串等任意数据类型。数据部分则存储了Series的实际值,可以是数值、字符串、布尔值等任意数据类型。
;可以使用pandas的Series()函数创建Series对象,其基本语法为:
pd.Series(data,index=None)
data是必要参数,指要放入Series中的数据,可以是列表、数组、字典等。index是可选参数,能够自定义Series对象的索引,如果没有指定索引,pandas会自动创建从0开始的整数索引。
;通过index属性可以获取Series对象的索引,values属性可以获取Series对象的数据值。同时,与字符串、列表等数据类型一样,Series也支持索引和切片操作,可以通过索引来选择或修改数据,也可以通过切片获取一段范围内的数据,得到一个新的Series数据对象。
;DataFrame是类似于二维数组或表格(如excel)的对象,它包含一组有序的列,每一列的数据类型是相同的,但不同列可以是不同的值类型(字符串、数字、日期时间等)。DataFrame既有行索引,又有列索引,可以看作由Series组成的字典。DataFrame包括3个基本要素,分别是索引、列、数据。在DataFrame的许多操作中,都使用了axis这一参数,用于指定操作是应用于行的方向还是列的方向,axis=0指操作应用于行,而axis=1指操作应用于列。
;DataFrame的创建可以通过多种方式实现,最常用的是通过字典、列表、文件导入创建。
使用字典创建DataFrame时,字典的键成为列名,字典的值(通常是列表或数组)成为对应列的数据。使用列表创建DataFrame时,实际上是通过列表的列表,即二维列表来创建,并通过使用columns属性指定列名。
;;;;本节将介绍对DataFrame数据的提取、增加、删除、修改、条件检索等内容,使用相同的DataFrame进行操作,创建数据的代码为:
importpandasaspd
data={ID:[001
您可能关注的文档
- Python数据分析及应用 课件汇总 徐娟 第1--6章Python基础应用 --- Python文件.pptx
- 挤压温度对6005A铝合金焊合区域显微组织和力学性能的影响.pdf
- 执业药师考试西药学专业一(习题卷24).pdf
- 拉链项目研究分析.pdf
- 收单系统安全管理制度手册.pdf
- 研讨发言:深刻领悟“两个确立”的决定性意义进一步增强“两个维护”的政治自觉 范文参考.docx
- 新能源汽车的发展现状及应用前景论文 .pdf
- 开学第一课节约粮食活动教案(精选7篇).pdf
- 必威体育精装版人教版七年级语文下册期末试卷(附答案) .pdf
- 新人教版四年级下册信息技术教学计划(真题20篇).pdf
最近下载
- 物联网平台建设方案.docx VIP
- 银行对自身员工电诈培训.pptx VIP
- 阀门知识简介完全版上中下.pdf VIP
- 伍蓓跨境电商理论与实务(微课版)课后习题答案.docx
- 道岔框架尺寸及尖(心)轨降低值.xls VIP
- 2024年江苏省南京市中考数学试题卷(含答案解析).docx
- T-PE002303C-气液分离器计算及选型导则.pdf VIP
- 2024阿里妈妈经营指南.pdf
- TCSTM 00017.2-2021 电站用马氏体耐热钢08cr9w3co3vnbcubn(g115) 第2部分 感应加热弯管.pdf VIP
- TCSTM 00001-2019 标准编制说明编写指南.pdf VIP
文档评论(0)