Python商务数据分析 第5章 Pandas数据分析.pptxVIP

Python商务数据分析 第5章 Pandas数据分析.pptx

  1. 1、本文档共122页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第5章Pandas数据分析

第4章NumPy数据分析Pandas数组结构Pandas数据分析基础Pandas常用操作Pandas高级操作Pandas缺失值处理Pandas数据分组Pandas数据合并Pandas时间序列Pandas透视表与交叉表

5.1Pandas简介Pandas是基于NumPy数组构建的,因此它在许多NumPy函数上提供了直接的支持。它还提供了用于对表格数据进行操作的数据结构,例如Series和DataFrame。Pandas提供了许多用于数据操作和处理的函数和方法,例如数据过滤,数据清洗,数据合并和重塑等。Pandas还提供了用于将数据导入和导出不同文件格式的函数,例如CSV,Excel和SQL等。它是Python数据科学生态系统中最受欢迎和广泛使用的库之一。Pandas是大数据分析的重要工具,我们生活中常用的数据处理软件是微软的Excel,当你学会pandas时候,你会发现pandas比Excel好用太多了。

5.2Pandas库安装与使用5.2.1安装在cmd命令行窗口输入以下命令,等待安装完成即可。pipinstallpandas

5.2Pandas库安装与使用5.2.2使用在使用Pandas库之前,我们需要先导入Numpy和Pandas库,代码如下。一般为了简化Pandas库的调用,约定俗成把Pandas简化为pd。importnumpyasnpimportpandasaspd

5.3Pandas数据结构Pandas中有两种主要的数据结构:Series和DataFrame,Series是一维的数据结构,类似于Python中的列表或数组,而DataFrame则是二维的数据结构,类似于Excel中的表格。Pandas可以读取多种数据格式的文件,包括CSV、Excel、SQL数据库和JSON等。

5.3Pandas数据结构5.3.1SeriesSeries(系列、数列和序列)是一个带有标签的一维数组,由一组数据值(value)和一组标签组成,其中标签与数据值之间是一一对应的关系标签数据值数据类型

5.3Pandas数据结构5.3.1Series(1)创建Series对象我们可以使用列表,元组,字典、Numpy数组和标量来创建Series对象。1)通过列表创建Series对象list1=[11,22,33,44]data1=pd.Series(list1)data1输出结果:011122233344dtype:int64

5.3Pandas数据结构5.3.1Series(1)创建Series对象2)通过元组创建Series对象tuple1=(1,2,3,4,5,6)data2=pd.Series(tuple1)data2输出结果:011223344556dtype:int64

5.3Pandas数据结构5.3.1Series(1)创建Series对象3)通过字典创建Series对象dic1={a:3.2,b:7.6,c:12.11,d:0}data3=pd.Series(dic1)data3输出结果:a3.20b7.60c12.11d0.00dtype:float64

5.3Pandas数据结构5.3.1Series(1)创建Series对象4)通过Numpy数组创建Series对象num=np.random.randn(4)#创建一个随机数组index=[a,b,c,d]#直接赋值索引data4=pd.Series(num,index)data4输出结果:a-1.774755b-0.947428c1.511671d-0.062458dtype:float64

5.3Pandas数据结构5.3.1Series(1)创建Series对象5)通过标量创建Series对象s=pd.Series(7)ss=pd.Series(7,[a,b,c,d,e])s输出结果:07dtype:int64a7b7c7d7e7dtype:int64

5.3Pandas数据结构5.3.1Series(2)Series常用属性属性说明axes以列表的形式返回所有行索引标签。dtype返回对象的数据类型。empty返回一个空的Series对象。ndim返回输入数据的维度。shapeSeries数据维度size返回输入数据的元素数量。values以ndarray的形式返回Series对象。index返回一个RangeIndex

您可能关注的文档

文档评论(0)

释然 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档