财务大数据分析 课件 项目二任务一 Pandas 数据处理基础.pptx

财务大数据分析 课件 项目二任务一 Pandas 数据处理基础.pptx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

项目二

数据处理与数据可视化基础;目录;1.知道横向或纵向堆叠合并数据;

2.掌握主键合并数据;

3.掌握重叠合并数据;

4.了解Pyplot基础语法;

5.绘制直方图、折线图。;任务一

Pandas数据处理基础;堆叠就是简单地把两个表拼在一起,也被称作轴向连接、绑定或连接。依照连接轴的方向,数据堆叠可分为横向堆叠和纵向堆叠。;一;当两张表完全一样时,不论join参数的取值是inner或者outer,结果都是将两个表完全按照x轴拼接起来,具体实现如图所示。;一;除了concat函数之外,append方法也可以用于纵向合并两张表。但是使用append方法实现纵向表堆叠有一个前提条件,那就是两张表的列名需要完全一致。append方法的基本方法如下。;主键合并,即通过一个或多个键将两个数据集的行连接起来,类似于SQL中的join。针对两张包含不同字段的表,将其根据某几个字段一一对应拼接起来,结果集的列数为两个原数据的列数和减去连接键的数量。

pandas库中的merge函数和join方法都可以实现主键合并,但两者的实现方式并不相同。;一;除了使用merge函数以外,join方法也可以实现部分主键合并的功能。但是使用join方法时,两个主键的名字必须相同,其具体用法如下。;数据分析和处理过程中偶尔会出现两份数据的内容几乎一致的情况,但是某些特征在其中一张表上是完整的,而在另外一张表上的数据则是缺失的。这时除了使用将数据一对一比较,然后进行填充的方法外,还有一种方法就是重叠合并。重叠合并在其他工具或者语言中并不常见,但是pandas库的开发者希望pandas能够解决几乎所有的数据分析问题,因此提供了combine_first方法来进行重叠数据合并。;一;pandas提供了readexcel函数来读取“xls”“xlsx”两种Excel文件,其语法和常用参数如下。;将文件存储问Excel文件,可以使用to_excel函数。其使用语法和常用参数如下。

DataFrame.to_excel(excel_writer=None,sheetname=’None’,na_rep=’’,header=True,index=True,index_label=None,mode=’w’,encoding=None)

to_excel函数和to_csv函数的常用参数基本一致,区别之处在于,to_excel函数指定存储文件的文件路径参数名称为excel_writer,??且没有sep参数;to_csv函数增加了一个sheetname参数,用来指定存储的ExcelSheet的名称,默认为Sheet1。;1、删除法;对菜品订单详情表利用dropna方法进行缺失值处理,如图所示。;2、替换法;3、插值法;THANKSFORWATCHING

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档