网站大量收购独家精品文档,联系QQ:2885784924

pandas统计分析基础.pdfVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

使用groupby方法拆分数据

groupby方法的参数及其说明

➢该方法提供的是分组聚合步骤中的拆分功能,能根据索引或字段对数据进行分组。其常用参数与使用格式如下。

DataFrame.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_keys=True,

squeeze=False,**kwargs)

参数名称说明

by接收list,string,mapping或generator。用于确定进行分组的依据。无默认。

axis接收int。表示操作的轴向,默认对列进行操作。默认为0。

level接收int或者索引名。代表所在级别。默认为None。

as_index接收boolearn。表示聚合后的聚合是否以DataFrame索引形式输出。默认为True。

sort接收boolearn。表示是否对分组依据分组进行排序。默认为True。

group_keys接收boolearn。表示是否显示分组的名称。默认为True。

squeeze接收boolearn。表示是否在允许的情况下对返回数据进行降维。默认为False。

使用groupby方法拆分数据

groupby方法的参数及其说明——by参数的特别说明

➢如果传入的是一个函数则对索引进行计算并分组。

➢如果传入的是一个字典或者Series则字典或者Series的值用来做分组依据。

➢如果传入一个NumPy数组则数据的元素作为分组依据。

➢如果传入的是字符串或者字符串列表则使用这些字符串所代表的字段作为分组依据。

使用groupby方法拆分数据

GroupBy对象常用的描述性统计方法

➢用groupby方法分组后的结果并不能直接查看,而是被存在内存中,输出的是内存地址。实际上分组后的数据对

象GroupBy类似Series与DataFrame,是pandas提供的一种对象。GroupBy对象常用的描述性统计方法如下。

方法名称说明方法名称说明

对每个分组中组员的进行标记,

count计算分组的数目,包括值。cumcount

0至n-1。

head返回每组的前n个值。size返回每组的大小。

max返回每组最大值。min返回每组最小值。

mean返回每组的均值。std返回每组的标准差。

median返回每组的中位数。sum返回每组的和。

使用agg方法聚合数据

agg和aggregate函数参数及其说明

➢agg,aggregate方法都支持对每个分组应用某函数,包括Python内置函数或自定义函数。同时这两个方

法能够也能够直接对DataFrame进行函数应用操作。

➢在正常使用过程中,agg函数和aggregate函数对DataFrame对象操作时功能几乎完全相同,因此只需要

掌握其中一个函数即可。它们的参数说明如下表。

DataFrame.agg(func,axis=0,*args,**kwargs)

DataFrame.aggregate(func,axis=0,*args,**kwargs)

参数名称说明

func接收list、dict、function。表示应用于每行/每列的函数。无默认。

axis接收0或1。代表操作的轴向。默认为0。

使用agg方法聚合数据

agg方法求统计量

➢可以使用agg方法一次求出当前数据中所有菜品销量和售

您可能关注的文档

文档评论(0)

183****7931 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档