- 1、本文档共22页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
项目七统计计算与分组运算
目标掌握Pandas的统计运算方法掌握Pandas的排序操作掌握Pandas分组统计方法
任务一MG公司2023年销售数据的统计计算
相关知识_常见的统计函数求最大值和最小值:max()、min()函数求均值:mean()函数求和:sum()函数统计描述函数:describe()函数
常见的统计函数以文件profits.xlsx中的数据为例进行一些常见的统计计算
求最大值和最小值说明:省略max()和min()函数的axis参数时,默认axis=0,表示按列纵向求最大或最小值。当axis=1时,表示按行求每行的最大或最小值。注意计算时对所有列(或行)进行计算。
求均值说明:mean()函数表示求均值,DataFrame的统计函数中都默认优先按列纵向计算,如果需要对每行的数据计算,在调用这些统计函数时,设置axis=1即可。按列计算按行计算
求和说明:本次求和的结果作为新的一行,添加到profitDF数据集的末尾。当loc方法的行标签参数是数据集中不存在的标签时,将在数据集中增加对应的标签。如果直接求和,执行profitDF.sum()代码,结果会是什么样的?
统计描述函数说明:1.可以一次性完成多个统计指标计算。2.该函数输出了数据集的count(行数)、mean(平均值)、std(标准差)、min(最小值)、25%(第一四分位数)、50%(第二四分位数)、75%(第三四分位数)、max(最大值)3.该函数在分析一个较大的文件时,作为初步的分析工具是非常有用的describe()函数
任务二MG公司2023年销售数据的排序
相关知识数据排序:按索引名排序、按值排序分位数函数:quantile()函数
按索引名排序sort_index()方法专门用于按数据集的索引标签名进行排序
按值排序sort_values()方法用于将数据集按值进行排序说明:参数by表示按指定的值排序
分位数函数quantile()函数是分位数函数说明:可使用参数q表示要计算的分位数,q取值范围为0=q=1营业总收入的二分位数是2534703976.32,这表明有一半的营业总收入大于此数,有一半的营业总收入小于此数profitDF[营业总收入].quantile()#省略了参数q=0.5,默认为二分位数按照列索引的方法代码如何写?
任务三MG公司2023年销售数据的分组统计
相关知识分组与聚合的原理groupby()方法
分组与聚合的原理分组是指使用特定的条件将原数据划分为多个组聚合是对每个分组中的数据执行某些操作,最后将计算的结果进行整合
groupby()方法将数据集按照某些标准划分成若干个组groupby(by=None,axis=0,sort=True)其中:by:用于确定进行分组的依据。axis:表示分组轴的方向。sort:表示是否对分组标签进行排序,接收布尔值,默认为True。
groupby()方法以下列数据为例
groupby()方法以“data1”为依据分组,对每个分组求均值和求和
groupby()方法查看分组情况
groupby()方法
文档评论(0)