网站大量收购独家精品文档,联系QQ:2885784924

大数据技术在财务中的应用(Python版) 课件 任务5.3 利用Pandas进行数据的分组与分段分析.pptx

大数据技术在财务中的应用(Python版) 课件 任务5.3 利用Pandas进行数据的分组与分段分析.pptx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;引入案例;知识解析;任务5.3利用Pandas进行数据的分组与分段分析;一、数据分组;groupby()函数常用参数说明;【做中学5.3.1】读入应收账款统计表.xlsx(位置:E:\file\),使用groupby()函数按年进行分组,并查看分组数据。;使用get_group()函数查看某一分组。程序如下:

df.groupby(年).get_group(2019)#查看组名是2019的分组;二、分组统计;【做中学5.3.2】读入应收账款统计表.xlsx(位置:E:\file\),统计2020年不同客户的本期发生额的总数及期初余额的平均数。;统计2020年不同客户应收账款期初余额的平均数。程序如下:

df1.groupby(客户ID)[期初余额].mean();importpandasaspd#引入pandas模块

#读取Excel表格数据

df=pd.read_excel(rE:\file\应收账款统计表.xlsx,converters={年:str,月:str})

df.groupby(年)[[本期发生额,期初余额]].agg([mean,sum,max,min]);【做中学5.3.4】接续【做中学5.3.3】使用groupby()函数按“年”进行分组,并统计各组本期发生额列的合计值、平均值,期初余额列的最小值。;5.2.2数据分段统计分析;【做中学5.3.6】读入公司资产负债率.xlsx(位置:E:\file\),根据资产负债率的分段情况进行统计。;0(24.437,45.467]

1(45.467,66.433]

2(45.467,66.433]

3(45.467,66.433]

4(66.433,87.4]

5(45.467,66.433]

Name:资产负债率(%),dtype:category

Categories(3,interval[float64]):[(24.437,45.467](45.467,66.433](66.433,87.4]]

分段统计结果为:

(45.467,66.433]4

(24.437,45.467]1

(66.433,87.4]1

Name:资产负债率(%),dtype:int64;指定区间进行分割并指定labels,再进行统计,程序如下:

cat2=pd.cut(df[资产负债率(%)],bins=[0,50,55,60,70,100],

labels=[优秀,良好,平均,较低,较差])

print(cat2)

print(分段统计结果为:)

print(cat2.value_counts());读入fin_data2.xlsx(位置:E:\file\)中的利润表项目,按年进行分组,并查看2021年的分组数据。程序如下:

importpandasaspd#导入Pandas模块

#读入Excel表格数据

df=pd.read_excel(rE:\file\fin_data2.xlsx,sheet_name=1,

converters={年:str,月:str})

grouped=df.groupby(年)#按年进行分组

grouped.get_group(2021).head();任务实训

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档