- 1、本文档共54页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
模块五商品销量数据分析Python数据分析与可视化典型项目实战(微课版)
【任务描述】【任务描述】Excel文件“商品销售数据.xlsx”共有1948行、7列数据,列名分别为:销售日期、销售区域、销售渠道、销售订单、品牌、售价、销售数量。针对该数据集完成以下统计计算与数据分析操作。(1)统计月度、季度销售额。(2)统计各月的最高销售额、最低销售额和平均销售额。(3)统计各个品牌销售额占比和季度销售额占比。(4)统计各区域月度销售额。(5)统计各渠道各个品牌的销量。(6)统计不同售价区间的月度销量占比。【任务实现】在JupyterNotebook开发环境中创建tc05-01.ipynb,然后在单元格中编写代码并输出对应的结果。【任务5-1】商品销售数据处理与统计分析
商品销售数据处理与统计分析1.导入模块%configInlineBackend.figure_format=svg#矢量图设置2.导入数据path=rdata\商品销售数据.xlsx#默认读取Excel文件的第一个工作表sales_df=pd.read_excel(path)sales_df.head()3.数据预处理查看数据集的基本信息sales_()
商品销售数据处理与统计分析如果“销售日期”列数据不是规范的日期格式数据,即其数据类型不是“datetime64”,则可以先使用to_datetime()进行格式转换,代码如下:sales_df[销售日期]=pd.to_datetime(sales_df[销售日期])如果转换日期格式时约定日期格式为“%Y-%m-%d”,则可以写成以下形式:sales_df[销售日期]=pd.to_datetime(sales_df[销售日期],format=%Y-%m-%d,errors=coerce)如果“销售日期”列数据包括星期数据,则可以使用以下代码抽取日期数据前10位:sales_df[销售日期]=sales_df[销售日期].astype(str).str.slice(0,10)从“销售日期”列数据中获取“年”“月”“日”“季度”数据sales_df[年]=sales_df[销售日期].dt.yearsales_df[月]=sales_df[销售日期].dt.monthsales_df[日]=sales_df[销售日期].dt.daysales_df[季度]=sales_df[销售日期].dt.quartersales_df.sample(5)
商品销售数据处理与统计分析对规范日期格式的“销售日期”列数据,也可以使用split()分离出年、月、日数据,代码如下:dateDf=sales_df[销售日期].astype(str).str.split(-,2,expand=True)sales_df[年]=dateDf[0]sales_df[月]=dateDf[1]sales_df[日]=dateDf[2]统计月度销售额sales_df.groupby(月).销售额.sum()4.统计计算与数据分析计算销售额sales_df[销售额]=sales_df.售价*sales_df.销售数量sales_df.head()
商品销售数据处理与统计分析统计季度销售额sales_df.groupby(季度).销售额.sum()统计各月的最高销售额(amax)、最低销售额(amin)和平均销售额(mean)sales_df.groupby(月).销售额.agg([np.max,np.min,np.mean])统计各个品牌销售额占比plt.figure(figsize=(10,5))temp=sales_df.groupby(品牌).销售额.sum()temp.plot(kind=pie,autopct=%.2f%%,fontsize=12)plt.title(各个品牌销售额占比,fontsize=16)plt.show()
商品销售数据处理与统计分析统计季度销售额占比plt.figure(figsize=(10,5))plt.title(季度销售额占比,fontsize=16)temp=sales_df.groupby(季度).销售额.sum()temp.plot(kind=pie,autopct=%.2f%%,fontsize=12)plt.show()统计各区域月度销售额使用groupby()函数统计各区域月度销售额的代码如下:sales_df.grou
您可能关注的文档
- 模块八 电商客户消费偏好特征分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块二 天气与空气质量数据分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块九 广告投放效果分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块六 订单数据分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块七 电商客户行为分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块三 房源数据分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块十 股票数据分析与股价趋势预测.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块四 旅游景点数据分析.pptx
- Python数据分析与可视化典型项目实战(微课版)课件 模块一 人口与 GDP 数据分析.pptx
- 写给客人的道歉信.doc
文档评论(0)