- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
项目三、电商用户画像分析(上)
一、前言:
电商用户画像分析:用户画像是通过分析用户的基础信息、特征
偏好、社会属性等各维度的数据,刻画出用户的信息全貌,它是建立
在一系列属性数据之上的目标用户模型。用户画像的本质是一个用以
描述用户需求的工具。用户画像一般是产品设计、运营人员从用户群
体中抽象出来的典型用户,从中可以挖掘用户价值,提供个性化推荐、
精准营销等服务。
电商用户画像分析的作用:
二、理解数据与分析思路
1.导入使用的包:
#加上后可以直接在界面画图.%matplotlibinline#导入包
importpandasaspdimportnumpyasnpimportmatplotlib
importmatplotlib.pyplotasplt#减少绘图产生的问题
matplotlib.rcParams[font.sans-serif]=[SimHei]#指定字体
matplotlib.rcParams[font.family]=sans-serif
matplotlib.rcParams[axes.unicode_minus]=False#解决负号-显
示为方块的问题#导入数据库包,从数据库里读取数据与存储数据
importpymysqlpymysql.install_as_MySQLdb()fromsqlalchemy
importcreate_engineimportgc#gc模块可以回收内存import
warningswarnings.filterwarnings(ignore)#减少报错from
datetimeimportdatetime
2.导入数据:
#导入数据集
df=pd.read_excel(order_data.xlsx)
df_user=pd.read_excel(user_data.xlsx)
3.理解数据:
df.head()
order_data共有五个字段,分别为,其中behavior_type中1为
浏览,2为收藏,3为加购,4为购买
df_user.head()
4.分析维度:
三、数据预处理:
1.缺失值处理:
2.时间格式转换:
3.制作用户标签表:
四、分析过程:
1、用户活跃的时间
1.1用浏览活跃时间段
time_brows=
df[df[behavior_type]==1].groupby([user_id,hour]).agg({item_
id:count}).reset_index()
time_brows.rename(columns={item_id:hour_counts},inplace=T
rue)#求出每个用户最活跃的时间段time_brows_max=
time_brows.groupby(user_id).hour_counts.max().reset_index()
time_brows_max.rename(columns=
{hour_counts:hour_counts_max},inplace=True)time_brows=
pd.merge(time_brows,time_brows_max,how=left,on=user_id)
#选取各用户浏览次数最多的时段,如有并列最多的时段,用逗号连接
time_brows_hour=
time_brows.loc
您可能关注的文档
最近下载
- dixell帝思 xc807m-xc811m-xc907m-xc911m调试维修参数设置资料.pdf
- 浙教版高中信息技术必修一1.2信息的编码课件.ppt VIP
- 燃气企业安全责任清单参考模板(1.0版)【模板】.pdf
- 【农村建房施工合同】 农村自建房包工包料.pdf VIP
- 二次函数图像与几何变换(解析版)-中考数学二轮复习难点题型专项突破.pdf VIP
- 有限空间作业安全培训PPT课件(必威体育精装版).pptx VIP
- 施工合同(示范文本)重点难点问题解读.ppt VIP
- 信息学奥赛培训课件 第4课 c++基础语法while循环结构(第二课时).pptx
- SJT 11104-2016 金电镀层规范.pdf
- 2024年统编版中考复习之说明文阅读(含解析).doc VIP
文档评论(0)