数据分析综合实训报告 (1).doc

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
经济管理学院 数据分析综合实训 课程设计 课 设 题 目 大数据精准营销项目 专 业 班 级 学 号 姓 名 指 导 教 师 2020年 12 月 20 日 指导教师评语及成绩 指导教师评语 成绩 签字: 年 月 日 ?录 1 项?背景与?标 1.1 项?背景 1.2 项??标 2 客户数据预处理与客户交易?为分析 2.1 数据集介绍 2.2 数据预处理 2.3 客户交易?为分析 3 客户标签体系构建 3.1 客户标签体系介绍 3.2 事实类标签构建 3.3 规则类标签构建 3.4 预测类标签构建 3.5 ?本类标签构建 3.6 典型客户画像分析 4 精准营销应? 4.1 商品兴趣排?榜的构建 4.2 ? 标客户的筛选 5 项?总结与?得体会 5.1 项?总结 5.2 项??得 1 项目背景与目标 1.1项目背景 该项目是针对客户所进行的分析报告,再报告中根据不同的角度,对确定目标客户以及客户对商品的选择等方面进行了一系列的分析。面对越来越多的竞争者,如何将商品销售出去是面临的首要问题,现代的销售模式不同于以往的经营模式,从大批量的采购货物再进行销售,逐渐转变为有目标性的采购并进行有目标性的营销,确定目标客户,并通过统计等进行分析,采取一系列的有利于企业的措施,增加最终的利润。 1.2 项目目标 该项目的目标是通过对顾客行为分析的研究,找出符合要求的客户,锁定目标客户。在进行过程中,将理论的知识与实际的知识相结合,通过实践对老师所讲的内容进行深入的理解。 2 客户数据预处理与客户交易?为分析 2.1 数据集介绍 该项目用到了四个数据集,数据集的分类汇总分别为data,dbo,user_too, user_labels。 (1)data数据集:在data数据集中,涉及到的属性是用户的ID,不同用户交易的数额和时间,以及用户进行交易时所采用的具体方式。 (2)dbo数据集:该数据集表示用户是否为潜在客户,1表示是,0表示否。 (3)user_too数据集:在此数据集中,用户的交易额度,交易方式,进行交易的时间以及次数,平均消费水平,具体消费是哪一项商品,且在该商品上消费的金额等详细信息有具体的统计。 (4)user_labels数据集:包括了用用户交易的最大金额数,交易的频率,是否使用网络进行交易等信息。 2.2 数据预处理 首先进行客户数据进行格式转换,才能保证以后的程序正常进行。 预处理 2.2.1 统计分析 统计分析数据 查看客户信息 2.2.2 异常值处理 正则表达式作为一个模板,将某个字符模式与所有哪些信誉好的足球投注网站的字符串进行匹配,利用正则表达式对数据进行异常值处理。 (1)交易时间 Unix时间戳是指格林尼治时间1970年01月01日00时00分00秒起至现在的总秒数。 ? Unix时间戳通常为10位数字(如果精确到毫秒为13位),我们使用正则表达式对数据进行匹配, 发现有一些异常值。 检查时间异常值 对交易时间异常值进行处理 (2)交易金额 检查交易金额异常值并对异常值处理 2.2.3 缺失值处理 缺失值是指某一数据集由于信息缺失等主客观因素 导致的字段记录的缺失,遗漏等现象,本项目中的交易附言字段存在数据缺失的情况。交易记录中存在交易附言为空的行,但其交易金额与交易时间都是完整的,这部分数据可以描绘一些客户的消费习惯, 我们不进行删除。 筛选附言缺失值并处理 2.2.4 数据格式转换 (1)时间和时区 对时间格式进行转换,将时间戳转换成“年-月-日 时:分:秒”的格式 ? 对时区进行转换,将格林威治时间转换为北京时间。 对时间和时区进行转换 (2)单位转换 交易金额(payment)字段以分为单位,为了符合我们的观察习惯,我们将其单位改为元。 计价单位转换 2.2.5 重复数据过滤 无重复值的行标记为False,有重复值的行标记为True。 处理交易记录的重复数据 2.3 客户交易?为分析 该过程包括四个方面:时间维度、交易属性、文本数据预处理和文本数据的分析。 2.3.1 时间维度的分析 (1)交易时间和交易金额 交易时间与交易次数的关系 交易时间与金额的关系 由图像可以看出,交易主要集中在2016年7月至2017年12月在本项目后续环节,我们选取该时间段的交易记录进行重点分析。 (2)交易时间细分 在对24小时的交易次数进行统计后,发现凌晨1点至7点交易数量较少,其余时间段交易数量分布较为均衡,大部分交易的时间集中在0点附近,这可能是金融机构进行清算的时间段。 2.3.2 交易属性 (1)不同客户交易次数 不同客户交易次数与所占比重 从不同客户的角度出发,我

文档评论(0)

东山书苑 + 关注
实名认证
内容提供者

业务以学生学习成长为中心,为外语培训、中小学基础教育、学前教育,提供各种学习资料支持服务。

1亿VIP精品文档

相关文档