国开电大大数据技术概论实验3:数据可视化.doc

国开电大大数据技术概论实验3:数据可视化.doc

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
作者:diandatiku 一、实验内容? 题目 1?通过读取文件 death rate.csv 获取数据保存到 df 中,简单分析数据,获取共有数据多少条,是否有缺失值或是异常值,若存在这样的数据,将这些数据剔除;对于死亡率来说,它的值域是 0q=1 。(1-6题的死亡率,只考虑男性的死亡率)。 2?绘制散点图,分别展示年龄、年份与男性的死亡率(对数即取 log)的关系。 3 绘制年龄与对数生存人数的散点图,分析这 2 个量的关系。 4 绘制直方图来观察一下男性死亡人数的分布。 5 绘制男性的对数死亡人数即(Male_death 的对数)的直方图,来观察男性的对数死亡人口数的分布情况。 6 计算 df 的各变量的相关系数,并画出相关图。? 题目2 1 通过读取文件 House-handle.csv 获取数据保存到 houseIndex 中。 2 数据探索,绘制一张图表来展示 1990 到 2011 年的 HPI 的变化情况,横轴是时间(可以是数据的第一列),纵轴是 HPI 值。 3 绘制一张图,展示每个月的 HPI 的增长量,表示为 delta,在 0 的位置添加参考线。 4 为了进一步了解 HPI 的波动,计算其每个月的增长率。绘图时,增长率为正数的月份由加号(“+”)表示,为负的用(“o”)表示。5 对 HPI 增长率建立表格,其中每一行代表一个月份,每一列代表一个年份,显示前四年的数据(HPI 增长率舍入到小数点后 4 位);并绘制一个 HPI 的平均年增长率和 HPI 的平均月增长率(全部年份的年增长率(列平均)和月增长率(行平均))。 6 绘制一个箱线图,来查看 HPI 的增长率的分布情况。 三、实现过程与实验结果? 题目1? 1.通过读取文件 death rate.csv 获取数据保存到 df 中,简单分析数据,获取共有数据多少条,是否有缺失值或是异常值,若存在这样的数据,将这些数据剔除;对于死亡率来说,它的值域是 0q≤1 。(1-6题的死亡率,只考虑男性的死亡率)。 2.绘制散点图,分别展示年龄、年份与男性的死亡率(对数即取 log)的关系。 3.绘制年龄与对数生存人数的散点图,分析这 2 个量的关系。 4.绘制直方图来观察一下男性死亡人数的分布。 5.绘制男性的对数死亡人数即(Male_death 的对数)的直方图,来观察男性的对数死亡人口数的分布情况。 6.计算 df 的各变量的相关系数,并画出相关图。 题目2? 1.通过读取文件 House-handle.csv 获取数据保存到 houseIndex 中。 2.数据探索,绘制一张图表来展示 1990 到 2011 年的 HPI 的变化情况,横轴是时间(可以是数据的第一列),纵轴是 HPI 值。 3.绘制一张图,展示每个月的 HPI 的增长量,表示为 delta,在 0 的位置添加参考线。(增长量用下一条减上一条来计算;第一条的上一条的 HPI 值可以认为是 1)。 4.为了进一步了解 HPI 的波动,计算其每个月的增长率。绘图时,增长率为正数的月份由加号(“+”)表示,为负的用(“o”)表示。 5.对 HPI 增长率建立表格,其中每一行代表一个月份,每一列代表一个年份,显示前四年的数据(HPI 增长率舍入到小数点后 4 位);并绘制一个 HPI 的平均年增长率和 HPI 的平均月增长率(全部年份的年增长率(列平均)和月增长率(行平均))。 6.绘制一个箱线图,来查看 HPI 的增长率的分布情况。

文档评论(0)

diandatiku + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档