JMP用于探索性数据分析.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
JMP用于探索性数据分析

JMP用于探索性数据分析当您从多种渠道获得了大量数据的时候,您可能需要在没有多少经验的情况下第一次对其进行仔细的分析,探索性数据分析(EDA: Exploratory Data Analysis)能够在这种情况下帮助你找到所有这些数据中隐含的信息。 不仅如此,探索性数据分析还能够引导你建立有用的模型。即使在您对类似的数据已经司空见惯或者认为建模工作只是例行公事的情况下,事先运用探索性数据分析方法检验模型的可靠性、验证相关的假设也是一项非常有用和重要的工作,它往往能帮助您获得意想不到的发现。本质而言,探索性数据分析是启发式、开放式和完全动态的。使用这种方法的时候常常也需要对数据进行清洗和整合,这些工作非常有助于帮助您运用多种可视化的方法真正事先“让数据说话”。JMP中的交互式图形和数据管理工具是非常理想的探索性数据分析工具。更值得一提的是,即使您面对的是海量数据,也不论您的数据中隐藏着何种信息,JMP特别的“In-memory”架构也能够非常敏捷地对您的指令做出反应,使您的数据探索过程充满乐趣。数据选取和管理上图为三个被测参数的缺失数据模式。其中动态链接在一起的图形展示了协变量和值之间的关系。在探索性数据分析中,妥善处理不一致的情况是很重要的一步。我们可以在JMP中直接从可视化数据分析的结果(如图形、图表等)中直接对数据表中的某些行进行操作,如选取、着色、标记、做标签、排除或隐藏等,这些操作之后产生的变化将同时反应在其它所有打开着的可视化分析结果中。您可以使用JMP的“缺失数据模式”快速地分离出不完整的数据,而“汇总”功能则可以帮助您快速地在一个动态的表格中对数据进行汇总,以从更高的尺度上对数据进行可视化分析。“数据筛选器”则可以按照您选择的数据以及它们的水平和范围有条件地显示相关的分析结果。对于指定的条件,“数据筛选器”帮助用户非常便捷地回顾、辨别和合理处理满足条件的数据。用户还可以用标准的或者自定义的主题对不同的情况着以不同的颜色。动态链接着的交互式图形上图中,运用“数据筛选器”功能在销售数据的两个动态链接着的分析结果中以“biscuit_category”为条件选取了一些数据,而这些销售数据已被根据“Retailer”信息赋予了不同颜色。对事物的感知往往因人而异,探索性数据分析的开放性意味着用户可以开发自己个性化的分析。JMP全面提供了各种可视化工具,这将是您的分析没有任何限制。各种工具可以让用户平移和探查展现的分析结果,并根据需要进行缩放。“图形生成器”是一个强大的开创性平台,它可以让用户完全交互地利用多个X和Y分组变量创建图形展示架构,其中包含的图形元素包括条形图、柱状图、折线图和等高线图等多种。如果数据的维度很高,您就可以借助“平行图”中的色彩和透明度来揭示多种情况中的特定信息。不过,对数据的洞悉往往需要同时综合使用多种可视化分析方法,而JMP的图形和图形、图形和数据表之间的动态链接功能以及“数据筛选器”功能又让这些方法变得更加强大和高效了。动态链接着的交互式图形不同年龄段车主的汽车保险理赔数据,用颜色区分不同的性别——可以在最开始获得的探索性数据分析报告的基础上,扩充更多选定分析方法的分析结果。在JMP的帮助下,您可以体验实实在在的数据驱动。在很多情况下,您可以直接用可视化方法进行探索性数据分析,然后根据你从分析结果中实际看到的信息(而不是你的期望)来做出相应的选择。其中的一个特色是,分析结果报表是随可视化分析结果直接在同一个报告窗口中出现的,于是分析报告窗口中就会增加一个可视化的分析结果(如一条具有置信区间的回归直线等)。而且,只要做好了正确的选项设置,分析结果就可以对您在“数据筛选器”中进行的选择实时地做出响应。

文档评论(0)

pangzilva + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档