- 1、本文档共30页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析 数据分析方法 1.分析工具库 ? Excel 提供了一组数据分析工具,称为“分析工具库”,在建立复杂统计或工程分析时可节省步骤。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或工程函数,在输出表格中显示相应的结果。其中有些工具在生成输出表格时还能同时生成图表。 安装“分析工具库”: 要使用查看可用的分析工具,请单击“工具”菜单中的“数据分析”命令。如果“工具”菜单中没有“数据分析”命令,则需要安装“分析工具库”。 2.工作表函数 ?Excel 还提供了其他一些统计、财务和工程函数。某些统计函数是内置函数,而其他一些函数只有在安装了“分析工具库”之后才能使用。 预备知识 要使用这些工具,用户还必须熟悉需要进行分析的统计学或工程学的特定 领域。 三.相关性分析 相关性分析: 判断两组数据集(可以使用不同的度量单位)之间的关系。 相关系数(R): 相关性计算的返回值。用来确定两个区域中数据的变化是否相关,以及相关的程度。是两组数据集的协方差除以它们标准偏差的乘积。 1、R0:一个集合的较大数据与另一个集合的较大数据相对应(正相关) 2、R0:一个集合的较大数据与另一个集合的较小数据相对应(负相关) 3、R=0:两个集合中的数据互不相关。 |R|0.4 :低度相关; 0.4=|R|0.6:中度相关; 0.6=|R|0.8:高度相关; |R|=0.8:非常高度相关 例 1、利用统计数据计算广告费与销售额之间的相关系数。 例 3、总平均成绩、出勤率、选修学分与每周打工小时数的关系。 例 利用“数据分析”工具计算汽车扳金、省油与价格的满意度之间的相关系数。 例4(线性回归)、 我们收集了某厂家同一车型中旧车的车龄及其售价数据,请使用给图表增加趋势线,求车龄对售价的回归方程,并计算车龄为6.5年的旧车售价是多少. * 数据分析的含义?: 数据分析就是根据电子表格中的数据以图形或数值的方式得出一些有意义的结论. 比如:数据的排序,筛选,运算,统计,图表化等等都可以说是数据分析的手段. 这里我们主要讲以下几个数据分析问题: 一.变量求解:有些数据之间存在因果关系,这些因果关系可以用数学模型来描述,如方程式,不等式等,如果知道了结果数据,能否根据这些数学模型求出原因变量的值?EXCEL提供一些这样的方法,如单变量求解,规划求解等. 二.模拟运算表:根据数学模型(公式)为一组假设数据产生预测结果,以供分析决策 三.相关性分析:判断两组数据集(可以使用不同的度量单位)之间的关系。 四.回归分析:当一个结果与一个或多个参数之间存在联系时,可以进行回归分析,通常可由一个或多个自变量来预测一个变量的值。? 1、CORREL函数: CORREL(array1,array2) 返回单元格区域 array1 和 array2 之间的相关系数。使用相关系数可以确定两种属性之间的关系。例如,可以检测某地的平均温度和空调使用情况之间的关系。 Array1?? 第一组数值单元格区域。 Array2?? 第二组数值单元格区域。 如果数组或引用包含文本、逻辑值或空白单元格,这些数值将被忽略,但是包含零值的单元格将计算在内。如果 array1 和 array2 的数据点的数目不同,函数 CORREL 返回错误值 #N/A。 相关系数 CORREL(B4:B15,C4:C15)=0例2.我们收集了某厂家同一车型中旧车的车龄及其售价数据,求价格与车龄的相关系数 2、使用数据分析工具求相关矩阵 利用CORREL函数只能返回两种属性之间的相关系数,如果使用Excel提供的“数据分析”工具可以计算多组数据间的相关系数,组成相关系数表。 回归分析:当一个结果与一个或多个参数之间存在联系时,可以进行回归分析,通常可由一个或多个自变量来预测一个变量的值。 回归方程:表达参数与结果之间相互关系的数学方程式(数学模型) 线性回归:如果变量与结果之间具有线性关系,我们可以用线性方程式来描述它们之间的关系,这种回归方法叫线性回归. 非线性回归:如果变量与结果之间不具有线性关系,我们必须用非线性方程式来描述它们之间的关系(如指数关系,对数关系等等),这种回归方法叫非线性回归. 单回归:当一个结果只与一个参数存在联系时,进行的回归分析称为单回归。 复回归:当一个结果与多个参数存在联系时,进行的回归分析称为复回归。 判定系数(R2):用来确定回归方程式的可解释性,即吻合程度。范围在0-1之间,越接近1,解释性越强,即吻合程度越高。 回归方法: 1、给图表增加趋势线; 2、使用Excel提供的“数据分析工具”; 3、利用回归函数 四.回归分析 车龄 价格(万) 1 56.0 2 48.5 3 42.0 4 37
文档评论(0)