- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析培训提纲
概论
数据分析的重要性
贯彻质量管理 8 项原则的需要
QM 的 8 项原则之一为:基于事实的决策方法。要避免决策失误必须提供足够的信息,以及进行科学决策。
信息:有意义的数据。
数据:能客观反映事实的资料和数字。
要使数据提升为信息,才能将其增值。为此,必须从数据收集和分析上运用科学的方法,使之便于利用。
通过数据的收集和分析可证实 QMS 是否适宜和有效。
帮助识别和评价 QMS 持续改进的机会。
增强对各种意见和决策的分析、判断、评审、质疑能力因此,数据分析是保障 QMS 有效运行的重要手段。
数据分析的一般过程
数据收集
收集范围
产品、体系和过程的数据,如:产品检测中的不合格,QMS 质量目标完成情况、持续改进情况、过程监视和测量情况等。
事实上在QMS 的各个过程中,都会产生一些数据,在管理中必须根据当前及长远目标的需要,确定应收集那些数据,重点如何。
收集方法
各种报表和原始记录(注意分类)
区域网中的数据库
注意明确收集人、收集时间、收集方式、传递方式。
收集的要求
及时
准确 数据的质量,“进来的是垃圾,出去的还是垃圾”
完整 数据项目齐全,数量符合要求。
数据分析、处理
数据的审查和筛选
剔除奇异点,确定数据是否充分
数据排序
按其重要度进行排序,以确定分析处理的对象和顺序
确定分析内容,进行统计分析
分析判断
在统计分析的基础上,以目标值或标准为依据,对统计分析结果
(绘图或计算)作进一步分析,以获得指导过程改进的明确信息,找出主要问题和薄弱环节,并提出相应的改进建议。
编写报告
对分析判断得出的规律、趋势整理成报告(附有直观的图表)
数据的利用
-1-
不能为分析而分析,要有“的”放矢,数据分析应指导管理。数据分析是为了科学决策,决策的结果,可通过前后对比来分析判断其有效性。数据分析应对其全过程做到闭环管理。
为此,应将数据分析信息有效地传递,做到信息共享。在风险评估的基础上,采取适当措施。
统计分析技术
概述
什么是统计分析技术
统计技术
运用数理统计的方法对数据进行分析,找出其规律和趋势。如: 常用的控制图、回归分析、试验设计等。
分析技术
运用逻辑分析的方法对数据进行分析,找出影响事物的因素及其影响程度。如常用的排列图、因果图、饼图、QFD 和 FMEA 等方法。
统计技术应用的基础条件
日常管理秩序健全,产品质量有可追溯性。
生产过程相对稳定。
影响质量的因素已规范化,过程质量处于受控状态。
具备必要的物质、技术基础
测试手段适用,必要的图表及计算处理用具或软件。
大量的数据计算和处理运用计算机
统计技术的基础知识
随机变量及其分布
什么是随机变量:
变量——数值有变化的量,相对常量而言。
随机因素——随机(不是人为偏向)因素(多种因素),如:年降雨量,抛硬币。
加工尺寸——由模具磨损、机器磨损、材料、人的操作重复性、环境……等决定。
随机变量——受随机因素影响的在一定范围内取值的量抽样必
分布
直方图:
ni据总数
ni
据总数
须随机,不能有倾向性,。
Δ
Δ X
间距
n — — 数
i频率:f =
i
n
参数n
参数
i
——第 i 组的频数
连续型随机变量: ΔX O 为一光滑曲线,此曲线为分布函数。
分布的特征:形状(对称、偏斜)、位置、分布宽度(最大值—最小值)。
总体与样本
总体——研究对象的全体,如一批电缆,可视为总体,研究其总长,每一根(或段)电缆则为总体中的一个个体(成员),一批所有电缆的总长为总体。
总体用变量X 表示
-2-
样本——从总体中抽出的部份个体组成的集合称为样本。抽样 因为不可能研究每一个个体。
从样本推断总体,必须正确反映总体的信息,正确抽样。随机抽样——简单随机样本、随机数表
Xi 0~99 可以构成 2500 个随机数。
正态分布
钟形曲线,曲线下的面积表示概率
对称,中间高,两边低
X~(μ,σ 2)
X
μ
μ——总体的均值;σ——总体标准差
正态分布检验:
·直方图
·概率纸 横坐标—— X 的等距取值 ;纵坐标——不等距
0.01%~99.99%
在概率纸上描出的点呈一直线,则为正态分布。 正态分布的分布函数值
近似正态分布——总趋势符合正态分布,但有个别的奇异点。
常用统计特征量(样本)
统计量——不含未知数的样本函数称为统计量。
统计量是由样本得出,但其对估计总体状况(产品的某些特性值) 具有重要意义。
反映样本位置的统计量
均值——样本的算术平均值 X
样本中的数据多数分布在样本均值附近,因此它是表示样本位置的最好的统计量。
局限性:容易受数据中的特大、特小值(异常值)的影响。若有 5 个样本,观测值为 3,5,7,9,11 X=7
如果误将 11 记为 21 X=9
当数据异常时,把 X 作为数据的代表不
文档评论(0)