秒表测时法—数据处理:格拉布斯准则剔除异常值.doc

秒表测时法—数据处理:格拉布斯准则剔除异常值.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
秒表测时法—数据处理:格拉布斯准则剔除异常值

秒表测时法——数据处理:根据格拉布斯准则剔除异常值 ——宋 楠 ??? 使用秒表测时法来确定某一作业单元(工序、工步或操作、动作,下同)的时间消耗,我们一般要针对该作业单元现场实测多个周期,由此获得一组测时数据(实测时间原始值),然后运用统计方法对这一组数据作出适当处理,并依据处理结果(实测时间有效值)来确定该作业单元时间消耗的一个代表值(实测时间代表值),最后通过工时评定对该代表值加以修正,才能获得该作业单元的正常作业时间(Tz),以之为基础加上必要的宽放就可以最终获得标准工时[(T=Tz(1+k)]。 ??? 运用统计方法对一组测时数据进行“适当处理”的步骤大体有四: ??? 1)判断这组数据(整体)是否稳定——否则需要重新测时; ??? 2)判断每个数据(个体)是否正常——否则需要予以剔除; ??? 3)判断数据组剩余时间值的数量(或者说测时次数)是否足够——否则需要进行补测; ??? 4)确定数据组的代表值——确定这一组实测时间的代表值,即该作业单元时间消耗的实测代表值。通常取各剩余时间值的平均数(或中位数或众数)。注意此时数据组中的数据是通过前三步骤处理后的余留数据,其个数不一定与原始数据组的时间值个数相同,既可能因剔除了异常值而减少了,也可能由于补测而增多了。 ??? 在上述数据处理过程中,时间数据的转化情况示意如下:??? ??? 现场实测:? 实测时间原始值(一组,整体可能不稳定、个体可能有异常且数量可能不足) ????数据处理:A.实测时间有效值(一组,与原始数据的个数不一定相同) ????????????? B.实测时间代表值(一个) ????工时评定:? 正常作业时间(一个) ??? “适当处理”的第二个步骤(判断每个数据是否正常,亦即剔除异常值)的所用方法,目前我国劳动定额的相关资料主要介绍了拉伊达准则(三倍标准差法),这种方法简单方便,无需查表,适合测量次数较多因而测时数据服从正态分布的情况。当测量次数较少(n=20-100)时,拉依达准则可靠性下降,这时可以采用格拉布斯准则。当测量次数更少(n为10次以下)时,测时数据将更接近t分布而不是正态分布,相应可以采用罗曼诺夫斯基准则。本文谨介绍格拉布斯准则剔除异常值的完整步骤。 ??? 在一组测时数据中,如果个别(或少数)数据(即时间值,下同)偏离这组数据的中心(由平均值确定)很远,而呈现出较大的离群倾向,那么可以暂时视之为该数据组中的“可疑值”(可能属于异常的时间值)。如果进一步用统计方法能将该“可疑值”从该组数据中剔除,那么该“可疑值”就确实是该组数据中的“异常值”——不应允许它或它们(一个或几个时间值)继续作为数据组成员参与后续处理或数据组代表值的计算。 ??? 我们可将一组测时数据按照从小到大的次序进行排列,得到一个升序数列,若该组测时数据之中存在有异常值,必然位于这个升序数列的两侧处。这样,对于任意一组测时数据,其可能存在的异常值的分布,可以归纳为下述三种情形: ??? 1)仅有异常小值(不一定唯一),异常值位于升序数列左侧; ??? 2)仅有异常大值(不一定唯一),异常值位于升序数列右侧; ??? 3)既有异常小值又有异常大值(也不一定仅仅各一),异常值位于升序数列两侧。 ??? 现假定对某工序的某一作业要素进行秒表测时,获得了一组共十个实测时间值:8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0(min),假定数据组的稳定性合乎要求,现采用格拉布斯法判断并剔除其中可能的异常值的步骤如下: ???1.对数据组作升序排列,得: ???? 4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。 ??? 可以肯定,初步的可疑值位于数列的两侧,不是最小值(左侧的4.7)就是最大值(右侧的14.0)。 ???2.计算数据组的平均值μ和标准差σ: ????1)平均值:μ =(4.7+5.4+...+14.0)/10=7.89; ????2)标准差:σ = 2.704 ???3.计算可疑数据的偏离值——以平均值为基准: ????1)最大值与平均值之差:14.0-7.89=6.11 ????2)平均值与最小值之差:7.89-4.7=3.19 ???4.确定一个可疑值——具有最大偏离值的数据: ???? ∵ 6.11 > 3.19 ???? ∴ 最大值14.0是可疑值。 ??? 注:这里先将偏离值较大者作为最可能的异常值,还只是怀疑而已,还需经过下面的定量判断才能确认。此外,如果偏离值较小者也是异常值,或者数列两端以内还存在有异常值,按照下面的步骤,并不会放过。 ???5.计算Gi值——公式:Gi=残差/标准差=(Xi-μ)/σ,亦即等于残差与标准差的比值。 ???? G10=(X10-μ)/σ=

文档评论(0)

qwd513620855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档