- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一类随机截尾Simmons模型及基于一种模糊均值算法识别分类应用
一类随机截尾Simmons模型及基于一种模糊均值算法识别分类应用摘要:文章在随机截尾模型基础上建立了一种随机截尾的Simmons模型,讨论了有限总体下敏感性问题的抽样调查方法,以及利用这种方法所得出的估计量,并给出了无偏与方差估计量公式。还提出了一种模糊均值算法,更加有效地对训练样本进行比较准确模糊分类。
关键词:Simmons模型;抽样调查;估计;模糊均值算法
一、随机截尾的Simmons模型
(一)背景与目的
被测试者对于样本特征有着较大的敏感性,为使之更好地配合如实提供特征信息,可以建立一种随机截尾的Simmons模型,即在随机截尾模型基础上增加一个装置产生服从均匀分布的随机变量。正是这一装置“滤去”了被测试者的敏感性,从而可以准确地估计出特征向量(体重,腰围)的估计平均值。
(二)假设与约定
第一,x=(x1,x2)T为样本体重与腰围特征向量。x1=(x11,x21,…,xn1),Xi1为第i个女生ai体重数据;x2=(x12,x22,…,xn2)T,Xi2为第i个女生ai腰围数据;X(i)=(xi1,xi2)T为ai的两特征向量,(i=1,2,…n)。
第二,假设xi1∈[42,63] [c1,c1+t1](千克),xi2∈[16,27] [c2,c2+t2](市寸),(i=1,2,…n)。
第三,假设样本x(1 ),x(2),…,X(n)相互独立同分布,f(x)=f(x1,x2)为x=(x1,x2)的概率密度,f1(x),f2(x)为相应边际密度,μ=(μ1,μ2)为x=(x1,x2)的数学期望。
第四,在测试实验中的两次抽卡所显示的数字Y,Z分别为服从[c1,c1+t1],[c2,c2+t2]上的均匀分布。
第五,已知样本容量n=20。
(三)实验步骤
第一,取3个空盒。
1号盒子放入红、白、黑、绿4种色小球,放入比例为1:1: (0<p<1);2号放入22张卡片,卡片上标有重数据42、43、…、63;3号放入12张卡片标上腰围数据16、17、…、27。将3个盒子分别摇匀。
第二,每位被测试者有放回地先从1号盒摸取一小球,并作答:
取到红、白、黑球分别作答1、0、,取到绿球则转到下一步。
第三,取到绿球者接着一次性从2号盒抽取两张卡片再放回摇匀,将该两张卡片上的数字Yi1、Zi1与自身的特征数据Xi1作比较,并作答:
若Xi1>max{Yi1,Zi1},作答1;若min{Yi1,Zi1}≤Xi1≤max{Yi1,Zi1};作答0;若Xi1<min{Yi1,Zi1},作答-1。作答完毕最后从3号盒一次性抽取两张卡片再放回摇匀,将该两张卡片上的数字Yi2、Zi2与自身的特征数据Xi2做比较,并做类似回答。
第四,记被测试者从1号盒子摸取小球、从2号盒子抽取卡片、从3号盒子抽取卡片时的作答值分别为βi,αi1,αi2。
对X1,X2均沿用数据βi,则最后得到的数据记为γi1,γi2,(i=1,2,…n)。
(四)模型的建立与分析
由上面实验结果有:
aij=1,xij>max{Yij,Zij}0,min{Yij,Zij}≤Xij≤max{Yi1,Zi1}-1,Xij<min{Yij,Zij}
βi=1,红球0,白球-1,黑球,(i=1,2,…n;j=1,2)
分别求解μ1,μ2的无偏估计与方差估计之表达式:
第一,μj的无偏估计表达式:(j=1,2):
本均值为:
γj=γij①
μj的无偏估计:
j=cj+ ②
第二,通过γij的方差求得μj的方差估计表达式(j=1,2):
估计量μj的方差:Var(μj)= + 于是μj的方差估计为:
Var( j)= + ③
(五)数据统计与结果
从上面可以看出,Var( j)关于p单调递增,综合考虑取p=0.4,则在1号盒子中放入30个小球:白球4,红球4,黑球4,绿球18。
通过测试实验得到以下样本数据(见表1):
βi所在列为空白说明取球者αi摸取的球为绿色。
根据表1的数据及①、②、③式可求得所要考察的两特征估计值。
样本均值:γ1= ,γ2=0
无偏估计: 1=54.83 2=22.00
方差估计:Var( 1)=13.54,Var( 2)=4.50
二、基于一种模糊均值算法的识别分类
所要识别的为参加测试男生“偏胖”、“中等”与“偏瘦”。算法给出了各男生所属类别的模糊矩阵,在此基础上构造出模糊集并进行了知识推理。
记号:第一,X={x1,x2,…,xn},xk为第k名男生ak体重,k=1,2,…,n;第二,论域A=
文档评论(0)