统计在考古学中的应用-第八讲-比例 精品.pptVIP

统计在考古学中的应用-第八讲-比例 精品.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计在考古学中的应用-第八讲-比例 精品

统计学在考古中的应用 第八讲 性别比例 玉器种类比例 是否有随葬品 二元变量 二项式分布 N30, 接近正态分布 总体比例的置信区间 1. 假定条件 两类结果 总体服从二项分布 可以由正态分布来近似 使用正态分布统计量Z 置信度 总体比例的置信区间 (实例) 东下冯墓地 男性11,女性6,11/6=1.83 随机涨落vs.异常? 0.166 元君庙 男性85,女性61,85/61=1.37 偏离 可靠性 样本容量 不能根据观测值进行直接推断,必须统计推断 估计总体比例时样本容量的确定 根据比例区间估计公式可得样本容量n为 估计总体均值时样本容量的确定 根据均值区间估计公式可得样本容量n为 置信度、精密度和样本容量 相对误差 RSD 精密度、准确度 两个总体比例之差的区间估计 1. 假定条件 两个总体是独立的 两个总体服从二项分布 可以用正态分布来近似 2. 两个总体比例之差P1-P2在1-?置信水平下的置信区间为 两个总体比例之差的估计 (实例) 【例】某饮料公司对其所做的报纸广告在两个城市的效果进行了比较,它们从两个城市中分别随机地调查了1000个成年人,其中看过广告的比例分别为p1=0.18和p2=0.14。试求两城市成年人中看过广告的比例之差的95%的置信区间。 两个总体比例之差的估计 (计算结果) 比例数一致性的假设检验 墓地甲:100 60 墓地乙:50 35 混合样本: 赤峰案例 子弹图 某类实体的缺失能否说明某类实体不存在 样本没有时,推断总体中比例小于1% 总体比例小于1%时,样本没有 P=0.01 N=1,10,100 χ2检验 χ2检验的用途: 推动两个总体构成比是否有差别 推断几组总体构成比之间有无差别 两个变量之间有无关联性 频数分布的拟合优度检验 四格表资料的χ2检验 在医学资料中,常常需要比较两个样本率之间的差异有无显著性,如推断某人群男与女的某种疾病的患病率是否相等,即该病是否与性别有关。这类资料由4个数据构成:男与女的患病人数和未患病人数,统计学称这类资料为四格表资料。 下面介绍四格表资料的χ2检验的几种计算 一.????? ? 通用公式法 二. 专用公式法 三. 四格表χ2值的校正公式 四. 精确概率法 五. 配对四格表资料的χ2检验 一. 通用公式法 (1)? 建立检验假设和确定检验水准 H0:两种方法总体阳性率相同,即π1=π2 H1:两种方法总体阳性率不相同,即π1≠π2 检验水准 α=0.05 (2)? 计算检验统计量 理论频数是在H0成立的条件下每个格子理论上的数据。 若H0成立,则合计的消除率为38/73=52.05%,则铅中毒病人理论上应有36*38/73=18.74人呈阳性。 理论频数 T11=36*38/73=18.74 T12=17.26 T21=19.26 T22=17.74 χ2=23.12 自由度f=(R-1)(C-1)=1 (3)? 确定p值 自由度f=(R-1)(C-1)=1 查χ2界值表得 P0.005 (4)? 推断 按α=0.05拒绝H0,认为两种方法总体阳性率不相同。 二. 专用公式法 以上计算χ2统计量的公式对任意行×列表都适合,而对于四格表资料,可以用其简化公式 三. 四格表χ2值的校正 一. 由于χ2界值表是由连续分布:χ2分布计算出来的,但原始 数据属计数资料是离散的,由此计算出来的χ2值也是离散的,特 别是四格表,有时若不校正,所求χ2值偏大,所得概率p值偏低。 二. ①n≥40,且T≥5时,用未校正的χ2值 ②1≤T5,且n≥40时,宜用校正χ2值或用精确概率计算法 ③T1或n40时,宜用精确概率计算法 三.校正公式 例2 某矿石粉厂当生产一种矿石粉石时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取15名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病率,结果如下: 穿新旧两种防护服工人的皮肤炎患病率比较 问两组工人的皮肤炎患病率有无差别? H0:两组工人的皮肤炎患病率无差别,即π1=π2 H1:两组工人的皮肤炎患病率有差别,即π1≠π2 最小的理论频数T11=15*11/43=3.84, 1T115且n=4340,所以宜用χ2值的校正公式 χ2=2.94 查χ2界值表得0.10p0.05,按α=0.05水平不拒绝H0,尚不能认为穿不同防护服的皮肤炎患病率有差别。 若不校正,χ2=4.33 p0.05 四.确切概率法(Fisher’s exact

文档评论(0)

pengyou2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档