网站大量收购闲置独家精品文档,联系QQ:2885784924

现代统计方法与应用-倾向性分析.docxVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第一份作业:第二章贝叶斯网络在医学中的应用

贝叶斯网络的优点与不足有哪些?

贝叶斯网络的主要优点有:

1)朴素贝叶斯模型有稳定的分类效率。

2)对小规模的数据表现很好,能处理多分类任务,适合增量式训练,尤其是数据量超出内存时,可以一批批的去增量训练。

3)对缺失数据不太敏感,算法也比较简单,常用于文本分类。

朴素贝叶斯的主要缺点有:

1)理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型给定输出类别的情况下,假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或者属性之间相关性较大时,分类效果不好。而在属性相关性较小时,朴素贝叶斯性能最为良好。对于这一点,有半朴素贝叶斯之类的算法通过考虑部分关联性适度改进。

2)需要知道先验概率,且先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳。

3)由于我们是通过先验和数据来决定后验的概率从而决定分类,所以分类决策存在一定的错误率。

4)对输入数据的表达形式很敏感。

第二份作业:第六章统计因果推断基础:倾向性评分

Kaul,P,?Tran,DT,?Sandhu,RK,?Solbiati,M,?Costantino,G,?Sheldon,RS.?Lackofbenefitfromhospitalizationinpatientswithsyncope:Apropensityanalysis.?JACEPOpen.?2020;?1:?716–?722.

研究设计:作者在亚伯达省进行了一项回顾性队列研究运行状况管理数据库。他们是流动护理数据库,包括ED访视;出院摘要数据库,记录所有急症住院治疗;以及人口登记和生命统计,提供患者人口统计学和死亡记录。数据库与匿名患者相关联唯一标识符。我们分别使用ED和出院诊断代码,用于对出院诊断进行分类。大学艾伯塔省健康研究伦理委员会批准了本研究(机构审查委员会编号Pr。

研究目的:晕厥患者经常住院,但这是否会改善结果尚不得而知。所以测试了是否晕厥患者住院降低了急诊科患者的死亡率。

倾向性评分使用方法:比较2个队列的患者特征,使用分类变量的χ2检验和连续变量的Kruskal-Wallis检验。我们使用了医院的logistic回归模型。以入院为结果变量,以急诊就诊的财政年度为患者性别、年龄、ED的位置和合并症为独立因素使用变量来计算倾向评分。在模型中我们研究了入学和出院时的死亡率,所有患者水平的变量以及

倾向评分作为独立变量,落后的采用逐步选择。我们使用似然比检验来检验包括其他可能有影响的独立变量关于住院的可能性他们是并存病,城市或农村住宅、救护车或自我介绍、家庭收入中位数四分位数(在前分类区域,即邻近地区),以及性别和年龄的互动。这些变量保留在若似然比检验在5%水平显著,则为最终模型。2组患者用1:1匹配(0.25SD)。根据最近入院倾向分为5个五等分。为了解释住院期间的早期死亡,我们实施了一项敏感性分析,其中只有住院指数幸存者(8803名患者)与他们进行倾向匹配出院。采用平衡试验来确认偏差倾向匹配后的减少。所有的分析都进行了使用Stata版本14(StataCorp.,CollegeStation,TX);P值0.05为显著性。

结局变量:患者30天和一年时的死亡率

所控制的协变量:年龄,性别,城市居民,家庭收入,和14个重要的合并症在4个阿尔伯塔省行政数据库。

主要结果:死亡结果:急诊患者57417例,初诊为晕厥;8864入院,24小时内出院48553例。承认患者年龄较大(平均76岁对49岁)、男性(53%对45%)、农村(23%对18%)和较低收入(中位数:58,599美元对61,422美元);均P0.001。所有的合并症都较高入院患者(平均Charlson评分,1.9vs0.7;P0.001)。倾向匹配的住院患者有较高的30天死亡率(3.5%vs1.0%)和1年死亡率。死亡率(14.1%vs8.6%);均P0.001。所有倾向五分位数的死亡率是住院组较高(均P0.001)。最常见的死因2719例患者中包括慢性缺血性心脏病,占14%;肺癌,7.1%;急性心肌梗死,6.9%;中风,3.7%;慢性阻塞性肺病,3.6%;痴呆,2.6%;心力衰竭为2.5%。

研究结论:住院并不能减少早期或晚期死亡率

文档评论(0)

爱分享的达人 + 关注
实名认证
文档贡献者

爱分享

1亿VIP精品文档

相关文档