Boosting算法及其在中医亚健康数据分类中应用.pdfVIP

Boosting算法及其在中医亚健康数据分类中应用.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

中华中区药学会亚健康分会换届选举暨“治未病”及亚健康防治论坛论文集 Boosti ng算法及其在中医亚健康数据分类中的应用 李霞1何丽云2刘超3 [摘要】目的:应用Boosting算法建模,对亚健康状态的人群进行分类并分析其临床特 征,同时与通常使用的logistic统计方法进行比较研究。方法:使用不同损失函数下boosting 算法对亚健康状态流行病学调查数据的健康和亚健康人群进行分类;同时,通过重要性度量 分析得到亚健康状态的重要临床特征。结果:采用boosting算法对亚健康人群进行了分类得 到了分类准确性及重要影响变量。结论:使用boosting算法对亚健康人群进行分类的方法比 传统的两种logistic回归模型分类准确率要高,同时也可以得到影响亚健康状态的重要变量。 [关键词]:logistic回归;Boosting=损失函数;重要性度量 统计学习是当前活跃在各个科研和应用领域中的一门学科,可以看作是新一代统计学的 重要分支,它同时将模型的可解释性和预测准确性考虑到对数据的建模当中,而其中的 Boosting方法由于其优良的预测准确性在近几年中最为引人注目.因此,本文考虑将其纳入 本研究当中,并同传统的logistic回归判别模型进行比较。 亚健康状态是现代社会的新概念,其发生受社会竞争加剧,工作压力加大,心理负担加 重及不良情绪干扰等因素的影响而日益增多,不仅影响人们的生活质量,也与多种慢性非传 染性疾病的发生发展密切相关。但由于亚健康状态概念宏观模糊,与正常和疾病状态难以明 确界定,给临床研究带来困难。本研究应用Boosting分类建模方法,对亚健康状态的流行病 学调查数据进行分析,建立了亚健康状态判断模型并对其临床特征进行了研究,现报道如下。 材料与方法 1.资料来源 本组资料来源于2003年3月到lO月进行被调查者为北京市不同行业的居民,发放亚健 康状态中医基本证候流行病学调查口1问卷4000份,回收问卷3676份,合格问卷3624份。 2.研究标准 7 2.1被调查者纳入标准:①符合本课题的亚健康专家诊断标准扭1,②年龄35-55岁,③愿 接受调查。 2.2合格问卷的判断标准:①一般信息中除地址和联系方式外的项目必须填写,②再次排 除有疾病诊断者,③全部问题条目的缺失和漏填不超过5%。 . 2.3问卷排除标准:①不符合纳入标准者,②患有心脑血管、糖尿病、肿瘤等重大疾病, ③患非重大疾病但需用药维持者,④不愿合作者。 3.研究目的与方法 3.1研究目的: ①亚健康分类模型的建立,即从初步分类的数据集中抽象出一个分类模型,该模型能够 很好的拟合当前分类结果并有解释其意义,对未知的人群分类具有指导作用,具有预测意义, 106 中华中医药学会亚健康分套换届选举暨“治未病”及亚健康防治论坛论文集 这是通用的目的之一。 ②对亚健康临床特征进行分析,即从亚健康的56个症状变量中筛选出重要的因素,为 亚健康诊断研究打下基础,这使得模型必须对实践具有指导和解释意义。 3.2研究的方法——基于boosting算法的模型: Boosting算法是一种用来提高学习算法准确度的方法,这种方法通过构造一个预测函数 系列,然后以一定的方式将它们组合成一个预测函数,达到把一弱学习算法提升为强学习算 作出了肯定的回答。一年后,Freund设计了一个高效得多的通过重取样或过滤运作的 Boosting算法是一种基于其他机器学习算法之上的用来提高算法精度和性能的方法。当 用于回归或分类分析时,不需要构造一个拟合精度高、预测能力好的算法,只要一个效果只 比随机猜测略好的粗糙算法即可,称之为基算法。通过不断地调用这个基算法就可以获得一 个拟合和预测误差都相当好的组合预测模型。Boosting算法可以应用于任何的基算法,无论 是线性回归、决策树、神经网络、还是SVM方法,都可以有效地提高精度。因此,Boosting可 以被视为一种通用的增强基础算法性能的回归分类分析算法。 本文的模型训练过程:首先将全部样本2613例按7:3的比例随机分为训练集(1830例) 和测试集(783例),在训练集上训练模型,在测试集上对模型准确性进行测试。 3.3研究辅助工具: 所有建模过程均通过在R中通过编程实现。 过程及结果

文档评论(0)

ygeorcgdw + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档