网站大量收购闲置独家精品文档,联系QQ:2885784924

临床医学大数据分析与挖掘—基于Python的机器学习与临床决策 第7章 医疗保险的欺诈发现模型.ppt

临床医学大数据分析与挖掘—基于Python的机器学习与临床决策 第7章 医疗保险的欺诈发现模型.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
在对不同主体进行发现疑似欺诈行为,部分投保人并非均在某段固定时间内发生索赔,从索赔到不索赔,不索赔到索赔,这些变化也是重要的人群特征。 故需要考虑出险和索赔过程的时间,本案例通过选择投保人的住院开始时间划分为上半年和下半年,再对不同对象特征进行特征变换。 特征变换 对主体为投保人提取特征进行特征变换,具体变换内容如下3点。 根据投保人的住院开始时间特征将其划分为上半年(1H)和下半年(2H)两个部分。 选取索赔订单中保费覆盖额、账单金额、支付金额的特征,分布按上、下半年时间进行统计,分别得到半年保费覆盖额、半年账单金额、半年支付金额、半年支付笔数。 选取投保人信息表中的年龄(Age)、性别(Sex取值范围为女和男)、治疗措施编码(MEDcode取值范围为MCbuy、RegularMedicare、MCD、MCQ、Undocumented)、保险条款属性(ProgramCode取值范围为伤残险和老年保障险)的特征,除了年龄之外的特征采用虚构变量法,即按值进行展开。 特征变换 1.投保人特征变换 变换结果如表所示。 特征变换 投保人编号 所属时间段 半年保费覆盖额 半年账单金额 半年支付金额 半年支付笔数 年龄 女 男 MCD MCQ MCbuy RegularMedicare Undocumented 伤残险 老年保障险 0 11200010435 2H 1240200 1254890 1225159 30 27 0 1 0 0 0 1 0 1 0 1 11600010648 1H 1051400 1065577 1039617 24 27 0 1 0 0 0 1 0 1 0 2 11700010743 1H 247800 250520 245811 4 49 0 1 0 0 0 1 0 1 0 3 11700010743 2H 785400 797520 776217 21 28 0 1 0 0 0 1 0 1 0 4 11800010877 1H 43800 44633 43172 1 92 1 0 0 0 0 1 0 1 0 5 11800010877 2H 823300 831500 814066 20 45 0 1 0 0 0 1 0 1 0 6 11900010939 2H 519800 525405 514391 13 61 1 0 0 0 0 1 0 1 0 7 12000011044 1H 634400 641222 624589 17 45 1 0 0 0 0 1 0 1 0 特征变换 投保人编号 所属时间段 半年保费覆盖额 半年账单金额 半年支付金额 半年支付笔数 年龄 女 男 MCD MCQ MCbuy RegularMedicare Undocumented 伤残险 老年保障险 7 12000011044 1H 634400 641222 624589 17 45 1 0 0 0 0 1 0 1 0 8 12000011044 2H 27400 27653 26477 1 55 1 0 0 0 0 1 0 1 0 9 12100011136 1H 2515600 2547452 2482790 66 90 1 0 0 1 0 0 0 1 0 10 12300011316 1H 1608700 1630068 1588060 44 90 1 0 0 1 0 0 0 1 0 11 12300011316 2H 2270200 2296306 2243225 52 67 0 1 0 0 0 1 0 1 0 12 12600011444 1H 1927500 1954878 1898355 57 67 0 1 0 0 0 1 0 1 0 13 12600011444 2H 209000 210953 207689 4 65 1 0 0 0 1 0 0 1 0 14 12800011526 1H 802900 814300 796480 19 22 0 1 0 0 0 1 0 1 0 15 12900011570 1H 186100 187962 183431 4 22 0 1 0 0 0 1 0 1 0 医疗机构特征变换过程与投保人特征变换过程操作类似,同样数据都对时间进行划分,具体特征变换过程如下3点。 先根据索赔信息表中投保人的住院开始时间特征划分为上半年(1H)和下半年(2H)两个部分。 接着按医疗机构编号和所属时间段进行分组,统计投保人数和处理过程数量;选取索赔订单中保费覆盖额、账单金额、支付金额的特征,分布按上、下半年时间进行统计,分别得到半年保费覆盖额、半年账单金额、半年支付金额、半年支付笔数。再选取医疗机构信息表中医疗机构大类(ProviderType)、医疗机构细(ProviderSpecia

您可能关注的文档

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档