- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
答卷编号(参赛学校填写):
答卷编号(竞赛组委会填写):
论文题目: A 医保欺诈的主动发现
组 别:本科生
参赛学校:
报名序号:(可以不填)
参赛队员信息(必填):
姓 名 专业班级及学号 联系电话 参赛队员1 参赛队员2 参赛队员3
答卷编号(竞赛组委会填写):
评阅情况(省赛评阅专家填写):
省赛评阅1:
省赛评阅2:
省赛评阅3:
省赛评阅4:
省赛评阅5:
1.2.3.1)假设;
(2)假设()假设 符号说明
事件发生的概率,存在医保欺诈概率为1 第i个识别因子 回归方程的似然函数值 引入解释变量后似然函数 样本容量 第i个自变量的回归系数 第i个案例的判定概率 识别因子中最大值 识别因子中最小值 M 为隐层节点数 4.通过对附件里的数据进行观察可以很容易发现,有很多表格里的栏目内容为空,还有就是有些信息对本次建模没有帮助,所以在建立模型前,有必要将原始数据进行筛选处理。通过将数据导入数据库,利用数据语言对数据进行处理(详见附录1)具体处理内容如下:
PAPMIVIPFlag、备注PAPMIRemark等栏目为空,可进行删除;利用出生日期,计算出病人在2014年的年龄;将性别PAPMI_SEX_DR为男为1,女为0;对于是否死亡PAPMI_DECEASED,死亡了的病人设为1,未死亡的设为0;对于手机号PAPMI_MOBPHONE,将有手机号的病人设为1,没有手机号的病人设为0;对于医保手册号PAPMI_Name3,将有医保手册的人设为1,没有医保手册号的人设为0,将没有医保手册号的病人删除,因为没有医保手册号的病人是不享受医保。
(2)对于表2.2病人资料费用明细
此表是所有表中有用信息最多,且是最为重要的表。选取里面下医嘱科室WORKLOAD_RECDEP_DR、医嘱数量WORKLOAD_QUANTITY、执行科室WORKLOAD_RECDEP_DR、下嘱医生WORKLOAD_RESDOC_DR、核算分类WORKLOAD_TAREC_DR、费用WORKLOAD_TOTALPRICE、单价WORKLOAD_UNITPRICE等信息,放入新表中;利用数据库语言,将医嘱日期WorkLoad_OrdDate到结算日期WorkLoad_FlagDate的时间间隔求出来表 数据处理后形成的新表
医保对象 购药记录 年龄 病例号 医保手册号 性别 是否死亡 17861496 0 6007833 0 0 工作单位 执行科室 下医嘱科室 医嘱数量 下医嘱医生 手机号 账单号 0 193 203 70 1326 0 5060035 核算分类 费用 单价 时间间隔 医嘱子类 3 1.75 0.025 0 25 医保对象 购药记录 年龄 病例号 医保手册号 性别 是否死亡 22568444 0 1519350 0 0 工作单位 执行科室 下医嘱科室 医嘱数量 下医嘱医生 手机号 账单号 1 191 133 1 794 0 5066057 核算分类 费用 单价 时间间隔 医嘱子类 …… 1 118 118 0 15 …… 5.logit回归模型
5.1.1 模型有效性检验
与一般的线性模型类似,logit模型也需要对模型进行检验和评价,同样分为回归的显著性检验、回归系数的显著性检验和模型拟合度评价。
logit模型回归方程整体显著性检验
logit模型回归方程的显著性检验用于检验用于检验logitP与所有变量之间的线性关系是否显著,检验的原假设为各回归系数为零,备选假设为各回归系数不同时为零。常用的检验方法有对数似然比检验和Housmer-Lemeshow检验。
(1)对数似然比检验
假设没有引入任何解释变量,即方程仅包含常数项时,回归方程的似然函数值为,引入解释变量后似然函数为,则似然比为。显然,似然比值为,且值越接近1表明模型中解释变量对模型总体没有显著影响;反之,越接近0表明引入解释变量对模型具有显著影响。
构造如下似然比卡方统计量:
可以证明,在原假设成立时,该统计量服从自由度为的卡方分布,为引入模型变量的个数。SPSS会自动给出似然比卡方统计量及其概率p值。若p值小于给定的显著性水平,则拒绝原假设,认为回归方程整体显著;反之,认为回归方程不显著。
(2)Housmer-Lemeshow检验
通过二元logit回归计算给定解释变量时被解释
文档评论(0)