- 1、本文档共45页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
五、联网数据应用演示 1.分析中断缴费人员的流失,分地区、分企业经济类型(国有、集体、外资、其他企业)、分性别、分年龄段参保人员中断缴费人员数量 2.分析参保人员中未来3年的预测退休人数(女50男60,不包括提前退休) 数据范围一:联网省份部分数据 五、联网数据应用演示 3.当期停止领取养老金人员年龄分组,从中可算出平均余命 4.分地区分性别分析离退休人员退休时平均年龄,分正常退休和提前退休 5.分地区、分单位类型(企业和机关事业)分性别、养老金水平差异 五、联网数据应用演示 数据范围二:地方运用联网数据开展分析应用的实例 六、联网数据质量评价 数据质量的评价:三个方面(一个指标) 一是数据格式正确 二是数据内容准确 三是与相关指标逻辑关系对应 目标 建立质量评价体系 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 通过指标项数据错误率进行判定 空项缺项 错误率 准确程度 逻辑对应 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 数据可用率计算方法及公式: 第一步:计算数据错误率 第二步:根据指标的数据错误率分类,确定指标的类别和可用度 第三步:根据分类计算数据的可用率 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 数据可用率计算方法及公式: 第一步:计算数据错误率 数据错误率 =空项缺项率or准确率or逻辑对应正确率 (or指或运算) 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 数据可用率计算方法及公式: 第二步:根据指标的数据错误率分类,确定指标的类别和可用度 第一类:指数据错误率在1%以下, 可用度=1 第二类:指数据错误率在1-20%之间, 可用度=2 第三类:指数据错误率在20-50%之间, 可用度=3 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 数据可用率计算方法及公式: 第三步:根据分类计算数据的可用率 每类指标的数据可用率 =[该类指标的数据总量÷全部数据总量] ×100% 数据总量 =[单位库数据量×单位库指标总量]+ [在职库数据量×在职库指标总量]+ [离退休库数据量×离退休库指标总量] 六、联网数据质量评价 联网指标的可用程度:(用于应用和分析) 对北京、天津、河北、辽宁、吉林、上海、福建、陕西8省的数据质量进行了评价。 1.可用程度较高的是上海、北京、天津。 2.离退休库的指标可用度最高。 六、联网数据质量评价 联网指标的可用程度排名(第一类) 六、联网数据质量评价 联网指标的可用程度综合排名(第二类) 六、联网数据质量评价 联网指标的可用程度综合排名(第三类) 规范整理数据 建设优质数据环境 是支持事业发展的当务之急! 谢谢! 养老保险联网数据应用分析框架 联网数据应用 联网数据应用 综合查询 公众服务 业务支持 测算支持 模型数据 支持 联网数据分析 联网数据分析 分类 归纳 比较 关联 预测 数据分析 数据挖掘 数据统计 对数据进行有效的组织(排列组合)、整理及特征提取,常用于用户查询,交互性强 深层次的数据分析,找出数据中潜在的规律和趋势,常用于决策分析系统(如精算领域中模型的建立和应用) 数 据 仓 库 技 术 一、联网数据指标结构 一、联网数据指标结构 交换库指标 期别类 地区代码类 单位信息类 职工信息类 离退休人员信息类 一、联网数据指标结构 单位信息类 单位自然属性 单位社会属性 单位参保属性 单位基金属性 一、联网数据指标结构 单位自然属性 第3项:单位编号 第4项:单位名称 单位社会属性 第5项:单位类型 第6项:组织机构代码 第7项:经济类型 第8项:隶属关系 第9项:所属行业 一、联网数据指标结构 单位参保属性 第10项:征缴方式 第11项:单位参保缴费状态 第12项:参保日期 第13项:单位缴费基数 一、联网数据指标结构 单位基金属性 第14项:本月
文档评论(0)