- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
智慧人社大数据平台建设整体解决方案
人社大数据业务需求第一章目录Contents人社大数据面临挑战第二章人社大数据解决方案第三章人社大数据实施路径第四章典型业务场景总体架构技术架构实施路径12333语音大数据方案
人社大数据业务需求1
人社大数据业务需求信息共享内部共享:“五险”合一,全国联网共享,异地就业、异地就医、异地领取养老金的需求非常强烈;内外部共享:人社与地税,工商,民政、卫生、住房保障、公安等部门存在信息共享需求。精准决策就业和失业形势分析预测;人才供需医保支付政策调整等业务创新与扶贫办、公安、民政等部门联合,发现违规行为个性化培训服务和评估,及时提醒代办事宜;科学监管医疗保险监管养老保险监管就业专项资金监管等
人社大数据面临的挑战2
人社数据管理现状以及面临的挑战全国所有省级城市和地级人社部门均已建立了数据中心:社会保障卡超过10亿张,覆盖72%的人口32个省级单位全部实现了与部中央数据中心的网络联结90%以上的地市实现了与省级数据中心的联网社保数据量不断增加。以某地级市为例,仅结构化的社保数据库数据已达TB级,如果算上12333电话语音、医保药店视频监控等数据,数据已接近PB级。数据类型已不是简单的结构化数据。数据库中存储的图片信息、12333的语音信息、医保药店的视频监控信息等非结构化数据日益增多。数据统计分析困难。历史数据繁多,部分历史数据未能有效整合、数据不能有效共享,数据提取利用困难。对数据处理速度要求高。海量数据的处理遇到性能瓶颈,而社保经办需要实时性,对数据处理速度提出了挑战。
人社大数据解决方案3
人社大数据建设目标业务创新科学监管精准服务
人社大数据业务分析专题
人员画像示例
人社数据管理现状以及面临的挑战骗保人员相似性分析PatientSimilarityAnalysis
利用相似性分析精准识别同类人员
个性化信息推送和提醒示例
领导仪表盘示例
LED大屏幕分析示例
人社大数据总体架构
人社大数据物理部署架构
数据挖掘建模过程
数据挖掘业务场景—人员群体分类应用场景:在商业上,聚类可以帮助市场分析人员利用消费者的消费数据区分出不同的消费群体,并且的信息,并且概括出分析。概括出每一类消费者的消费习惯。它可以发每一类的特点,进而把注意力放在某一个特ns聚类算法。数据需要是数值化的。,就是将相似的事物聚集在一起,而将不分聚类算法是根据给定的n个对象或者元组每个划分即为一个聚簇,并且k=n。现数据中一些深层定的类上做进一步采用的算法:K-mea算法要求:被分类的算法原理:所谓聚类同的类别的过程。划个划分聚类的方法。相似的事物划分到不的数据集,构建k步骤一:将所有对象随机分配到k个非空的簇中。步骤二:计算每个簇的平均值,并用该平均值代表相应的簇中心。步骤三:根据每个对象与各个簇中心的距离,分配给最近的簇。步骤四:转到步骤二,重新计算每个簇的平均值。这个过程不断重复直到没有数据点被重新分配则停止。
典型业务场景-相关性分析应用场景:产品关联度分析主要的应用场景就是购物篮分析,用于购物推荐或者电影推荐等。比如最典型“啤酒和尿不湿”的案例。在本次项目中,我们可以用于分析客户(经销商、最终买家)的购买记录,为有关联的商品做一些捆绑促销等。采用的算法:Apriori关联算法。算法要求:被分析的商品需要是相对独立的,本身并未作捆绑销售。算法原理:关联度分析是基于概率进行分析的。需要计算以下指标:支持度:一条销售记录同时包含A、B的概率,记作support(A=B)。置信度:包含A的销售记录中包含B的概率,记作confidence(A=B)。提升度:(X发生则Y发生的概率)/(Y发生的概率),记作lift(A=B)=confidence(A=B)/support(B)。? 提升度=1表明A与B是独立的? 提升度1表明A与B是有关联性的,一般实际大于2我们才承认有效? 提升度1表明A与B是互斥的
典型业务场景-需求量预测应用场景:为了更好的调整产量,需要对需求进行预测,根据预测结果动态调整产能。采用的算法:ARIM算法要求:一般需A时间序列算法。要数据的波动有一定的规律性。动态数据处理的统计方法。该方法基于随序列所遵从的统计规律,以用于解决实际有的历史数据对未来进行预测。据进行平稳性检验。据进行多阶差分,阶数需要多次尝试。据进行平稳性检验的白噪声检验。CF(自相关系数)和PACF(偏自相关系算法原理:是一种学方法,研究数据主要目的是根据已机过程理论和数理统计问题。时间序列分析的步骤一:对数步骤二:对数步骤三:对数步骤四:计算A步骤五:确立模型的自回归项和移动平均项。数)。步骤六:使用模型预测短期的值,并
您可能关注的文档
最近下载
- 高速公路养护安全培训会PPT精选文档共23页.ppt
- 普通高中物理课程标准解读PPT学习教案.pptx
- 神经网络与深度学习课件.pptx VIP
- 工程制图_习题集(含答案).doc
- 五年级下册语文第5-6单元综合训练1(原卷+答案)2023-2024学年部编版).pdf VIP
- 2024年湖北省重点高中八校联考自主招生优录数学试卷附答案解析.pdf
- 游戏化教学论文 《小学数学“综合与实践”领域开展游戏化学习的意义与策略》.docx VIP
- 2023年高考北京卷英语阅读理解C篇解析讲义 高三英语一轮复习.pdf
- 2024个人年终工作总结:PPT中的收获与不足.pptx VIP
- 统编版初中语文七年级下册全册教学课件.pptx
文档评论(0)