浅析数据挖掘技术在企业职工培训中的应用.docVIP

浅析数据挖掘技术在企业职工培训中的应用.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析数据挖掘技术在企业职工培训中的应用

浅析数据挖掘技术在企业职工培训中的应用   从现状看,数据挖掘范畴内的技术,惯常用于金融、大规模特性的商业之中。然而,企业预设的职员培训,较少采纳这一技术。对于搜集得来的培训信息,仍停留于建构某一数据库、单一情形下的数据查验。数据信息特有的决策价值,没能充分被发觉。本文依循数据挖掘的本源原理,创设了新颖情形下的数据库。采纳挖掘手段,予以深入调研。数据挖掘得来的适宜结论,能为后续时段的培训规划,提供最佳指引。   1新颖技术的特性   搜集得来的初始数据通常数目偏多,数据表征出来的不完整倾向应当被注重。原初的数据夹带着噪声,且带有模糊特性及随机特性。数据挖掘依托着的手段,是从搜集得来的最初数据以内提炼出潜藏着的、不被知晓的、带有高层级价值这样的信息、关联着的知识等。惯用的挖掘方式包含关联规则、建构好的决策树、神经网络及特有的贝叶斯、建构的粗糙集、对应着的模糊集、挖掘流程内的聚类分析。细分出来的挖掘步骤整合了初始时段的数据预备、数值的选取、预处理特有的流程、侧重的挖掘流程、模型更替及转变、后续时段的挖掘评价。   数据挖掘概念。数据挖掘是从大量的、不完整的、有噪声的、模糊的和随即的数据中,提取隐含在其中的、人们事先不知道的、潜在的和有价值的信息和知识的过程。数据挖掘的技术最常用的数据挖掘技术主要有决策树、关联规则、贝叶斯、神经网络、聚类分析、模糊集和粗糙集等。数据挖掘的步骤数据的挖掘过程主要包括5个阶段:数据准备、数据选择、数据预处理、数据挖掘、转换模型及模式评价。   2构建数据库   数据挖掘特性的新颖技术不能脱离建构起来的数据库。它能从数目偏多的信息之内提炼得来可用的数值。职员培训特有的领域以内,数据库可以归整在册范畴的一切职员,对于获取到的关联结果予以辨识解析。数据库存留着的信息之内涵盖基础数据、培训得来的真正结果。   2. 1拟定物理框架   职员培训特有的数据库,应设定适宜情形下的物理模型。拟定好的物理模型是数据特有的存留方式、多层级的数据组织。例如:某企业筛选出来的数据库,带有关系型这样的特性。搭配的管理系统设定成SQL架构下的server。   2. 2拟定概念模型   职员培训关涉的概念模型能够明晰预设的系统界限,拟定根本主题。数据库涵盖着的根本信息是职员固有的自身信息、这一时段的培训成绩。归整好的这些信息凸显了单一性,但又潜藏着某些关联。采纳数据仓库,提炼并归整这样的数值,以便提炼得来决策依凭的可用信息。依循细分出来的职员特性、建构的主题,把总体范畴内的培训结果,分成多个层级,并归入数据库。   3选出来的运用实例   3. 1采纳的关联规则   依循的评判指标,是体系架构中的置信度、对应着的支持度。必备的概率信息包含物品集特有的出现频次。最小数值的支持度表征着筛选出来的这一项目,在统计之中凸显了最低层级的重要价值。最小数值的置信度表征着设定好的这类规则,凸显了不可靠的倾向。采纳关联规则,建构精准模型,以便解析某一时段的培训状态。   3. 2采纳的模型   抽取出来的数值涵盖固有的职员信息、测试得来的成绩等。采纳预设的规则,操作这些数值。这样做能够明晰数值潜藏着的彼此关联,抽取得来的字段含有单位称呼、职员个体姓名、微机处理特有的等级。   3. 3具体的挖掘步骤   预处理特有的时段中,为了辨识设定好的关联规则,对于初始数据予以概念化。采纳A这样的符号来表征职员固有的年龄。这种情形之下,A (1)特有的信J息,表T年龄没能达到25岁;A (2)表征着年龄涵盖在25岁至35岁;A (3)表征着年龄超出了35岁。采纳H这一符号,表明测试特有的通过状态。H (1)涵盖着没能通过的职员,H (2)涵盖着通过的职员。经山离散化特有的处理以后,得来最终结果。   3. 4后续的挖掘步骤   在测试之中,职员特有的通过人数,总和5910;没能通过的人数,总和1810。没能通过的概率,占到了22%。采纳预定的关联规则来挖掘这样的数据。体系范畴内的每类行为都设定了这一规则。这就表明输入数值及对应着的输出之间带有偏强的关联。   3. 5解析得来的结论   数据特有的重要性,也即兴趣度,能够辨识频繁项、设定好的规则等。依循降序排列可以获取明晰的规则列表。例如某次解析得来这种结论:年龄超出50这样的职员、工龄超出25这样的职员或者高级别范畴内的职员通过培训概率还是偏大的。与此同时,学历层级偏低的职员,通过等级与特有的学历,凸显了相关的倾向,这样的对应符合惯常的认知。   由此可见,学历层级偏低这样的职员在接纳新认知时能力是偏弱的。针对企业以内的这类职员,在

文档评论(0)

专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!

1亿VIP精品文档

相关文档