浅析数据挖掘技术在企业职工培训中的应用.docVIP

下载本文档

3
0
约2.36千字
约 7页
2017-02-20 发布于河北
举报
版权申诉

浅析数据挖掘技术在企业职工培训中的应用.doc

1、本文档共7页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浅析数据挖掘技术在企业职工培训中的应用

浅析数据挖掘技术在企业职工培训中的应用　　从现状看，数据挖掘范畴内的技术，惯常用于金融、大规模特性的商业之中。然而，企业预设的职员培训，较少采纳这一技术。对于搜集得来的培训信息，仍停留于建构某一数据库、单一情形下的数据查验。数据信息特有的决策价值，没能充分被发觉。本文依循数据挖掘的本源原理，创设了新颖情形下的数据库。采纳挖掘手段，予以深入调研。数据挖掘得来的适宜结论，能为后续时段的培训规划，提供最佳指引。　　1新颖技术的特性　　搜集得来的初始数据通常数目偏多，数据表征出来的不完整倾向应当被注重。原初的数据夹带着噪声，且带有模糊特性及随机特性。数据挖掘依托着的手段，是从搜集得来的最初数据以内提炼出潜藏着的、不被知晓的、带有高层级价值这样的信息、关联着的知识等。惯用的挖掘方式包含关联规则、建构好的决策树、神经网络及特有的贝叶斯、建构的粗糙集、对应着的模糊集、挖掘流程内的聚类分析。细分出来的挖掘步骤整合了初始时段的数据预备、数值的选取、预处理特有的流程、侧重的挖掘流程、模型更替及转变、后续时段的挖掘评价。　　数据挖掘概念。数据挖掘是从大量的、不完整的、有噪声的、模糊的和随即的数据中，提取隐含在其中的、人们事先不知道的、潜在的和有价值的信息和知识的过程。数据挖掘的技术最常用的数据挖掘技术主要有决策树、关联规则、贝叶斯、神经网络、聚类分析、模糊集和粗糙集等。数据挖掘的步骤数据的挖掘过程主要包括5个阶段:数据准备、数据选择、数据预处理、数据挖掘、转换模型及模式评价。　　2构建数据库　　数据挖掘特性的新颖技术不能脱离建构起来的数据库。它能从数目偏多的信息之内提炼得来可用的数值。职员培训特有的领域以内，数据库可以归整在册范畴的一切职员，对于获取到的关联结果予以辨识解析。数据库存留着的信息之内涵盖基础数据、培训得来的真正结果。　　2. 1拟定物理框架　　职员培训特有的数据库，应设定适宜情形下的物理模型。拟定好的物理模型是数据特有的存留方式、多层级的数据组织。例如:某企业筛选出来的数据库，带有关系型这样的特性。搭配的管理系统设定成SQL架构下的server。　　2. 2拟定概念模型　　职员培训关涉的概念模型能够明晰预设的系统界限，拟定根本主题。数据库涵盖着的根本信息是职员固有的自身信息、这一时段的培训成绩。归整好的这些信息凸显了单一性，但又潜藏着某些关联。采纳数据仓库，提炼并归整这样的数值，以便提炼得来决策依凭的可用信息。依循细分出来的职员特性、建构的主题，把总体范畴内的培训结果，分成多个层级，并归入数据库。　　3选出来的运用实例　　3. 1采纳的关联规则　　依循的评判指标，是体系架构中的置信度、对应着的支持度。必备的概率信息包含物品集特有的出现频次。最小数值的支持度表征着筛选出来的这一项目，在统计之中凸显了最低层级的重要价值。最小数值的置信度表征着设定好的这类规则，凸显了不可靠的倾向。采纳关联规则，建构精准模型，以便解析某一时段的培训状态。　　3. 2采纳的模型　　抽取出来的数值涵盖固有的职员信息、测试得来的成绩等。采纳预设的规则，操作这些数值。这样做能够明晰数值潜藏着的彼此关联，抽取得来的字段含有单位称呼、职员个体姓名、微机处理特有的等级。　　3. 3具体的挖掘步骤　　预处理特有的时段中，为了辨识设定好的关联规则，对于初始数据予以概念化。采纳A这样的符号来表征职员固有的年龄。这种情形之下，A (1)特有的信J息，表T年龄没能达到25岁;A (2)表征着年龄涵盖在25岁至35岁;A (3)表征着年龄超出了35岁。采纳H这一符号，表明测试特有的通过状态。H (1)涵盖着没能通过的职员，H (2)涵盖着通过的职员。经山离散化特有的处理以后，得来最终结果。　　3. 4后续的挖掘步骤　　在测试之中，职员特有的通过人数，总和5910;没能通过的人数，总和1810。没能通过的概率，占到了22%。采纳预定的关联规则来挖掘这样的数据。体系范畴内的每类行为都设定了这一规则。这就表明输入数值及对应着的输出之间带有偏强的关联。　　3. 5解析得来的结论　　数据特有的重要性，也即兴趣度，能够辨识频繁项、设定好的规则等。依循降序排列可以获取明晰的规则列表。例如某次解析得来这种结论:年龄超出50这样的职员、工龄超出25这样的职员或者高级别范畴内的职员通过培训概率还是偏大的。与此同时，学历层级偏低的职员，通过等级与特有的学历，凸显了相关的倾向，这样的对应符合惯常的认知。　　由此可见，学历层级偏低这样的职员在接纳新认知时能力是偏弱的。针对企业以内的这类职员，在