WEB文本挖掘在客户知识管理中应用.docVIP

下载本文档

0
0
约3.81千字
约 10页
2018-05-22 发布于福建
举报
版权申诉

WEB文本挖掘在客户知识管理中应用.doc

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

WEB文本挖掘在客户知识管理中应用

WEB文本挖掘在客户知识管理中的应用　　提要本文以客户知识管理需求为出发点，对WEB页面中富有知识资源价值的WEB文本及其挖掘方法进行研究，提出客户知识管理中的WEB文本挖掘采集方法，为进一步实现分布式知识资源的动态配置与管理打下了良好的基础，从而更好地支持客户知识管理实施。　　关键词：知识管理；客户知识采集；WEB文本挖掘　　中图分类号：C93文献标识码：A 　　　　一、引言　　　　随着知识经济的发展，企业基于信息的竞争优势正在向基于知识创造的竞争优势发展，知识作为一种稀缺资源成为经济发展的核心要素。企业的知识资产不仅可以增加企业的市场竞争力，不断充实企业知识资本，累积企业实力，还能更好的支持企业管理。因此，知识管理作为企业管理的新模式悄然兴起，实施知识管理成为企业的重要战略。　　在客户关系管理中，传统的方法是采用客户服务模式处理客户的信息和知识，其核心是建立基于售后服务的客户知识采集、反馈体系。本文以客户知识采集需求为基础，以WEB文本中的客户知识为采集目标，以WEB文本挖　　掘的相关方法与技术为手段，创建了基于WEB文本挖掘客户知识采集方法，具有很广的研究和应用价值。　　　　二、基于WEB文本挖掘的客户知识管理方法　　　　（一）知识管理的概念。世界知识管理之父Sveiby博士1986年在世界上首次提出知识管理这个名词。知识管理的概念可从狭义和广义的角度理解：狭义的知识管理主要是针对知识本身的管理，包括对知识的创造、获取、加工、存储、传播和应用的管理；广义的知识管理不仅包括对知识进行管理，而且包括与知识有关的资源和无形资产的管理，涉及知识组织、知识设施、知识资产、知识活动、知识人员的全方位和全过程的管理。　　（二）客户知识管理理论。1997年美国学者韦兰与科尔首次完整提出了客户知识管理（简称CKM）。CKM是一种管理策略，它使得企业组织、工作流程、技术支持和客户服务以客户为中心来协调和统一与客户的交互行动，从而达到获取、发展、保留价值客户，挖掘潜在客户，提升客户满意度和忠诚度，最终使客户长期价值最大化，为企业增加盈利。作为解决方案，CKM集合了当今必威体育精装版的信息技术，包括Internet和电子商务、多媒体技术、数据仓库和数据挖掘、专家系统和人工智能、呼叫中心以及相应的硬件环境。　　（三）基于WEB挖掘的知识采集。知识采集作为一个外来词，又名知识获取、知识抽取。本文采用知识采集，主要是为了进一步突出在这个过程中对知识的收集和分类。知识采集也有自己的生命周期。从早期的直接从原始资料（人类专家和书面材料）中采集知识，到中期的从知识素材中提炼规律性知识，再到后期的通过实践检验和修正知识，经历过无数次周而复始的循环。客户知识采集过程体系应包括三项基本功能：（1）数据或信息采集功能；（2）信息到知识的转化功能；（3）知识分类功能。　　企业关注客户服务，采集经销商和最终消费者对产品提出的各类问题及意见，这些信息和知识很大一部分存在于分布在全国各地经销商的网站中，知识采集者不可能一一登录网站查看。因此，需要设计面向WEB页面的知识采集方法，实现自动获取。　　（四）WEB文本挖掘方法。在WEB文本挖掘中，文本的特征表示挖掘工作的基础，而文本分类和聚类是两种最重要、最基本的挖掘方法。　　矢量空间模型（VSM）是近年来应用较多且效果较好的方法之一。在该模型中，文档空间被看作是由一组正交词条矢量所形成的矢量空间，每个文档d表示其中的一个范化特征矢量：　　V（d）=（t1，w1（d）；…；ti，wi（d）；…；tn，w（d））　　其中ti为词条项，wi（d）为ti在d中的权值。可以将d中出现的所有单词作为ti，也可以要求ti是d中出现的所有短语，从而提高内容特征表示的准确性。　　wi（d）一般被定义为ti在d中出现频率tfi （d）的函数，即：　　wi（d ）=（tfi（d））（1）　　式中常用的有：　　布尔函数――=1，tf（d）?1 　　0，tf（d）=0 　　平方根函数――= 　　对象函数――=log（tfi（d）＋1）　　TFIDF函数――=tfi（d）×log［N/ni］　　其中，N为所有文档的数目，ni为含有词条ti的文档数目。　　文本分类是一种典型的有教师机器学习问题，一般分为训练和分类两个阶段，具体过程如下。　　1、训练阶段：①定义类别集合C=｛c1，…，ci，…，cn｝，这些类别可以是层次式的或并列式的；②给出文档集合S=｛s1，…，sj，…，sn｝，每个训练文档sj，标上类别标识cj；③统计S中所有文档的特征矢量V（sj），确定代表C中每个类别的特征矢量V（cj）。　　2、分类阶段：①对于测试文档集合T=｛d1，