WEB文本挖掘在客户知识管理中应用.docVIP

WEB文本挖掘在客户知识管理中应用.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
WEB文本挖掘在客户知识管理中应用

WEB文本挖掘在客户知识管理中的应用   提要本文以客户知识管理需求为出发点,对WEB页面中富有知识资源价值的WEB文本及其挖掘方法进行研究,提出客户知识管理中的WEB文本挖掘采集方法,为进一步实现分布式知识资源的动态配置与管理打下了良好的基础,从而更好地支持客户知识管理实施。   关键词:知识管理;客户知识采集;WEB文本挖掘   中图分类号:C93文献标识码:A      一、引言      随着知识经济的发展,企业基于信息的竞争优势正在向基于知识创造的竞争优势发展,知识作为一种稀缺资源成为经济发展的核心要素。企业的知识资产不仅可以增加企业的市场竞争力,不断充实企业知识资本,累积企业实力,还能更好的支持企业管理。因此,知识管理作为企业管理的新模式悄然兴起,实施知识管理成为企业的重要战略。   在客户关系管理中,传统的方法是采用客户服务模式处理客户的信息和知识,其核心是建立基于售后服务的客户知识采集、反馈体系。本文以客户知识采集需求为基础,以WEB文本中的客户知识为采集目标,以WEB文本挖   掘的相关方法与技术为手段,创建了基于WEB文本挖掘客户知识采集方法,具有很广的研究和应用价值。      二、基于WEB文本挖掘的客户知识管理方法      (一)知识管理的概念。世界知识管理之父Sveiby博士1986年在世界上首次提出知识管理这个名词。知识管理的概念可从狭义和广义的角度理解:狭义的知识管理主要是针对知识本身的管理,包括对知识的创造、获取、加工、存储、传播和应用的管理;广义的知识管理不仅包括对知识进行管理,而且包括与知识有关的资源和无形资产的管理,涉及知识组织、知识设施、知识资产、知识活动、知识人员的全方位和全过程的管理。   (二)客户知识管理理论。1997年美国学者韦兰与科尔首次完整提出了客户知识管理(简称CKM)。CKM是一种管理策略,它使得企业组织、工作流程、技术支持和客户服务以客户为中心来协调和统一与客户的交互行动,从而达到获取、发展、保留价值客户,挖掘潜在客户,提升客户满意度和忠诚度,最终使客户长期价值最大化,为企业增加盈利。作为解决方案,CKM集合了当今必威体育精装版的信息技术,包括Internet和电子商务、多媒体技术、数据仓库和数据挖掘、专家系统和人工智能、呼叫中心以及相应的硬件环境。   (三)基于WEB挖掘的知识采集。知识采集作为一个外来词,又名知识获取、知识抽取。本文采用知识采集,主要是为了进一步突出在这个过程中对知识的收集和分类。知识采集也有自己的生命周期。从早期的直接从原始资料(人类专家和书面材料)中采集知识,到中期的从知识素材中提炼规律性知识,再到后期的通过实践检验和修正知识,经历过无数次周而复始的循环。客户知识采集过程体系应包括三项基本功能:(1)数据或信息采集功能;(2)信息到知识的转化功能;(3)知识分类功能。   企业关注客户服务,采集经销商和最终消费者对产品提出的各类问题及意见,这些信息和知识很大一部分存在于分布在全国各地经销商的网站中,知识采集者不可能一一登录网站查看。因此,需要设计面向WEB页面的知识采集方法,实现自动获取。   (四)WEB文本挖掘方法。在WEB文本挖掘中,文本的特征表示挖掘工作的基础,而文本分类和聚类是两种最重要、最基本的挖掘方法。   矢量空间模型(VSM)是近年来应用较多且效果较好的方法之一。在该模型中,文档空间被看作是由一组正交词条矢量所形成的矢量空间,每个文档d表示其中的一个范化特征矢量:   V(d)=(t1,w1(d);…;ti,wi(d);…;tn,w(d))   其中ti为词条项,wi(d)为ti在d中的权值。可以将d中出现的所有单词作为ti,也可以要求ti是d中出现的所有短语,从而提高内容特征表示的准确性。   wi(d)一般被定义为ti在d中出现频率tfi (d)的函数,即:   wi(d )=(tfi(d))(1)   式中常用的有:   布尔函数――=1,tf(d)?1   0,tf(d)=0   平方根函数――=   对象函数――=log(tfi(d)+1)   TFIDF函数――=tfi(d)×log[N/ni]   其中,N为所有文档的数目,ni为含有词条ti的文档数目。   文本分类是一种典型的有教师机器学习问题,一般分为训练和分类两个阶段,具体过程如下。   1、训练阶段:①定义类别集合C={c1,…,ci,…,cn},这些类别可以是层次式的或并列式的;②给出文档集合S={s1,…,sj,…,sn},每个训练文档sj,标上类别标识cj;③统计S中所有文档的特征矢量V(sj),确定代表C中每个类别的特征矢量V(cj)。   2、分类阶段:①对于测试文档集合T={d1,

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档