基于K―means算法的电子商务客户细分研究.docVIP

下载本文档

5
0
约4.2千字
约 8页
2016-02-21 发布于北京
举报
版权申诉

基于K―means算法的电子商务客户细分研究.doc

1、本文档共8页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于K―means算法的电子商务客户细分研究.doc

基于K―means算法的电子商务客户细分研究　　【摘要】本文首先对客户细分理论、聚类分析与K-means算法进行了阐述与分析，然后运用实例分析完成了对K-Means聚类算法在电子商务客户细分中应用的研究。通过本文的研究来识别、分析电子商务的客户信息，从客户信息中挖掘出潜在知识，对客户进行分类管理，为电子商务企业了解客户、挖掘潜在客户、实现差异化营销提供有力的帮助，同时为聚类技术在电子商务客户细分中的应用研究提供一些新思路。　　【关键词】客户细分聚类分析 K-means算法　　一、引言　　在竞争日益激烈的网络商业时代，电子商务企业越来越强烈的感觉到客户资源是企业获胜的法宝之一。因此企业开始从以产品为中心的模式向以客户为中心的模式转变，主要围绕保留现有顾客和挖掘潜在顾客展开，预测出客户未来的购买趋势，制定相应的营销策略。但是随着企业产品的个性多样化，客户的需求日益增加，传统的应用统计学的方法对客户进行细分显得力不从心。采用聚类挖掘算法可以处理几个甚至上百个变量，通过收集整理客户相关信息，发现存在于客户整体内部具有不同需求特点、购买行为、浏览兴趣等特征的客户群体，分析出具有相似浏览或购买行为的客户群，进而对客户进行细分，帮助电子商务企业深入了解自己的客户，为客户群体提供更加全面的个性化服务，提高客户的满意度和忠诚度，为企业创造更多的价值。　　二、客户细分相关理论　　客户细分是20世纪50年代中期由美国学者温德尔?史密斯（Wendell R.Smith）提出的，他认为“客户细分是基于某一时期市场中个体需求的不同特点而做出的产品决策，而产品差异策略则仅定位于市场竞争者，不考虑需求的复杂性[1]。”其理论依据在于顾客需求的异质性和企业需要在有限资源的基础上进行有效地市场竞争。简单地说，客户细分是指在明确的战略业务模式和特定的市场中，根据客户的属性，行为，需求，偏好以及价值等因素对客户进行分类，并提供有针对性的产品，服务和销售模式。　　三、聚类分析　　聚类（clustering）是一个将数据集划分为若干组（class）或类（cluster）的过程，并使得同一个组内的数据对象具有较高的相似度，而不同组内的数据对象则是不相似的。一个聚类（cluster）就是由彼此相似的一组对象所构成的集合，不同聚类中的对象通常是不相似的。相似或不相似的度量是基于数据对象描述属性的取值来确定的。聚类源于很多领域，包括数学，计算机科学，统计学，生物学和经济学。在不同的应用领域（如商业、地理、保险业、因特网、电子商务），很多聚类技术都得到了发展，这些技术方法被用作描述数据，衡量不同数据源间的相似性，以及把数据源分类到不同的簇中。聚类分析的结果不仅可以揭示数据间的内在联系与区别，同时也为进一步的数据分析与知识发现提供了重要的依据，如数据间的关联规则，分类模式以及数据的变化趋势等。　　目前在文献中存在大量的聚类算法，算法的选择取决于数据的类型以及聚类的目的和应用。图1展示了常用聚类算法之间的层次关系[2]。本文即采用K-means聚类算法。　　四、K-means算法　　（一）K-means算法的基本原理　　K-means算法是最为经典的基于划分的聚类方法，是十大经典数据挖掘算法之一。给定一个包含n个数据对象的数据库，以及要生成簇的数目k，随机选取k个对象作为初始的k个聚类中心；然后计算剩余各个样本到每一个聚类中心的距离，把该样本归到离它最近的那个聚类中心所在的类，对调整后的新类使用平均值的方法计算新的聚类中心；如果相邻两次的聚类中心没有任何变化，说明样本调整结束且聚类平均误差准则函数已经收敛。本算法在每次迭代中都要考察每个样本的分类是否正确，若不正确，就要调整。在全部样本调整完成后修改聚类中心，进入下一次迭代。如果在一次迭代算法中，所有的样本被正确分类，则不会有调整，聚类中心不会有变化。在算法迭代中值在不断减小，最终收敛至一个固定的值。该准则也是衡量算法是否正确的依据之一。　　（二）K-means算法的步骤　　1.给定一个包含n个数据的数据集D，给定聚类个数k和k个初始聚类中心Zj（I），j=1，2，…k；　　2.计算每个数据到聚类中心的距离D（xi，Zj）（I），i=1，2，…k，若满足　　D（xi，Zk（I））=min{D（xi，Zj（I），j=1，2，3，…n）}，xi∈wk （3-1）　　并根据距离最小将每个对象分派到最相近的聚类；　　3.重新计算每个聚类的均值并确定新的聚类中心；计算误差平方和准则函数J；　　5.输出k个聚类集合。　　五、K-means算法在电子商务客户细分中的应用　　（一）K-means算法在客户细分中的步骤　　通常我们根据电子商务网站中的访客日志或者C