五章购物篮分析MarketBasketAnalysis.pptVIP

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
五章购物篮分析MarketBasketAnalysis

第五章 購物籃分析 Market Basket Analysis 購物籃分析的三大特點 虛擬標籤 (Virtual Items) Confidence、Support 使用購物籃分析的基本流程 使用購物籃分析的基本流程 連續時間序列分析 跨時綜覽 (Time Windows) * * 雖然購物分析的主要資料來源是零售業,但是它仍然可以應用在其他的行業中: ●如果消費者使用信用卡消費,我們將可以推知他 們下一項會購買的商品。 ●電話使用者最常選用的附加功能,可以幫助我 們決定配套方案 。 ●消費者的常用銀行服務,可以幫助我們找出他 們會要的其他服務。 ●異常的保險配套方式可能是詐欺的跡象,提醒 我們進行深入調查。 ●依據患者的病歷,我們可以判定他們使用特定 治療方式發生併發症的可能機會。 有用的 - 包含高品質的有效情報 ●在禮拜四,消費者通常同時購買尿布和啤 酒。 明顯的 - 該行老手已經知道的事 ●消費者簽定維修協定後,通常會買大型家 電用品。 無法理解的 - 看起來沒有合理解釋的 ●當一個大型的五金行開幕後,最常賣出的 商品之一是馬桶蓋。 虛擬標籤可以幫助描述一筆交易,但它們並不是真的分類項 可以幫助比較差異 Example: 健怡可樂 低糖百事可樂 低糖蘇打水 可口可樂 百事可樂 蘇打水 交易紀錄 客戶 商品 1 柳橙汁、蘇打飲料 2 牛奶、柳橙汁、玻璃清潔劑 3 柳橙汁、清潔劑 4 柳橙汁、清潔劑、蘇打飲料 規律 條件 結果 有蘇打飲料, 必有柳橙汁 – 100% 有柳橙汁 , 必有蘇打飲料 – 50% Confidence — 在A事件發生的狀況下,同時發生A、B事件的機率 =條件機率 = P(B∣A) Support— 在所有事件發生的狀況下,同時發生A、B事件的機率 =P(B∩A) 選擇正確的組合 *組成的item是取決於各行業所需 *分類法 – 商品分類 *去除雜質 計算超過門檻的商品 * Support - P(A∩B) * Confidence - P(BlA) 定義threshold 大小 分析機率取得規則 ? 規則(如果 條件句,則 結論句) 表8.5 商品及其組合的機率: 表8.6 規則的信心水準 信心水準最的就是最好的規則,所以我們似乎應該選「如果 B和C 則 A」。但是這裡有點問題,這個規則事實上比隨便說A會出現在交易中還糟。A在45%的交易中出現,但是該規則只有33%的信心水準,規則比隨便猜猜還糟。 這種情況就要利用一技巧 -「增益」( Improvement ) 。增益能告訴我們,一條規則在預測結果時能比隨機發生的機會好多少。公式如下: 當增益效果大於1時,那麼最後的結果會在預期結困的基礎上比單純亂數好;但是當數值小於1時,效果就很差了。表8.7顯示了三種規則的增益效果和最高增益的增益效果。 表8.7 規則的增益效果 當增益效果小於1時,否定陳述句會引出一條比較好的規則。例如: 如果 B 和 C,則 A = 有0.33的信心水準; 如果 B 和 C,則 ~A = 會有0.67的信心水準。 P(~A l B∩C) = 0.67 I(~A l B∩C) = 0.67/0.55 = 1.22 購物籃分析主要發生同一時間的事件,在特定時間點發生的事 時間序列資料 (Time series data) 通常建立在顧客的基本資料上, 才能找出同一個人的不同交易紀錄

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档