[摘要] 本文從數據倉庫和數據挖掘的角度探討了零售業在現代化的市場進行信息收集和分析的必要性和發展趨勢。提出了零售業基于數據挖掘的數據倉庫設計與構造和利用數據挖掘技術進行的各種有效分析,闡明了基于數據挖掘技術的信息高效利用是商家競爭的有效手段。
[關鍵詞] 零售業 數據倉庫 數據挖掘
零售業是任何一個處于從事由生產者到消費者的產品營銷活動的個人或公司,他們從批發商、中間商或者制造商處購買商品,并直接銷售給消費者。當代的零售業早已不再是傳統的“整買零賣,賤進貴出”的簡單商業行為。它是行業間科學管理和高科技應用的競爭。沃爾瑪前CEO David Glass 曾經說過這樣一句話:“沃爾瑪是一家科技信息公司”。乍一聽,這句話很難理解:沃爾瑪不是世界上最大的零售商嗎?細細品味,Glass 這句話可以說是一語道出了沃爾瑪低成本、高效益的真諦。
眾所周知,現代化的市場信息收集和分析本身就是高科技的體現。消費者的心理、行為、生活習慣,以及收入甚至婚姻狀況無不成為商家的決策必需,由此,新的系統、軟件應運而生。高科技在產品開發、商品策劃、銷售預測、貨源采購和精確定價等各個環節的應用已經成為經營者們不可缺少的決策依據。而支持眾多決策的是其中的數據倉庫和挖掘技術。
一、構建數據倉庫與數據挖掘技術的必要性
簡單講數據倉庫是一種多個異種數據源在單個站點以統一的模式組織存儲,以支持管理決策。數據挖掘是從存放在數據庫、數據倉庫或其他信息庫中的大量數據中挖掘有用知識的過程。
數據的豐富帶來了對強有力的數據分析工具的需求,大量的數據被描述為“數據豐富”,但“信息貧乏”??焖僭鲩L的海量數據收集、存放在大型和大量數據庫中,沒有強有力的工具,理解它們已經遠遠超出了人的能力。結果,收集在大型數據庫中的數據變成了“數據墳墓”——難得再訪問的數據檔案。這樣,重要的決定常常不是基于數據庫中的信息豐富的數據,而是基于決策者的直覺,因為決策者缺乏從海量數據中提取有價值知識的工具。此外,考慮當前的專家系統技術,通常,這種系統依賴用戶或領域專家人工地將知識輸入知識庫。不幸的是,這一過程常常有偏差和錯誤,并且耗時、費用高。數據挖掘工具進行數據分析,可以發現重要的數據模式,對商務決策、知識庫、科學和醫學研究做出了巨大貢獻。數據和信息之間的鴻溝要求系統地開發數據挖掘工具,將數據墳墓轉換成知識“金塊”。簡單講數據挖掘是從大量數據中提取或“挖掘”知識。
數據倉庫中不是存放每個銷售事物的細節,而是存放每個部門每類商品的匯總數據,或對較高層次的匯總數據。OLAP(聯機分析處理)提供數據倉庫中匯總數據的多視圖和動態視圖能力,為成功的數據挖掘奠定了堅實的基礎。數據挖掘可以幫助商界經理們找到合適的客戶,也能獲得對商務的洞察,幫助提高市場份額和增加利潤。此外,數據挖掘能夠幫助經理們了解客戶的群體特點,并據此制定價格策略;不是根據知覺,而是根據客戶的購買模式導出的實際商品組的排放;在降低推銷商品開銷的同時,提高總體推銷的純效益。
二、零售業中的數據倉庫與數據挖掘
零售業是數據挖掘的主要應用領域,這是因為零售業積累了大量的銷售數據,顧客購買歷史記錄,貨物進出,消費與服務記錄,等等。其數據量在不斷地迅速膨脹,特別是由于日益發展的Web或電子商務商的商業方式的方便和流行。今天,許多商店都有自己的Web站點、顧客可以方便地在線購買商品。一些企業,如Amazon.com,只有在線方式,沒有磚瓦構成的(物理的)商場。零售數據為數據挖掘提供了豐富的資源。
零售數據挖掘可有助于識別顧客購買行為,發現顧客購買模式和趨勢,改進服務質量,取得更好的顧客保持力和滿意程度,提高貨品銷售比率,涉及更好的貨品運輸與分銷策略,減少商業成本。
零售業中的數據挖掘可從以下幾個方面具體實施:
1.基于數據挖掘的數據倉庫設計與構造
由于零售數據覆蓋面廣(包括銷售、顧客、職員、貨品運輸、銷量和服務),所以有許多設計數據倉庫的方式。所包含的細節級別可以變化很大。由于數據倉庫的主要用途是支持數據分析和數據挖掘,預先的一些數據挖掘例子的結果可作為設計和開發數據倉庫結構的參考依據。這些設計要決定哪些維護什么級別,以及為保證高質量和有效的數據挖掘應進行哪些預處理。建議以遞增、進化的方式(如圖1)實現數據倉庫。
圖1 數據倉庫開發的方法
2.銷售、顧客、產品、時間和地區的多維分析
考慮到顧客的需求,產品的銷售,趨勢和時尚,以及日用品的質量、價格、利潤和服務,零售業需要的是實時的信息。因此提供強有力的多維分析和可視化工具是是十分重要的一件事,這包括提供根據數據分析的需要構成復雜的數據立方體如圖2所示?;痉襟w包含所有的維city,item和year,它可以返回這三維的任意組合。頂點方體表示分組為空的情況,它包含所有銷售的總合。特征數據立方體,在零售數據分析中是一種有用的數據結構,因為它方便了帶有復雜條件的聚集上的分析。
圖2 三維數據立方體
3.促銷活動的有效分析
零售業經常通過廣告、優惠券和各種折扣和讓利的方式搞促銷活動,以達到促銷產品,吸引顧客的目的。認真分析促銷活動的有效性,有助于提高企業利潤。多維分析可滿足這方面分析的要求,方法是通過比較促銷期間的銷售量和交易數量與促銷活動前后的有關情況。此外,關聯分析可以找出哪些商品可能遂將假商品一同被購買,特別是與促銷活動前后的銷售向比,它廣泛應用于購物車或事物數據分析。
4.顧客保持力——顧客忠誠分析
通過顧客榮譽卡信息,可以記錄下一個顧客的夠買序列。顧客的忠誠和購買趨勢可以按系統的方式加以分析。由同一顧客在不同時期購買的商品可以分組為序列。序列模式挖掘可用于分析顧客的消費或忠誠的變化,據此對價格和商品的花樣加以調整,以便留住老客戶,吸引新顧客。
5.購買推薦和商品參照
通過從銷售記錄中挖掘關聯信息,可以發現買某一品牌香水的顧客很可能夠買其他一些商品。這類信息可用于形成一定的購買推薦,購買推薦可在Web、每周傳單或收據上宣傳,以便改進服務,幫助顧客選擇商品,增加銷售額。同樣,諸如“本周熱點商品”之類的信息或有吸引力的買賣也可以和相關信息一同發布,以達到促銷的目的。
總之,與其他行業一樣,零售業的競爭是信息獲取和有效利用的競爭。數據挖據可以幫助商界經理們找到更合適的客戶,也能獲得對商務的洞察,幫助提高市場份額和增加利潤。此外,數據挖掘能夠幫助經理們了解顧客的群體特點,并據此制定價格策略;不是根據直覺,而是根據顧客的購買模式導出的實際商品組來修正商品排放;在降低推銷商品開銷的同時,提高總體推銷的純效益。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。