傅柯萌
摘要:如何利用客戶數據已經成為了電子商務目前最關注的問題。Web挖掘的出現,給電子商務所面臨的問題提供了有效的解決途徑。就這一問題,系統分析了客戶在電子商務中的重要性以及對客戶行為的Web挖掘。
關鍵詞:電子商務;Web挖掘;客戶行為
中圖分類號:F224-39
文獻標識碼:A
文章編號:167Z-3198(2009)08-0237-02
1電子商務中客戶的重要性
營銷學上有個著名的公式;100-1=0,即一個企業即使有100個客戶對其感到很滿意,但是只要有一個客戶對持否定態度,企業的盛名就可能立即化為0,盡管這個觀點有點夸大其實,但是至少它說明了一個問題,即:客戶滿意的重要性。
市場經濟體制下,公司的目標就是為企業持股者爭取利潤的最大化,而公司的利潤從何而來——客戶。換句話說,為客戶服務能創造長期的利益,而長期的利益又能夠滿足持股者的目的需求。雖然,使客戶滿意需要花更多的錢,同時也需要更長的周期,但是長周期加上大量的資金意味著企業更多的利益。所以,客戶對企業的重要性是越來越突出。即使在電子商務領域這個遵循市場經濟體制的網上交易體系。這一重要性也是同樣符合的。
如今Google、Amazon、Yahoo、MSN等一些Web公司都要求員工運用Web挖掘技術來了解客戶行為,并根據挖掘出的信息數據及模式設計更加符合客戶需求的服務和產品。也就是說利用Web挖掘可以了解客戶行為,其分析的數據結果可提供給企業參考,做出合適的調整策略。
2客戶行為的Web挖掘
2.1挖掘數據來源
在挖掘過程中,關鍵性步驟是提供合適的挖掘對象。在電子商務中,客戶行為挖掘的數據源,主要有以下幾種:
(1)服務器日志文件。
Web服務器日志文件記錄了客戶每次登錄瀏覽網站的行為信息,包括了IP地址、時間、頁面等,是Web挖掘的主要數據源。
(2)Cookies日志文件。
Cookies是服務器為自動跟蹤網站瀏覽者而在客戶端生成的標志,用于存儲類似于購物手推車狀態信息或者瀏覽者所訪問的電子商務網站的頁面信息或交易信息等。
(3)客戶信息。
客戶信息指客戶通過Web頁在屏幕上輸入的、要提交給服務器的相關信息。在電子商業網站須進行信用授權才能進行交易,因此客戶大量的個人資料會傳到網站上。對這些信息組織序化后,存儲到數據倉庫中可作為長期分析客戶消費趨勢的來源。
2.2挖掘過程
對客戶行為的Web挖掘并不是雜亂無序的,一般其過程可分為三個階段:
(1)數據的預處理;
預處理主要對用戶訪問日志(包含用戶的訪問日志、引用日志和代理日志)進行過濾、反蜘蛛化、客戶驗證、會話和路徑補全等處理,形成用戶會話文件。
①過濾:收集完數據后,首要的步驟便是過濾出不想要的記錄,為分析做準備。
②反蜘蛛化:所謂蜘蛛,就是搜索引擎對萬維網的掃描建立索引的半自動化程序。蜘蛛的行為與人的行為不同(要比客戶的全面),在數據處理中要把蜘蛛的行為和客戶的行為區分開來,并過濾掉蜘蛛行為在服務器上的記錄。
③客戶驗證:在會話之前必須識別客戶,一是識別出同一客戶在一次瀏覽中為建立會話而發出的頁面請求,另一目的是識別在多次站點瀏覽的同一客戶,使我們能夠分析客戶在數天,數月或是數年中的行為。
④會話;會話指客戶在一次訪問中訪問的所有Web頁面,通過這些可以反映出訪問者對網站什么地方有興趣或關心。
⑤路徑補全;客戶在瀏覽網時可能出現頁面后退現象,導致路徑損失,所以需要根據客戶訪問前后頁面進行推理,補全訪問路徑。
(2)模式發現:
模式發現是對數據預處理所形成的用戶會話文件,利用數據挖掘的一些有效算法,例如統計分析、關聯規則、聚類、分類等。來發現隱藏的模式、規則。
①統計分析:統計方法是從電子商務網站中抽取知識的最常用的方法。可以根據選擇的特征來分析網頁此特征的點擊次數,根據獲得的數據結果來調整網站。
②關聯規則:根據關聯規則,可以從客戶訪問網站的行為中找出相關性。利用這些相關性,可以改進電子商務網站的結構,例如哪些產品可以擺在一起或捆綁銷售。
③聚類和分類:聚類規則是從一組數據項中聚集出相似特征的一個聚類,可分為用戶聚類和網頁聚類。而分類規則是找出描述并區分數據類或概念的模型,并使用模型預測類標記未知的對象類。
(3)模式分析:
在這個階段,主要是對挖掘出來的模式、規則進行分析,找出用戶感興趣的模式,并輔助理解。最常見的模式分析方法是采用sQL查詢語句進行分析。另一種分析方法是先將數據導入并提供可視化的結果輸出。
3Web挖掘的應用
網絡個性化服務是目前電子商務商業運作和發展的新方向,它根據用戶興趣、愛好、習慣,以及各個用戶之間的相關性等向用戶在線推薦商品,提供瀏覽建議,通過不定期調整網站的結構方便用戶訪問。動態地為用戶定制個性化的網站等。
如今,許多商家一直在尋求識別有利可圖的市場分割和追蹤網絡使用者的行為習慣,其目的是提醒用戶他們可能感興趣的產品的實用性。這就出現了像亞馬遜網站那樣的一種新模式,根據某一特殊用戶可能感興趣的問題提出所需信息。對于被特征化的用戶,運用一些客戶分類、挖掘技術,讓他們了解所感興趣產品的預報。
網絡個性化服務的本質就是以客戶為中心提供Web服務。首先,客戶瀏覽訪問電子商務網站的資源;其次,系統分析客戶行為特性,創建訪問模型;最后,根據所獲取的信息知識調整服務,系統進行推薦來滿足不同用戶的個性化需求。通過客戶與系統不斷的交互,最終為客戶提供個性化服務。
4Web挖掘面臨的問題
Web挖掘給電子商務帶來新機遇的同時,也帶來潛在的問題——隱私安全問題。網絡的特點使得我們在網站上留下的信息幾乎都可以被全世界獲得。事實上,對用戶數據的采集和挖掘,有些時候利用了用戶的注冊信息和登記信息,這包括客戶姓名、性別、地址、出生年月、電話號碼、購物習慣、收入、信用卡號碼、電子郵件及經常訪問的Web站點地址等私人信息。如果這些信息的利用未得到客戶的允許,則會涉及到隱私權問題并產生糾紛。
如何對客戶隱私進行保護,我們可以從三個方面著手:第一,立法進行強制性規范;第二,對涉及隱私的網上數據采取技術防范;第三,行業自律,不隨意泄露客戶信息,禁止買賣數據等。
5結語
電子商務是現代信息技術發展的必然結果,也是未來商業運作模式的必然選擇。運用Web挖掘技術對電子商務網站上的客戶行為進行分析,挖掘出客戶行為的知識模式,有助于企業更好的理解客戶改善客戶關系,減少費用支出并且增加網站靈活性,從而為企業帶來更高的利益,也加快了電子商務的發展。