吳敏
摘要:本文從電子商務信息挖掘的角度來研究數據挖掘在電子商務中的商務應用。針對目前已有的一些WEB數據挖掘方法,作者將數據挖掘中的模糊關聯規則應用到電子商務中的信任評價系統中去,并對這種方法的流程進行詳細說明。
關鍵詞:電子商務;數據挖掘;模糊關聯規則;信任評價系統
1引言
電子商務中的信息挖掘一直是人們研究的熱點。很多研究數據挖掘的學者紛紛將其研究的成果應用到實際當中,并作為市場預測、市場細分與分類、客戶關系管理以及其他商務應用的參考模型。電子商務信息挖掘一般采用的是WEB數據挖掘中的一部分。例如,文獻[1]就是利用SVM來進行電子商務中的應用挖掘——網絡日志的分析,以提取客戶分類及評分。
在電子商務環境中,一個電子商務支撐環境能夠產生一個信任值,通過衡量已交付的服務質量以及從顧客和信任管理機構中獲得的服務評價。沒有任何信任管理機制,許多消費者也許會因為欺騙性的廣告而請求了欺騙性的服務。另一方面,一個簡單但是不完整的信任管理系統也許讓服務提供商有選擇性地欺騙顧客(例如,通過給許多低價的交易提供好的服務,但是在高價的交易中欺騙顧客來謀取大量的好處),以及欺騙信任管理機構(例如,通過在信任評價中合謀欺騙)。一些如此的欺騙可能導致服務質量降級,并且給客戶帶來經濟損失。因此,電子商務行業必須有有效的信任管理[2]。
2關聯規則的分類
關聯規則的一個要求是結果得有透明度和可用性,這些結果是以產品群組規則的形式表示的,它表述了現實的產品和服務是如何組合到一起的。關聯規則容易理解,但它們并不總是有用的。
有用的規則包含高質量、可操作的信息。平凡的結果早已被熟悉商業的任何一個人所知曉。平凡規則確實有一個用處,盡管它不是直接的數據挖掘應用。當一個規則應當在該時間100%出現,然后它卻沒有出現,這種情形可以提供關于數據質量的許多信息。換句話說,不遵循平凡規則的例外情況指出了商業運作、數據收集和處理等可能需要進一步改進的方面。費解的規則似乎沒法解釋,并且不給出行動過程。
當應用購物籃分析時,許多結果常常是平凡的或費解的。平凡規則再現商業常識,浪費了利用高級分析技術的努力。費解的規則是數據中的偶然事件,是不可操作的。[3]
關聯規則有三個度量。支持度反映在交易數據中發現該規則的頻繁程度,置信度說明當“如果”部分為真時“那么”部分也為真的頻繁程度,而提升度反映該規則預測“那么”部分額相對根本沒有規則要好多少。
這樣生成的規則可以分成三類:有用的規則闡明可能沒有預料到的關系,平凡規則闡明已知(或應該知道)存在的關系,費解的規則沒有意義。費解規則常常有很弱的支持度。
3基于模糊關聯規則的電子商務評價系統設計
3.1電子商務信任評價系統
一些著名的電子商務網站采用的是集中式信任管理機制[8]。在淘寶,每完成一筆交易之后,買家能夠給一個反饋給系統,這個反饋是有關賣家的服務質量的,也許是良、中評或差評。淘寶服務器將這個評分存儲在中心管理系統中。它用公式S=P-N來計算出這個反饋的分,其中P表示好評個數,N表示差評個數。淘寶網將這個S值顯示在賣家的網頁上。另一值R=(P – N)/(P + N)(1 ≥ R ≥ 0)是好評率。如果僅用好評率來作為信任評價的標準是不對的。通過模糊關聯規則中,防止一些欺騙。例如,通過給許多低價的交易提供好的服務,但是在高價的交易中欺騙顧客來謀取大量的好處。
規則集相似度可以量化地表示當前的交易狀態是否與正常的狀態的相似程度,由此可以推斷出此次交易的風險程度。并且可以根據其風險程度來進行報警或者提醒。
基于模糊關聯規則的電子商務信任評價系統的流程如下圖所示。
3.2模糊集和模糊隸屬函數的建立
模糊集的建立實際上就是把數據集中的所有屬性用模糊屬性表示[4],每個模糊屬性包含多個模糊值,每個模糊值有其對應的模糊集。模糊隸屬函數用來描述一個確定屬性值對于一個模糊屬性集的隸屬度。一個確定屬性值可以隸屬于多個模糊值,對應有多個隸屬度。
如表1所示交易數據庫T={t1,t2,t3,t4},屬性I={num,money}(i1=num,i2=money)。
將每個屬性又分別劃分為若干個模糊集,對表1所示的數據庫,在計算其各數據項隸屬度之后數據庫被轉換為如表2所示。
4結束語
本文從電子商務信任管理中所發現的一些問題,結合現在數據挖掘在電子商務的應用,找到了一種基于模糊集的關聯規則算法應用到電子商務信任評價中。在基于信譽的電子商務評價問題中,電子商務的評價往往是通過反饋的信息來完成,但是反饋回來的信息以及交易過程中本身所產生的信息要盡量將其中所隱含的信息挖掘出來,進行一定的分析,就可以得到一些有用的規則。而對于一些平凡的規則,也可以利用其來尋找其中的問題。這個系統還可以在進一步的進行擴展。例如,對規則集進行修正,去掉一些費解的規則,還可以去掉一些冗余的關聯規則。這些都可以對整個流程有更好的改進。本文主要是對交易管理中的一些數據屬性進行提取和發現規則。
參考文獻:
[1] 過蓓蓓,方兆本.基于SVM的Web日志挖掘及潛在客戶發現[J].管理工程學報,2010(1).
[2] Yan Wang and Kwei-Jay Lin.Reputation-Oriented Trustworthy Computing in E-Commerce Environments.
[3] Michael J.A.Berry,Gordon S.Linoff.別榮芳 尹靜 鄧六愛譯.Data Mining Techniques:For Marketing,Sales,and Customer Relationship Management 數據挖掘技術:市場營銷、銷售與客戶關系管理領域應用(原書第2版)[M].北京:機械工業出版社,2006.
[4] 王坤.模糊關聯規則挖掘在入侵檢測中的應用研究[D].西南交通大學,2006.
[5] 吳君輝,殷肖川,張薇.基于模糊關聯規則挖掘改進算法的IDS研究[J].計算機測量與控制..2009.17(11)
[6] 邵峰晶,于忠清,著.數據挖掘原理與算法[M].北京:中國水利水電出版社,2003.
[7] Min Wu.Cloud Trust Model in E-Commerce[C].The Second International Symposium on Networking and Network Security(ISNNS 2010).JingGangShan.2010.4