[摘 要] 針對當前個性化導購系統存在的問題,本文利用多層體系結構的數據倉庫為數據導購系統提供數據環境,將多Agent思想運用到電子商務智能導購領域,提出了一種基于數據倉庫的智能導購Agent系統模型,并討論了模型中各組成部分的功能與數據倉庫的構建#65377;
[關鍵詞] Agent;智能導購;數據倉庫
[中圖分類號]F724.6[文獻標識碼]A[文章編號]1673-0194(2008)09-0100-03
0 引 言
隨著Internet安全技術的不斷完善,網上購物成為電子商務中的新熱點[1]#65377;在購物網站繁多的情況下,除了優惠的價格#65380;完善的售后服務外,個性化服務成為廣大商家吸引客戶的新手段#65377;智能導購Agent系統以其獨特品質對消費者購買行為產生積極的影響,為網絡消費者提供優質的服務,發揮了良好的導購作用#65377;
目前已開發出一些智能導購系統,其中比較有代表性的有:WebWatcher[2]系統,SiteHelper[3]系統和Footprints[4]系統等,這些系統取得了較好的效果,但也存在一定的局限性,主要包括:
(1)缺乏個性化#65377;對所有的用戶采用相同的推薦策略,不能根據不同用戶的興趣愛好給出不同的產品推薦,難以滿足用戶的個性化需求#65377;
(2)直接將各個局部站點的數據合并成全局的數據統一進行挖掘,由于數據龐大,網絡傳輸效率較低,導致數據挖掘的效率低下#65377;
(3)信息收集不完全#65377;基于用戶一次登錄得到的信息,而不是基于長期收集用戶瀏覽網頁時給出的興趣偏好信息,對用戶做出個性化的推薦#65377;
針對上述問題,為了使現有智能導購系統適應電子商務網站動態變化的需要,能為用戶提供更為主動的#65380;具有智能適應性的個性化商品推薦服務,本文采用基于數據挖掘的多Agent技術,將各種功能模塊構造為一個能主動為用戶服務#65380;能在問題求解環境中自主運行的實體,提出了一個基于數據倉庫的智能導購Agent系統的結構,以使傳統導購系統的應用更具有可塑性#65380;自主性,更能適合用戶的需求,可以在動態#65380;不確定環境下使用#65377;
1 數據挖掘技術和多Agent技術
1. 1數據倉庫與數據挖掘技術
目前,對于“數據倉庫”一詞尚沒有一個統一的定義,著名的數據倉庫專家W.H.Inmon在其所著《Building the Data Warehouse》一書中給予如下描述:數據倉庫(Data Warehouse)是一個面向主題的(Subject-Oriented)#65380;集成的(Integrated)#65380;相對穩定的(Non-Volatile)#65380;反映歷史變化(Time-Variant)的數據集合,用于支持管理決策#65377;
數據挖掘是從大量的#65380;不完全的#65380;有噪聲的#65380;模糊的#65380;隨機的實際應用數據中,提取隱含在其中的#65380;潛在的有用信息和知識的過程[5]#65377;在商業上,按照企業業務目標,對商業數據庫中大量業務數據進行探索和分析,揭示隱含的#65380;未知的規律性,進一步找出有效的方法,幫助企業的決策者調整市場策略,減少風險,做出正確的決策#65377;
1. 2Agent及多Agent系統及其特點
Agent的概念出現于20世紀70年代的人工智能(Artificial Intelligence, AI)中#65377;所謂Agent,是指一種具有自制能力#65380;智能和目標驅動屬性,能夠通過各種學習#65380;推理等方法感知和適應復雜的動態環境,并能夠主動追求目標的能動實體[6],其能力主要包括知識獲取與應用能力,環境通信能力和事務處理能力等#65377;它具有某種程度的“擬人性”,能夠按照人的意圖去獨立自主地為人完成某些任務#65377;它還具有自主性#65380;反應性#65380;主動性#65380;交互性等特點#65377;因而利用Agent來構建個性化推薦系統具有先天性的優勢#65377;
多Agent系統(Multi-Agent Systems, MAS)是指一些自主的Agent通過協作共同完成某些任務的計算系統,側重于研究如何協調一組Agent的行為,即研究這組Agent為了聯合采取行動或求解某個復雜問題時,協調各自的知識#65380;目標#65380;策略和計劃等#65377;多Agent系統優于僅由單個Agent控制的系統,通過Agent間合作,多Agent系統不僅改善了每個Agent的基本能力,而且可以解決單個Agent無法解決的復雜問題#65377;
2 系統架構及總體流程
2. 1總體結構
智能導購系統的基本功能是:分析顧客以往的購買行為,建立表示顧客行為的模型,并利用模型模擬商店銷售人員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購買過程#65377;要完成商品導購,系統需要知道用戶的興趣#65380;偏好和訪問模式等信息#65377;在電子商務環境下,一方面商品的種類#65380;數量會不斷地增加,另一方面用戶的興趣#65380;瀏覽行為也都是動態變化的#65377;因此,個性化導購問題的求解過程應該是動態的,要具有較強的自適應性#65377;基于數據倉庫的特點及多Agent系統的思想,本文構建的基于數據挖掘的智能導購Agent系統結構如圖1所示#65377;

2. 2各子Agent的功能
2. 2. 1偏好獲取Agent
負責客戶偏好信息的獲取#65380;更新和維護#65377;獲取客戶偏好有兩種途徑,即被動獲取和主動獲取#65377;被動獲取是讓客戶填寫一份偏好信息表,系統將之規格化后存入偏好數據庫中;主動獲取就是指系統根據客戶的購買行為,主動捕捉客戶的行為傾向,依此修正偏好數據庫中現有的偏好#65377;因為不可能要求客戶每次購買都填寫偏好信息表,也不能保證客戶所填寫的信息準確可信#65377;因此偏好獲取應以主動獲取為主,被動獲取為輔[7]#65377;
2. 2. 2數據挖掘Agent
在客戶的偏好被獲取后,通過關聯規則#65380;決策樹#65380;神經網絡#65380;遺傳算法等方法,產生顧客訪問產品序列中的關聯規則#65380;客戶分類#65380;相似客戶群體等模式,隨時更新規則庫中的規則,為推薦Agent完成推薦任務提供依據,真正實現“個性化導購服務”#65377;
2. 2. 3數據清理Agent
一般采用離線方式進行,它的主要任務是對服務器的日志文件進行數據預處理#65377;數據預處理的主要步驟包括:數據凈化,用戶識別,用戶訪問操作識別,路徑完善和用戶事務模式識別并進行格式的轉換,建立和維護數據集市#65377;經過數據預處理后,可獲得用戶事務模式,并且生成每個用戶的事務模式文件,供數據挖掘Agent#65380;偏好獲取Agent及推薦Agent使用,為實現個性化導購任務提供必要的數據#65377;
2. 2. 4顧客界面Agent
用戶與系統交互的接口,主要職責為隨時捕獲登錄網站的顧客信息,并依據顧客的瀏覽或購買行為向推薦Agent發送推薦請求#65377;顧客界面Agent可以采用主動的或被動的執行方式#65377;主動執行方式是指及時地捕獲用戶瀏覽行為或購買行為的變化,一旦顧客的行為發生變化,采用URL重寫#65380;暫存Web服務器的日志文件等方法來獲取當前用戶訪問操作序列;被動方式是顧客可以和顧客界面Agent進行交互,由用戶提出搜索商品或需要推薦的要求,再由其通告推薦Agent為用戶提供推薦服務#65377;
2. 2. 5推薦Agent
主要任務是根據顧客的需求#65380;顧客偏好#65380;產品的規則,并采用一定的推薦策略與具體的推薦算法,為顧客提供個性化的產品推薦列表#65377;推薦Agent接受顧客界面Agent的請求,并管理#65380;指揮和協調其內部的數據挖掘Agent#65380;偏好獲取Agent協同工作,必要時會驅動數據挖掘Agent#65380;偏好分析Agent進行實時的分析,由這些Agent共同完成推薦任務,最后將推薦結果呈現給顧客#65377;同時,推薦Agent將推薦過程中所用的推薦算法#65380;規則#65380;推薦結果保存到推薦案例庫中,供下次推薦時再利用和自身的不斷學習之用#65377;
2. 2. 6營銷界面Agent
為營銷管理人員提供一個人機交互界面,通過該Agent可以為數據清理Agent#65380;數據挖掘Agent#65380;偏好獲取Agent#65380;推薦Agent設置相應的參數#65377;
3數據倉庫的構建
由于各用戶在地域上比較分散#65380;業務上相對獨立;在構成企業級DW時,實現難度和工作量都比較大,集成和數據抽取也相對困難;局部的即時OLAP應用頻繁等多方面的原因,在實施數據倉庫系統時,其體系結構可能與傳統的數據倉庫體系結構有一些差別#65377;
除在中心節點(總部)上創建全局DW之外,局部也需要獨立的或者依賴型的數據集市#65377;各部門除進行正常的OLTP之外,部門級在不同的分散OLTP DB之上構建局部的ODS(Operate Data Store)模型,完成局部的即時OLAP和OLTP功能;進而形成全局的ODS數據環境,實現全局即時OLAP和全局OLTP功能#65377;在此基礎上建立全局一致的數據倉庫,然后導出數據集市#65377;該數據倉庫的整體結構如圖2所示,需要指出的是,從各局部的ODS向全局ODS抽取數據時,往往需要經過遠程環境,在沒有專用網絡的情況下,通常借助于Internet實現數據傳遞#65377;

4 結束語
當前,導購行為已成為銷售行為之外的增值服務項目,隨著其專業化程度的深入,已出現作為第三方的信息“中介”,衍變成為一個新的經濟增長點#65377;隨著商品差異化之路越走越遠,市場導購將是一個時尚的#65380;必不可少的市場決策行為#65380;信息服務行為#65377;
本文以多層體系結構的數據倉庫為數據導購系統提供數據環境,在降低數據倉庫構建難度的同時提高了導購的速度;采用多Agent的軟件設計思想,構建了一個電子商務智能導購模型,由分工不同的智能體相互協作來完成推薦任務,從而使系統具有一定的智能性#65380;自主性和靈活性,解決了現有導購系統中存在的一些問題#65377;
主要參考文獻
[1] Guttman R H , Moukas A G, Maes P. Agent-Mediated Electronic Commerce: A survey[J]. The Knowledge Engineering Review ,1998,13(2):147-159.
[2] Joachims T, Freitag D, Mitchell T. Web Watcher:A Tour Guide for the World Wide Web[C].Proceedings of the 15th International Joint Conference on Artificial Intelligence. Morgan Kaufmann Publishers,1997.
[3] Ngu D, Wu X. SiteHelper:A Localized Agent that Helps Incremental Exploration of the World Wide Web[C].Proceedings of the 6th International World Wide Web Conference, Santa Clara, California, USA,1997.
[4] Alan W, Maes P. Using History to Assist Information Browsing[C].Proc. of RIAO’97:Computer-assisted Information Retrieval on the Internet, Montreal,1997.
[5] 陳文偉. 數據倉庫與數據挖掘教程[M]. 北京:清華大學出版社,2006.
[6] Wooldr Idgem, Jenn Ings N R. Intelligent Agents:Theory and Practice[J].The Knowledge Engineering Review,1995,(2).
[7] 楊淑萍,聶哲.基于中間件技術的智能導購組件的設計與實現[J]. 計算機工程與設計,2006,27(17).