任秀春
(渤海大學 管理學院,遼寧 錦州 121013)
基于RDF三元組的電子商務競爭者數據挖掘
任秀春
(渤海大學 管理學院,遼寧 錦州 121013)
越來越多的消費者通過互聯網從事商務活動,電子商務的數據規模逐漸擴大。互聯網上的商家希望了解競爭對手及其信息,以調整經營策略。提出一種利用RDF三元組的語義特征和結構特征來檢測具有競爭關系的商家,利用淘寶網的商店數據,使用MapReduce作為處理可擴展性的工具。實驗證明了基于RDF的電子商務競爭者數據挖掘的有效性。
電子商務;RDF;數據挖掘;MapReduce
在日常生活中,越來越多的人使用互聯網從事商務活動。由于電子商務數據的飛速擴張,網絡銷售商迫切希望可以找到網絡上競爭者,獲取競爭對手的經營數據,分析商品的交叉信息,以便對經營策略做出調整,從而獲取較大的市場份額。
電子商務的數據有4個主題[1]:商品、銷售商(賣家)、消費者(買家)、交易記錄。在電子商務領域,傳統的數據挖掘方法通常采用邏輯上的方法找出潛在和有用的模式[2],例如采用ILP模式[3],聚類分析方法[4-5],協同過濾算法[6-7]等。對電子商務競爭者進行數據挖掘,有幾種模式產生預先確定的競爭關系,通過邏輯運算將其結合,參照這個結果,可以很容易對新目標檢測到競爭關系[8]。文中采用RDF三元組表示網店里的所有商品特征和屬性。RDF是W3C規范的一部分,最初是作為元數據的數據模型設計的[9]。RDF是用于表示網絡信息的通用語言,RDF三元組可以表示網絡結構、屬性、關系等[10-11]。……