王 磊 施新程 陳瑩瑩 李 靜 張盼盼
(信陽師范學院城市與環境科學學院,河南 信陽 464000)
超市是人們生活中必不可少的商業形式。隨著人們生活節奏的加快,顧客們越來越不愿意等待,他們希望到了超市能夠快速選購所需要的商品,然后快速的結賬離開超市;但是,很多超市的內部結構復雜,給人們造成了極大的不便[1]。隨著GIS 技術的飛速發展,GIS 技術在社會生活各方面的作用也日益凸顯。本文基于GIS技術結合信陽市沃爾瑪超市為例對超市的內部布局進行分析與優化設計,綜合了數據挖掘的關聯規則算法與GIS 空間分析技術,實現了有科學依據的布局分析評價與設計。
隨著互聯網的飛速發展,電子商務大行其道,究其根源,是因為互聯網商業給人們帶來了巨大便利。超市作為傳統零售業的代表形式,也應積極改變,以消費者為中心,合理分析消費者的消費習慣等線索,借助大數據的方法進行科學分析,合理優化超市布局,使超市的服務最優化,才能達到利益最大化。
對于超市布局的研究,是商業布局分析的一部分,出現過許多重要理論,如城市市場空間結構研究、中心地理論等,加納(B.J.Garner)的商業中心空間模式、赫夫(D.L.Huff)的商業零售引力模式等,加里森(B.J.Garrison)等對中心地理論的發展研究中專門針對城市內部商業等級體系進行了研究[2]。并且依據這些理論結合GIS 的空間分析技術形成了較為成熟的超市布局分析方法理論。但是,針對超市內部布局、商品陳列位置的分析卻不常見,結合GIS進行超市內部分析的案例更是十分鮮見。
本文的主要研究內容包括數據挖掘關聯規則算法和GIS空間分析方法。研究過程分為兩個部分,一方面使用關聯規則算法對所超市銷售數據進行分析挖掘,得出關聯結果;另一方面首先使用GIS 軟件繪制超市商品分布的平面圖,然后利用空間分析方法計算出超市內部不同類型商品分布的實際關聯結果。最后通過將銷售數據挖掘得到的關聯規則與超市實際關聯結果對比,得出超市內部布局的分析結果。

圖1 論文基本框架圖
數據挖掘是通過對數據庫中存儲的各種類型數據和信息進行相關分析,以揭示其中有意義、有價值的新的關系、模式和傾向的過程[3],如今數據挖掘已經被應用在了人們生活的許多方面。它作為一門交叉性學科,融合了人工智能、數據庫技術、模式識別、機器學習、統計學和數據可視化等多個領域的理論和技術[4]。
3.1.1 算法實現
使用Java 語言編寫Apriori 算法,對采集所得到的超市銷售數據進行關聯規則挖掘,得出所有頻繁項集的置信度與支持度。
Apriori算法部分代碼如下。

3.1.2 獲得關聯規則
使用上面的方法,對銷售記錄進行關聯規則挖掘[5],得出了每個頻繁1 項集的支持度以及277 對頻繁2 項集及其支持度和置信度。由于數據量龐大,這里通過取較高的置信度和支持度閾值以得到強關聯規則[6]。

表1 頻繁1項集及其支持度
支持度閾值計算公式:

其中φ表示該頻繁項集對的支持度閾值,Ii表示每對頻繁項集的支持度,Ν表示頻繁2項集的對數,ε表示閾值系數,這里使用15%。
置信度閾值計算公式:

其中σ表示該頻繁項集對的置信度閾值,Ci表示每對頻繁項集的置信度,Ν表示頻繁2項集的對數,ε表示閾值系數,這里使用15%。
計算得出支持度與置信度的閾值分別為6.5%和20.62。通過篩選,得出同時滿足支持度和置信度閾值的頻繁2項集6對。

表2 強關聯規則頻繁2項集及其置信度與支持度
在ArcGIS 中將信陽市沃爾瑪超市的平面圖矢量化,將表1中的數據作為新字段添加給商品要素,使頻繁1項集的支持度在圖上直觀地顯示出來,由于頻繁1 項集的實際意義即商品的銷售數量,因此從圖2也能直觀地看出各類商品的銷售情況。

圖2 沃爾瑪超市銷售數據頻繁1項集分布
通過平面圖我們可以看到信陽沃爾瑪超市的內部結構比起普通的通道型結構和環形結構要復雜得多,同時也發現該超市內部商品分布比較零散,不利于陌生顧客快速尋找自己需要的商品[7]。
在傳統的超市內部布局過程中,通常考慮兩方面內容,一是兩種商品的屬性是否相似,比如水果和蔬菜等;另一方面是考慮顧客的購買心理[8]。因此,超市中不同商品類別之間的位置關系成了超市布局的重要因素,所以,本文采用不同商品類別之間的距離這一量化指標代替位置關系。并依據每個商品類別占據的面積及其支持度計算出強關聯規則頻繁項集的緩沖區半徑。強關聯規則的緩沖半徑計算公式:

其中Rb表示緩沖半徑,Si表示強關聯規則中頻繁項集的面積,N 表示符合計算要求的頻繁項集對數,σ表示該頻繁項集對的置信度閾值,φ表示該頻繁項集對的支持度閾值。

表3 強關聯規則頻繁項集及其面積(表中數據均保留3位有效數字)
使用Apriori 算法得出的強關聯規則與空間分析方法求得的實際關聯結果進行判定,給超市的布局進行量化評分。超市內部布局評分公式:

其中表示超市內部布局得分,θi表示強關聯規則中頻繁2 項集與關聯面積大于閾值的頻繁項集對的判定值(以頻繁2 項集為基準,取0或1),Si表示強關聯規則中頻繁項集的面積,N表示符合計算要求的頻繁項集對數。

圖3 沃爾瑪超市重新布局平面圖
通過依據銷售數據的計算,得出信陽沃爾瑪超市的布局得分為34.87(保留四位有效數字)。得分較低,則要依據逆行上述方法,對信陽沃爾瑪超市進行重新布局。
超市的布局設計應該遵循自主性、便利性、人性化的原則。依據這三個原則結合本文的分析結果對信陽沃爾瑪超市進行重新布局[9]。
將優化設計后的超市布局數據重新代入關聯計算方法進行分析,對關聯結果進行緩沖區分析和空間疊加分析,并將得出的實際關聯結果與Apriori 算法分析得出的強關聯規則進行對比判斷,得出重新布局后的結果得分為87.64(保留兩位有效數字)。評為優秀等級。
本文以大型超市為研究對象,綜合運用了數據挖掘關聯規則方法與GIS 空間分析技術,結合商業布局理論和GIS 空間分析方法,對超市內部商品布局的評價與優化方法做了探討。研究內容中包含了Apriori算法在超市銷售數據分析中的應用以及GIS緩沖區分析方法和空間疊加分析方法在布局優化中的應用,涉及了多個領域的相關問題,探索出了一種量化的超市布局評價與優化方法。
[1] 安運運.大型超市布局優化設計[D].吉林大學,2011.
[2] 許昊.基于業態優先的商業綜合體內部布局研究[D].湖南大學,2013.
[3] 梁循.數據挖掘算法與應用[M].北京:北京大學出版社,2006.4.
[4] 趙謙.數據挖掘技術在大型超市中的應用研究[D].哈爾濱理工大學,2007.
[5] 朱正國.基于超市銷售數據的關聯規則挖掘算法的研究[J].現代計算機,2013(1).
[6] 劉華婷,郭仁祥,姜浩.關聯規則挖掘Apriori 算法的研究與改進[J].計算機應用與軟件,2009(1).
[7] 程林,王法輝,修春亮.基于GIS 的長春市中心城區大型超市服務區分析[J].經濟地理,2014(4).
[8] 于偉,郭敏,宋金平.北京市新型零售業空間特征與趨勢研究[J].經濟地理,2012(5).
[9] 肖琛,陳雯,袁豐,程紹鉑.大城市內部連鎖超市空間分布格局及其區位選擇[J].地理研究,2013(3).