郭軍 祿蕾 張艷



摘要
本文從卷煙零售戶銷售假煙的驅動因素考慮,在結合某市煙草專賣局的實地調研,參照相關調研的歷史數據,以BP神經網絡為基礎,構筑了研究零售戶銷售假煙行為的預警模型。該模型在原基礎指標的基礎之上,新增了零售戶自身特征、時間因素等12項指標。經試驗表明,該預警模型有著良好的穩健性能,能較為準確的預測假煙銷售的有關信息。
【關鍵詞】煙草行業 BP神經網絡 假煙銷售預警模型
在某市煙草專賣局的實地調研的基礎之上,本文結合卷煙零售戶銷售假煙的驅動因素,構建了以BP神經網絡為基礎的零售戶銷售假煙行為的預警模型,并對其進行樣本檢驗,旨在為相關管理提出可供參考的價值。
1 違規零售戶歷史數據的特征分析
以某市在違規銷售假煙方面的調研歷史數據為基礎,對其進行細致深入的分析,銷售假煙的情況與該商戶的經營規模、經營狀態有著極大的關系。另外,商店所處的地理位置也會影響假煙的銷售行為。
首先,從經營業態上講,違規銷售假煙的一般是規模較小的零雜貨店或者是中小型超市居多,其次就其所處的商圈來看,主要還是以居民區或商業區為主,再次就其市場分布來看,假煙銷售商一般都分布在農村、鄉鎮或城鎮邊緣地帶。一般說來,小型零售商或銷售卷煙的數量和種類少,顧客群是一定的,在這種情況下銷售假煙,會影響其銷售信譽,因此違規銷售煙草的商家開店的規模大都以中大型超市為主。這里羅列著卷煙的種類繁雜,流動型的顧客人數較多,固定用戶群少,不存在聲譽受損的威脅。
2 零售戶銷售假煙行為的影響因素分析
2.1 利益因素
銷售假煙最重要的一個因素就是可以給商家帶來豐厚的利潤。煙草專賣是煙草行業的主要特征,因此所有零售商的煙草都是從當地的煙草專賣局取得的,有正規的批售指導價格以及零售價格。但反觀假煙,獲取的渠道則是從非法途徑獲得的,進貨成本較低,以市場指導零售價賣出,商家可獲取巨大的利潤。再加之煙草專賣局對販賣假煙的零售用戶沒有行之有力的處罰措施,因此在巨大的利益面前,很多零售商戶都選擇銷售假煙。
2.2 環境因素
就某市的煙草銷售假煙實地調查顯示,商戶所處的地理環境也是影響假煙銷售的相關因素。從經濟學角度來講消費者、經營者也會有從眾的心理。若一個地方有一家銷售假煙,就會有其它零售商戶隨之跟隨,往往會出現扎堆的現象。尤其是對假煙的銷售目前處于懲處較輕的情況下,商戶往往會存在僥幸的心理。
3 基于BP神經網絡的零售戶違規銷售的預警模型
BP神經網絡系統是一種誤差反向傳播的神經網絡,它具有以下四種特性:一是該系統具有自學習和自適應性,二是該系統具有容錯性,三是該系統具有并發性,四是該系統的構成是復雜的非線性。因此該系統多數情況下會應用于圖像的識別,用于預測、預警等領域。
3.1 零售戶銷售假煙行為的預測指標的遴選
零售商的合法銷售量會因為其銷售假煙而有所不同,因此在對相關銷售行為進行研究時,可以從零售商銷量的變化來考慮。從第一節零售假煙商戶的歷史數據,不難發現不同特征的零售商戶銷售假煙的行為是不一樣的,鑒于此,本文在傳統銷售假煙數據的基礎之上,增加了零售戶的特征指標以及時間指標。
3.1.1 銷售類指標
根據調查結果顯示,單單從銷售總量來觀察銷售假煙零售戶的行為,反映的結果并不全面,有時并不能反映出銷售行為的規律。因此本文在傳統研究結果之上,又更詳細的增加了新的指標內容。當地煙草專賣局調配五種類型的卷煙價格是根據當地的經濟發展水平和人們的消費水平來定的。因此不同地區卷煙的銷售情況并不一樣。
3.1.2 零售戶的特征指標
通過對某市違規煙草銷售實際調研所留存下來的歷史數據來分析,特選定以下四個指標來歸納總結零售戶的特征。詳見表1。
3.1.3 時間因素
根據某市煙草銷售實際調研數據顯示,煙草的銷量也會因為時間的變化而發生變化,主要體現在兩方面,一是節假日煙草的銷量要比平常稍高一些,其中最為典型的是春節期間,煙草的銷售量要遠遠高于平常銷量;每個月份煙草銷量的高峰期均不相同。綜合以上考慮本文選擇某月份作為預警模型的一個時間指標,并將該月份輸入到預警模型系統中。
3.2 預警模型的構建
以某市煙草專賣局從2018年1月中旬到2018年7月中旬的銷售數據為選擇研究對象,剔除掉該選項沒有商店屬性信息的零售戶或者銷量信息不全的銷售數據,篩選之后得到銷售假煙的零售戶為62個,正常經營的用戶可達25000個。按照1:1的比例來分配數據并不平衡,因此研究決定選用1:3的配比來研究數據。初始樣本是從研究對象中隨機抽取的,它的構成有兩部分。本研究中訓練集樣本比例占6成,驗證集樣本比例占3成,測試集的樣本比例占1成。
梳理前文可知,本文選取了12個驅動因素作為零售戶銷售假煙預警的指標因素,預警模型輸出數據則為零售戶銷售假煙的可能性。反復試驗之后,該模型中最優參數已被確定,如下所示:該模型中包含著6個隱含層,學習率是0.004,從輸入層到隱含層,從隱含層到輸出層選用的函數是不同的,前者使用的是雙曲正切函數,后者使用的是線性傳遞函數,初始權值設定范圍為(-1,1)之間的隨機數字。如圖1所示。
初始樣本經過預警模型的自適應學習的功能模擬,取得相關參數經計算之后,結果如下所示:該模型中訓練集的數據判別錯誤的分類率可以達到21.71%,檢驗集中的錯誤分類率可以達到22.80%,僅僅相差1.09%,這一結果說明該模型在穩定性上性能是十分良好的。該模型中總體錯誤判別率可達22.68%,準確率高達78.32%,這一結果說明該模型具有較高的準確率。
3.3 模擬預警與結果分析
根據其數據結果,本文對零售戶的類型做了如下劃分,并記錄下了所涉及到的商戶類型違規銷售煙草的可能性。詳情參照表2.
緊接著對剩余所有的數據樣本進行預警模擬檢測,發現有30102組數據可能是違規樣本,這些數據對應的零售商戶數量為1901,其中14個商戶違規售賣煙草可能性大,524個商戶違規售賣煙草可能性比較大,剩余商戶違規可能性一般。通過對上述538個違規可能性較大的樣本數據進行分析,這些違規用戶的特征與上述3.1節中分析中的特征基本類似。這一結果進一步驗證了該模型中加入細分指標的正確性。
綜上所述,本文得出如下啟示:煙草專賣局監管對象要符合如下特征,一是規模較大的零售商戶;二是分布在農村鄉鎮;三是品種雜亂的中小型批零、雜貨店;四是居民區或商業區的零售商戶。
4 結論
鑒于上述分析,通過對該預警模型的指標分析,可繼續開展預警結果的影響數據分析,以便于為煙草局監管人員方便查閱相關數據,制定出合理的監管策略,進一步規范煙草市場。
參考文獻
[1]朱衛東.基于神經網絡的煙草零售戶銷售假煙行為的預警模型研究[A].中國煙草學會2015年度優秀論文匯編[C].中國煙草學會,2015:7.
[2]朱衛東,孫宜博,吳勇,李礦,杜承勇.基于神經網絡的卷煙零售戶銷售假煙行為的預警模型研究[J].中國煙草學報,2014,20(06):127-132.
[3]杜承勇.基于BP神經網絡的卷煙銷售違規預測研究[D].合肥工業大學,2013.