鄭曉峰,邢文龍
(廣東省道路運輸管理局,廣東 廣州510101)
廣東省嶺南通卡系統是全國最大的且真正具有跨地市級應用意義的智能卡系統,積累了大量的跨區消費數據。跨區消費數據作為公交一卡通工作的重要決策支持數據,研究其數據挖掘能發現全省公交出行規律和旅游消費市場規律,具有特殊的現實意義。
人工神經網絡(Artificial Neural Network,ANN)是一種重要的數據挖掘方法。該方法采用人工系統來模仿人腦神經網絡——神經元的結構和關系的模型,通過不斷修正其內部大量的模仿神經元節點的相互連接關系來處理信息,目前很多學者已提出神經網絡的數據挖掘算法,Setiono等(2009)[1]提出利用神經網絡提取數據庫規則的方法,Mehmed Kantardzic(2001)[2]總結了神經網絡應用于數據挖掘的各種方法。誤差反向傳播算法(Back Propagation,BP)是神經網絡中最為成熟和應用最廣泛的算法,因為該算法有正向傳播和誤差信號反向傳播的過程,所以稱為“BP 算法”。近年來學者致力于改進BP 算法固有的收斂速度慢、可能陷入局部極小點等缺陷,已取得豐富的成果,李紅(2011)[3]提出用雙向權值來調整BP算法的自適應控制,柴毅(2007)[4]提出由改進的遺傳算法來確定網絡結構和訓練方法等。BP 神經網絡在經濟社會的預測[5]、社會經濟的發展評價[6]、經濟管理[7]以及金融方面的評價[8]等等領域都取得了豐富的應用成果。在交通運輸方面,研究利用神經網絡實現交通量的預測成果比較豐富,俞潔(2006)[9]改進BP 神經網絡,提出OD 推算神經網絡用于公交線路OD矩陣預測。姜平(2009)[10]建立了徑向基神經網絡模型(RBF) 來預測公交客流。研究表明,神經網絡在公交OD和客流預測方面具有良好的效果,但目前的研究只局限于城市內部交通出行規劃和管理的數據挖掘,跨地域交通規劃的數據挖掘研究和應用鮮見報道,公交一卡通跨區消費問題屬于此類問題,研究成果更為少見。陳鵬(2010)[11]研究的是公交和軌道交通換乘的收益分配問題,不屬于同一種方式的跨區分配問題。
針對目前的公交一卡通跨區消費推算模型鮮見具體研究和應用成果的現狀,本文研究目標是建立和驗證一種類似BP 神經網絡的公交一卡通跨區消費推算模型,首先提出公交一卡通跨區消費分布矩陣的概念,然后分析BP 神經網絡建模方法的優勢與不足,建立公交一卡通跨區消費推算模型和方法,結合實際數據來設置核心參數,最后輸入實際數據進行訓練,并根據試驗過程確定核心參數,輸出訓練結果。
嶺南通卡系統具有統一的后臺清算系統,用戶所持嶺南通卡在全省各地的消費信息都實時進入嶺南通清算系統進行清分結算,這是嶺南通系統的關鍵技術之一。跨區消費數據可從嶺南通清算系統直接抽取。表1是從嶺南通的清算系統抽取的部分跨區消費統計表,表示廣州地區發行的嶺南通卡2013年8月份在各地級市的消費情況。

表1 嶺南通卡消費統計表(節錄)
從表1可知,通過嶺南通后臺清算系統可統計嶺南通卡在各地的消費情況,可從這些統計數據中發現隱藏的消費分布模式。本文提出從研究跨區消費筆數的分布來發現消費分布模式。
消費筆數等同于消費次數,用M來表示。設i市發行的卡的跨區消費總筆數是Mi,在j市消費筆數是Mij,則設wij=Mij/Mi,則對于任意i,則跨區消費筆數分布問題是wij的分布規律問題,稱wij為分布權。分布權矩陣W為:

BP 神經網絡的算法通過計算網絡權值和偏差以使期望輸出和實際輸出的誤差平方和最小,設有1個如圖1所示的三層BP網絡。

圖1 BP神經網絡模型
網絡輸入為mi,網絡輸出為lk,網絡期望輸出為ok,令輸出誤差為ek,則平方型輸出誤差函數E為:

各節點之間的傳遞函數是Signmoid 對數函數f(n)。輸入層的輸出信號記為Pi,隱含層的輸入信號記為Qj,輸出信號記為Pj,輸出層k的輸入信號為Qk,則:

式中:wji為i層到j層的網絡權值;θj為偏差,用于調節網絡的精度。
BP 算法是按誤差函數E的負梯度去修改網絡權值,設迭代第t次的網絡權值為w(t),則:

通過反饋傳遞推算得到各層的權值修改量Δw:

從而不斷修正wkj和wji,直到E小于閥值。
可見,BP 神經網絡算法的關鍵點在于兩個方面:
(1)通過網絡權值和神經元激活函數傳遞網絡信號;
(2)通過誤差反饋修改網絡的權值,直到網絡輸出達到最優。
結合式(1)和上述的分析可以看出,公交一卡通跨區消費推算的分布權矩陣問題和BP 單層神經網絡類似,分布權矩陣的調整可嘗試采用BP 神經網絡的誤差反饋方法,思路有以下差異:
(1)建立BP 神經網絡的目的是能夠整體預測輸出數據即可,并不關心最后的網絡權值,而跨區消費推算問題則必須得到具體的網絡權值;
(2)分布權矩陣是有約束的,而BP 神經網絡權值完全靠訓練得到;
(3)為了保證分布權矩陣的直接推算能力,推算模型的輸入信號不必通過神經元激活函數傳遞。
本文將針對這些差異提出公交一卡通跨區消費推算模型。
從嶺南通清算系統中可以得到每月城市i的跨區總消費筆數Mi和在城市j各市發行的卡消費總筆數Oj。而城市i發行的卡在城市j的消費筆數是Mij,嶺南通已通行的城市有n個,設訓練樣本數據有k個月,則第k個月消費筆數M的網絡輸入為:

期望網絡輸出:

代入分布權矩陣W,則實際輸出為:

第k個月訓練樣本的輸出誤差是:

按照BP 網絡的設計規則,得到平方型誤差函數E是:

設訓練第t次的網絡權值為wij(t),仿照BP 網絡算法,按照誤差函數E的負梯度去修改網絡權值,即化簡為式(12):

此為網絡學習規則。
網絡停止學習的規則為總輸出誤差小于閥值e,即式(12):

上述推算網絡涉及到權值初始矩陣W0和兩個重要參數的設置,即學習率η和收斂閥值e。根據實際應用,本文提出以下設置方法:
(1)對于初始矩陣W0,因為可以從清算系統得到訓練樣本的網絡權值矩陣W,因此可選W0為初始矩陣,然后代入第2 個訓練樣本數據開始計算;
(2)閥值e決定訓練的時間,甚至是否能夠訓練,本文根據計算實例的特點,選取期望訓練輸出的標準差作為初始e,然后根據訓練的情況做進一步的調整;
(3)因為學習率η設得過大,會使網絡喪失學習時間,設得過小會使網絡學習過慢,本文提出根據式(14)中的導出值的數量級去設置。
本文選擇嶺南通2013 年6—7 月的消費數據作為訓練數據,用8—9 月的消費數據作為測試數據,根據5月份各市所發嶺南通卡在各地的消費筆數得到初始矩陣W0。
6—7 月兩月每月的各市嶺南通卡跨區域消費總筆數代入式(7)為輸入訓練數據,是一個15維數組。將各市跨區域消費總筆數代入式(8)為期望網絡輸出數據,也是一個15維數組。
6 月輸入訓練數據M1和期望網絡輸出數據O1分別是:

7 月輸入訓練數據M2和期望網絡輸出數據O2分別是:

(1)初始收斂閥值e
通過計算得到O1的得到O3的標準差,則設置初始收斂閥值e=σ1+σ2=6798482。根據初始值的數量級,后續的e通過不斷減少7×10n的n值來調整設置。
(2)學習率η的設置
觀察式(12),由于wij要精確到10-5,的結果是108級,則均衡考慮學習的速度,η取值到10-10。
根據上述算法和參數的設計,用開發環境Del?phi 7 編程運行,對訓練數據進行運算。結果表明,以上述設計設置參數,可在3s 內實現收斂,然后不斷調整e的數值,圖2為e值的數量級n(7×10n)與收斂時間的對應圖,當達到一定時間后,e減少得很慢,因此e只要取到一定的值就行,不必用更多的時間,本文的e最后定為7×103。

圖2 訓練時間收斂趨勢圖
根據訓練的情況,在e=10000時輸出訓練結果WT,用于測試數據。
8 月的測試數據M3和期望網絡輸出數據O3分別是:
9 月的測試輸入數據M4和期望輸出數據O4為:

可見兩個月的誤差均在預計范圍中,證明了WT接近于實際消費分布矩陣,本文的方法適用于預測實際消費分布。

本文結合廣東省公交一卡通工作實際和BP神經網絡理論,提出一種類似BP 網絡的公交一卡通跨區消費推算模型,并以2 個月的實際數據進行訓練學習,通過實驗證明了學習率η和收斂閥值e等模型各參數的設置方法,最后用2 個月的數據來測試結果。誤差分析表明輸出的分布矩陣接近于實際跨區消費分布,進一步表明本文提出的模型和方法對推算公交一卡通跨區消費是有意義的。
本文在BP 神經網絡建模方法的基礎上建立了符合實際應用的模型,可以作為神經網絡研究的有益補充。但該模型的關鍵參數需通過實驗確定,自適應能力較弱。而且模型的健壯性亦需得到大規模數據的進一步考驗。
[1] 陳鵬,嚴新平,李旭宏,等.基于可拓學的軌道交通與常規公交換乘收益分配[J].上海交通大學學報,2010,44(6):797-802.
[2] Rudy Setiono, Bart Baesens, Christophe Mues. A Note on Knowledge Discovery Using Neural Networks and Its Ap?plication to Credit Card Screening[J]. European Journal of Operational Research,2009,192(1):326-332.
[3] Mehmed Kantardzic.數據挖掘——概念、模型、方法和算法[M].閃四清,等譯.北京:清華大學出版社,2001.
[4] 李紅,楊劍鋒.基于改進的BP 神經網絡模型參考自適應控制[J].蘭州交通大學學報,2011,30(1):37-41.
[5] 柴毅,尹宏鵬,李大杰,等.基于改進遺傳算法的BP神經網絡自適應優化設計[J].重慶大學學報,2007,30(4):91-96.
[6] 蔣雪,王頂. 基于BP 神經網絡技術的GDP 預測方法[J].經濟論壇,2010(3):203-204.
[7] 高朋,黃世祥.地區現代化水平BP 人工神經網絡評價方法初探[J]. 安徽農業大學學報,2006,15(3):27-30.
[8] 郝艷,李秉祥.基于BP 神經網絡的經理管理防御程度測評模型[J].科技管理研究,2010,30(9):212-215.
[9] 肖國榮.BP 神經網絡在基金價格預測中的應用研究[J].計算機仿真,2011,28(3):373-375.
[10] 俞潔,楊曉光.基于改進BP 神經網絡的公交線路OD矩陣推算方法[J].系統工程,2006,24(4):89-92.
[11] 姜平,石琴,陳無畏,等.公交客流預測的神經網絡模型[J].武漢理工大學學報,2009,33(3):414-417.