宮劍 李潔玲
[摘 要] 藥品的市場需求預測是制藥企業生產控制中的重要組成部分,具有復雜的非線性特點。本文以制藥企業的藥品需求預測為研究對象,通過分析藥品需求的特征,建立了基于神經網絡的組合預測模型。本文選擇3種具有互補特征的神經網絡預測方法(BP神經網絡的預測方法、RBF神經網絡的預測方法和GRNN廣義回歸神經網絡)分別對藥品需求進行預測,然后在此基礎上使用平均絕對相對誤差(MAPE)為最優準則,通過求解二次規劃問題得到權重并按照一定的規則進行變權,從而建立了基于神經網絡的藥品需求組合預測模型,最后對該模型實際應用的精度和穩定性進行評價。實驗表明,本方法能夠提高預測精度、穩定性,并擴大了模型的適用范圍。
[關鍵詞] 藥品;神經網絡;組合預測;需求預測
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 08. 051
[中圖分類號] TP183 [文獻標識碼] A [文章編號] 1673 - 0194(2014)08- 0084- 05
0 引 言
隨著人工智能技術的發展,人工神經網絡得到了廣泛研究和應用。由于神經網絡具有良好的學習能力和較強的非線性處理能力、不依賴于特定數學模型等優勢,其作為一種預測方法已被廣泛應用于許多領域。
在醫藥企業、醫藥衛生管理領域,藥品需求預測一直是管理部門關心的熱點問題。藥品需求除了受由藥品自身屬性影響外,還受國家政策或醫藥行業規定等因素的影響,如藥品在某地區是否中標、是否為處方藥等;同時,制藥企業自身制定的定價、渠道以及促銷等營銷策略和銷售團隊的組建制度也對藥品需求產生不同程度的影響。藥品需求特征的多樣性,決定了藥品需求預測本質上是一個復雜的非線性系統建模問題。
國內外眾多學者對藥品需求預測進行了深入的研究,產生了一批有價值的研究成果。目前,藥品需求預測的主要方法包括:回歸分析法、時間序列分析法、神經網絡、遺傳算法等。這些方法從不同角度出發建模,均取得一定效果,尤其是BP神經網絡,已經在藥品預測研究中取得了眾多應用。盡管相關討論和研究不斷增多,但是目前常用的神經網絡預測方法普遍存在以下問題:由于藥品需求特征頗為復雜的特殊性,運用單項預測方法對其進行預測無法涵蓋其較多的特征信息,通常表現為對某類特定的藥品預測效果良好,而對其他藥品則預測性能較差,從一定程度上限制了預測模型的適用范圍。
本文采用基于神經網絡的組合預測模型來解決上述問題。組合預測方法(combined forecasting)是指通過一定數學方法將不同的單項預測模型組合起來,綜合利用各種單項預測方法所提供的信息,從而達到提高預測精度的目的。組合預測方法最早由Bates和Granger[1]于1969年提出,他們認為對于一個包含系統獨立信息的單項預測方法,與預測精度較小的預測方法進行組合預測完全可以增強系統的預測性能。
考慮到各種神經網絡預測方法的特點及其適用范圍,本文選擇BP神經網絡預測方法、RBF神經網絡預測方法和基于廣義回歸神經網絡(GRNN)3種常用的神經網絡預測方法作為組合預測模型中的單項預測方法。在此基礎上,用平均絕對相對誤差(MAPE)和方差為衡量標準,并根據設置的閾值對單項預測方法進行篩選,最后選取了MAPE作為最優準則計算得到權重,從而建立組合預測模型,在提高組合預測模型精度的同時,使得組合預測模型具有現實意義。實驗結果表明,本文提出的模型的預測精度高于傳統的線性組合模型的預測精度。
1 相關工作
基于神經網絡的預測方法具有很多其他預測方法所不具備的優點,近年來越來越被人們所關注。吳正佳 等(2010)[2]針對某備貨型企業的產品需求量,建立了基于良好學習能力的BP神經網絡預測模型,并通過實證分析與簡單移動平滑法和加權移動平滑法的預測結果相比較,結果表明BP神經網絡預測結果比其他兩種更為有效果。童明榮 等(2007)[3]提出一種季節性RBF神經網絡預測模型,對具有季節性的產品月度市場需求進行預測,最后利用構建好的RBF神經網絡模型進行仿真實驗,并與ARIMA模型、分組回歸模型等常用季節預測模型做對比分析,結果表明前者的預測誤差均方差最小,預測精度較高。Maria Cleofé(2005)[4]利用人工神經網絡(ANN)對圣保羅地區的降雨量進行預測,并通過實證分析與其他線性回歸模型作對比評價,實驗結果表明人工神經網絡有著更好地預測效果。此外還有其他很多學者在交通、航運、氣候等多個領域運用神經網絡進行了預測[5-7],不在此贅述。
針對藥品銷量預測這一特定問題,國內外部分學者也做了一定的研究工作,試圖尋找合適的預測方法對藥品需求做出較為準確的預測。馬新強 等(2008)[8]提出了一種基于BP神經網絡的藥品需求預測模型,該文先利用數據倉庫及數據挖掘技術分析提取了相關有效的藥品銷售信息作為研究對象,在此基礎上利用BP神經網絡對其進行預測,最后在較為精確銷售量的基礎上提出了一種優化的生產決策系統方法。王憲慶 等(2009)[9]利用BP神經網絡模型對藥品超市的藥品銷售情況進行預測并做了相關實證分析,該文通過觀察藥品預測的顯著性差異評價模型的性能,最終取得了良好的效果,支持了其BP神經網絡非常適用于資金有限、倉儲量不大的藥品超市的結論。劉德玲(2012)[10]提出了一種針對大范圍內的藥品銷售的預測方法。該文利用遺產算法優化支持向量機藥品銷售預測方式進行預測,提高了藥品銷售預測的精確度,得到了較為滿意的結果。
盡管有關研究不斷增多,但由于藥品需求特征頗為復雜的特殊性,運用單項預測方法對其進行預測無法涵蓋其較多的特征信息,從一定程度上限制了預測模型的適用范圍。本文根據藥品需求高度非線性的特點選取了3種不同特性神經網絡模型作為單項預測方法,每種神經網絡都有其所針對的藥品需求特征,并在此基礎上建立組合預測模型,擴大了藥品預測模型的適應范圍,對于提高藥品預測精度和預測穩定性具有重要意義。
2 基于神經網絡的藥品需求組合預測模型的建立
基于神經網絡的藥品需求組合預測模型的具體步驟如下:
(1)數據異常點預處理。為提高組合預測模型的適用范圍和預測精度,本文運用基于距離的異常點檢測方法對存在異常點的藥品需求數據進行異常點修復,得到正常的需求數據。
(2)單項預測方法的選取。針對藥品需求的不同特征,選取3種不同特性的神經網絡模型作為單項預測方法,以此作為組合預測模型單項預測方法的篩選基礎。
(3)單項預測方法的篩選與變權重的計算。因為不同藥品具備不同需求特征,在進行組合預測時仍需要在已選取單項預測方法的基礎上再次篩選合適的單項預測方法進行組合,以相對誤差為最優準則,通過求解二次規劃問題得到權重并按照一定的變權規則進行變權。
(4)根據權重建立組合模型進行預測。
2.1 藥品數據異常點預處理
在藥品銷售數據中,由于特殊事件(如鋪貨)等原因,個別數據會表現出明顯突變,導致藥品歷史數據存在異常點,掩蓋了數據本身的規律。本文通過基于距離的異常點檢測方法和多項式擬合方法對藥品數據做預處理,具體處理步驟如下:
首先,選擇一個較大的數(如1010)將缺失數據補足,然后運用基于距離的異常點檢測方法進行檢測。第一步,對藥品需求數據進行歸一化處理并計算出各個數據之間的距離,得到距離矩陣P。計算公式如下:
Pij=|xi-xj|,i,j=1,…,n(1)
式中,xi表示時間序列中第i期的數據,Pij表示時間序列中i期數據與j期數據之差的絕對值。距離矩陣P的第i列表示時間序列第i期數據與長度為n的時間序列中所有數據(包括第i期數據本身)的距離。
P=p11,p12,…,p1np21,p22,…,p2n… … … …pn1,pn2,…,pnn(2)
通過設置距離閾值d,計算出所有滿足Pij>d的距離個數,記di,得到判別矩陣D。
D=[d1,d2,d3,…,dn](3)
將di與閾值f進行比較,若大于f,則識別該點為異常點,否則為正常值。最后利用多項式擬合方法,將檢測出來的異常點作擬合處理,得到建模需要的正常數據。
2.2 單項預測方法的選取
藥品需求預測是一個復雜的非線性系統建模問題,相對于傳統分析方法(如指數平滑方法、ARMA模型、MTV模型),神經網絡依據數據本身的內在聯系建模,具有良好的自組織、自適應性,以及抗干擾能力以及非線性映射能力,能夠較好地解決非線性數據擬合問題。
本文選取3種具有不同特征的神經網絡模型,即BP神經網絡、RBF神經網絡和GRNN廣義回歸神經網絡,綜合其各自優勢建立組合預測模型,提升整個預測模型的泛化能力,提高預測精度與預測穩定性。
2.2.1 基于BP神經網絡的藥品需求預測方法
BP神經網絡由Rumelhard和McClelland于1986年提出,它是一種典型的多層前向型神經網絡。藥品銷售記錄作為BP神經網絡輸入值,藥品需求預測即為BP神經網絡輸出值。當輸入節點數為m,輸出節點數為n時,BP神經網絡就表達了從m個自變量到n個因變量的非線性函數映射關系。
BP神經網絡側重對全樣本的學習,因此適合對樣本整體特征相近的時間序列進行預測,即適應受某一特定因素影響顯著,且該影響因素相對穩定的藥品預測。
2.2.2 基于RBF神經網絡的藥品需求預測方法
徑向基函數(RBF,Radical Basis Function)由Powell于1985年首次提出,它是一種三層前饋網絡,即輸入層、隱含層和輸出層。從輸入層到隱含層是一個非線性到線性的變換過程,從隱含層到輸出層是一個線性處理過程。RBF神經網絡在處理非線性問題時,引入RBF核函數將非線性空間映射到線性空間,極大地提高了非線性處理能力,且RBF神經網絡采用自組織有監督的學習算法進行訓練,其訓練收斂速度具有顯著的優勢。
RBF神經網絡具有很好的非線性處理能力,其學習算法屬于局部激活性較高的高斯函數,對于相似的樣本有著較高的逼近能力,因此適用于受會隨時間變化而較為顯著變化的因素影響的藥品需求預測。
2.2.3 基于GRNN的藥品需求預測方法
廣義回歸神經網絡(GRNN,Generalized Regression Neural Network)由美國學者Donald F. Specht在1991年提出,它是徑向基神經網絡的一種。GRNN具有很強的非線性映射能力和柔性網絡結構以及高度的容錯性和魯棒性,適用于解決非線性問題。
GRNN在逼近能力和學習速度上較RBF網絡有更強的優勢,網絡最后收斂于樣本量積聚較多的優化回歸面,并且在樣本數據較少時,預測效果也較好。此外,網絡還可以處理不穩定數據。因此GRNN適用于數據不全、異常點較多的藥品。
綜上所述,3種神經網絡都具有良好的非線性處理及預測能力,因為學習算法的不同有著各自側重的學習方向,皆為應用廣泛的預測方法,且對各自適應范圍內有著較好的預測效果。因此本文選擇BP神經網絡、RBF神經網絡以及廣義回歸神經網絡作為單項預測方法,并在此基礎上建立組合預測模型。
2.3 單項預測方法的篩選與變權系數的計算
本文在已選取3種單項預測方法的基礎上,再根據合適的MAPE和誤差方差篩選出組合模型中的單項預測方法,計算出變權系數。假設藥品需求的實際時間序列為y(t),t=1,2,…,N,N+1,…,N+T,其中t表示預測區間,T表示預測步長。
(1)單項方法篩選
單項方法進一步篩選的具體步驟為:
①預先設置選擇單項方法MAPE閾值m 和誤差方差閥值ε
②進行逐期單步預測,預測序列為:
{i(t),i=1,2,…,n;t=N+1,…,N+T}
③計算n種單項方法的相對誤差ei(t)、誤差方差εi(t)和MAPE。其中,單項預測方法的相對誤差序列為:
ei(t)=i=1,2,…,n;t=N+1,…,N+T(4)
單項預測方法的誤差方差為:
εi(t)=(5)
單項預測方法的MAPE為:
MAPEi(t)=ei(j),(i=1,2,…,n;t=N+1,…,N+T)(6)
④若MAPEi(t) (2)變權系數的計算 本文考慮預測效果,選用基于相對誤差為最優準則的最優加權法進行計算。 假設從n中方法中篩選出p(p≤n)種單項預測方法,則組合模型第t+1期的權系數w(t+1)由相對誤差ei(1),…,ei(t)決定,其中i=1,…,p。變權規則如表1所示。 權系數具體計算過程如下: ①設組合權重wi為方法mi在組合預測方法中權重,則組合預測方法第t期相對誤差為: e(t)=wi*ei(t),i=1,2,…,p(7) ②組合模型前t期的相對誤差平方和為: e2=e(1)2+e(2)2+…+e(t)2(8) 令w=[w1,w2,…,wP]T, E=e1(1),e2(1),…,ep(1)e1(2),e2(2),…,ep(2) … … … …e1(t),e2(t),…,ep(t) 建立如下目標規劃: min P=e2=wT*ET*E*w s.t. wi=1(9) ③求解該目標規劃得到變權系數w。 2.4 建立組合模型進行預測 組合預測模型可表示為: 式中, wi(t)表示第t期單項方法mi的變權系數,(t)表示第t期組合預測方法的預測值。根據該模型對藥品進行預測。 3 實驗與分析 本文以上海市某制藥企業月度銷售額為藥品需求預測的實證數據,根據銷售地區的不同抽取有代表性的藥品銷售數據,其中選取上海地區10種藥品,北京地區4種藥品及全區域銷售數據12種藥品,數據長度皆為30(2009-1至2011-6)。 數據選擇依據如下:①藥品銷售有一定的連續性,為公司主推或在某地區主推藥品,具有代表性及預測意義;②在考慮異常點和數據缺失時,選取異常點和缺失數據較少的藥品。 3.1 單項方法篩選和變權系數計算 根據不同銷售區域藥品需求的具體情況,設定單一省市藥品的MAPE閾值和方差閾值分別為20%和0.1;設定公司的MAPE閾值和方差閾值分別為30%和0.1。shy03和all03的單項預測方法選取結果如表2 所示。 利用單項預測方法的6期預測結果計算組合預測模型的3期權重,選相對誤差最優準則進行權重計算,運用MATLAB的二次規劃函數quadprog求解。變權規則及權重計算結果如表3所示。 3.2 預測模型的精度比較 本文選取平均絕對相對誤差(MAPE)和預測有效度兩個指標來綜合評價模型的預測精度。當MAPE越小時,說明預測精度越高。然而當實際值非常小時,即使是預測值與真實值之差較小,其平均絕對相對誤差也會很大,而預測有效度能很好地避免此類問題,故我們引入預測有效度來綜合評價預測精度,預測有效度越大,預測精度越高。 用單項預測方法BP、RBF、GRNN與組合預測方法單一省市和全區域藥品銷售預測值的MAPE和有效度,對MAPE和有效度的情況進行統計并且計算MAPE和有效度的平均值,比較結果如表4所示。 可以看出,運用組合預測方法對單一省市的14種藥品進行需求預測時,MAPE小于標準值20%的有8個,占藥品總數的57.14%,優于BP(7)、RBF(4)、GRNN(6)方法;14種藥品的MAPE平均值為19.81%,優于BP(26.71%)、RBF(28.45%)、GRNN(40.59%)方法。預測有效度大于標準值0.5的有11個,占藥品總數的78.57%,優于BP(8)、RBF(10)、GRNN(8)方法;14種藥品的預測有效度平均值為0.62,優于BP(0.57)、RBF(0.61)、GRNN(0.57)方法。 此外,運用組合預測方法對全區域銷售的12種藥品進行需求預測時,MAPE小于標準值30%的有7個,占藥品總數的58.33%,優于BP(4)、RBF(6)、GRNN(3)方法;12種藥品的MAPE平均值為25.22%,優于BP(35.90%)、RBF(32.07%)、GRNN(70.59%)方法。預測有效度大于標準值0.45的有10個,占藥品總數的83.33%,優于BP(7)、RBF(9)、GRNN(5)方法;12種藥品的預測有效度平均值為0.58,優于BP(0.46)、RBF(0.56)、GRNN(0.49)方法。 通過上述實證結果,從整體上看,組合預測方法的預測精度優于單項預測方法,而且模型的適用范圍較廣。 3.3 預測模型的穩定性比較 本文選擇預測誤差的方差作為評價模型穩定性的指標。將單項預測方法BP、RBF、GRNN與組合預測方法的誤差方差進行比較,單一省市和全區域的比較結果如表5所示。 可以看出,運用組合預測方法對單一省市的14種藥品進行需求預測時,誤差方差小于標準值0.1的有12種,占藥品總數的85.71%,優于BP(10)、RBF(11)、GRNN(10)方法;此外,14種藥品誤差方差平均值為0.0263,優于BP(0.0613)、RBF(0.0361)、GRNN(0.0522)方法。運用組合預測方法對全區域銷售的12種藥品進行需求預測時,誤差方差小于標準值0.1的有11個,占總數的91.67%,優于BP(9)、RBF(10)、GRNN(8)方法,此外,14種藥品的誤差方差平均值為0.031 0,優于BP(0.092 7)、RBF(0.033 5)、GRNN(0.065 0)方法。因此從整體上看,組合預測方法的預測穩定性優于單項預測方法。
4 總結及展望
本文選擇3種具有不同適應特征的神經網絡模型作為單項預測方法,建立了基于神經網絡的藥品需求組合預測模型,以上海市某藥企的實際銷售數據作為實證對象,驗證了該模型在預測精度和預測穩定性上均優于單項預測方法。當然,雖然建立的神經網絡組合模型在一定程度上彌補了現有方法的不足,擴大了預測方法的適用范圍,但在研究過程中依然存在亟待解決的問題:
(1)單項預測方法的參數優化有待進一步研究。本文在參數優化時,大部分采用遍歷法和經驗法進行設置,缺乏相應理論依據和方法指導。如何采用合適參數尋優方法進行參數確定是下一步亟待解決的問題。
(2)進行組合預測時,選擇合適的最優準則有待于進一步研究。本文選取相對誤差作為最優準則進行需求預測,該準則的選取忽視了量綱統一性,未來的研究應該綜合考慮量綱統一、預測誤差和預測穩定性,使組合預測方法更科學、更合理。
主要參考文獻
[1]J M Bates,C W J Granger.The Combination of Forecasts[J]. Operations Research Quarterly,1969,20(4):451-468.
[2]吳正佳,王文,周進.BP神經網絡在備貨型企業銷售預測中的應用[J].工業工程,2010(1):105-108.
[3]童明榮,薛恒新,劉路冰.基于季節性RBF神經網絡的月度市場需求預測研究[J].運籌與管理,2007(3),146-150.
[4]Maria Cleofé,R Valverde.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J].Journal of Hydrology,2005,1(20):146-162.
[5]A A Khan,K E Marion,C Bil. The Prediction of Ship Motions and Attitudes Using Artificial Neural Networks[C].19th National Conference of the Australian Society for Operations Research, Melbourne, Victoria, 2007.
[6]D C Park,El-Sharkawi.Electric Load Forecasting Using an Artificial Neural Network[J].IEEE Transaction on Power Systems, 1991, 6(2):442-449.
[7]Maria Cleofé, Valverde Ramírez.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J]. Journal of Hydrology , 2005, 301(20):146-162.
[8]馬新強,黃羿.基于BP神經網絡的藥品銷售預測模型設計[J].重慶文理學院學報,2008(2):64-66.
[9]王憲慶,涂冰,文詩琪.BP神經網絡在藥品銷售預測中的應用[J].中國醫藥技術經濟與管理,2009(5):27-29.
[10]劉德玲.大區域內藥品銷售預測方法研究與仿真[J].計算機仿真,2012(7):227-229.