鄭建鋒,王應明
福州大學 經濟與管理學院,福州350108
在管理學中,效率是指在特定的時間內,一個組織投入與產出的比值關系,能夠反映這個組織在各個方面的能力,進行效率分析顯得尤為重要。效率分析是對各個組織的效率進行測度與評價的一種方法,在目前國內外研究中,主要是利用數據包絡分析(DEA)或者將數據包絡分析與其他模型結合等方法對效率進行評價。效率評價在近幾十年的發展,已經發展得越來越成熟了,然而對效率進行預測仍停留在探索階段。李果等人[1]用神經網絡的方法進行DEA 有效預測,證實了效率預測的可行性。之后的幾年,一些學者通過DEA 和神經網絡的方法對各個不同行業的效率進行評價并預測,如體現在物流聯盟伙伴選擇[2],不同高校科研能力評估[3],美國鐵路性能測量和預測[4],基坑施工評價[5]等方面。可見DEA 與神經網絡模型在效率評價與預測能力上,具有科學性、廣泛性。但是由于評估某個決策單元的效率時,受到許多因素的影響,除了投入與產出之外,還有很多復雜的環境因素,所以增加了效率準確預測的困難。區間預測就解決了點預測給決策者帶來的不確定性。區間預測是在收集到的數據基礎之上,通過一系列的學習優化,給出的一個參數范圍。本文在前人研究的基礎上,繼續沿用DEA 與神經網絡結合對效率進行評級與預測的方法,提出效率置信區間預測模型。首先,利用DEA方法,對決策單元的效率進行評價,得出各個單元的效率值;其次,對BP 神經網絡進行模型參數修改,結合student 學生式分布得到預測區間模型,詳見第1 章模型構建。對決策單元的效率進行區間預測,并按區間進行分類,然后采用預測區間覆蓋率(Prediction Interval Coverage Probability,PICP)、歸一化平均預測區間寬度(Normalized Mean Prediction Interval Length,NMPIL)和區間分數(Interval Score,IS)等指標對預測結果進行評價,根據最后不同類別的決策單元分析原因。
數據包絡分析(Data Envelopment Analysis,DEA),是交叉了包括數學、管理科學、系統工程學等學科,而形成的一個新的領域[6],是由Charnes等人[7]于1978年提出并命名的。DEA是使用線性規劃等數學規劃模型對具有多輸入和多輸出的決策單元(DMU)進行效率評估的。關于對DEA 的研究,已經有上千位學者對它進行了深入的研究,并把DEA 用來評估供應商、銀行、保險公司、高校等地方的效率。在對DEA的研究中,許多學者將DEA 與其他模型結合起來,對決策單元的效率進行評估。實證結果表明,這些結合起來的模型,在評估效率時表現出比單純使用DEA 來評估,具有更好的性能,特別是當遇到比較復雜、比較大的數據量的問題時。DEA進行效率評價時,有著自身獨特的優點,可以在很大程度上避免了人為因素的干擾,使評價的結果更加客觀、科學。但是DEA也存在不足的地方,如不能實現進一步的預測和仿真效率值。
本文先采用DEA 對決策單元進行效率評價,DEA方法主要有兩個基本模型:CCR 模型和BCC 模型。這兩者方法之間主要的區別是CCR 假設規模收益不變,而BCC 是假設存在規模收益可變。1978 年,Charnes等[7]給出了第一個DEA 模型CCR。CCR的基本原理是假設共有n個決策單元DMU,每個決策單元中具有m種投入和s種產出,評價第j個決策單元(DMUj,1 ≤j≤n)的技術有效與規模有效,在CCR模型基礎之上加上就得到BCC 模型[8]。在BCC 模型中技術有效決策單元是在最優前沿面上的,但BCC 模型卻不考慮規模報酬變化。在實際的應用中,DEA 模型往往是以CCR 模型為基礎,基于投入型CCR 模型可得出不同DMU 的效率值。含有非阿基米德無窮小的CCR 模型線性規劃對應的對偶規劃表示為:

(3)如果θ0<1,被評價的決策單元無效。
人工神經網絡(ANN)是模擬大腦活動,是對人的大腦中神經網絡的基本特性進行抽象和模擬,具有非線性逼近、分布式并行信息處理、自訓練學習、自組織等能力[9]。
人工神經網絡在組合優化、預測等領域得到了廣泛地應用。BP神經網絡是一種多層網絡學習的誤差發現傳播算法,在目前對人工神經網絡的研究中,有80%~90%的模型采用BP 神經網絡或者它的變形形式[10]。因此,采用BP神經網絡進行預測研究具有可操作性。
圖1 顯示了簡單的BPNN 模型,典型的BPNN 模型具有多層結構,包括輸入層、隱含層、輸出層。

圖1 三層BPNN模型
如圖1所示,相鄰的兩個層中的神經元通過高度互連的權重連接在一起。wni是指從輸入層單元到隱含層單元的權重,wij是指從隱含層到輸出層的權重。輸入層的加權輸入總和,作為第i個隱含層的輸入,通過傳遞函數的作用轉化成隱含層的輸出,激活函數選擇常用的Sigmoid函數,則有接著輸出層的輸出單元輸出先是由隱含層單元Hi的加權總和,然后通過再一次的傳遞函數(Sigmoid 函數)得到。在神經網絡模型中,需要訓練網絡來確定最佳的權重,達到滿足訓練數據的基本特征。反向傳播算法通過使所有訓練集中的目標輸出gJ與實際輸出yJ之間的誤差項最小化,得到下面的公式:

盡管神經網絡相對于其他傳統的回歸技術具有優越性,但是在進行預測時,調試誤差的精度仍是一個難點;另一方面,神經網絡的點預測性能隨著數據來源的復雜性和不確定性的增加而顯著下降。因此,本文采用構造置信區間的技術來進行神經元模型的區間預測。
對于給定的輸入為x,輸出為y的系統,系統模型用來表示。其中,θ*代表系統模型中參數θ的真實值。假設誤差ε是系統的實際輸出與觀測輸出的差值,并且誤差ε服從于均值為0,方差為σ2的正態分布,該分布表示為:ε~(0,σ2)。所以系統可以表示為:

通過公式(4),來使得誤差最小化,得到θ*的最小二乘估計量為。



通過使用公式(2)、(6)、(7),來計算真實值y與預測值之間的差值,公式(8)表示的是差值之間的期望:




置信區間用t-分布表示為:


代替傳統的驗證模型,如平均百分比誤差(MAPE)、均方誤差(MSE)的傳統標準,本文使用預測區間概率和預測區間平均寬度來驗證預測結果。對于每個點輸出的預測區間,本文將通過計算區間的概率和寬度來進行預測區間改正,而不是僅僅通過減少基于誤差的度量。根據文獻,將預測區間覆蓋概率PICP定義為[11]:

同樣,歸一化平均預測區間寬度NMPIL定義為[11]:

其中,tmax、tmin分別是樣本中的最大值和最小值。如果NMPIL的值足夠大時,則可以包含所有的真實值,但是這樣就完全沒有意義了。所以構造預測區間的驗證標準是在PICP足夠大的前提下,NMPIL足夠小。然而,在理論上這兩個目標函數是有沖突的,概率越高區間寬度自然會越大;區間寬度越小概率自然越小。為了解決這個問題,提出綜合評價指標(Coverage Lengthbased Criterion,CLC)[12]:

其中,μ=1-α,η稱為懲罰參數,綜合評價指標CLC越小越好。
以“一帶一路”經濟帶沿途的中國18個省市為決策單元。所有的評價指標來源于2017 年的《中國統計年鑒》《中國建設統計年鑒》《中國旅游統計年鑒》,目的是針對這18 個省市的旅游效率評估。參考已有的文獻[13],選用3 個輸入指標、2 個輸出指標進行評價。通過模型(1)計算,結果如表1所示。
從表1 的第8 列θ值的結果可以看出,只有3 個省市(上海、福建、海南)的旅游效率是DEA 有效的,而剩下的省市的旅游效率全部都是無效,為了分析無效的原因,首先要對這些省市進行分類。文獻[14]認為可以將DEA 得出的效率分為4 類:S1∈(0.98, ]1 為強相對有效,這一類中的單元只要稍微修改,就能達到最佳的組合配置;S2∈(0.8, ]0.98 為相對有效,這一類的單元除了需要修改資源的利用,還需要花上一點的時間;為相對低效區間,這一類的單元需要重新調整資源配置或者產出標準,同時需要一段時間來適應;S4∈(0, ]0.5 為非常低效區間,這一區間內的單元,需要大幅度地修改投入和產出,還要投入大量的時間進行不斷調整。
由于DEA 計算的結果屬于后評價的范圍,評價的結果不能夠完全說明結果,要想準確地將結果進行分類,需要通過神經網絡模型進行區間預測,如果預測的結果正好完全落在Si中,可以認為該單元屬于這個區間;如果預測結果部分落在某個Si中,可以通過公式判斷。以分別落在S1、S2區間的預測區間為例。


表1 18個省市旅游效率結果

表2 真實值與預測區間比較
基于1.3 節的相關模型和相關公式,利用Matlab編程求解,并且令置信水平分別為80%、90%、95%、99%。圖2 顯示了BP 神經網絡經過多次訓練好的預測圖。在置信水平為80%的置信區間內,共有15 個樣本點落在置信區間內。當置信水平為90%、95%、99%時,預測的結果明顯比置信水平為80%的結果差很多,主要原因是樣本的容量較少,但在一定程度上能夠說明BP神經網絡在效率區間預測上的可行性。

圖2 BP神經網絡預測區間結果
旅游效率為無效的省市效率點轉化為效率區間的結果如表2所示,一共有15個樣本點。
所有樣本點的預測區間,利用公式(15)~(17)進行驗證檢驗,結果如表3 所示。結果顯示,CLC 的值低于0.5,具有較好的預測性能,所以可以利用區間數來說明樣本的效率值。根據公式(18)對12個落在預測區間內的樣本進行分類,結果如表4 所示,真實值和預測區間之間分類的結果會存在少量的差異。

表3 驗證模型結果

表4 真實值與預測區間的分類結果
可以發現,如果按真實的效率值和預測區間進行分類,結果是存在差異的,主要因為樣本系統的復雜性和不確定性造成。對于這樣的差異,該選擇哪一種分類方式,本研究通過分析差異點來探討此問題,同樣以這些點為例分析無效點改進的方法。由結果可以看出,M7為樣本的差異點。
M7代表著是黑龍江省。黑龍江省作為中國最北的省份,被大家譽為“冰雪之城”。但是哈爾濱商業大學的研究團隊在做黑龍江省的旅游業景氣指數研究時[15],指出黑龍江省旅游行業的許多問題:經營項目雷同、旅行社不正當競爭、宰客現象嚴重等一系列問題。這就導致通過訓練得出M7的預測區間下限到達非常低的位置,導致預測區間劃分到S4,本文認為可以將M7劃分到S4集合中。
對于落在S4中黑龍江省的旅游效率問題,提出以下幾點建議:(1)根據表1 的計算結果本文認為,可以減少或者停止對土地要素和資本要素的投入,即減少綠地面積和住宿業、餐飲業的投入,同時管控住宿業和餐飲業亂收費的現象,讓旅客且真實地感受旅游市場的公平;(2)大力構建旅游品牌,增強旅游競爭力,吸引游客的流入;(3)拓寬國際旅游業務,由于黑龍江的地理位置優越,位于中國邊境地帶,可以推進境外游,吸納境外游客來黑龍江旅游。分析結果表明黑龍江的旅游效率比較低,需要黑龍江省投入大量的時間和精力來改善現狀。
本文研究的主要目的是找出一個最佳的神經網絡模型進行效率區間預測,雖然神經網絡模型不是一個新的概念,但還是有很多問題沒有解決,這也對本文的模型精度產生了影響。隨機過程和復雜系統的不確定性的不斷積累會導致神經網絡點預測的性能,特別是在進行效率預測時。針對此問題,本文假設樣本真實值與預測值的誤差成正態分布,采用Delta 方法對每一個點預測構建預測區間。因為在訓練神經網絡時,只需要計算一次雅可比矩陣,所以計算難度大大下降。在驗證預測區間結果方面,采用新的測度模型,比傳統的驗證標準更具有說服力[11]。最后在利用18 個省市的旅游效率進行預測,驗證結果誤差較小,包括有效點在內總有15個樣本真實值點在預測區間內,誤差為16.7%,CLC 低于0.5,說明了預測區間具有較好的可靠性。由于本文所給的樣本數量少,指標選擇具有主觀性等問題,所以本文研究仍需要進一步的改進。
未來研究改進方向:(1)在保證精度的前提下,考慮加入含有噪聲的統計數據;(2)將本文的模型用于更加復雜、模糊的系統中,對其效率進行區間預測。