張相斌,梁 嘯
(南京郵電大學(xué) 經(jīng)濟與管理學(xué)院,南京 210046)
多元線性回歸分析是一種重要的處理變量間相關(guān)關(guān)系的數(shù)理統(tǒng)計方法,不僅可以提供變量間相關(guān)關(guān)系的數(shù)學(xué)表達式,利用概率統(tǒng)計知識對此關(guān)系進行分析,以判別其有效性;還可以利用關(guān)系式,由一個或多個變量值,預(yù)測和控制另一個因變量的取值,并進行因素分析。我們在建立多元線性回歸模型并進行預(yù)測的時候,首先會對各個自變量進行預(yù)測,這種預(yù)測往往只反映出自變量單一的可能性,即自變量只取單一的預(yù)測值。然而在未來,自變量的取值是具有多種可能性的,不同的自變量的取值都會對預(yù)測值產(chǎn)生影響。在這種情況下,概率排序型的預(yù)測方法可以考慮到不同的自變量取值對預(yù)測值的影響,并通過期望值的最大最小值和方差的最大值描述預(yù)測的結(jié)果并衡量預(yù)測結(jié)果的波動性,對未來的預(yù)測更加貼近實際。
目前基于多元線性回歸反映自變量的多種可能性以及將概率排序的預(yù)測方法應(yīng)用到多元線性回歸模型的研究還很少,本文針對運用多元線性回歸進行預(yù)測時,由于自變量的不確定性導(dǎo)致的預(yù)測值的波動性,提出了概率排序型的預(yù)測方法,并用期望值的最大最小值和方差的最大值作為預(yù)測的指標(biāo),描述預(yù)測的結(jié)果并衡量預(yù)測結(jié)果的波動性,最后結(jié)合示例說明該方法的有效性。
在實際問題中,我們研究的變量往往會受到很多因素的影響。例如對于某件商品的需求量會受到消費者的收入、自身價格、相關(guān)產(chǎn)品的價格等因素的影響。這就涉及到一個因變量與若干自變量的相關(guān)關(guān)系問題,對于這樣的問題,我們常常通過多元線性回歸分析的方法來解決。
如果影響影響因變量 y的因素有n個,分別記為:x1,x2,…,xn,y 與 x1,x2,…,xn之間存在線性相關(guān)關(guān)系,那么多元線性回歸的數(shù)學(xué)模型的就可以表示為:

目前,利用多元線性回歸進行預(yù)測時,如果求得回歸系數(shù),那么只要知道當(dāng)期 (x1,x2,…,xn)具體的值,就可以通過多元線性回歸方程,預(yù)測出下一期y的值。但是這種方法的問題在于,預(yù)測是對未來的判斷,而未來是不確定的,每一個因素都可能會有若干個可能的取值,并且各個取值出現(xiàn)的概率也有可能不一樣。因此,我們在利用多元線性回歸模型對下一期進行預(yù)測的時候,應(yīng)當(dāng)通過調(diào)查問卷、專家調(diào)查法等方式,得到未來變化的波動性范圍,比較出不同組合出現(xiàn)的概率大小,這樣才把未來的變化導(dǎo)致的不確定性考慮了進來。


表1 不同概率下各種組合及其對應(yīng)的結(jié)果
從表1中可以看出,在實際的預(yù)測分析中,決策者對未來狀態(tài)出現(xiàn)概率的了解是處于既有所了解但又不足以單值地計算出準(zhǔn)確數(shù)值來。換句話說,決策者只知道N個未來狀態(tài)的概率將呈現(xiàn)出這樣的順序:p1≥p2≥…≥pN,或 pi-pi+1≥0,而不知道 pi的具體數(shù)值。在這種情況下,概率排序型預(yù)測方法不失為一種實用并且有效的方法。
在概率排序型預(yù)測中,由于無法確定各個需求的準(zhǔn)確概率數(shù)字,所以也無法準(zhǔn)確地計算其期望值,但是我們可以通過求得期望值的最大值和最小值來確定期望值可能的取值范圍,因此,用f(x)的最大期望值和最小期望值來描述在需求不確定情況下預(yù)測的結(jié)果,不失為一個可行的辦法。又因為在期望值相同的情況下,需求的波動性也可能有很大的差別。因此,我們在保留期望值的前提下,用方差作為衡量預(yù)測的波動性的指標(biāo),同時運用到概率排序型預(yù)測方法的構(gòu)建中。
對于每個結(jié)果 fi(x)的期望值E(Ai)的最大值和最小值為:


根據(jù)克米耶托維茨所著《決策論和不完全信息》中對這種概率弱排序條件下的特殊的二次規(guī)劃問題研究后,可以得出以下結(jié)論:


表2 機電行業(yè)銷售額與汽車產(chǎn)量和建筑業(yè)產(chǎn)值
某地區(qū)相關(guān)部門對本地區(qū)機電行業(yè)銷售額y、汽車產(chǎn)量x1以及建筑業(yè)產(chǎn)值x2進行統(tǒng)計,如表2所示。
根據(jù)表中的統(tǒng)計數(shù)據(jù)和多元線性回歸的相關(guān)知識,可以得到樣本回歸方程:


表3 不同組合下對應(yīng)的預(yù)測y值
由于是對未來的預(yù)測,所以汽車產(chǎn)量和建筑業(yè)產(chǎn)值各個組合出現(xiàn)的概率是無法準(zhǔn)確的判定的。但根據(jù)各方面的綜合研究和市場形勢的判斷,決策者認(rèn)為各個組合出現(xiàn)的概率由大到小分別為 y4≥y1≥y5≥y2≥y3≥y6,那么我們就能得到按概率大小排序以后新的預(yù)測表4,表中π1≥π2≥π3≥π4≥π5≥π6。

表4 按概率排序后的預(yù)測表



表5 預(yù)測值的最大期望值、最小期望值和最大方差
本文討論了概率弱排序的預(yù)測問題,對于未來預(yù)測值的各個影響因子出現(xiàn)的概率既有所了解,又不足以準(zhǔn)確的計算出數(shù)值,即由于自變量的不確定性導(dǎo)致的預(yù)測值的波動性,提出利用概率排序的預(yù)測方法,建立多元線性回歸模型進行預(yù)測,不僅具有堅實的理論基礎(chǔ),而且更貼近實際。將期望值的最大最小值和方差的最大值作為預(yù)測的指標(biāo),可以很好的描述預(yù)測的結(jié)果并衡量預(yù)測結(jié)果的波動性,方法簡單、應(yīng)用方便。因此,應(yīng)用該模型企業(yè)可以及時的根據(jù)相關(guān)因素在市場中未來的取值概率對資源進行合理的預(yù)測,從而制定相應(yīng)的對策,實現(xiàn)企業(yè)的效益最優(yōu)化。最后示例驗證了模型應(yīng)用的可行性和有效性。
[1]葉春明,齊靜.基于多元線性回歸模型的專利技術(shù)產(chǎn)業(yè)化評價研究[J].科技管理研究,2010,(21).
[2]王振友,陳莉娥.多元線性回歸統(tǒng)計預(yù)測模型的應(yīng)用[J].統(tǒng)計與決策,2008,(5).
[3]王義宏.基于多元線性回歸分析的縣域經(jīng)濟發(fā)展程度的評價——以江陰為例[J].生產(chǎn)力研究,2009,(18).
[4]陳剛,蔡遠利,穆靜,楊衛(wèi)麗.海量信息異常檢測問題的異常概率排序算法[J].西安交通大學(xué)學(xué)報,2011,(4).
[5]邱滌珊,賀川,朱曉敏.基于概率可信度的區(qū)間數(shù)排序方法[J].控制與決策,2012,(12).
[6]Kmietowicz Z W,Pearman A D.Decision Theory and Incomplete Knowledge[M].Hampshire,England:Gower Pub,1981.