喬亮亮 (上海海事大學物流工程學院,上海200135)
根據中國服裝協會對部分服裝產業集群抽樣調查顯示,每年受到人力成本、原料成本、能源成本、政策成本上升的影響,中小企業面臨生存威脅,特別是人數在100人以內的小企業關、停現象普遍。在這樣的條件下,如何提高需求預測的精度是企業所面臨的問題之一。在物流需求預測中,物流需求的多少受到多種因素的影響,可以通過在各相關影響因素間建立回歸預測模型來實現對物流量的預測。回歸就是研究自變量與因變量之間的關系的分析方法。
已知某青年女裝1993~2005年13a中每個季度的銷售額及其相關影響因素的數據,見文獻 [1]。下面,筆者用多元線性回歸法進行預測,求出其數學模型,并進行誤差及精度檢驗。
如果不能確定哪些自變量應包括在變量內,可以利用所考慮的所有變量建立一個相關矩陣[2],保留因變量與自變量高度相關的因素,而把能引起多重共線性的自變量刪去或替換。
考慮年份、男女比例、購買力、人均購買數、文化程度、生產狀況、人口數,銷售額等因素,由文獻 [1]中數據計算其相關矩陣如表1所示。

表1 相關矩陣
由表1數據可知,年份和購買力與銷售額的相關系數較大,其他因素不存在多重共線問題,故選用年份和購買力為數學模型的參數,分別記做X1,X2。
分別以年份和購買力為X、Y軸,銷售額為Z軸繪制散點圖,如圖1。

圖1 相關因素的散點圖
由圖1可以看出,這些散點大致呈直線型,與前面假設相符,所以可將該模型設為二元線性回歸[2],銷售額的預測值:

回歸系數的確定用自小二乘法求得。通過最小二乘法[3]可得如下方程組:

將表1中的數據帶入上式中,得到:

所以其數學模型為:

依據以上計算,可以得銷售額的預測值,如表2所示。
因變量y的各個觀察值點聚集在回歸直線周圍的緊密程度,稱為回歸直線對樣本數據點的擬合程度[2]。通常用可決系數R2來衡量。它取值于0和1之間,并取決于回歸模型所解釋的y方差的百分比。可決系數R2的公式為:

顯然殘差平方和占離差平方和的比重越小,可決系數R2越大,回歸直線的擬合程度越強。可決系數R2的取值區間為 [0,1],實際上,可決系數R2是線性相關關系r的平方,|R|越接近于1,則因變量與自變量的線性相關關系越密切,回歸直線擬合程度越高[3]。帶入數據得:

由此可以看出此回歸模型解釋了服裝銷售量變差的51.54%。
標準誤差又稱剩余標準差,是評價回歸直線代表性大小或實際值與估計值的標準誤差大小的綜合指標,也是計算置信區間估計值和其他擬合優度的基礎指標。計算公式如下:

將數據帶入得:

回歸系數的顯著性檢驗是用t參數檢驗的。t服從自由度為n-3的t分布,取顯著性水平α=0.05,查表得tα=2.021,若|tβ1|>tα則說明回歸系數顯著。在該模型中:

帶入數據得:


表2 預測值及其它參數
由以上的結果可以看出2個系數的|t|>tα所以回歸系數β1,β2顯著。
即檢驗整個回歸方程是否具有顯著性,判別y與x之間是否存在真實的線性相關,采用F檢驗[4]。其公式為:

F服從F(1,n-3),取顯著性水平 α,如果 F>F(1,n-3)則表明回歸模型顯著,如果F<F(1,n-3)則說明回歸模型不顯著,回歸模型不能用于預測。
在本模型中,默認的α=0.05,n=48,查表得F(1,45)=4.08將已知數據帶入得:

因為F>F(1,n-3)因此回歸模型顯著,可用于預測。
[1]徐國祥.統計預測和決策[M].上海:上海財經大學出版社,2005.
[2]江鈴.統計學 [M].北京:人民郵電出版社,2007.
[3]鄭雪梅.青島朗訊需求預測改進及應用研究 [D].北京:北京交通大學,2007.
[4]李志輝,羅平.Sp ss for Window s統計分析教程 [M].電子工業出版社,2003.