■李道松
(福建省交通工程造價管理站,福州 350001)
當前,交通工程造價站在網上定期發布交通工程材料價格時,其價格的制定主要是參考各定價來源收集到的價格而最終確定出來的。雖然,當前材料價格市場存在波動加劇,以及定價來源不斷增多的情況,但往往會發現某個或者幾個定價來源對于材料價格的制定與發布參考價值更大。因此,如何更加有效的、高效的利用各個定價來源的數據,如何更加準確的考慮各個定價來源的相對重要性以及制定與發布材料價格,對于提升交通工程造價站的整體服務水平和服務質量都至關重要。
定價來源相對重要性評價是一個典型的自變量相對重要性評價問題,針對該問題,已有許多學者進行了相關研究。張波等[1]提出了一種可視化圖示法用于評價線性回歸模型中自變量的相對重要性。施慶生等[2]通過偏最小二乘法對影響江蘇省房價的九類自變量進行了研究,并利用變量投影重要性計算了各影響變量的重要程度。馬金輝等[3]采用優勢分析方法對影響白龍江流域泥石流災害的自變量的相對權重進行了求解。于松青和林盛[4]基于偏最小二乘回歸的方法對影響山東省電力需求的自變量進行了重要性分析。楊衛兵等[5]通過Logistic回歸模型和決策樹模型得出了影響居民環境治理支付意愿的自變量重要性排序。樓狄明等[6]基于偏最小二乘法分析了影響柴油機顆粒物排放特性的自變量的影響強度。Admassu和Jan[7]采用Shapley值法對影響人類主觀幸福感的幾個因素進行了相對重要性分析。Tso等[8]通過使用互相關分析,對液壓斷層分析中的影響因素進行了相對重要性的研究。
在傳統的多元線性回歸模型當中,如果自變量之間互不相關,則有以下三種方法來估計它們的相對重要性:(1)簡單相關系數(ryxi);(2)以斜率為基礎的指標如標準回歸系數(βi)等;(3)方差降低指標如半偏相關系數(ry(xt|x1…xj))等[9]。 然而當自變量之間存在相關性時,上述方法的模型依賴性將十分嚴重。鑒于此,Johnson[10]提出了相對權重估計法用以估計自變量相對重要性。相對權重法需要分別建立原始變量對正交變量以及因變量對正交變量的線性回歸方程,其中,自變量的相對重要性即為兩組回歸系數平方的積和[11-12]。Chao Y E等[13]通過相對權重法對影響公共健康的主要因素的相對重要性進行了分析,結果表明相對權重法比優勢度指數法具有計算量更小更穩定的特點。代魯燕等[14]基于相對權重
法對肝病手術病人預計存活時間的影響因素進行了評價,并指出當自變量間存在相關性時,
采用相對權重法對自變量的相對重要性進行評價,其結果更加科學、穩定,與實際情況更為貼切。
綜上所述,相對權重法在對自變量的相對重要性評價中具有很強的適用性,因此本文將其應用到福建省交通工程材料價格的各定價來源相對重要性評價中。
(1)相對權重法的基本原理
圖1表示的是包含三個自變量的相對重要性示意圖[9]。各自變量和因變量之間的關系可以通過兩個獨立的回歸方程進行表示。
以自變量X1為例,通過式(1)描述原始變量Xi和正交變量Zk的關系:

圖1 自變量的相對重要性示意圖

其中,λik為 Xi關于 Zk的回歸系數。 通過式(2)描述正交變量Zk和因變量Y之間的關系:

其中,βk為Y關于Zk的回歸系數。因此,X1的相對權重 ε1可以通過式(3)求出:

(2)相對權重法的數學原理
假設因變量y為n×1列矩陣,自變量n×p為滿秩的階矩陣,并且所有變量均滿足標準化形式,那么,原始變量矩陣X的正交轉換如式(4)所示:

其中,P為矩陣XX′的特征向量,Q為矩陣X′X的特征向量。矩陣Z為彼此互不相關但與原始自變量存在高度相關性的正交變量矩陣,通過式(5)可計算出y關于矩陣Z的回歸系數β:

由于正交變量之間不具有相關性,則可以用β2來表示正交變量矩陣Z占因變量y的貢獻比例的大小。β2可以大致地表達出原始變量矩陣X中各自變量的相對重要性。為了提高相對重要性求解的精確性,通過式(6)建立原始變量對正交變量的線性回歸方程:

由于矩陣Z中的正交變量彼此之間不具有相關性,則可以用 Λ2()來表示正交變量矩陣Z占原始變量矩陣X的貢獻比例的大小。因此,各變量的相對權重ε可通過式(7)求出:

因為相對權重是由原始變量經過正交轉換而求出的,所以,其可以更好地處理自變量間存在的多重共線性的問題。此外,相對權重法求解出的各個自變量的權重之和與整個模型的決定系數R2相等,如式(8)所示:

因此,相對權重可以表示為各自變量解釋因變量變異(方差)的比例,其不僅兼顧了各個自變量的直接效應還考慮了其與回歸方程中其他變量進行結合時的效應,以使得各自變量的相對重要性能夠被更加直觀準確的表達。
(1)實證背景
為研究福建省交通工程材料價格各個定價來源的相對重要性,以2002~2015年的福建省交通工程造價站發布的數據為基礎,鋼材材料中的鋼板價格 為例,研究福州公路局、福州交通局、TM公司、住建廳造價站、福州物價局、建材在線、網絡價格等7個價格定價來源的相對重要性。
(2)結果分析
通過Stata軟件首先對鋼板價格的各個定價來源進行相關系數分析,各定價來源的相關系數結果如表1所示。

表1 鋼板價格定價來源的相關系數結果
從表中可以看出,福建省交通工程造價站發布的價格數據和各個定價來源收集到的數據都存在一定的相關性。其中,TM公司具有的相關系數最大(0.97),然后是福州物價局(0.90)、住建廳造價站(0.89)等。然而,雖然相關系數分析能較準確地確定各個定價來源的相對重要性排序,但是無法精確的表達出對各定價來源的相對重要性程度。而采用相對權重法不但可以對各自變量的重要性排序進行準確估計,更能夠對各自變量的相對重要性進行有效地定量估計。因此,下面利用相對權重法來考量各個定價來源對福建省交通工程材料價格的參考權重的大小,結果如表2所示。
在表2中的 同樣表示鋼板價格 對于各個定價來源的相關系數。此外,相對權重法估計的各定價來源的相對重要性之和等于總模型的 ,也就是表2中的sum_epsilon為0.9927即為總模型的 ,說明了模型擬合程度很高。最后,各定價來源的相對重要性可以表示為其所能解釋的因變量的貢獻度占已知決定系數 的百分比,因此可以得知TM公司對鋼板價格的參考價值最大,相對重要性達到27.2%,接下來依次是福州物價局(19.54%)、住建廳(16.98%)、建材在線(13.12%)、福州公路局(12.09%)、網絡價格(6.38%)以及福州交通局(4.69%)。

表2 鋼板價格定價來源相對重要性評價結果
通過上述分析可以看出,無論是從傳統的相關系數角度出發,還是從相對重要性PropWeights角度出發,各個定價來源對于鋼板價格的參考價值的排序是一致的。由此可見,相對權重法不僅可以對各定價來源的相對重要性做出排序,還可以定量地估計各數據定價來源的相對重要性,從而使其相對重要性表達更精確、直觀。
本文還分別對交通工程造價站負責制定的其他重要交通工程材料價格進行了定價來源相對重要性分析。其中,鋼材類、水泥類、石油類、砂和碎石類定價來源相對重要性結果匯總如表3~表6所示,“-”表示該材料缺少這一定價來源。

表3 鋼材類價格定價來源相對重要性評價結果及排序

表4 水泥類價格定價來源相對重要性評價結果及排序

表5 石油類價格定價來源相對重要性評價結果及排序

表6 砂和碎石類價格定價來源相對重要性評價結果及排序
根據表3~表6的結果,可以發現相同的定價來源對于不同的交通工程材料價格,其相對重要性的排序和PropWeights往往是有所不同的,所以每一種材料價格的制定都需要進行具體分析。同時,通過觀察TM公司的相對重要性排序和PropWeights值,可以發現其往往都排在較為靠前的位置,說明了該渠道的價格數據相對來說最為精確、完整、科學。
在市場經濟條件下,交通工程造價站是否能對各定價來源進行有效的相對重要性評價,決定了其能否準確、迅速的對各定價來源的參考價值進行科學區分,并制定出最具有實際指導意義的交通工程材料價格。由于相對權重法相比于傳統的相關系數分析能更好地求解自變量存在相關性時的相對重要性問題,所以本文將其應用到了福建省交通工程材料價格各定價來源的相對重要性評價當中,證明了該方法的可行性。通過實例研究,得出各定價來源對于鋼板價格的相對重要性排序依次是TM公司、福州物價局、住建廳、建材在線、福州公路局、網絡價格以及福州交通局;而其他材料價格的定價來源相對重要性評價結果則各有不同。總體來說,TM公司的影響作用較強,在交通工程造價站今后制定交通工程材料價格時,可重點參考TM公司的價格數據。
[1]張波,黃啟風,代魯燕,等.Logistic回歸模型中自變量的秩優勢比圖[J].統計與決策,2008(24):87-89.
[2]施慶生,翟文斌,鄧曉衛.基于PLS的江蘇省房地產價格影響因素的實證研究[J].數學的實踐與認識,2013,43(17):19-26.
[3]馬金輝,田菲,陳璐.基于優勢分析法的泥石流影響因子相對重要性分析——以白龍江流域為例[J].蘭州大學學報(自然科學版),2014,50(5):722-727.
[4]于松青,林盛.基于偏最小二乘回歸的山東省電力需求預測分析[J].干旱區資源與環境,2015,29(2):14-20.
[5]楊衛兵,豐景春,張可.農村居民水環境治理支付意愿及影響因素研究——基于江蘇省的問卷調查[J].中南財經政法大學學報,2015(4):58-65.
[6]樓狄明,胡磬遙,胡志遠,等.基于PLS的噴油參數對共軌柴油機顆粒物排放特性影響研究[J].內燃機工程,2015,36(5):56-62.
[7]Admassu N L,Jan A O.The Relative Importance of Health,Income and Social Relations for Subjective Well-being:An Integrative Analysis[J].Social Science&Medicine,2016,152:176-185.
[8]Tso M,Zha Y Y,Yeh J,et al.The Relative Importance of Head,Flux,and Prior Information in Hydraulic Tomography Analysis[J].Water Resources Research,2016,52(1):3-20.
[9]Johnson J W,Lebreton J M.History and Use of Relative Importance Indicesin OrganizationalResearch [J].OrganizationalResearch Methods,2004,7(3):238-257.
[10]Johnson J W.A Heuristic Method for Estimating the Relative Weight of Predictor Variables in Multiple Regression[J].Multivariate Behavioral Research,2000,35(5):1-19.
[11]James M.Multivariate Relative Importance:Extending Relative Weight Analysis to Multivariate Criterion Spaces[J].Journal of Applied Psychology,2008,93(2):329-345.
[12]Johnson J W.Determining the Statistical Significance of Relative Weights[J].Psychological Methods,2009,4(1):387-399.
[13]Chao Y E,Zhao Y,Kupper L L,et al.Quantifying the Relative Importance of Predictors in Multiple Linear Regression Analyses for Public Health Studies[J].Journal of Occupational and Environmental Hygiene,2008,5(8):519-529.
[14]代魯燕,沈其君,張波.相對權重法在線性模型自變量相對重要性中的估計及其應用[J].中國衛生統計,2013,30(1):19-22.