李 欣 吳祥國 余清星 李 涵
(重慶市城市交通規劃研究所 重慶 400020)
受城市土地利用布局和居民出行特征的多樣性、復雜性的影響,同時隨著對交通模型精度的要求越發的苛刻,城市交通需求預測成為了一項越來越復雜而困難的工作.因此為了有效升級模型精度,在模型構建技術上各方做了大量突破和進步[1].本文將主要關注交通出行生成模型的構建研究,作為傳統“四階段法”的第一階段,出行生成模型的構建方法的可靠度將直接影響后續3個階段的預測精度.而居民出行生成預測的常用模型有生成率模型,交叉分類生成率模型,回歸分析模型[2-3].各種產業的崗位數,不同用地性質的建筑量和社會經濟指數等通常被認為是直接影響出行生成模型的基本變量,而在以上所有闡述的常用方法中都默認了影響出行生成的變量因素是相互獨立的,忽略了變量之間的相互關聯性.一個城市或者一個區域內的各種產業崗位布局或者不同用地性質布局之間的關系也會直接影響出行生成,這種影響關系隨著城市或者區域功能的多元化和完善,會越發明顯影響居民出行的意愿和選擇[4].
本文將重慶市主城區綜合交通模型升級中利用主成分分析法首先確定各變量之間相互關系再做回歸分析的方法來優化出行生成模型.
2002年,在重慶市第一次編制綜合交通規劃中,進行了相對規模較大的主城區綜合交通調查,首次建立了統一的主城區綜合交通模型.在當時的出行生成模型構建中采用了傳統的交叉分類法,將主城區分為3個地帶和3種年齡結構、6種用地性質進行出行生成率和吸引率計算[5].在隨后歷年的維護升級中,為了更好的體現交通出行和用地性質的結合,將出行產生率與不同用地性質的建筑量進行了關聯計算,進而獲得了不同用地性質單位面積的出行產生率和吸引率,同時,重慶作為多中心組團出行城市的代表,為了體現各交通組團不同的出行特征,不同用地性質的交通出行率的計算還分解到了不同的交通組團內.
為了和重慶居民出行調查問卷中的目的地和出發地的用地性質保持一致,交通小區的用地性質被整理成7種用地性質:工業倉儲用地、大專院校用地、中小學校用地、行政辦公用地、商業醫療用地、文體游憩用地、居住用地.依據各組團不同類型用地的出行吸引量、建筑面積計算不同用地類型的建筑面積早高峰吸引率,見表1.

表1 各組團不同類型用地建筑面積吸引率 人次/100m2
由表1可見,由于調查樣本的數量和取樣設置問題,在個別發展還沒有成型的組團的商業用地性質的出行吸引率甚至超過了很多中心區域.交叉分類法的準確程度極大的受限于調查樣本的設置,對于計算結果的應用也有了很大的偏頗性.
模型校核的基本思想是以現狀調查值為基準,將現狀調查值與模型計算值相比較,檢驗符合程度.如果兩者差異在允許范圍內,則認為模型反映了實際情況,是切實可行的;反之,要分析不符合原因,進一步修正模型,直到符合為止.校核的具體方法是:以交通小區為單位,假定現狀調查所得到的值為應變量Y,通過模型計算的值為X,運用回歸原理建立如下算式.
Y =aX+b (1)式中:a為回歸系數;b為回歸常數.
用線性回歸法算出系數a和b,并得到擬合優度R2.檢驗的標準為:(1)a=1±0.5,觀察a值可以判斷調查值與計算值總量的關系,一般限定在95%以上;(2)R2表示了各樣本點與回歸線的擬合優度,R2越大,樣本點越接近回歸線.
當a≈1,R2≈1時,為理想模型.

圖1 交叉分類法模型校核曲線
回歸分析法是在大量調查數據的基礎上,運用數理統計分析的方法,建立因變量與自變量之間的回歸分析方程的方法.在出行生成模型應用過程中,其中出行生成量為因變量,自變量則依據其與因變量之間的相關關系的強弱進行取舍,通常為小區人口、崗位數量、土地利用面積或者建筑面積等.模型形式如下.

式中:Y為小區出行產生量或吸引量,人次/h;Xi為第i類自變量;ai為第i類自變量的回歸系數;a0為常數項,可根據需要決定是否設置為零;
回歸分析法的主要缺陷體現在以下方面:(1)因變量與所選自變量之間的不確定性,即所選擇的自變量并不一定能夠通過回歸分析完全解釋因變量;(2)自變量回歸系數的不可解釋性,即通過回歸分析計算出的因變量與自變量之間的回歸系數難于從邏輯上進行解釋分析;(3)在某些狀況下,回歸分析法不能夠保證計算出的因變量結果具有實際的物理意義,即因變量會出現負值.
以重慶市主城區出行吸引模型為例,介紹多元線性回歸分析法的應用情況.選取居民出行調查中7種用地類型的建筑面積為自變量,在進行相關性分析的基礎上,篩選出擬合度最高的用地類型建筑面積組合進行回歸分析,并進行參數檢驗.
采用1.2闡述的方法進行多元線性回歸生成模型校核,見圖2.

圖2 多元線性回歸分析法校核曲線
通過分析發現,應用多元線性回歸分析法擬合得出的出行吸引量與調查出行吸引量之間的擬合優度R2為0.673 5,符合精度要求,且高于交叉分類法的擬合優度.
回歸分析法已被證明是能夠描述出行吸引量及其相關影響因素之間關系比較準確的一種方法.然而,該方法并不能夠分析出各影響因素之間的多重相關性,從而擴大了回歸分析模型的誤差,并破壞了模型的穩健性.
主成分分析法是統計學中描述各變量間相關關系的一種數學方法,能夠從因變量中導出幾個主成分變量,從不同側面反映自變量的綜合影響,并且互不相關,從而在不丟掉重要信息的前提下避開變量間的多重相關性問題.它是通過線性變換,將原來的多個變量指標組合成相互獨立的少數幾個能充分反映總體信息的指標,所提取出的每個主成分變量都是原來多個自變量的線性組合.

式中:Zi為所提取的第i個主成分變量;Xj為應用于模型中的第j類自變量;aij為第i個主成分變量與第j類自變量的線性組合系數;m為所提取的主成分變量個數;n為自變量類數.
修正回歸分析法是在提取原始自變量的主成分變量的前提下,建立因變量與主成分變量之間回歸關系的一種數學方法.修正回歸分析法是一個可以選擇偏差大小的有偏估計,其偏差大小由選擇的主成分變量個數決定.在自變量矩陣呈現病態的狀況下,采用該方法能夠消除各自變量間的多重相關性,對最小二乘估計方法進行有效的改進,不失為一種較好的方法.回歸模型形式如下.

式中:Y為小區出行產生量或吸引量,人次/h;Zi為所提取的第i類主成分自變量;bi為第i類主成分自變量的回歸系數;b0為常數項.
修正回歸分析法的基本操作步驟如下.
1)對原始自變量數據進行標準化處理.
2)以標準化處理之后的自變量數據為基礎,進行數據的降維(Data Reduction)分析.
3)基于各主成分變量的方差累計貢獻率(一般要求大于85%)篩選主成分變量.
4)建立主成分變量與各原始自變量之間的線性組合關系.
5)基于因變量與主成分變量進行多元線性回歸分析,建立修正回歸分析模型.
基于修正回歸分析法的操作步驟,對重慶市主城區出行吸引量與不同用地類型的建筑面積進行分析,所提取的主成分變量與自變量之間的線性組合關系見表2.

表2 主成分變量與原始標準化自變量線性組合系數
模型校核繼續采用擬合出行吸引量與調查吸引量進行一元線性回歸分析的方法進行,見圖3.

圖3 主成分回歸分析法校核曲線
通過分析可知,修正回歸分析法所擬合的出行吸引量與調查吸引量的擬合優度更高,為0.750 6,比交叉分類法和多元線性回歸分析的擬合效果更加理想.
傳統的出行生成模型構建方法往往忽略了各變量之間的相互影響關系,進而在生成模型的構建里無法有效的體現用地布局或者產業布局之間的影響關系對出行生成的影響,本文通過引進主成分分析法來修正多元線性回歸,相比出行率法和線性回歸的方法,不僅有效地提高了預測精度(擬合優度的提高),更在數學機理上體現了變量之間的相互關系.
[1]杜剛誠,彭國雄.交通組合模型在交通需求預測中的應用研究[J].武漢理工大學學報:交通科學與工程版,2004,28(1):92-94.
[2]劉 安,宋偉芳,楊佩昆.出行生成預測模型的研究[J].同濟大學學報,1998,26(3):290-293.
[3]石 飛,王 煒,陸 健.居民出行生成預測方法的歸納與創新[J].城市交通,2005,3(1):43-46.
[4]劉洪麗.城市居民出行生成預測方法研究[D].南京:河海大學,2006.
[5]重慶市城市交通規劃研究所.重慶市主城區交通發展年度報告[R].重慶:重慶市城市交通規劃研究所,2010.