溫旭麗,張志成
(東南大學成賢學院 土木與交通工程學院,江蘇 南京 210088)
從既有文獻看,國內外學者已經開展了公共交通公平性相關研究。LITMAN[1]指出交通決策往往對公平性具有重要影響,通過定義不同類型的交通公平,討論了各種公平問題。THOMOPOULOS等[2]提出了一種基于MCA層次分析法將公平問題納入交通基礎設施項目評估的方法。DELBOSC等[3]認為公平性一直是公共交通服務的主要問題之一,提出了一種利用洛倫茲曲線來測量人口相對公共交通供給的新方法。WELCH等[4]提出一種基于綜合路線、時間表、社會經濟、人口和空間活動模式等因素的圖論方法,以衡量公共交通服務公平性。GRIFFIN等[5]提出了一種基于收入的交通公平性分析方法。JEDDI YEGANEH等[6]認為獲得高質量的公共交通對就業至關重要,利用回歸分析方法探討了按種族和收入劃分的公共交通就業機會趨勢。國內學者結合我國公共交通發展情況也開展了豐富研究。唐子來等[7]基于社會公平理念提出了用于軌道交通社會公平績效評價方法。劉明輝[8]基于構建的公共交通供給指數綜合評價指標,以武漢為例分析了公共交通設施空間分布公平性。潘亞偉[9]提出了我國健康城市的橫向和縱向“多模式”公共交通體系結構模型。戢曉峰等[10]基于底線公平理論,采用主成分分析方法對城市公交的底線公平性進行了分析。戢曉峰等[11]設計了公交出行調查問卷,并運用結構方程模型分析了昆明公共交通系統公平性。王歡明等[12]對大連市公共交通服務公平性和影響因素進行了分析。楊庭[13]通過對比公共交通和小汽車交通的出行成本和可達性差異,評價分析了廣州市交通出行公平性。侯松巖等[14]基于ArcGIS和網絡分析法,以最短可達時間和公交服務頻次為分析指標,研究了長春市醫院可達性的時空分布特征。既有成果主要從公共交通作為城市公共服務資源的公平性角度來展開相關研究,尚未涉及針對公共交通對城市公共服務公平性影響的研究。對于健康城市來說,公平性是一個比貧困更廣泛的概念。貧困主要是針對某個貧困線以下的人口,而公平性對整個人口范圍而言。經濟學中,通常運用基尼系數、泰爾系數和變異系數等指標來量化城市收入公平性,公平性衡量標準通常是根據支出以外的分配來計算,這些指標主要考慮人均收入的影響。而公共交通對健康城市服務公平性影響也可以選用人均收入指標來考量,因此本文將這種公平性概念引入城市公共交通對健康城市服務公平性影響研究當中,以此開展研究。
根據《全國健康城市評價指標體系(2018版)》中提出的城市健康評價指標來設置和選取健康城市公共服務指標,結合數據可得性、可比性和科學性等原則,選用城市每萬人口擁有公共衛生人員數作為健康城市公共醫療資源水平代理指標。
從2個角度來設計和選取公共交通系統的解釋變量指標。一是面向健康城市公共交通服務供給方面;二是面向公共交通服務需求方面。數據來源于2種方式,一種是居民出行調查統計數據,另一種是城市年鑒統計數據。指標選取見表1。

表1 公共交通面向健康城市服務公平性指標Table 1 Public transportation face to the fairness of urban medical public service indicators
以南京市公共交通和城市醫療公共服務為研究對象。根據中國社會科學院發布的《城市藍皮書:中國城市發展報告No.11》,南京城市健康發展指數綜合排名居全國第9位,江蘇省第1位,故以南京作為健康城市樣本具有較好的代表性。公共交通分擔率指標的統計數據來源于《南京市交通年報(2001~2017)》,所涉及的城市醫療技術人員的樣本數據來源于《南京統計年鑒(2001~2017)》,其中人均GDP數值統一換算成2000年可比價,以消除價格因素影響,滿足不同歷史數據對比需要。樣本數據屬于時間序列數據集,數據描述統計情況如表2所示。為消除異方差影響,同時便于擬合系數比較和結果分析,對樣本原始數據采用Z-Score標準化方法進行標準化和無量綱化處理。計算公式為其中,x'表示標準化之后的數據;x表示原始數據;xmean為樣本均值;d為原始數據標準差。

表2 樣本數據描述統計Table 2 Descriptive statistics of sample data
基尼系數是研究經濟分布不平等程度(公平性)的一個重要指標,用來衡量一個國家的財富或收入分配與完全平等的分配差距有多大,可以通過Lorenz曲線來實現。對于Lorenz曲線未知情況,可以采用公式(1)來計算加權基尼系數:
式中:ni=Ni/N表示第i個區域的人口權重;yi表示第i個區域的平均收入;yˉ(w)表示加權平均收入。
本文借鑒加權基尼系數指標公式來構造適合健康城市公共服務公平性評價的方法,分為2類,即按照人口和GDP為權重的加權基尼系數,通過替換公式(1)中對應參數從而計算得出2種形式的加權基尼系數具體數值。
該模型的表達式一般可以寫成:
式 中:響 應 變 量Y=(y1,y2,…,yn)T;自 變 量X=(X(1),X(2),…,X(d)),對 于 每 一 個X(j),有X(j)=假 設 每 個1,2,…,d)均已標準化,隨機誤差項εi~N(0,σ2),(i=1,2,…,n),ε=(ε1,ε2,…,εn)T, 回 歸 系 數β=(β1,β2,…,βd)T。當X為列滿秩設計矩陣時,回歸系數β可由普通最小二乘估計(OLS)方法求得:
當設計矩陣X不滿足列滿秩時,將不能采用普通最小二乘法來求解回歸系數β,此時引入懲罰方法,可同時滿足變量選擇和參數估計要求。在參數估計時,通過將部分參數壓縮為0以達到變量選擇的目的。
在多元回歸中,被解釋變量常受到很多因素共同影響,如何根據研究目標選擇合適的被解釋變量進入回歸模型是首先需要考慮的問題。如果引入的解釋變量較少,回歸模型將不能對被解釋變量變化規律做出較好解釋,但解釋變量個數也并非越多越好,由此可能引起變量間多重共線性問題,造成參數估計結果非有效和方差增大等問題。本文采用逐步篩選策略(Stepwise strategy)對回歸模型的解釋變量進行篩選。計算結果如表3所示。從表中可以看出,利用逐步篩選策略將公交客運量,人均GDP,公交標臺車數以及城市道路里程等變量剔除在回歸模型之外。影響最大的是綠色出行分擔率,其系數為正,說明提高綠色出行分擔率不利于醫療資源的公平性。在負向指標中,影響最大的公交指標為公交車公里分擔率,為-4.310 6,即提升該指標有助于提升公共服務公平性。

表3 最小二乘回歸分析結果Table 3 Results of OLS regression analysis
以上回歸結果的可靠性還需要從變量共線性、殘差獨立性和異方差等方面進行回歸后檢驗分析。
1) 變量共線性檢驗。采用方差膨脹因子(VIF)來判斷自變量間是否存在共線性問題。一般情況下,VIF值不大于10則說明變量間不存在共線性問題[15]。由表4可知,VIF的變量最小值為5.863,平均達到194.715,存在嚴重的共線性問題。

表4 變量膨脹因子Table 4 Variance inflation factor of variables
2) 異方差檢驗。分析結果見表5。根據懷特檢驗結果(p=0.385 6大于0.05顯著水平),說明樣本數據異方差現象并不明顯。

表5 懷特檢驗結果Table 5 White test results
Ridge方法中對于β的估計公式為:
也可以寫成:
參數含義同LASSO回歸模型,γ由λ或t決定。可以看出嶺回歸方法估計的是β的有偏估計,即且嶺回歸估計結果是將OLS估計以相同比例進行了壓縮。嶺回歸和LASSO回歸方法最大的區別在于后者采用的是L1penalty,嶺回歸是L2penalty。以二維數據空間為例,圖1中左圖對應于LASSO方法,右圖對應于Ridge方法。
圖1中,橢圓代表隨著λ變化的殘差平方和函數等高線,?是橢圓中心點,對線性模型最優解。左右2個圖的區別在于約束域分別對應圖中原點區域。對于LASSO方法,將不顯著的變量系數壓縮至0以達到變量選擇的目的。Ridge方法雖然也對原本的系數進行了一定程度的壓縮,但是任一系數都不會壓縮至0,最終模型保留了所有的變量。

圖1 LASSO(左)和嶺回歸(右)差異對比Fig. 1 Difference between LASSO (left) and Ridge Regression (right)
圖2是嶺回歸模型求解路徑,最優λ值為19.64。模型求解得出的各變量回歸系數如表6所示。結合圖2和表6可知,對加權基尼系數具有正向邊際效應的變量指標包括人均GDP,城市道路里程,公交運營線路網長度,公交全方式分擔率以及公交車車標臺數,其余指標為負向指標,影響最大的2個指標為公共交通車公里分擔率和公共交通機動化出行分擔率,指標的提升可以促進健康城市醫療資源公平性。總體上,邊際效應較小的2個公交指標為公交全方式分擔率指標(0.004 7)和公共交通客運總量(-0.025 2)。

圖2 Ridge回歸模型求解路徑(λopt=19.64)Fig. 2 Solution path of Ridge regression (λopt=19.64)
從表6中的Ridge回歸系數一列中也可以看出,與嶺回歸相比,OLS回歸方法對各解釋變量的擬合估計值都變大。
LASSO方法是在普通線性模型中增加L1懲罰項,對于普通線性模型的LASSO估計為:
式中:t與λ相對應,是一個決定規則化程度的預定的自由參數,為調節系數。令當t 圖3給出了LASSO回歸模型求解路徑,最優λ值為2.48。該模型求解得出的各變量回歸系數如表6中的LASSO擬合系數列所示。結合圖3和表6可知,在最優調整系數下,僅有公交車公里分擔率指標、公交機動化分擔率指標以及城市道路里程3個指標進入最終回歸模型。對加權基尼系數具有正向邊際效應的為城市道路里程指標,其余2個指標為負向效應指標,進一步說明提升公共交通車公里分擔率指標和公共交通機動化出行分擔率指標將促進健康城市醫療資源公平性。但LASSO回歸系數比Ridge回歸系數略大一些,但仍然比OLS回歸系數小(見表6)。 表6 3種回歸分析結果匯總表Table 6 Regression results of the three models 圖3 LASSO模型求解路徑(λopt=2.48)Fig. 3 Solution path of LASSO regression (λopt=2.48) 彈性網回歸分析是一種同時使用L1penalty和L2penalty為先驗正則項的線性回歸模型。它的計算公式為[16]: 易知,當α=1或者令α=0時,彈性網絡模型可以分別簡化成LASSO模型和Ridge模型,也就是說,后兩者是彈性網絡模型的特例。圖4列出了3種模型擬合函數之間的差異性。 圖4 LASSO,Ridge和Elastic Net回歸擬合損失函數變化差異Fig. 4 Difference among the three regression models 圖5為彈性網回歸模型的求解路徑分析。模型調整系數λ的最優值為4.96,與LASSO回歸分析結果相同,僅有公交車公里分擔率指標、公交機動化分擔率指標以及城市道路里程3個指標進入最終回歸模型。相比Ridge回歸和LASSO回歸模型,這3個公共交通指標同樣保持了相同的變化方向,進一步驗證了這3個指標對于城市醫療服務加權系數邊際效應的一致性。從回歸系數大小來看,與LASSO模型差別不大。 圖5 彈性網模型求解路徑(λopt=4.96)Fig. 5 Solution path of elastic net(λopt=4.96) 綜上,選擇彈性網回歸模型,由表7得出南京城市醫療公共服務水平加權基尼系數與公交分擔率回歸方程為: 表7 模型選擇準則指標值Table 7 Model selection criteria index values 從回歸模型可以分析得出: 1) 南京城市醫療公共服務加權基尼系數主要受到公交車公里分擔率、公交車機動化分擔率和城市道路里程3個指標影響。 2) 對城市醫療公共服務基尼系數產生負向邊際效應最大的是公交車機動化分擔率指標,其次為公交車公里分擔率,故增加這2個指標有助于提升南京城市醫療公共服務公平性,這與目前大多數公交都市建設目標一致。 1) 分析研究了基尼系數及加權基尼系數研究經濟分布公平性方面的應用及計算方法,結果表明,將衡量城市收入公平性的量化指標基尼系數引入城市公共交通評價是合適的。 2) 設計提出了城市醫療公共服務的加權基尼系數公平性評價方法,梳理了嶺回歸、LASSO回歸和彈性網回歸方法以及相應的模型選擇方法,在此基礎上構建了公交分擔率指標與城市醫療公共服務加權基尼系數的多元回歸計量模型。結果表明,彈性網回歸模型能夠較好地描述公共交通擔率指標對城市公共服務公平性影響關系。 3) 運用所構建模型對南京市醫療服務公平性進行分析評價。結果表明,影響南京城市醫療公共服務公平性的正向指標為公交車公里分擔率、公交車機動化分擔率和城市道路里程,增加這3個指標有助于提升南京城市醫療公共服務公平性。研究成果有助于為健康城市社會公平性建設目標實現提供理論基礎和政策依據。 本文分析了公共交通分擔率指標與城市醫療公共服務公平性之間的相關性和數量變化規律,重點考察了基于公交分擔率的公共交通與醫療公共服務影響評價的方法構建和驗證,研究方法可以用于除了醫療公共服務以外的教育資源、體育活動場地和公園綠地等服務公平性研究。需要指出的是,文中所討論的公平性是指健康城市的醫療服務資源的公平性,不是公共交通本身的公平性。今后將進一步開展更具普遍性的研究,類推其他不同規模和不同層級的城市公平性問題。

2.5 彈性網回歸分析(Elastic net)


3 模型應用

4 結論