劉 垚 史柯峰 王奕然 楊 卓 盧 佳 陳 雷
(1.中交鐵道設計研究總院有限公司,北京 100088;2.北京城建設計發展集團股份有限公司,北京 100037;3.北京清華同衡規劃設計研究院有限公司,北京 100085)
近年來,我國城市軌道交通行業發展迅猛,運營里程超過7 000 km,已建及在建線路達上百條[1-3]。從行業發展角度分析,城市軌道交通工程項目的若干統計數據應具有重要的研究價值。通過采用數據統計等方法對工程數據的基本特征進行分析,有助于全方位了解我國城市軌道交通工程建設領域的內在規律與變化趨勢,為行業發展提供指導。
常用的數據分析方法有描述性統計分析、參數估計、假設檢驗、方差分析、回歸分析等。描述性統計分析是一種基礎而有效的手段,可將一系列復雜的數據減少到幾個能起到描述作用的關鍵數字,是對已有數據樣本的整體情況描述,并體現數據的集中趨勢、離散程度、分布形態。
針對數據進行描述統計的分布形態較多,主要有正態分布、均勻分布、冪律分布、二項分布、指數分布等,在城市軌道交通若干專業領域的數據分析中已得到應用與體現[4-8],但針對行業總體數據分析的研究與應用較少。原因是行業總體數據龐雜且難于收集,未經整理的原始數據一般不易體現明顯規律。應在結合已初步構建起來的軌道交通工程多樣本數據庫[9]的前提下,選擇適合且便捷的數據統計分析方法開展相關工作,這也是亟待解決的問題之一。
在統計學領域里,正態分布是一項重要的分布形態。當隨機變量X服從一個數學期望為μ、標準差為σ的正態分布,可記為[μ,σ]。
雙參數決定性:若一組樣本數據被證實符合正態分布特征,其概率密度函數由μ決定分布的位置,由σ決定分布的幅度。特征值推斷性:工程樣本選取合理且數量足夠時,樣本的正態分布特征,可以反映行業總體的正態分布特征。統計學基礎性:正態分布是許多統計方法的前提,如假設檢驗、方差分析、回歸分析等,均要求分析數據服從正態分布。
上述正態分布的基本特征,有利于工程數據的快速整理與標準化,描述簡潔,合理劃分,并可通過樣本推斷總體,也有助于軌道交通領域相關專業進行深入的數據分析。
城市軌道交通工程所涉及的專業眾多[10],統計數據類型繁多、數據量龐雜,按照其主要性質進行分類。
規模類:線路長度、車站數量、車站建筑面積、車輛基地建筑面積、主變電所數量、控制中心數量、建設用地及征地拆遷面積等。經濟類:總概算、技術經濟指標、工程費、建設費、設備費、安裝費、其他費用、預備費、專項費等。技術類:各專業技術參數,如客流預測、行車組織、車輛制式、速度制式、供電制式、信號制式以及空調制式等。
工程技術類統計數據一般由各專業設計需求決定,在不同軌道交通項目中具有一定的共通性。本文選擇前兩類相對獨立且有一定代表性的工程樣本統計數據作為研究對象,對其正態分布特征進行驗證與分析,研究其內在規律。
考慮多樣本數據庫的工程批復時間跨度為2003~2019年,在對經濟類統計數據進行分析前,應結合我國經濟發展的影響,將數據庫中各樣本與經濟相關的數據修正到在庫最新年份(2019年),使這些數據處于同一歷史階段、同一經濟水平,數據分析更合理。
按樣本工程初步設計批復時間,將線路長度L、車站數量N、車站總建筑面積A等規模類統計數據展開對應時序散點分布圖,總概算C、工程費E、單公里技術經濟指標P等經濟類統計數據展開對應時序散點分布圖,如圖1、圖2所示。

圖1 樣本工程規模類統計數據的時序散點分布

圖2 樣本工程經濟類統計數據(修正后)的時序散點分布
由圖1、圖2可知,城市軌道交通工程各項統計數據的散點分布,未體現明顯的規律性、趨勢性、集中或分散性。
Q-Q圖是驗證數據是否符合正態分布的一種有效手段。對城市軌道交通工程規模類與經濟類統計數據分別進行正態分布Q-Q圖比對,結果如圖3、圖4所示。

圖3 樣本工程規模類統計數據的正態分布Q-Q圖

圖4 樣本工程經濟類統計數據(修正后)的正態分布Q-Q圖
可以初步判定,線路長度L、車站數量N、車站總建筑面積A、總概算C、工程費E、單公里技術經濟指標P等統計數據,均符合正態分布特征。
經過正態分布Q-Q圖初步驗證后,將城市軌道交通工程規模類與經濟類統計數據的正態分布頻率柱狀圖與概率密度曲線圖進行繪制。
如圖5、圖6所示。

圖5 樣本工程規模類統計數據的正態分布

圖6 樣本工程經濟類統計數據(修正后)的正態分布
獲得正態分布統計分析如表1、表2所示。

表1 樣本工程規模類統計數據的正態分布參數

表2 樣本工程經濟類統計數據(修正后)的正態分布參數
由表1和圖5可知,線路長度L符合[μ=25.839,σ=13.004]正態分布,呈低峰、右偏態;
車站數量N符合[μ=17.2,σ=8.5]正態分布,呈低峰、右偏態;
車站總建筑面積A符合[μ=27.738 0,σ=15.571 8]正態分布,呈低峰、右偏態。
由表2和圖6可知,總概算指標C符合[μ=191.685 2,σ=100.327 5]正態分布,呈尖峰、右偏態;
工程費指標E符合[μ=108.550 4,σ=56.255 7]正態分布,呈低峰、右偏態;
單公里技術經濟指標P符合[μ=7.618 8,σ=1.999 3]正態分布,呈尖峰、左偏態。
根據正態分布特征,上述城市軌道交通工程規模類與經濟類統計數據的正態分布驗證與分析結果,在無其他制約或影響因素的前提下,可由樣本推斷至總體,作為描述我國城市軌道交通行業總體層面規模類與經濟類對應數據的統計推斷。總體期望值μ與樣本期望值取值相同,總體標準差σ按樣本數n-1計算獲得,與樣本標準差略有差異。
城市軌道交通工程統計數據正態分布參數如表3所示。

表3 城市軌道交通工程(總體)統計數據正態分布參數
本文以城市軌道交通工程多樣本數據庫中若干統計數據作為研究對象,對規模類與經濟類數據分別進行統計學正態分布特征驗證與應用分析,得到相關結論。
(1)以線路長度L、車站數量N、車站總建筑面積A等為代表性的城市軌道交通工程規模類統計數據,以總概算C、工程費E、單公里技術經濟指標P等為代表性的經濟類統計數據,經驗證均為正態分布,并具有顯著特征。
(2)基于上述統計數據的正態分布特征,可由樣本工程推斷至行業總體,揭示出我國城市軌道交通行業在總體層面上的統計數據正態分布情況與內在客觀規律。
綜上所述,符合正態分布特征的樣本統計數據,體現出我國城市軌道交通行業所符合的基本規律,展現出城市軌道交通工程多樣本數據庫建立與持續豐富的重要意義,為進一步深入進行其他統計分析工作提供了重要前提條件,也為我國城市軌道交通工程領域在總體層面上的行業分析與發展研究等相關工作提供了必要的借鑒與數據基礎。