岑晏青,董 靜
道路客運實載率是交通運輸行業節能減排的重要考核指標,也是運輸主管部門合理調控運力的重要依據。在計劃經濟的“單車→車隊→企業→行業”分級管理模式下,運輸主管部門通過全面統計報表制度,對包括實載率在內的所有旅客運輸生產指標進行全面調查并層層匯總。隨著道路客運市場化程度的不斷提高,運輸主管部門的職責由直接經營管理轉變為宏觀政策調控,掌握每一輛載客汽車的基礎信息已經不再可能也沒有必要。此時,調查成本較低、推算精度有保證的抽樣調查在全國范圍內逐漸推廣應用。但由于調查經費等原因,以往的公路運輸量抽樣調查主要是針對客運量和旅客周轉量等核心指標進行設計和實施,使得實載率等運輸效率指標無法進行科學、合理的調查和推算。
因此,本文將基于道路客運實載率的定義和計算公式,結合交通運輸部2008年組織開展的全國公路水路運輸量專項調查,提出實載率指標抽樣估計值及其精度的估計方法,以期對規范實載率指標的調查和推算、支撐交通運輸行業的相關工作有所裨益。
現行的實載率定義、統計調查方式和計算方法遵循的是2002年交通運輸部頒布的《公路、水路、港口主要統計指標及計算方法規定》,是基于原計劃經濟條件下“單車→車隊→企業→行業”的全面調查方式而設計的。根據定義,道路客運實載率是指報告期內載客汽車完成的旅客周轉量占總行程載客量的比重,用以反映總行程載客量利用程度,計算公式為:

設ki,yi,xi分別為第i輛載客汽車的實載率、旅客周轉量和總行程載客量,則對于單車而言,其實載率ki的計算公式為:

對于車隊、企業或行業而言,實載率的計算公式為:

其中,N為車隊、企業或行業擁有載客汽車的數量。可見,在全面統計報表制度下,只要掌握了所有載客汽車的旅客周轉量 yi和總行程載客量 xi(即i=1,2,3,……N),利用上述計算公式就可以得出總體N(如全行業)或者任何一個子總體Nj(如車隊或企業)的實載率k或者kj。但在抽樣調查中,由于只獲取了部分載客汽車(即樣本車輛)的相關數據,此時i=1,2,…,n(n<N),要計算出總體N或者某一子總體Nj的實載率k或者kj,就必須要遵循抽樣調查方法對目標變量的均值和方差進行推算。
為提高抽樣效率,2008年全國公路客運專項調查以地市、車輛類型、線路類型和標記客位等指標作為分層標志,采用了較為復雜的多重分層抽樣方法。這里為方便討論,我們假設只進行了一次分層。下面討論實載率指標的兩種估計方法。
所謂定義法,就是嚴格按照實載率的計算公式,先分別估計旅客周轉量Y和總行程載客量X兩個中間變量的估計值,再利用計算公式實載率K=Y/X得到K的估計值。
根據抽樣方案設計,旅客周轉量Y采用逐層推算的模式。設yhi為第h層第i個樣本車輛的旅客周轉量,nh和Nh分別為對應層的載客汽車樣本數和總體數,Yh為對應層的旅客周轉量。
根據分層抽樣調查的推算原理,第h層樣本車輛的平均旅客周轉量為:

第h層旅客周轉量的估計值Y?h為:

Y?h的方差估計值 v(Y?h)為:

由此可得,旅客周轉量Y的估計值Y?為:


在正態分布假定條件下,Y?的置信水平為1-∝時的置信區間為:

按照同樣的步驟,可以獲得總行程載客量X的置信水平為1-∝時的置信區間為:

其中,X?為總行程載客量X的估計值,v(X?)為 X?的方差估計值。

顯然,根據現有抽樣技術理論,估計值K?的方差是無法進行科學計算的。但按照精度估計的穩健性原則,可以根據Y?和X?的置信區間來估計出K?的近似置信區間。實載率K?的置信水平為(1-∝)2時的近似置信區間為:

所謂變量替換法,就是根據調查數據計算出每一個樣本車輛的實載率ki=yi/xi,然后將ki視為目標變量進行分層簡單估計,得到K的估計值及其方差。
根據抽樣方案設計,實載率K同樣也采用逐層推算的模式。設khi為第h層第i個樣本車輛的實載率,nh和Nh分別為對應層的載客汽車樣本數和總體數,kˉh為對應層的實載率。
根據分層抽樣調查的推算原理,第h層樣本車輛的平均實載率 kˉh為:

第h層總體車輛的實載率估計值K?h為:

K?h的方差估計值 v(K?h)為:

由此可得,實載率K的估計值K?為:

K? 的方差估計值 v(K?)為:

在正態分布假定條件下,K?的置信水平為1-∝時的置信區間為:

以2008年陜西省班線客車運輸量調查為例,為簡化計算,假設僅按經營線路類型分為縣內班線客車、跨縣班線客車、跨地市班線客車和跨省班線客車4層(即h=1)。已知:N1=7427,N2=5210,N3=3646,N4=1308,n1=784,n2=443,n3=341,n4=155;可得 f1=0.1056,f2=0.0850,f3=0.0935,f4=0.1185,W1=0.4222,W2=0.2962,W3=0.2073,W4=0.0744。
采用上述兩種方法對該省班線客車實載率進行估計,設Y為日均旅客周轉量,X為日均總行程載客量,K為客運實載率。根據調查數據計算出來的有關結果見表1。

表1 根據調查數據計算出來的有關結果
實載率的估計值K?為:

實載率K?的(1-∝)2=90.25%的置信區間近似為:

實載率的估計值K?為:

實載率K?的1-∝=95%的置信區間為:

上述結果表明,采用定義法和變量替換法計算得到的實載率估計值K?基本相同,分別為53.69%和53.77%,兩者相差不到0.1%;但估計的置信區間顯示出變量替換法的精度要明顯高于定義法。
本文基于抽樣調查的理論和方法,從道路客運實載率的定義和計算公式出發,研究提出了分層抽樣條件下實載率的兩種估計方法,即定義法和變量替換法;并以2008年陜西省班線客車運輸量調查為例,對兩種估計方法進行了實證分析。結果表明,適用于全面統計報表制度的定義法同樣也適用于抽樣調查方法,但其估計精度和操作簡易性方面卻遠不及變量替換法,尤其是采用多重分層抽樣時,變量替換法的優勢將更為突出。事實上,本文提出的估計方法不僅可用于實載率的推算,同時也可以應用于里程利用率、客位利用率等其他運輸效率指標的推算,為道路運輸統計調查提供了新的思路和方法。
[1]中華人民共和國交通部.公路、水路、港口主要統計指標及計算方法規定[M].北京:人民交通出版社,2002.
[2]馮士雍等.抽樣調查——理論、方法與實踐[M].上海:上海科學技術出版社,1994.
[3]杜子芳.抽樣技術及其應用[M].北京:清華大學出版社,2005.