摘要:本文以地級市為基本單位,選擇與行包運輸相關的多項經(jīng)濟指標對其進行聚類分析,選出其中重要的行包運輸核心城市,并根據(jù)其地理位置及路網(wǎng)結構,再次應用聚類分析的方法,以這些核心城市群為對象把全國分為20個行包區(qū)域,為行包專列開行路徑的規(guī)劃提供參考依據(jù)。
關鍵詞:行包運輸;聚類分析;區(qū)域劃分
中圖分類號:U116.2 文獻標識碼:A 文章編號:1002-3100(2007)02-0096-03
Abstract: Based on the method of clustering analysis, this paper picks up cities which are essential for transportation of railway baggage and parcel according to economical indexes related. Then we also use the method to divide these cities into 20 zones according to their geography locations and railway network. It will offer some reference to the route planning of special trains of railway baggage and parcel.
Key words: transportation of railway baggage and parcel; clustering analysis; division of zones
未來行包運輸需求的變化對行包運力配置的結構提出了新的要求,專列運輸具有距離長、速度高、運量大、組織形式簡單、利潤率較普包高等特點,在未來一段時間內(nèi)將逐步成為行包運輸?shù)闹饕\輸形式。因此,如何優(yōu)化行包運輸路徑、組織高效的行包專列運輸就成為亟待研究的問題。
1問題的研究思路
本文的主要目的就是參考地理位置和路網(wǎng)結構等因素,同時考慮行包專列開行對周邊區(qū)域流量的吸引,將行包運輸覆蓋的區(qū)域進行分類,劃分為若干行包小區(qū),為專列開行路徑的規(guī)劃提供參考,進而最終建立起能有效銜接各大經(jīng)濟區(qū)域的行包運輸快速通道網(wǎng)。
考慮到計算規(guī)模的問題,我們不可能一次性對全路行包站點進行劃分歸類。因此,本文提出一種二次分類的方法,基本步驟是:第一步是行包運輸城市重要度的標定。針對幾大經(jīng)濟區(qū)中分別進行分類分析,依次提取出重要行包運輸OD點城市,形成全路重要的行包OD點集合,作為下一步工作的基礎;第二步以第一步的結果為基礎,參考各城市的地理位置和路網(wǎng)結構等,以這些重要OD點為對象,把全國分為若干個行包運輸小區(qū),以這些小區(qū)為基礎,即可進行行包運輸?shù)穆窂揭?guī)劃工作。
根據(jù)上述問題的特點,本文主要采用聚類分析的方法。聚類分析是多元分析中研究“物以類聚”的一種方法,它在人們對社會、經(jīng)濟、技術系統(tǒng)的認識過程中有著廣泛的應用。它從數(shù)據(jù)分析的角度,給出在同一分類過程
中始終如一的定量方法,從而避免了普通分類中主觀隨意性大的弊端,是一種更加準確、更加細致的科學分類工具[1]。本文應用統(tǒng)計分析軟件SPSS和SAS等進行聚類分析。
2行包運輸城市重要度的標定
根據(jù)“八五”期間國務院發(fā)展中心UNDP課題組提出的中國經(jīng)濟區(qū)劃[2](全國分為東北區(qū)、西北區(qū)、華北區(qū)、西南區(qū)、華東區(qū)、華中區(qū)、華南區(qū)七大區(qū)),結合我國鐵路干線走向及重點工業(yè)區(qū)分布進行調(diào)整,我們把山西省和河南省劃入華北區(qū),并把山東省單獨劃出作為山東半島區(qū),這樣就得到八大經(jīng)濟區(qū)域。考慮到我國東西部經(jīng)濟發(fā)展的不平衡,行包運輸?shù)闹匾狾D城市需要在各個經(jīng)濟區(qū)域內(nèi)分別選取,這樣所選出的重要行包城市群才能較廣泛地覆蓋我國的鐵路運輸網(wǎng)。本文以珠三角地區(qū)為例,運用聚類分析方法標定其中的重要行包運輸城市。為了結合相關經(jīng)濟指標進行衡量,我們選取行包作業(yè)量較大的地級市作為分析的基本城市集合。
在進行數(shù)據(jù)分析時,根據(jù)行包運輸目標市場的特點,我們選取的指標是與行包運輸量息息相關的2004年行包發(fā)送量、到達量、工業(yè)總產(chǎn)值、社會消費總額和城市GDP,詳見表1。

本例可以看作是對17個5維的樣本進行聚類分析,我們對原始數(shù)據(jù)采用標準Z分數(shù)(Z score)方法進行標準化,以歐氏距離衡量組間距離,采用離差平方法進行聚類計算。其聚類分析的流程如圖1。

聚類結果產(chǎn)生的樹形圖(如圖2所示)形象地反映了各類城市的異同,0~25的標尺刻度表示類別之間的親疏距離。
根據(jù)聚類樹形圖可以看出,珠江三角洲地區(qū)的行包運輸城市應該分為三類,表2是聚類結果:

由以上圖表可知,第1類中的廣州市是珠江三角洲最重要的行包運輸城市。通過上述聚類分析結果,我們可選取第1類和第2類包含的廣州市、深圳市、佛山市和東莞市作為珠三角地區(qū)的行包運輸?shù)暮诵某鞘小I鲜鏊膫€城市2004年行包發(fā)送量已超過了地區(qū)發(fā)送量的90%,也從另一個角度說明上述劃分是比較合理的。區(qū)域重要行包運輸城市的標定也可以作為建立行包基地和行包分撥中心的參考。
3全國行包物流區(qū)域的劃分
按照上例的方法,在其他各大經(jīng)濟區(qū)域分別進行分析計算,即可得到全國重要行包城市群,這里我們獲得了77個城市,2004年其行包發(fā)送總量和到達總量均超過了全路行包運量的90%。這77個城市就是我們進一步劃分行包運輸小區(qū)的基礎。
通過對這77個城市間的鐵路線距離矩陣的數(shù)據(jù)分析,用SAS統(tǒng)計軟件進行聚類分析。通過方差分析法得到聚類過程表,如表3。

表3中,F(xiàn)REQ為新類中所含的樣品數(shù);SPRSQ為半偏R2,它表示每一次合并對信息的損失程度,看這1列的數(shù)值可知:從20類合并成19類時損失最多。此統(tǒng)計量表明聚成20類較合適;再結合PST2統(tǒng)計量的值,PST2從NCL=20到NCL=19時峰值增加的幅度很大。綜合這兩個統(tǒng)計量的結果可知:將77個樣品分為20類較合適。
根據(jù)聚類過程表中多個統(tǒng)計量的特性值,我們認為把77個行包運輸核心城市分為20個行包運輸小區(qū)比較合適,如表4及圖3所示。

結合圖3中我國鐵路路網(wǎng)基本結構圖可以看到,我們劃分的這20個行包區(qū)域較全面地覆蓋了我國五縱三橫的鐵路干線網(wǎng),也基本覆蓋了全國主要的經(jīng)濟區(qū)域,可以在其間建立貫通東部沿海、東北和西部地區(qū)的快速通道網(wǎng)絡,據(jù)此可以確定各OD流的合并與拆分,確定行包專列開行方案。

4 結束語
本文應用聚類分析的方法對行包運輸區(qū)域進行了較合理的劃分。通過聚類,可以具體地對不同城市對行包運輸?shù)闹匾冗M行合理標定,進而選出全路行包運輸城市,并劃分出以它們?yōu)橹行牡娜舾尚邪鼌^(qū)域,為專列開行路徑的規(guī)劃提供了參考,以便建立起銜接各大經(jīng)濟區(qū)域的行包運輸快速通道網(wǎng)。
參考文獻:
[1] 閆楓逸,毛海軍. 安徽省各城市物流重要度聚類分析[J]. 交通科技與經(jīng)濟,2005(3):67-69.
[2] 張金鎖,康凱. 區(qū)域經(jīng)濟學[M]. 天津:天津大學出版社,2003.
[3] 國家統(tǒng)計局城市社會經(jīng)濟調(diào)查總隊. 中國城市統(tǒng)計年鑒2004[M]. 北京:中國統(tǒng)計出版社,2005.
[4] 米紅,張文璋. 實用現(xiàn)代統(tǒng)計分析方法及SPSS應用[M]. 北京:當代中國出版社,2004.
[5] 高惠璇,等. SAS系統(tǒng)SAS/STAT軟件使用手冊[S]. 北京:中國統(tǒng)計出版社,1997.