摘 要:長江沿線內河港口各有特色,港口之間的合作與競爭并存。為了推進長江“黃金水道”的全面發展,
需要對長江沿線內河港口的發展情況進行科學分析。將遺傳算法和模糊目標函數C-均值聚類算法
(FCM)相結合,對長江干線下游7個集裝箱港口進行了聚類分析,最后根據聚類結果提出了長江
干線下游集裝箱港口的發展定位。
關鍵詞:長江干線 集裝箱港口 遺傳算法 模糊聚類
基于遺傳算法的模糊目標函數C-均值算法簡介
模糊目標函數C-均值算法(FCM)是現在相當流行的一種模糊聚類算法,它被廣泛地應用于各個領域,但由于它是一種局部搜索算法,存在著兩個致命的弱點:一是在處理大數據集時花費的時間相當多;二是對初始化非常敏感所以很容易陷入局部極小值,所以在實際問題應用中受到了很大的限制。而遺傳算法是一種搜索能力強大的全局搜索算法,它的主要優點是簡單、通用、魯棒性強和適合并行處理,如果把這種方法與FCM算法相結合就可以彌補FCM算法的缺點,達到理想的聚類效果。本文主要研究的是基于遺傳算法的模糊聚類算法,可以得到一種能改善聚類效果、提高收斂速度的新方法。
基于遺傳算法的FCM聚類算法如下:
編碼:使用適合于模糊聚類算法的用聚類中心作為染色體的浮點數編碼方法。把一條染色體看成由c個聚類中心組成的一個串:,由于每個聚類中心有s個特征,因此一條染色體是長度為的浮點碼串。假設種群大小為N,則要按以上方法生成N條染色體來組成初始種群。
適應度函數:以F作為適應度函數。其中,
(1)
(2)
(3)
(4)
Z(?簸;V)為類別方差,全集為X={x1,x2,···,xk,···,xn},c為聚類中心個數,m(m?叟1)是一個給定的數,為?簸=[?滋ik]模糊分類矩陣(且?簸ik=[0,1] i,k)。
選擇和復制:為了保證每一代的進化過程中當前最優個體不會被遺傳操作所破壞,采用比例選擇與最優保存策略相結合的混合選擇算子。我們先選擇群體中10%的優秀個體直接進入下一代,剩下的部分按比例選擇(用隨機遍歷抽樣算法)進行選擇。
交叉:本文采用浮點數編碼方式,所以使用算術交叉算子。算術交叉是指由兩個個體的線性組合而產生出新的個體:
Child=parent1+?琢(parent2-parent1)(5)
其中是[0,1]范圍內的隨機生成數,Child是新個體,parent1和parent2是兩個舊個體。
變異:采用實值種群的變異函數mutbga( )進行變異,先產生個中間任務表決定變異的變量,再產生第二個中間表標識正常的變異步長大小。變異的變量由變量加步長形成。
個體的FCM優化。由于FCM法是一種局部搜索能力較強的算法,因此本文在每一代執行完遺傳操作后對其進行FCM優化,優化后的群體才會進入下一次演化。這樣做不僅可以提高混合算法的局部搜索能力,同時又有利于提高其收斂速度。具體的優化方法如下:①根據每條染色體的聚類中心編碼值,計算各自新的模糊分類矩陣U;②根據模糊分類矩陣U,計算新的聚類中心矩陣V并編碼成為新的染色體;將以上產生的N條新的染色體作為新一代種群開始下一次的遺傳操作。
終止:最大重復執行次數為200。
解碼:在最后一代中找出適應度最高的染色體,它所對應的聚類中心矩陣V即為混合算法所得到的最優解。由這個最優聚類中心矩陣按照式計算得到最優模糊分類矩陣U,再根據最大隸屬度原則來確定最優的聚類劃分并輸出,這樣就完成了整個算法的執行過程。
港口聚類影響因素分析
港口營運水平:衡量一個港口能力大小的根本性指標在于港口的營運生產能力,本文用集裝箱吞吐量和貨物吞吐量指標來進行描述。
港口增長水平:港口增長水平反映了港口未來發展潛力的大小,本文采用港口建設投資以及集裝箱吞吐量增長系數進行描述。
集裝箱吞吐量增長系數:按照過去5年(2004-2008)集裝箱吞吐量增長率的平均值計算。
港口交通水平:港口位于發達的交通運輸樞紐地區,可以擴大其對貨物的吸引范圍,尤其是對中轉貨物的吸引量。相對完善的交通運輸條件,可以促進經濟的發展,刺激運輸需求量的增長,為港口的長遠發展創造條件。本文用交通環境系數來衡量港口交通水平。
交通環境系數:反應港口交通運輸道路基礎狀況。根據連接地級及地級以上城市的高速公路、國道干線公路、省道公路、鐵路的條數,按一定的系數(高速、國道、省道權重分別為:0.4、0.35、0.25;公路、鐵路權重分別為:0.55、0.45)進行折算而確定。
港口設備水平:港口設備條件反映了港口進行生產營運的支持保障能力的高低。其評價指標可以采用生產用碼頭泊位、生產用裝卸機械以及生產用堆場來進行衡量。
長江干線下游集裝箱港口的遺傳模糊聚類分析
對長江干線下游集裝箱港口進行模糊聚類分析的目的是將港口進行分類,針對不同層次港口的特點對港口進行定位,制定不同的港口發展戰略和策略,做到有的放矢。結合影響港口聚類的影響因素,對港口進行遺傳模糊聚類分析的背景為:
選擇長江干線下游的南京、江陰、鎮江、南通、揚州、泰州和蘇州7個主要集裝箱港口分成3類進行聚類分析。
選擇7個港口的集裝箱吞吐量、貨物吞吐量、港口建設投資、集裝箱吞吐量增長系數、交通環境系數、生產用碼頭泊位、生產用裝卸機械以及生產用堆場8個指標作為聚類分析特征指標。
聚類分析指標中的前6項指標值以及集裝箱吞吐量增長系數的基礎數據來自《中國港口年鑒2009》;交通環境系數的基礎數據來自《中國交通營運里程圖(新編版)》。
表12008年長江干線下游主要集裝箱港口聚類特征指標值
表22004-2008年集裝箱吞吐量增長率(單位:%)
采用MATLAB7.9.0(R2009b)對遺傳模糊聚類算法進行編程,通過計算獲得7個港口對應3個類別的模糊聚類隸屬度見表3。
表3 各城市對應類別的隸屬度
根據上表,得到長江干線下游集裝箱港口的聚類分析結果如下:
一類港口——蘇州港、南京港
二類港口——南通港、江陰港
三類港口——鎮江港、揚州港、泰州港
從港口所處地理位置以及港口發展的角度,一類港口是地區干線港,在長江干線下游集裝箱港口體系中最高層次的港口,可以發展為區域性集裝箱樞紐港,主要負責上海港的喂給協作工作。二類港口是地區支線港,其基礎設施與營運能力等與一類港口存在一定的差距,主要負責地區干線港的重要補充工作。其中,一類和二類港口可以作為上海港的側翼與上海港形成組合港口共同發展,形成以上海樞紐港為核心,蘇州港和南京港為干線喂給港,南通港和江陰港為支線喂給港的規模等級港口體系。
(作者單位:交通運輸部水運科學研究院)