但 開 段隆振
(南昌大學信息工程學院 江西 南昌 330031)
經典的旅行商問題(Travelling Salesman Problem,TSP)可以描述為:給定一組城市,這些城市之間的距離已知,尋找一條經過所有城市一次且僅一次并返回起始城市的最短路線。旅行商問題有著廣泛的實際應用,生活中經常出現的各類組合優化問題都可以歸為旅行商這類問題。如物資運輸路線中,汽車應走怎樣的路線使路程最短[1];大型工業制件在增材制造中的路徑規劃[2];CNC在線檢測中,如何盡可能縮短檢測路徑長度[3];在航海相關問題中,無人駕駛船舶路徑規劃或船舶航線自動生成[4];多無人機協同作業中,規劃出符合無人機機動性能約束和安全要求的最優航跡的問題[5]等。
三角不等式是TSP的一個很自然的限制:對任意三座城市A、B和C,從A到C的路程加上從C到B的路程應該大于等于從A到B的路程。旅行成本是對稱的,而且滿足三角不等式的題目稱為TSP的度量(metric)題目。當把城市視為平面上的點,許多距離計算方式都滿足這個自然條件,例如城市距離為歐幾里得距離(Euclidean distance)、曼哈頓距離(Manhattan distance)、切比雪夫距離(Chebyshev distance)的TSP都屬此類。如果兩個城市之間的距離是相應的歐幾里得距離,且兩個城市之間的距離在兩個方向上都是相同的,這樣的TSP稱為對稱的Euclidean TSP。許多自然實例都是對稱的Euclidean TSP。
旅行商問題的最優化求解非常困難,其最根本的原因是求解這些問題的現有算法需要極長的運行時間以及極大的存儲空間,以至于根本不可能在現有的計算機上實現,即存在所謂的“組合爆炸”。例如31個城市的旅行商問題,使用窮舉法需要遍歷30!/2種排列。如果使用目前我國排名第一的超級計算機——神威太湖之光(Sunway TaihuLight,含有10 649 600個處理器,運算速度可達每秒125 436萬億次),假設檢驗每條路線只需要一次算術運算,那么解決這道31個城市的TSP問題預計需要超過3 352萬年。
通過Cook[6]和Karp[7]的理論,可以將旅行商問題和許多其他問題聯系起來。很多的組合優化問題,比如背包問題、車間調度問題、分配問題都和旅行商問題同屬于NP完全問題。如果其中任意一個能用多項式確定性算法解決,那么其他所有NP完全問題也能用多項式算法解決。事實上,有很多方法本來是研究旅行商問題時提出來的,經過不斷的發展,后來又推廣到了其他NP完全問題上去。
動態規劃(Dynamic Programming)是解決多階段決策過程最優化的一種數學方法。在多階段決策過程中,動態規劃方法將問題的過程分成幾個相互聯系的階段,恰當地選取狀態變量和決策變量及定義最優值函數,從而把一個大問題化成一組同類型的子問題,然后逐個求解。即從邊界條件開始,逐段遞推尋優,在每一個子問題的求解中,均利用了它前面的子問題的最優化結果,依次進行,最后一個子問題所得的最優解,就是整個問題的最優解。動態規劃的方法在電網調峰[8]、航天航空[9]和保險金融[10]等領域中都有廣泛的應用。
已知求解旅行商問題的精確算法的運行時間界限是Held-Karp[11]動態規劃法的O(n22n),這個紀錄已經保持了58年。如果能突破這個界限,哪怕只是一點點改進,也有可能獲得更快的時間界限,就有可能適用于實際應用,從而推進旅行商問題的實戰前線。
插入算法(Insertion Algorithm)的思路是從一條周游幾個城市的子路線出發,逐個增加新的城市并插入到合適位置,直至得到一條包含所有城市的新路線。算法核心部分的偽代碼為:
Begin
設算法運行過程中M為當前子路線;
根據新城市選取函數選取待插入城市i;
根據插入位點選取函數選取插入位點p;
M.insert(p,i);
if所有城市均在M中:
返回M;
else:
進行下一步插入操作;
End
其中插入位點選取的規則是遍歷所有可插入位點,計算插入后的路線長度,其中最短路線長度所對應的位點作為插入位點。將這條規則稱作簡單選取規則,通過簡單選取規則進行的插入稱為簡單插入。
例1十三個城市的TSP,城市從0到12依次編號,城市橫坐標依次為{466,826,555,79,781,251,329,336,978,793,489,496,735},城市縱坐標依次為{407,389,485,264,618,766,640,670,195,15,714,218,438}。
其最優路線為[7,6,2,0,3,11,9,8,1,12,4,10,5],最優路線長為3 082個單位長度,如圖1所示。

圖1 例1的最優路線
對于旅行商問題,有兩個最基本定理,分別是交叉避免和凸包規則。
交叉避免:最優路線不會自交,因此在解題過程中應避免出現交叉的情況。
用一步2-opt可以證明這個事實,若巡回路徑中存在交叉路徑,則打開交叉路徑得到的路徑長度一定小于原路徑長度。
凸包規則:最優路線中經過邊界各點的順序和凸包邊界經過邊界各點的順序相同。它們在邊界上的順序與在最優路線上的順序相同,其余城市的順序則是由邊界向內側拐入短的子路徑而得。
最優路線需要避免自交,所以經過邊界各點的順序必須和凸包邊界經過邊界各點的順序相同。
對于例1,使用凸核插入法,即初始子路線從城市點集的凸包開始,插入位點選取規則不變,遍歷所有可能的插入順序,可能得到的結果只有4種,如圖2所示。其中路線長度最小為3 106個單位長度,大于最優路線的3 082個單位長度。

圖2 凸核插入法求解例1的所有可能結果
作為近似算法而言,在插入法中加入能夠把握整體形狀的初始子路線可以在插入城市的過程不斷完善細節,往往能得到比不加入初始子路線更優質的路線。但在尋找最優解方面,由于插入法在插入過程中不會改變已插入的城市排列,所以加入的初始子路線首先必須保證其排列與其在最優路線上的排列一致。即使找到凸包這種特殊的初始子路線滿足排列一致的條件,例1也說明了其有可能無法達到最優解。
例1已經指出增加初始子路線的做法會使得最優解被排除在算法的解空間之外,那么,不指定初始子路線,用簡單插入的方式,遍歷所有的城市插入順序,是否必定能得到最優解呢?對于例1,按照插入順序5→10→4→12→11→1→8→6→2→0→9→3→7,可以得到最優解,如圖3所示。

圖3 不指定初始子路線基于簡單插入的例1最優解插入過程
針對對稱的Euclidean TSP,考慮如下猜想。
簡單插入最優性猜想:對于任意TSP,依據簡單選取規則的插入法的所有可能中,必定包括TSP的最優解。
定義1對于任意的TSP,從其最優路線中選擇任一城市a剔除,剩下的城市排列為城市a的插座。
定理1通過將a簡單插入a的插座中得到的必定是最優路線。
證明:用反證法。
若將a簡單插入a的插座中得到的不是最優路線,設a插入的位點為i,最優路線中a的插入位點為j,根據簡單插入的定義,有插入i后的路線長度tour(i)小于插入j后的路線長度tour(j),這與最優路徑長度最短的定義矛盾。證畢。
插座本身可以看作原問題規模減一的TSP,如果插座中的城市排列恰好是這個子問題的最優解,這樣的插座稱為同型插座,其他的不是子問題最優解的則稱為異型插座。城市數量為n的TSP,插座總數為n。
易知,存在異型插座數量為0情形(n個城市的凸包),那么存在同型插座數量為0的情形嗎?
針對對稱的Euclidean TSP,考慮如下猜想。
同型插座猜想:對于任意TSP,必然存在同型插座。
根據定理1,對于任意TSP,其最優解可以由其中一個城市通過簡單插入操作插入到與其對應的插座中得到。而根據同型插座猜想,對于任意TSP,必然存在同型插座,同型插座即為子集的最優解。結合定理1以及同型插座猜想,由數學歸納法即可推出下面的同型插座猜想的推論。
同型插座猜想的推論:對于任意TSP,依據簡單選取規則,必然存在這樣插入過程:插入中每一步的子路線都是當前的TSP最優解。
這樣的插入過程中可以根據子路線中不同城市的數量分為n個階段,每個階段所有子路線的集合稱為該階段的最優插入子集。
圖3中的插入過程就是這一推論的一個例子,在每一步的插入過程中,其插入后形成的路線都是當前已插入城市組成的子問題的最優解。
在1 000×1 000正方形區域內隨機取m個點的坐標數據,這些數據構成了城市規模為m的旅行商問題,用X表示這個旅行商問題的同型插座數量,X是一個隨機變量,它的概率密度記為f(x),其均值為μ,標準差為σ。設X1,X2,…,Xn表示來自f(x)的一列獨立的隨機變量。根據中心極限定理,當n很大時(在實際的抽樣中,一般當樣本容量大于等于30時就可以應用中心極限定理),隨機變量Yn近似地服從正態分布N(nμ,nσ2)。
已知Yn的概率分布模型,可以利用樣本的密度構造似然函數求出μ和σ2的極大似然估計值。Yn的似然函數為:
(1)
對式(1)兩邊取對數:
(2)
對式(2)求偏導:
解得:
考慮一般情況,假設城市個數為n的所有TSP組成一個集合Un,用Cm表示Un中異型插座的數量為m個的所有元素集合,m=0,1,…,n。如果同型插座猜想成立,那么對于任意Un,可知Cn=???紤]三個城市的TSP,其所有排列方式都是等價的,換言之,三個城市的TSP只有一條路線,這條路線即為最佳路線。根據插座理論可知,四個城市的TSP有四個插座,這些插座都是三個城市,又因為三個城市只有一種可能路線(即最佳路線),所以四個插座皆為同型插座。如果同型插座猜想不成立,則存在城市個數為k的TSP不存在同型插座。綜上所述,k應該大于等于5。


表1 插座型號數量分布實驗的數據
從表1同型插座數量頻數分布的實驗數據中可以看出,同型插座為1的情形,在城市數量大于7時開始出現,且不同城市數量的3萬次獨立實驗中出現的頻數均為個位數,計算其平均頻率為0.000 103;同型插座為0的情形,在實驗中沒有出現過一次。這樣的實驗結果有兩種可能:(1) 同型插座猜想成立,任意TSP至少存在一個同型插座;(2) 存在同型插座猜想的反例,即存在同型插座數量為0的TSP,但反例的出現是極小概率的事件,以至于在本次實驗中未出現。
假設同型插座猜想存在反例。根據伯努利大數定律,當n足夠大時,事件A出現的頻率將接近于其發生的概率。比如同型插座數量為1的情形,用頻率估計其概率,概率約為萬分之一。同型插座數量為0的情形,頻率為0,根據假設其概率不為0,那么,其概率必然遠小于萬分之一。