周雨萌 初秀民 蔣仲廉* 鐘 誠
(武漢理工大學國家水運安全工程技術研究中心1) 武漢 430063) (武漢理工大學能源與動力工程學院2) 武漢 430063)
內河航標由于航標本身的結構及外界動力作用,會發生位置偏移[1].當位移超過一定的閾值,即視為航標發生了飄失,將會對過往船舶通航帶來極大的安全隱患.呂應龍等[2]提出了助航標志立法的重要性,呼吁國家出臺配套的、專業的、統一的航標管理規定,從立法層面改善航標漂移對航行安全的影響.馮心愷等[3]從航標的硬件出發,分別提出了對航標自身沉石結構和錨鏈系掛方式的改進,一定程度上降低了航標的漂移量.為了研究航標的漂移規律、達到對航標的實時監控,呂永祥[4]初步構建了一套航標遙測遙控系統,林秀明等[5]則對系統進行了升級,并達到了更高的精度和準確度.在大數據背景下,李術元等[6]提出了基于云模型的航標評估體系,為航標可視化評估提供了研究思路.
目前,航標位置數據全部來源于基站接收的航標GPS數據;因此,對航標漂移的研究也只能從航標GPS數據著手.減少GPS數據包含的誤差,是研究航標漂移不可缺少的步驟.近年來,很多學者提出采用差分定位的方法來降低GPS定位誤差;然而,差分定位方法需對GPS接收機進行改裝,具有一定的操作難度.卡爾曼濾波具有無需儲存觀測數據、實時處理快速的優點,在GPS數據處理領域得到了廣泛而深遠的應用.趙琳等[7]利用極大似然準則推導出了精度和穩定性更佳的自適應卡爾曼濾波方法;王虎等[8]通過優化協方差矩陣降低了異常數據對濾波的影響.K-means++聚類算法是K-means聚類算法的一種改進算法,它優化了K-means算法初始隨機點的選擇,降低了偶然因素對聚類結果的影響,更適用于修正航標漂移聚類中心.
文中圍繞長江中游武漢段航標的漂移與水位變化情況,首先根據研究區域的航標分布特點對航標數據進行分塊處理;然后分別使用卡爾曼濾波和K-means++算法對數據進行預處理,減小誤差對航標漂移計算的影響;基于航標的日均位移及日均水位相關性分析,建立了航標漂移與水位的二次擬合模型,經過實際數據驗證,擬合曲線真實可靠.
內河航標往往依橋而布,用以指示船舶在橋區的復雜水文條件下安全通航.長江武漢段因為橋梁眾多,通航環境相對復雜,此現象尤為明顯.長江武漢段歷年最高水位29.73 m,最低水位10.08 m,平均水位為19.01 m.根據歷年航道水位的變化情況,航道部門將長江武漢段的水位期分為枯水期、中水期和洪水期.本文主要關注水位變化較大的中水期、洪水期,即每年的5—8月.
目前,長江武漢段投入使用的航標有39座,其中,分布在橋梁附近的31座(包括軍山大橋).根據跨江大橋的分布,將研究區域劃分為圖1所示的五個子區域,每個子區域內包含5~7個航標不等,研究區域航標約占長江武漢河段布設總數的80%.
GPS的定位精度受諸多因素影響,如:衛星星歷誤差、衛星鐘差、大氣折射誤差和接收機天線相位中心偏差等.長江航道武漢段航標的GPS定位誤差為5~15 m.卡爾曼濾波可以通過測量結果對估計結果進行不斷地修正,從而得到最優的估計,具有可操作性強、效率高等特點,因而常常應用于GPS定位誤差分析與修正研究.
假設航標的動態位置由向量Xk=[xkyk]T表示,xk和yk分別為第k次記錄下的實驗航標的經度和緯度信息,建立航標運動簡易模型為
(1)
式中:取樣時間間隔為Δt=tk+1-tk;在較短的時間內,rk可認為是固定不變的.假設tk時刻的航標動態位置Xk受系統噪聲序列Wk-1驅動,則航標漂移系統狀態方程和觀測方程分別為
Xk=Φk,k-1Xk-1+Γk-1Wk-1
(2)
Zk=HkXk+Vk
(3)
式中:Xk為狀態向量,對Xk的觀測滿足線性關系;Φk,k-1為tk-1時刻至tk時刻的一步轉移陣;Γk-1為系統噪聲驅動陣;Hk為測量陣;Vk和Wk分別為觀測和系統噪聲.
假設實驗觀測周期為T,可得到航標速度模型參數為
參照文獻[9]取連續觀測實驗數據方差為觀測噪聲Vk,則Vk=Std(d)2.
通過上述分析,采用卡爾曼濾波算法處理GPS接收機原始數據,將濾波后的精度控制在可接受的范圍內.
(4)
為驗證算法可靠性,取“武漢長江大橋橋區下水2白浮”(具體位置見圖1標注)2017年5月AIS基站收到的有效位置數據共1 208條進行測試.濾波前后數據分布見圖2,原始數據呈現離散特征,有較多位移異常值存在;濾波處理后,航標位置數據相對集中,反映了實際通航條件下的航標漂移情況.

圖2 卡爾曼濾波前后航標位置數據分布圖(以武漢長江大橋橋區下水#2白浮為例)
在進行內河航標安裝作業時,為提高航標布設的精度,航標船需要獲取前甲板作業點準確的位置信息[10].目前,廣泛采用的定位方式是工作人員經驗結合GPS定位,受外部動力因素作用,該方法很難將航標錨點布設在預定的位置上,必然產生安裝誤差.加上多次的碰撞和航標復位,已知的航標基點往往并不是其實際的聚類中心.為得到內河航標相對準確的聚類中心和漂移距離,需根據濾波后的航標位置數據計算其漂移的聚類中心.
因內河航標的布設基點是已知的,為降低算法計算量,將已知基點應用于航標聚類中心的計算.使用K-means++算法對濾波后的GPS數據采用進行聚類分析,將航標布設基點選取為初始聚類中心,算法流程見圖3.

圖3 K-means++算法流程圖


圖4 濾波前后K-means++聚類中心對比(以武漢長江大橋橋區下水#2白浮為例)
采用卡爾曼濾波預處理前后的航標經緯度數據、K-means++聚類算法計算獲取的聚類中心,計算航標漂移距離并繪制分布直方圖,見圖5.

圖5 航標漂移距離預處理前后直方圖
由圖5可知,經卡爾曼濾波與K-means++聚類分析后獲取的航標漂移量,總體小于原始數據計算結果,且數據相對集中,無異常數據,較好地反映了實際環境條件下航標漂移的基本特征,避免了無效誤報警的出現.
文獻[10]采用卡爾曼濾波與ISODATA結合的算法,開展了關于航標誤報警的研究,通過校正航標位置誤差改善了航標誤報警的情況,減輕了航標維護的壓力.相較之下,本文所采用的卡爾曼濾波和K-means++算法更簡潔可靠,所得結論與其基本一致.
因研究子區域距離相對較近,其水文、氣候條件相似,在五個橋區水域各選取一個航標開展分析研究.因長江武漢河段遠離河口區域,航標僅受下泄徑流作用;水位漲落只影響漂移距離不影響方向,利用式(5)將航標2017年5—8月的經緯度數據轉換成位移數據.
D=R×arccos (siny1siny2+
cosy1cosy2cos (x1-x2))
(5)
式中:R為地球半徑,均值為6 370 km;x1,y1為航標聚類中心的經緯度(rad);x2,y2為航標的瞬時坐標經緯度(rad);經緯度東經為正、西經為負,北緯為正、南緯為負.
圖6為水位與航標漂移絕對位移日均變化圖,由圖6可知,研究區域水位在7月左右達到局部最高值,對應的五個航標漂移距離同樣出現局部峰值;其中,二七長江大橋處的航標(航標2)波動最為劇烈.因其所處漢口水道河道順直、水深及航道條件良好,水位變化對其影響最大.

圖6 水位與航標漂移絕對位移日均變化圖
采用Pearson相關系數R衡量水位xn與航標絕對位移mn之間的具體線性相關程度:
(6)


表1 相關性分析表
由表1可知,航標3、5與水位為切實相關,航標1、2、4為高相關.另有顯著性(雙側)檢驗結果為0.000<0.01,這表明該結果具備了統計學意義上的顯著性水平.因此,航標的漂移與水位的變化有較高的相關性.
建立航標漂移量關于水位的一元線性回歸模型、一元二次回歸模型和一元三次回歸模型為
Mn=a+bxn
(7)

(8)
(9)
式中:Mn為航標日均漂移量,m;xn為日均水位,m;a,a1和a2分別為回歸方程常數;b,b1,b2,b3,b4和b5分別為兩個回歸方程系數.對二者進行一元線性、一元二次和一元三次回歸分析,分析結果見表2,曲線擬合結果見圖7.
R2(擬合優度或稱為回歸分析的決定系數)反映了自變量和因變量形成的散點與回歸曲線的接近程度,其數值介于0~1.以上五個航標三次曲線的最高次項接近為0,二次曲線的擬合度明顯高于線性曲線,說明數組的變化關系更符合二次方程.文中所建的模型具有統計學意義.

表2 航標漂移-水位變化分析結果

圖7 航標漂移與水位擬合關系
航標位置經緯度數據采樣頻率為0.5 h/次,測量水深數據采樣頻率為1 h/次.實驗過程將航標位置數據進行篩選,使航標數據與水位數據采樣頻率一致,數據呈一一對應關系.對上述的5個區域進行回歸模擬,求出的實驗結果見表3.

表3 擬合結果匯總
為驗證模型的準確性,將2017年9月的日均水位數據代入擬合公式,分別求取每個航標的預測漂移量.計算航標預測漂移量與實際漂移量間的均方根誤差(RMSE)結果見表4.
(7)


表4 均方根誤差表
由表4可知,航標漂移預測結果與實際結果的均方根誤差約為0.5 m,二次擬合模型可較好地反映長江武漢段航標的漂移量與水位之間的相關關系.
文中構建了基于卡爾曼濾波和K-means++算法的航標漂移模型,分析了長江中游武漢段航標漂移特性,模型可有效降低航標日常運行、維護和管理中的誤報警率;基于回歸分析方法,探討了航標漂移量與水位之間的相關關系,建立了二次回歸擬合模型;經實際數據驗證,模型預測結果與實際數據吻合較好,誤差約為0.5m,可應用于不同水位條件下的內河航標漂移距離估算.