陳施吉,李家啟,王遠謀,李科,孫恩虹
(1. 重慶市氣象服務中心,重慶 401147; 2. 長壽區氣象局,重慶 401220; 3. 江津區氣象局,重慶 402260)
長江,素有“黃金水道”之稱,是橫貫我國東西的水運大動脈。大霧、暴雨、強風等惡劣天氣常對長江水上交通安全及運輸效率產生不利影響,其中又以霧情影響最為嚴重。1990 年代以來,相關領域專家學者針對長江干線的霧情特征開展了大量研究,俞香仁等[1]結合長江沿岸氣象臺站的監測記錄,分析了長江霧的時空分布特征,李子華等[2]利用南方各省的野外探測資料,開展了長江霧情特征分析,結果與前者較為一致。
近年來,針對長江霧情的研究逐漸聚焦在重點航段,如三角洲地區、三峽庫區等。孫錦銓等[3]通過在長江南通航段的江心囤船上建設自動監測站,探討了長三角南通段的江面霧時空氣候特征;周偉燦等[4]和張恩紅等[5]選取長三角地區多個代表站的能見度監測資料,分析了該地區的能見度變化特征;田小毅等[6]對長江江蘇段的江面霧時空特征進行統計分析,提出了“象鼻形”先期振蕩的概念模型。
三峽庫區河段航道屬于山區航道,復雜地形造成了庫區航道多霧的氣候特征,三峽成庫后航道等級提高,庫區航運量不斷增加,霧情對航運的影響愈加明顯[7]。陳乾金等[8]以宜昌站為代表,利用氣象監測資料分析了三峽壩區長江霧的基本特征。虞俊等[9]和黃治勇等[10]選取三峽庫區多個氣象站作為代表站,利用多年歷史資料分析了庫區極端大霧天氣的氣候變化特征;白永清等[11]和王林等[12]進一步利用長江三峽航道沿線的能見度監測儀和人工監測霧情臺站資料,分析了涪陵、萬州、宜昌3組區域的能見度時空分布特征和氣象因子、地理因子對霧情的影響;王中等[13]利用重慶市氣象監測資料,謝斌等[14]和代娟等[15]利用長江重慶航道局監測資料研究了長江航道重慶段的大霧時空分布特征。
受監測頻次和精度限制,以往的研究多是基于逐時、逐日的監測資料開展,鮮有利用分鐘級監測數據的精細化分析。隨著長江上游航運能力的提升,大霧天氣對長江航運及航道維護的影響服務需求愈加精細化。重慶市氣象局自2017年開始對沿線的航道氣象監測站進行升級,時間精度提高到分鐘級,本文即是基于此類監測資料,對長江航道重慶段霧情特征進行分析,研究結果對提升水上交通安全、保障航道高效運行具有重要意義。
研究采用的長江重慶航道沿線26個自動氣象監測站(圖1)2018—2020 年期間的逐5 min 能見度監測數據來源于重慶市氣象信息技術與保障中心,重慶海事管轄水域數據來源于重慶市海事局,長江重慶航道地理位置信息來源于長江航道測量中心。

圖1 長江重慶航道氣象監測站空間分布圖
表1 給出了26 個航道站的長江航道位置信息,可見涪陵及其下游的各海事處轄區內均設有2個及以上的能見度氣象監測站。

表1 長江重慶航道氣象監測站地理位置信息
長江干線重慶段內,不同天氣條件下(如:輕霧、大霧、濃霧天氣[16])采取禁限航措施不同:當能見度不足1 500 m 時,禁止客船下行;當能見度不足1 000 m 時,客船禁止出港和航行,渡船不能開航,其他船舶禁止下行;當能見度不足500 m 時,禁止所有船舶出港和航行[17]。研究不同類型大霧天氣的發生發展過程,對于航運有效管控具有積極意義。
根據不同類型的大霧天氣分別開展時間序列變化特征分析,為了便于后期提取霧情過程的前兆信息,本文定義長江重慶航道的一次輕霧過程為自水平能見度2 000 m 的a 點開始以某種形態降低,于b 點降至1 500 m 以下,而后在c 點開始以某種形態返升至2 000 m 的d 點,大霧、濃霧過程則是自b 點開始分別降至1 000 m、500 m 以下(圖2)。

圖2 (輕/大/濃)霧過程概念圖
2.3.1 數據預處理
為了便于霧情時間序列樣本提取,設置能見度2 000 m為閾值,超過該值的能見度監測值均作2 000 m處理,缺測值以線性插值算法補齊。
根據2.2 節的霧情過程定義,從能見度監測數據集中提取到了11 619個霧情過程樣本。對該樣本集按照3σ原則以時間長度為指標檢測異常樣本,3σ原則是基于概率統計的異常檢測算法,檢測效果具有很好的魯棒性[18]。將超過3σ的樣本均視為異常樣本,作刪除處理。最終得到長江重慶航道2018—2020 年期間的霧情過程樣本共8 784個,其中輕霧過程4 272 個、大霧過程2 600 個、濃霧過程1 912個。
2.3.2 時間序列形態識別
本文在樣本提取過程中發現,不同霧情過程的時間長度差異很大,如2020 年6 月29 日涪陵外坪水域的濃霧過程樣本時長達到24 h 左右,而2020年8月30日凌晨萬州苧溪河附近水域的輕霧過程時長僅10 min。針對樣本之間差異過大的樣本集,直接提取時間序列形態會產生平滑效應,因此本文對樣本集作進一步處理。
(1) K-Means 分類。根據“肘部”觀察法確定分類K值,基于樣本的時間序列長度屬性,利用KMeans算法[19]對霧情過程進行分類。
(2) 等長時序樣本集。對每一個樣本按照該類最大時長,線性插值隨機生成1 000 個時間序列。基于動態時間規整方法(DTW)[20],選擇該樣本的1 000個時間序列中距離最小者作為新樣本,從而得到新的時間長度相等的時間序列樣本集。
(3) 主成分分析。經局部加權回歸散點平滑(LOWESS)技術[21]加工后,對等長時序樣本集進行標準化處理,利用主成分分析法(PCA)提取樣本集的主要形態特征。
2.3.3 算法實現說明
本文通過Python 工具實現數據的分析與處理,涉及到的工具包主要為Sklearn(包括K-Means、PCA)、Tslearn(DTW)。Sklearn(scikit-learn)是基于Python語言的開源機器學習庫,包括分類、回歸、聚類、降維等模塊,K-Means 屬于聚類模塊的常用算法,PCA 則為降維算法中的一員。Tslearn 庫是Python 下專門用于時間序列數據的機器學習工具包,DTW是其中的一個算法,主要通過計算兩個時間序列的相似度實現序列的延展或壓縮。
長江重慶航道地處西南山區,航道呈典型山區河流特征,三峽成庫后,自然航段、回水航段、庫區航段并存,有著水流態勢復雜、局地小氣候明顯的特征。2018—2020 年3 年間重慶境內長江航道的26 個航道站共發生了8 784 次霧情過程,其中輕霧過程占48.6%,大霧過程為29.6%,而濃霧過程僅占總次數的21.8%。
圖3 為長江重慶航道自動氣象站的霧情過程空間分布圖,可見霧情過程隨著航道里程的減小呈現“中-高-低”分布型,其中長壽海事水域上游平均發生330次霧情過程,巴南水域的唐家沱和黃溪溝、朝天門水域的普子巖相對偏多。霧情高發區主要位于涪陵-忠縣航段,平均發生560 次霧情過程,涪陵海事水域尤為顯著,而萬州及下游的水域發生霧的起數最少,平均僅194次。統計各監測站附近水域的霧情過程發生頻次,普遍表現為輕霧最多、大霧次之、濃霧最少,普子巖、蝦子梁兩處水域則是輕霧最多,大霧最少。長江重慶航道沿線霧情發生次數最多的是涪陵海事處管轄水域,蝦子梁、外坪分別發生了679、667 次霧情過程,前者輕霧242 次、大霧209 次、濃霧71 次,居全航道之最,后者輕霧366次、大霧167次、濃霧134次,僅次于蝦子梁水域。

圖3 長江重慶航道氣象監測站霧情發生頻次圖
總體而言,涪陵-忠縣水域霧情高發,長壽及上游水域次之,萬州水域霧情次數較低,這與陳施吉等[22]關于巴南-涪陵一帶氣候危險性最高的研究結論較一致。
3.2.1 月變化
王中等[13]指出長江航道低能見度冬季出現最多,其次是秋、春季,夏季最少。田小毅等[6]的研究認為6 月是長江江蘇段江面霧的峰值之一。代娟等[15]的研究表明長江山區航道有冬少夏多的情況存在。謝斌等[14]認為長江山區航道受航道跨度長、地形復雜等因素影響,不同河段的霧情分布差異較大。
利用2018年1月—2020年12月長江沿線的實況監測資料分析了江面霧的月變化特征(圖4),可見長江重慶航道的霧情主要呈現夏季多、冬季少的分布特征,二者分別占48%、10%,春季約占26%,秋季約占16%;霧過程在1—7 月期間逐漸增多,6月增幅尤為顯著,8月驟降,自9月開始呈逐漸下降趨勢;就不同霧情過程發生頻次來看,全年均呈現輕霧最多、大霧次之、濃霧最少的分布特征。
3.2.2 日變化
霧情過程的發生包括開始、進入、返回、結束4個時間點,統計各時間點占該類霧情過程總數的百分率(圖5),長江重慶段的江面霧具有明顯的日變化特征,霧情過程的開始、進入、返回、結束時間均主要集中在凌晨或早晨,自08 時開始遞減至12時后維持低值水平,20時開始又呈現出返升趨勢。

圖5 長江重慶航道霧情過程的日變化特征 a. 開始時間ta;b. 進入時間tb;c. 返回時間tc;d. 結束時間td。
表2 給出長江重慶航道霧情過程時長。無論是輕霧、大霧過程,或是濃霧過程,大部分的霧情過程時長在1 h內,造成較大概率發生在夜間的霧情過程也主要在夜間結束。8 784 個樣本序列中有約77%的樣本時長處于1 h內,近14%的樣本時長處于1~2 h之間,霧情過程時長超過2 h的樣本數僅占9%。值得注意的是,隨著霧情的加重,霧情過程時間序列長度逐漸增大,輕霧過程超過2 h的樣本僅占輕霧過程樣本數的2%,大霧過程占10%,濃霧過程則增至19%。

表2 長江重慶航道霧情過程時長統計表
3.2.3 低能見度持續時間
當能見度不足1 500 m時,海事管理部門開始采取禁限航措施。因此有必要了解霧情過程“進入-返回”時段內的低能見度維持狀況。表3 統計了長江重慶航道霧情過程的低能見度持續時間,可以看出,低能見度持續時間特征與霧情過程的時長特征較為一致。低能見度持續1 h 以上的霧情過程為濃霧過程最多,共有151 次,為輕霧過程的1.8 倍、大霧過程的4.7 倍。約99%的大霧過程低能見度僅持續不到1 h,而近8%的濃霧過程低能見度持續超過1 h。隨著霧情的加重,持續不足1 h 的霧情過程逐漸減少,輕霧過程占總樣本數的48%,大霧過程降至29%,濃霧過程僅1 761 次,占比跌至20%。

表3 長江重慶航道霧情過程低能見度持續時間統計表
不同的霧情過程樣本,時間長度差異很大,為了更精準地提取時間序列形態特征,研究首先利用K均值算法對時間序列樣本進行分類。通過“手肘法”發現,當K=3 時,誤差平方和SSE 的遞減趨緩。因此,基于時間序列長度屬性將霧情過程樣本集最佳分為3 類:第一類為時長5.6 h 以內的樣本,第二類樣本集的時長不足27 h,即5.6~27 h,第三類則為超過27 h 的樣本,各樣本集的樣本數分別為8 563、202、19個?;贒TW 算法,每個樣本在隨機生成的1 000 個時間序列中選擇距離最小的序列作為新樣本,構建了新的等長時間序列樣本集。對新樣本集進行平滑、標準化處理,利用PCA技術提取到了各樣本集的主要形態特征(圖6)。
圖6a 是第一類樣本集的前三個成分曲線,可見第一成分主要表征的是能見度快速下降,方差貢獻率高達0.61,第二成分則主要體現能見度緩慢下降,方差貢獻0.24,第三成分代表能見度的波動變化信號,當霧情過程時長在5.6 h 內時,波動變化信號很弱。隨著霧情過程時長的增加,但不超過27 h 時(圖6b),霧情過程的能見度快速下降信號迅速變弱,跌至方差貢獻率為0.26 的第二成分。能見度緩慢下降信號增強至第一主成分,方差貢獻為0.46。而能見度的波動變化信號仍然較弱,僅增長了1個百分點的方差貢獻率。當霧情過程時長超過27 h(圖6c)后,能見度的波動變化信號激增,方差貢獻率達到0.14,信號強度較第二類樣本集增強了1倍。伴隨波動變化信號的加強,第一成分、第二成分的方差貢獻率分別下降至0.39、0.24,而兩個成分表征的信號區別主要在于能見度下降后的形態,第一成分為能見度緩慢上升,第二成分為能見度波動上升。值得注意的是,能見度變化的波動信號與“象鼻形”概念模型[6]的先期振蕩信號頗為相似,即“象鼻形”先期振蕩信號隨著霧情過程時長的加大而進一步增強。

圖6 長江重慶航道霧情過程的主要形態特征 a. 第一類樣本集;b. 第二類樣本集;c. 第三類樣本集。圖例中括號內的數值表示成分對應的方差貢獻率,能見度波動為無量綱值。
綜上所述,長江重慶航道霧情過程隨著時間長度的不同,表現出不同的形態特征。當時長在5.6 h內時,主要是能見度快速下降和緩慢下降;不足27 h時,轉為以能見度緩慢下降為主,能見度快速下降次之;當過程時長進一步增加,含“象鼻形”先期振蕩信息的波動信號逐漸加強,能見度下降過程的信號變化也不再那么強烈,反而體現了能見度的回升階段信號,即緩慢上升、波動上升。
本文利用2018—2020 年長江重慶航道沿線26 個自動氣象監測站每5 min 1 次的能見度監測資料,通過定義輕霧、大霧、濃霧三類霧情過程,統計分析了航道能見度的時空變化特征,利用KMeans、DTW、PCA 等機器學習算法提取了航道能見度時間序列的形態特征。
(1) 霧情過程隨著航道里程的減小呈現“中-高-低”分布型,霧情高發區主要位于涪陵-忠縣航段,平均發生560 次霧情過程,涪陵海事水域尤為顯著,長壽及上游水域次之,而萬州及下游的水域發生霧的起數最少,平均僅194次。
(2) 長江重慶航道的霧情過程在6—7 月有1個波峰,即1—7 月逐漸增多,6 月增幅尤為顯著,8月驟降,自9 月開始呈逐月下降趨勢,主要表現為夏季多、冬季少的特征。無論輕霧、大霧、濃霧過程,大部分霧情過程時長均在1 h 內,造成較大概率發生在夜間的霧情過程也主要在夜間結束。
(3) 長江重慶航道霧情過程隨著時間長度的不同,表現出不同的形態特征。當時長在5.6 h 內時,主要是能見度快速下降和緩慢下降;不足27 h時,轉為以能見度緩慢下降為主,能見度快速下降次之;當過程時長進一步增加,能見度下降過程的信號變化也不再那么強烈,反而是主要體現了能見度的回升階段信號,即為緩慢上升、波動上升。值得注意的是,“象鼻形”先期振蕩信號隨著霧情過程時長的加大而進一步增強。
(4) 霧情對航運影響嚴重,而重慶霧日較多[23],因此建立長江重慶航道霧情監測預警模型尤為重要。本文提取到霧情過程時序形態的前兆信號,可進一步利用機器學習算法進行識別建模,與王遠謀等[24]利用航道影像資料建立的霧圖像識別模型耦合,有望基本實現重慶航道能見度的多源資料融合,提升航道霧情過程監測預警能力。