摘 要:結合實際觀測業務值班工作經驗,介紹了縣級觀測業務工作中常見的涉及數據傳輸、數據質量、業務軟件、觀測業務計算機、觀測儀器、供電6個方面的國家級地面氣象觀測站臺站級告警信息種類,詳細分析了各類告警信息產生的原因及其表現,總結了具體的應急處理辦法及注意事項,供基層臺站業務一線人員借鑒,為提高應急處置能力奠定基礎。
關鍵詞:國家級地面氣象觀測站;觀測業務;常見告警信息;處置方法
中圖分類號:P415.1 文獻標志碼:B 文章編號:2095–3305(2024)11–00-03
隨著地面氣象觀測自動化改革從全國試運行切換為正式業務運行,我國地面氣象觀測邁入全面自動化時代。全國國家級地面氣象觀測站由以往的每天值班、守班改為有觀測任務時值班、守班(除長期保留人工觀測任務的臺站),大大減少了一線業務人員的工作量,縣級觀測業務重心向觀測裝備維護維修和現場核查、標?;驒z測、質量管理等轉變[1]。
當前,觀測業務要求臺站業務人員定期檢查業務系統和觀測設備,及時響應數據異?;蛟O備故障等告警信息并按規定處置。當業務系統和觀測設備出現故障時,應盡早確定故障原因,及時排除故障[2];當省信息中心出現無法判斷的疑誤信息、數據顯性錯誤、未知原因數據缺測時,應配合做好數據質控處理和反饋工作[3]。因此,臺站業務一線人員具備告警信息診斷及高效、準確應急處置的能力,對保障地面觀測業務系統穩定運行和氣象觀測數據達到預期質量要求至關重要。
1 告警信息分類及處置原則
1.1 告警信息分類
地面氣象觀測是氣象觀測的重要組成部分,為天氣預報、氣象信息(數據)建設、氣候分析、科學研究和氣象服務提供重要依據。在觀測過程中,常見的告警信息主要分為數據傳輸異常告警、數據質量異常告警、觀測業務軟件運行異常告警、觀測業務計算機故障告警、觀測儀器故障告警、供電故障告警。
1.2 常見告警信息處理原則
1.2.1 時效原則
由于中國氣象局對所有觀測數據上傳的時間有所要求,因此,當臺站出現告警信息時,應在規定時效內進行處置。例如,遇裝備故障時,若臺站在規定時限內無法排除故障或故障級別超出本級職責時,應及時提請市級或省級技術保障部門進行技術指導或現場維修,并配合市級或省級技術保障部門開展維修活動,直至設備恢復運行。
1.2.2 安全原則
自動氣象站的供電單元輸入220V交流電,經過電源轉換模塊轉換為適合的電壓,再輸送至各觀測儀器設備,具有一定的危險性。在排查故障時,維修人員應根據各類設備儀器的工作原理和供電類型進行分析,防止帶電更換故障部件,防止因接線錯誤造成設備損壞,保護工作人員的人身安全[4]。
1.2.3 邏輯判斷原則
當發生告警時,應根據工作原理和故障的外在表現,逐步追蹤查找。一般先從觀測業務軟件開始排查,若軟件無故障,再從硬件進行故障排查。當判斷為硬件出現故障時,根據組成結構和工作原理,按照從采集器到傳感器的基本思路,綜合分析故障原因,并按照先易后難的順序進行故障處理,從而縮短設備維修時間[5]。
2 常見告警信息原因分析及處置
2.1 數據傳輸異常告警原因分析及處置
數據傳輸異常是指網絡傳輸故障或其他軟硬件故障導致的數據內部傳輸故障(觀測場到值班室計算機數據傳輸中斷,導致觀測軟件的數據本地計算機入庫異常)和數據外部傳輸故障(計算機網絡故障,導致臺站數據上傳至省氣象數據中心出現異常)。
(1)數據內部傳輸故障通常是由觀測場至測報值班室業務機通信線路斷路或觀測場綜合集成硬件控制器故障所致,表現為通信參數設置正常情況下ISOS軟件所有觀測數據采集失敗。此時,應對綜合集成硬件控制器、室內外光電轉化模塊、光纖依次進行排查:檢查綜合集成硬件控制器供電是否正常(正常情況下供電指示燈PWR常亮)。若綜合集成硬件控制器運行正常,則檢查室內外光電轉化模塊正常供電下TX燈和Rx燈閃爍是否正常;若燈不亮,可使用測光筆檢測光纖是否完好,若光纖斷路,可啟用備份光纖恢復數據傳輸,及時報告省氣象數據中心并補調入庫數據。
(2)數據外部傳輸故障通常是網絡故障所致,表現為ISOS軟件所有數據采集正常,但向省氣象數據中心傳輸時中斷。先啟動應急傳輸手段(外網或無線網卡撥VPN方式),以保證在考核規定時限內完成觀測數據傳輸。再通知網絡管理人員進行逐項排查:檢查交換機或路由器供電是否正常。若供電正常,查看業務機在交換機或路由器上所對應的端口信號燈是否正常,同時將備用網線接入筆記本電腦測試網絡是否正常,若確定為交換機或路由器故障,則更換相應設備。若確定非電腦端、交換機及路由器故障問題引起的網絡中斷,可電話至各運營商詢問是否存在網絡故障,若各運營商均網絡正常,可利用電腦端cmd命令ping各自對應的網關,若本級網關不通,則逐條排查故障端至運營商路由器間的各條網線;若上級網關不通,則及時向上級反饋問題并協助上級開展故障排查。
2.2 數據質量異常告警原因分析及處置
主要表現為因維護設備、觀測儀器故障或性能下降導致現用站的數據缺測、異常偏大或偏小未能通過質量考核。若出現某個觀測數據異常且無使用價值時,業務人員應按照“地面氣象自動觀測規范 第21章 異常記錄處理原則與方法”予以處理,當氣壓、氣溫、相對濕度、風向、風速、地溫、草溫記錄異常時,正點時次的記錄按照正點前10 min內接近正點的正常記錄、正點后10 min內接近正點的正常記錄、備份站記錄、內插記錄的優先順序進行代替(風向、風速異常時,均不能內插;挑選2 min風或10 min風時,應按照技術規定的要求挑取“有效數據”進行替換;瞬時風向、瞬時風速異常時按缺測處理);若正點數據用正點后10 min數據代替且為極值時,需手動修改該正點的極值,并將出現時間修改成該時次00分。若出現某段時間分鐘數據異常時,除降水外的其他要素的分鐘數據異常均按缺測處理。若全部數據不正常,應及時啟用備份站開展應急觀測。數據處理完畢后應做好異常數據處理備注,并在規定時間內反饋省氣象數據中心無法判斷的疑誤信息。
2.3 觀測業務軟件運行異常原因分析及處置
當前業務規定所有國家級地面氣象觀測站需使用集成版ISOS軟件,該軟件對計算運行環境的要求如下:主頻2.4 GHz及以上,內存8 G及以上,硬盤需160 G
及以上,操作系統需滿足Win7專業版或旗艦版以上正版系統。觀測軟件運行異常通常表現為ISOS軟件在運行過程中出現卡頓死機,嚴重時還會導致ISOS軟件運行錯誤、數據讀取或傳輸異常等情況,原因可能是軟件長時間沒有重啟,導致駐留內存或進程中的程序過多,不能釋放相應內存。若出現這種故障,僅需避開整點重啟計算機即可。此外,軟件運行過程中還可能出現觀測成功率不高的情況,即非連續性的分鐘數據缺測。遇到這種情況,可通過對采集器進行校時解決。在日常工作中,切忌在業務計算機上安裝無用或多余的程序,以防增加業務計算機的負擔,且需要定期重啟計算機,以保證ISOS軟件高效運行。
2.4 觀測業務計算機故障告警原因分析及處置
觀測業務計算機可能因長期不間斷地運行或雷擊、電腦病毒等原因造成故障,針對此類情況,可重啟計算機,嘗試是否恢復正常,并通過BUFR數據補發故障期間未形成、未發送的報文重新生成發送,若期間有數據丟失,可通過ISOS軟件“查詢與處理”→“數據下載”→重新下載相應缺測時段數據進行補發。若重啟計算機未能恢復正常,應立即切換備份機,具體操作流程:確認備份機業務軟件參數和主計算機保持一致→清空上傳目錄文件下的歷史數據→接入現用站數據傳輸網線→啟動ISOS、CTS2客戶端等相關程序→下載切換期間數據進行補發。若主機經短期修復正常,可切換回主機,若不能修復,則備份機可長期替換為主機使用。
2.5 觀測儀器故障告警原因分析及處置
2.5.1 傳感器故障告警
通常傳感器容易受到外部條件干擾,如蟲鼠、惡劣天氣等,主要表現為ISOS軟件單一的氣象要素顯示缺測或極端異常。常見的傳感器故障主要包括電氣故障、傳感器損壞、堵塞或污染等。此時,業務人員應按照上述“2.2觀測數據質量異常告警原因分析及處置”保證數據的可用性和傳輸的及時性,同時通知裝備保障人員啟動維修程序[6]:檢查業務軟件和采集器的相關參數設置是否正確→線纜連接有無脫落或松動→檢查傳感器供電或運行狀態→檢查采集器。
檢查傳感器狀態時需注意:(1)溫度類傳感器(包括氣溫、草溫、地溫)采用四線制,應在斷電情況下用萬用表測量同端電阻R1(電阻值1~8 Ω)及異端電阻R2(電阻值80~120 Ω),利用公式T=(R2-R1-100)/0.385計算出溫度值,并與實際溫度進行比較,若相差較大,則判斷傳感器是否故障。
(2)濕度傳感器的輸出電壓U與濕度RH成線性正比關系(0~1 V對應0~100%),利用公式RH=U×100%算出濕度值,再與實際值進行比較,若相差較大,則判斷傳感器是否故障。
(3)翻斗雨量傳感器需使用萬用表的通斷檔測量傳感器紅、黑接線柱的輸出信號,同時翻轉計數翻斗,每翻一次觀察是否有短路提示音,沒有短路提示音說明干簧管損壞。
(4)光電日照計可利用串口調試助手,向日照傳感器發送READDATA命令,查看日照傳感器有無返回當前分鐘的數據。若返回EXCARD NONE,則說明日照傳感器內部存儲卡故障;若無響應,則說明日照傳感器發生故障[7]。
(5)蒸發傳感器的輸出電流信號值應為4~20 mA,利用公式EC=100×(I-4)/(20-4)計算得出的水位若與軟件顯示值不一致,則說明蒸發傳感器故障。
(6)氣壓傳感器檢查使用串口線直連計算機和氣壓傳感器串口,并給傳感器加電,同時利用計算機端的串口調試助手發送測試命令,若返回值異常,則說明氣壓傳感器故障。
(7)風速傳感器在供電正常且穩定的情況下以D6~
D0的順序測量并記錄格雷碼信號電壓值(4.5~5 V的電信號為高電平,0~0.7 V的電信號為低電平),并查詢此格雷碼所對應的方位,通過與實際方位對比,判斷傳感器是否故障;風向傳感器可使用萬用表頻率檔直接測量風速的輸出頻率,利用風速與頻率線性公式(通常光電式風速傳感器V=0.1 F,霍爾效應風速傳感器V=0.231 5+0.049 5 F)計算出風速值,判斷傳感器是否異常。
(8)能見度傳感器、稱重式降水傳感器檢查時采用計算機直連接傳感器串口,檢查每分鐘的輸出數據內容是否正常且不應該出現亂碼,同時其數值應在量程范圍內。
2.5.2 采集器故障告警
現行業務風向風速、稱重雨量、蒸發、氣壓、能見度傳感器均直接接入主采集器,氣溫、濕度和地溫均經分采集器,通過CAN總線接入主采集器,“三溫三雨”分別經多傳感器標準控制器通過CAN總線接入主采集器。主采集器一旦出現故障,會導致其與各傳感器銜接中斷,數據采集失真,表現為正常供電情況下接入主采器所有數據缺測,ISOS軟件顯示新型自動站采集失敗。此時,應立即啟動備用站采集并上傳數據。同時進行排查維修:檢查主采供電是否正?!鷻z查主采集器的運行指示燈是否閃爍正常→主采集器相應的通道是否損壞→更換主采集器。主采集器故障恢復修復后,應立即切換回主站運行,特別注意切換后的首份正點報文小時極值需在切換前備用站分鐘數據和切換后現用站分鐘數據中挑取,并關注是否影響日極值。
2.5.3 分采集器故障告警
主要表現為正常供電情況下經過分采集器或多傳感器標準控制器的某類氣象數據缺測。此時,業務人員應按照上述“2.2觀測數據質量異常告警原因分析及處置”保證數據的可用性和傳輸的及時性,隨后進入裝備保障維修程序:檢查分采供電是否正?!鷻z查分采或多傳感器標準控制器各指示燈的狀態(CANR指示燈綠色常亮,CANE指示燈紅色不亮)→檢查CAN線是否連接正確(是否出現線路斷路或短路)→測量CAN線上匹配的120 Ω電阻是否正常。
2.6 供電故障告警原因分析及處置
2.6.1 局部(設備)供電故障告警
主要表現為某些設備出現供電異常,影響業務工作。可使用萬用表先進行故障初排,排除跳閘原因造成的局部供電故障。尤其要注意UPS故障導致供電中斷的情況,此時應第一時間跳過UPS采用市電直接供電方式,保證自動站正常運行,隨后開展UPS維修。若無法修復,應及時尋求相關儀器設備廠家的技術支持。
2.6.2 市電供電故障告警
因自然災害或供電線路維修等原因導致市電供電故障時,業務人員應第一時間確保UPS正常運行并聯系供電公司詢問停電大致時間。若時間停電時間較長,則啟動發電機進行應急供電,此時,應優先保證業務計算機、觀測設備和網絡設備等地面觀測業務的穩定運行,其余負載暫時處于關閉狀態,并定時檢查各項發電參數,直至恢復市電供電。
3 結束語
為有效預防日常業務工作中可能發生的各種突發情況、提高業務人員的應急處置能力、保證業務工作正常開展,應結合實際制定觀測系統應急預案,定期模擬數據傳輸異常、人工應急觀測、供電系統故障等場景開展應急演練。每次修復故障后,需觀察設備運行狀況,若設備運行未出現異常,則此次維修完成,由裝備維修人員如實在值班記錄簿填寫維修情況,并在規定時限內在天元系統關閉維修單。維修過程中若更換了備件,在完成維修后應及時將故障件送修。
參考文獻
[1] 聶云,周繼先,秦暢暢,等.地面觀測業務調整給氣象觀測工作帶來的變化[J].貴州氣象,2016,40(1):72-75.
[2] 李青建,羅紅,閔怡.新型自動氣象站異常數據快速診斷及處理方法[J].氣象水文海洋儀器,2016,33(2):117-120.
[3] 麥柳霞,郭亮.MDOS系統臺站疑誤數據處理技術[J].氣象研究與應用,2016,37(S1):116-117.
[4] 閆平,高超越,趙建凱.淺析DZZ4型自動氣象站電源系統常見故障處理[J].內蒙古氣象,2015(1):47-48.
[5] 唐燕,潘來,陳蘊,等.DZZ4型自動氣象站觀測中常見故障診斷方法[J].貴州氣象,2015,39(6):83-87.
[6] 周繼先,聶云,袁慶,等.新型自動氣象站故障判斷及處理辦法[J].中低緯山地氣象,2021,45(3):117-121.
[7] 朱一正,楊嚴意,董猛.DFC3光電式數字日照計故障排查與維護[J].農業與技術,2019,39(7):53-54.