杜 翠,劉 杰,程遠水
(中國鐵道科學研究院集團有限公司 鐵道建筑研究所, 北京 100081)
21世紀以來,鐵路建設正從信息化、數字化走向智能化。隧道、路基等鐵路基礎設施的智能診斷,是智能建造技術的重要組成,為工程質量驗收提供重要的技術支撐[1-2]。
探地雷達(GPR,Ground Penetrating Radar)無損檢測技術是高速鐵路路基、隧道襯砌質量檢測的主要手段[3-6]。但在實際應用中,地質雷達數據處理還面臨兩個典型問題:(1)數據處理周期長,檢測結果時效性差;(2)人工解釋雷達圖像及多解性引起的誤判。因此,針對探地雷達數據處理存在的問題,對檢測數據快速處理的關鍵技術進行攻關,實現路基、隧道等鐵路基礎設施的智能診斷,對推動鐵路智能制造技術的發展具有重要的現實意義。
通過研究和開發鐵路GPR檢測數據智能管理分析系統,可為鐵路路基、隧道檢測工程提供項目管理、數據管理、快速處理、輔助解釋和統計分析服務,提升目前的數據管理和數據處理解釋的自動化、智能化水平,為路基、隧道等鐵路基礎設施的智能診斷提供重要的技術支撐。
GPR數據處理是一個復雜的過程[7],不同的探測介質采用的處理流程會有一定的差異,典型的GPR數據處理流程,如圖1所示。外業進行數據采集后,內業需根據現場打標記錄、橋隧涵設備表等信息,進行里程校正、試處理、信號處理、圖像解釋、統計分析以及檢測報告編制等一系列工作。
GPR檢測采集的數據量非常龐大。路基普查約5 GB/100 km,隧道約1.2 GB/ km,與具體的測線數量和采集參數有關。

圖 1 典型的GPR數據處理流程
目前,數據處理通常采用的是雷達設備廠商提供的配套軟件。根據目前軟件存在的問題,總結鐵路GPR檢測數據智能管理分析系統的需求,主要包括4個方面。
(1)建立數據管理機制和管理平臺
數據通過拷貝等形式流轉,硬盤存儲,效率低風險大,不利于查找和再利用,也給軟件部分自動化功能的實現帶來難度。
(2)增加目前軟件缺失的功能
目前,軟件欠缺里程校正、數據統計、報告輔助生成等功能,且開發商通常不提供定制版本,也不提供二次開發接口,無法對目前軟件進行改進。
(3)良好的人機交互
由于軟件設計理念不同,軟件都是針對一個文件進行精細處理。如果用于大批量文件的應用場景,則存在大量的重復性操作,影響工作效率。
(4)增加輔助解釋功能
通過人工進行圖像解釋,存在效率低、標準不一的問題,使得圖像解釋這一步驟占用了大量的時間,且存在多次反復,增加了數據統計和編制報告的工作量。
鐵路GPR檢測數據智能管理分析系統基于B/S模式,采用分層架構,如圖2所示。表現層展現用戶界面,負責視覺和用戶交互;業務邏輯層實現軟件各類算法;公共組件層為業務邏輯層的各個模塊提供公共服務;數據訪問層用于同數據庫進行交互,對數據的添加、刪除、修改、顯示等,為業務邏輯層或表現層提供數據服務;數據層采用Oracle和HDFS組合的方案。

圖 2 系統架構
根據GPR數據處理流程及系統需求分析,系統功能分為5個模塊,分別為項目管理、數據管理、數據處理、圖像解釋、統計分析。
2.2.1 項目管理
以基礎設施檢測項目為核心,對項目相關的靜態、動態數據進行信息化管理。靜態數據包括基礎設施的設計資料、 施工資料等,動態數據包括GPR原始數據、處理后數據、典型圖像、異常信息等。
此外,為保證數據處理的客觀性,該模塊還設計了任務分配功能,項目管理員將項目涉及的GPR文件匿名分配至處理人員,并可查看數據處理進度。
2.2.2 數據管理
實現雷達原始文件上傳、采集記錄上傳、數據下載等功能。因各類基礎設施檢測涉及到多種雷達品牌和型號,其文件格式各不相同。在此模塊下,原始文件上傳后,在服務器后臺自動完成文件解析過程,將雷達文件轉換為統一格式存儲,文件頭中的屬性信息存入關系型數據庫。
2.2.3 數據處理
實現雷達數據處理的功能,包含里程校正、信號處理和工作流處理3部分。里程校正功能利用采集時的打標記錄,通過回歸計算的方式對累積誤差進行校正。信號處理功能實現了常用的雷達信號處理算法,如背景去噪、增益、濾波等,用于去除干擾信號,提高信噪比。工作流處理功能利用并行計算技術,實現多文件的批量處理,提高處理效率。
2.2.4 圖像解釋
實現GPR圖像解釋的功能,包括AI識別、數據成像、交互解釋3部分。AI識別功能實現對GPR圖像中各類異常的自動識別;交互解釋功能用于人工解釋以及復核AI識別結果是否存在錯判、漏判等,這里也實現了層位追蹤功能,可以瀏覽雷達剖面圖像,修正AI識別層位結果,繪制襯砌層位、道床層位線等。
2.2.5 統計分析
實現GPR解釋結果的統計分析功能,包括自動統計、圖表展示、輔助報告3部分。根據項目需求,實現各類異常的數量、分布、等級等參數的自動統計,以豐富的圖表形式實現結果的可視化,根據指定的格式生成報告,節約數據處理人員的工作量。
目前,雷達軟件通常缺失或只有簡易的批處理功能,交互方式較為復雜,批處理步驟的計算效率很低。如果從算法并行化角度出發,則實現難度和成本較高[7]。為滿足海量的數據處理需求,本研究提出了基于Hadoop大數據技術的并行工作流處理技術。并行工作流處理流程,如圖3所示。

圖 3 并行工作流處理流程
(1)根據GPR檢測數據的特點,選取單個雷達文件進行試處理,設計相適應的標準工作流,包含若干濾波、增益等信號處理算法,采用C++編程實現。
(2)通過自定義Hadoop作業,發起一個處理作業將同時處理多個雷達數據文件,Hadoop MapReduce框架根據需要處理的文件個數,創建相應個數的map作業。一個map作業從分布式文件系統(HDFS)中讀取數據文件,并將文件流傳遞給標準工作流的C++數據計算函數進行處理,在處理完成后,接收處理的結果數據,保存在HDFS中。多個map作業并行的處理多個數據文件,使原本的串行處理過程改造為并行的處理過程,提高了處理效率。由于雷達數據間并無關聯性,無需將處理結果進行合并,所以Hadoop作業可設置為單map作業,忽略reduce過程。
為了更好地配合Hadoop MapReduce并行作業的運行,雷達數據文件將事先導入到Hadoop分布式文件系統中(HDFS),使Hadoop集群中的每個節點均可訪問到需要處理的雷達數據文件。處理后的結果也將保存在HDFS中。
目前,GPR圖像解釋工作是通過數據處理人員進行人工判讀,數據處理人員的技術水平和經驗對解釋結果有很大的影響。由于GPR圖像的各類識別目標的特征均差異很大,判別依據并不十分明確,且判別特征非常抽象,使得提取具有表征性的特征建立特征向量的難度非常大[8-11]。而深度神經網絡技術將特征提取和分類集成到一起,自動提取圖像特征,可克服傳統機器學習方法對特征工程的依賴,更適用于GPR圖像的識別。因此,為了提高GPR圖像解釋的準確度和效率,本研究采用深度神經網絡技術對GPR圖像進行智能識別。基本流程包括如下3個主要步驟,如圖4所示。
(1)建立GPR圖像樣本庫,進行訓練后建立識別模型。
(2)將GPR文件進行圖像分割后,通過調用識別接口,對GPR圖像進行智能識別,獲取的結果為每個識別目標的類別和圖像坐標。
(3)對步驟(2)獲取的結果,通過拼接、去重、定位、統計等手段進行智能修正,最終的識別結果為整個文件的識別目標類型、數量和實際坐標(里程和深度)。

圖 4 GPR圖像智能識別方法
為了測試系統各個功能的實際應用效果,開發完成后利用高鐵隧道襯砌檢測車采集的數據進行系統測試。并行計算硬件配置為CPU:Intel 至強4核處理器;內存:16 G;硬盤:200 G;網絡:千兆網。智能識別采用的顯卡為英偉達TITAN Xp顯卡。
在5節點集群環境下,并行計算測試應用效果,如表1所示。現有軟件無批處理功能,單個文件處理時長約90 s。引入該系統后,50個雷達文件處理時長約90 s,處理效率提升效果十分顯著。

表 1 并行計算測試效果
利用拱頂數據建立訓練樣本集,利用拱腰數據建立測試樣本集,對鋼筋和鋼拱架兩類識別目標進行了訓練和識別測試,取得了良好的效果,識別結果分別見圖5和圖6所示。在智能識別的基礎上,技術人員再進行檢查和修正,比全人工判讀節省大量的時間和精力。

圖 5 鋼筋識別結果

圖6 鋼拱架識別結果
隧道、路基等鐵路基礎設施的智能診斷,為工程質量驗收提供重要的技術支撐。為提升鐵路GPR檢測數據的處理效率和智能化水平,滿足新建線路海量檢測數據快速處理的迫切需求,本文研究設計了鐵路GPR檢測數據智能管理分析系統,通過基于Hadoop大數據框架的并行工作流技術實現批量文件的快速處理,采用深度神經網絡技術實現GPR圖像的輔助解釋,并設計了項目管理、統計分析等模塊減輕處理人員的工作量,可顯著提升GPR檢測數據處理的自動化、智能化水平。