季 偉,吳建靈,吳建友,潘科宇,葉吉超
(1.浙江省麗水市正陽電力建設有限公司 技術部,浙江 麗水 323020;2.國家電網麗水供電公司 技術部,浙江 麗水 323020)
近年來,利用無人機巡檢作業保證了高空復雜環境下的電力安全,國家電網公司已將無人機巡檢納入輸電線路精益化考核指標中。航線規劃[1]作為無人機電力巡檢的基礎和前提,其目的是根據無人機巡檢任務搜索最優路徑。與其它應用領域不同,無人機電力巡檢的航線規劃在對電力設備位置檢查的同時,還需考慮高空復雜環境下的干擾因素,現有通過位置制定航線的方法[2]忽略了環境信息的動態變化,使規劃效率較低、航線導航不準,難以解決巡檢精準性問題。動態環境下的航線規劃主要提供了概率路標圖[3](PRM)、擴展隨機樹[4](RRT)、粒子群優化[5](PSO)、Voronoi圖[6]、智能學習方法[7,8]等方法,但這些方法應用于電力巡檢的動態規劃需要沿特定電力纜線排查和精細化設備巡檢執行,其檢測區域不同于平面搜索區域,因此較難適用于電力巡檢的軌跡策略。
針對電力巡檢的軌跡規劃問題,文獻[9]構建了一種用于無人機巡檢航線規劃的智能桿塔連通圖,為智能規劃提供數據支持;文獻[10]利用規劃區域內電力線走廊激光點云數據確定航跡位置點,實現巡檢過程中對障礙物的規避;文獻[11]研究了一種最小時間搜索的目標監測方法,應用于高空電力電纜的監測;文獻[12]在研究改進RRT算法的基礎上,提出一種在電力輸電線路中適用于無人機的路徑規劃算法。但以上方法在實時規劃線路上無法描述無人機感知器采集的信息,缺乏在線軌跡位置節點的語義擴展,不能反映在線環境信息,影響最佳飛行軌跡和巡檢位置。
綜上所述,從信息處理角度,提出一種面向無人機電力巡檢航線規劃的語義軌跡模式,目的是構建具有環境感知、航跡構造和語義策略圖模型的語義服務應用,在netlogo[13,14]仿真平臺上驗證所提方法的有效性。
(1)無人機屬性及飛行參數
無人機在一定巡檢區域W×L內飛行,不僅需要對巡檢對象上升下降巡檢,還需要對前后線纜的實時檢測,同時受到包括環境障礙、碰撞規避、電磁干擾等干擾因素的約束影響。設系統為基于四旋翼的單體無人機,每臺無人機都架構了相同的傳感器和觀測系統,采用文獻[15]的方法計算飛行參數,通過加速器直接測量機體坐標下的水平移動速度為VU,最大偏角度為ω,有效探測距離為L,考慮無人機動態飛行時的角度和半徑。
(2)巡檢任務描述
無人機以VU的速度在巡檢區域的水平和豎直方向飛行,如圖1所示,所有的目標對象信息分布于未知環境區域中,設有NI個干擾因素(用圓形表示),巡檢任務是對所在區域目標對象進行巡檢,覆蓋所有電力對象及對象附屬實體。

圖1 電力巡檢環境區域描述
航跡的語義服務是被賦予了語義信息的軌跡結構,當無人機在空間位置進行巡檢定位時,形成了大量的關于巡檢位置的空間序列,由Stop序列集和Move序列集組成[16]。其中,Stop序列集表示為Stop_sq={Ωk,Ti,Ti+n}, 它是航跡巡檢停留節點集合,Ωk表示第Ti至Ti+n時刻巡檢的區域;而Move序列集Move_sq表示為連接兩個Stop位置點之間的最大子軌跡。由于感知到具體實體對象時,需要根據環境感知推理的數據交換格式,在Stop序列集和Move序列集形成航跡可重構的特征點,以保證規劃的精準性。其實時航跡特征點表示為
S={si|si∈λ∩?Stopi(i∈[1,n])∩
(Stopi="tower"∩DStopi>d∩DθStopi>ω)}
(1)
式中:ω為偏角度,d為位置偏移距離閾值,對于航跡λ中任意采樣點Stopi, 記DStopi為Stopi的位置偏移距離,DθStopi為Stopi的角度偏移距離。當采樣點位置語義標簽Stopi.label="tower"或DStopi>d或DθStopi>ω, 則Stopi定義為一個特征點si。
針對高空巡檢動態環境下航線管控的背景特征和信息的不確定性質,將巡檢航線規劃框架分為環境感知模塊、語義策略圖模型和航跡構造模塊。
(1)環境感知模塊用于計算事件概率,根據語義模型觸發航跡位置的語義空間計算為目標線路選擇提供空間搜索方式,其功能主要包括特征點提取、區域劃分和感知推理。特征點提取用于對大量航跡數據的位置點進行語義信息提取,形成Stop序列集和Move序列集;區域劃分用于劃分當前區域環境,形式化表示干擾因素區域劃分、對象實體劃分以及巡檢關聯比重計算;感知推理通過Jena[17]推理控件的數據交換格式,用于為無人機提供航跡變化所做出的位置、姿態和引擎等狀態的服務,提供生成基于位置的語義連接,使特征點序列集加載了語義標簽,包括基于Jena的數據交換和位置連接;
(2)語義策略圖模型為基于OWL[18]的知識庫,其用途為存儲語義地圖、環境及無人機系統狀態,主要由規則推理、行為更新、功能維護等組成,主要包括環境態勢庫、行為控制庫、歷史航線庫;
(3)航跡構造模塊用于為無人機巡檢航線提供路線搜索和選擇機制,主要包括語義空間距離計算和強化學習的路徑選擇機制,使學習到的知識遷移至新的相似歷史航跡中,并實時更新語義策略圖模型,為航跡的構造提供語義應用服務。圖2顯示了面向巡檢航線規劃的語義服務框架,它是整個系統的底層架構。

圖2 面向電力巡檢的語義服務框架
無人機利用傳感器獲取信息開展巡檢感知任務,進而生成行為規劃以及關于位置的語義連接,并與語義策略知識庫協同為規劃模型,形成語義航跡,提供統一的數據規范。環境感知和航跡構造共同觸發語義航跡模式,根據干擾區域進行語義空間距離計算和最優路徑選擇。可視化界面提供人機交互界面,研判無人機系統狀態和航線規劃;語義策略圖模型作為形式化表示模型,為任務提供所需背景知識,刻畫復雜環境下巡檢航跡位置節點的因果關系,從而實時提供語義模式的航跡規劃服務。
語義策略圖模型O_strategy構建過程為:首先,獲取傳感器中的原始信息,生成行為控制庫、環境態勢庫和歷史航線庫,構建相關的概念、屬性以及實例。如圖3所示,在語義策略知識庫中,態勢環境庫是由無人機傳感器和地面信息系統獲取的環境信息數據,主要針對已構建的電力桿塔、線纜、變壓器、閘閥、高壓螺栓等可視化設備,還包括雨雪風等天氣變化情況,并與空間數據平臺postGIS[19]進行數據接口對接;行為控制庫為無人機系統狀態及其引擎、位置和姿態等行為控制,通過實例獲取系統運行的參數,用擴展Move序列集和Stop序列集的語義信息;歷史航線庫用于存儲或搜索歷史巡檢航線所記錄的關鍵位置節點、障礙物規避位置節點以及航線路徑的方向選擇等歷史線路構建信息。

圖3 語義策略圖模型設計

(2)
然后,在考慮干擾因素基礎上,根據關聯比重對巡檢對象實體進行空間劃分,由式(3)計算得

(3)

區域劃分根據特定的巡檢需求和相關事務的特征位置對整個巡檢區域做了空間劃分,對于航線規劃而言需根據已劃分的區域,按照語義策略圖對路徑及位置進行研判,利用Apache Jena API[17]獲取語義概念、實例,生成可識別的數據交換格式,其代碼片段如下所示。
< PositionControl rdf:ID=“PosControl_1”/>
< tower rdf:ID=“tw_1”>
datatype=float”> electromagnetism=0.75
latitude
PositionControl >
< fil2_1 rdf:ID=“flx”>
has_Value_1>
< coll rdf:ID=“flx”>
has_Value_1>
由代碼片段可知,PosContr_1表示當前無人機位置控制狀態的實例,has_Stop表示Stop序列集中的數據系數,根據序列集的語義推理擴展區域環境的“障礙干擾”概念集。從而確定該Stop位置上是否存在“電磁干擾(electromagnetism)”且電磁干擾系數為0.75時,選擇路徑方向“hasDirection”概念集下的具體經緯度位置;ObjContr_1為巡檢對象可達的實例,flx表示卡爾曼濾波觀測數據,0.67為系統噪聲因素;coll為共位參數,0.54表示位置共位的參數量值,是對巡檢航線的方位控制。
基于上述數據片段,設無人機的位置狀態桿塔數據“tw_1”區域自定義規則connect連接關聯桿塔數據“tow_2”區域,生成事實庫cons_links。
String
rlex=“Constructs{ ?p_1:relates_To:Cryp_tography1}
Where”+”{{:tw_1?p_:tw_2}union{: tower_2?p_: tw_1}}” // 關聯事件存儲器
reo_1=newSails_Repositorys_1(new Query(new Store(),Query.SPARQL,rlex, “ ”))
代碼中,cons_links描述OWL文件轉化單個無人機在某狀態下的關系,通過Jena遍歷結點,可以較好保證語義策略本體的完備性和有效性。
通過對巡檢區域的環境態勢進行語義感知推理后,生成了基于位置的語義連接,使特征點序列集加載了語義標簽,而航跡規劃的語義控制是對巡檢區域內線路進行搜索選擇,并提供連接語義策略知識庫的接口。考慮航跡規劃的最優性和實時性矛盾[20],采用語義空間距離為目標線路選擇提供空間搜索的方式,通引入強化學習[21]的路徑選擇機制提高區域航跡規劃的航線代價值,使語義巡檢航跡達到期望最優。
所提出的語義空間距離是將當前軌跡與語義策略圖O_strategy 進行航線選擇策略的一個計算方法,取決于語義距離和空間距離兩個部分。其中,語義距離是衡量空間位置節點與巡檢目標在語義上的距離。而空間距離是衡量O_strategy中空間頂點vCi與當前巡檢位置節點q的歐式距離。
(1)語義距離。考慮某時刻t巡檢某特征點位置信息q生成的Stop序列集和Move序列集,q的位置信息表示為vq, 可能匹配語義策略圖O_strategy上的多個頂點vCi, 采用與vCi在O_strategy圖上的最近距離來度量vq與vCi之間的語義距離,即為
(4)
其中,disO_strategy(vqi,vCi) 表示頂點vqi與vCi的最短路徑加權距離,如果vqi與vCi不存在路徑或者O_strategy中無q存在,則disO_strategy(vqt,vCi)=∞。
(2)空間距離。其O_strategy中空間頂點vCi與巡檢位置節點q的歐式距離表示為
Span(vqi,vCi)=dis(vqi.Coor,vCi.Coor)
(5)
式中:Coor表示當前位置的坐標值。綜合考慮語義距離和空間距離,使用以下公式對空間頂點進行排序

(6)
其中,α∈[0,1] 為平衡兩種距離的權重參數,可以通過實驗調整。在式(2)、式(3)計算巡檢實體對象關聯比重和區域的基礎上,SemO_stragegy(vqi,v′Ci) 和Span(vqi,v′Ci) 用于對語義距離和空間距離進行特征位置點的k-means聚類[22],從而選擇合適的路徑作為航線規劃的期望網絡集合。
語義空間距離計算為巡檢航線路徑選擇提供了依據,通過路徑選擇多個區域內特征位置節點的聚類,生成了一個與語義策略圖網絡相匹配的期望網絡,為使巡檢航線規劃的信息要素達到最優,引入強化學習方法對航跡的路徑進行選擇,不斷調整規劃航線。采用該方法,可以利用語義空間計算結果提高較優航跡區域的信息要素濃度,降低較差航跡區域的信息要素濃度,有利于擴展巡檢航線的語義搜索空間;另一方面,通過信息要素更新過程中的航跡評價作為獎勵信號,對較優的路徑進行獎勵,提升航線規劃的自適應能力。將期望網絡設為S={S1,S2,…,SN}, 通過輸出Q值波爾茲曼分布指導語義策略網絡O={O1,O2,…,ON}, 以獎勵信號π作為對航跡的評價值,其計算如式(7)所示
(7)
其中,τ為影響因子,QQi為指導網絡Oi行動空間,而期望網絡Si的信息要素均加載了語義標簽用于計算語義距離,根據Si策略和Oi策略的交叉嫡計算信息素濃度系數,提高巡檢的精確性和準確率[23]
(8)
式中:logπAMN(α|S;θ) 用于指導Si,Oi輸出為監督信號,指導當前網絡Si的行為向Oi靠攏,在減少航跡構造過程中信息要素衰減的同時選擇最優路徑。
針對語義空間距離計算和基于強化學習的路徑選擇,為使航跡區域的信息要素濃度達到最優,提出了航線構造方法,具體算法如下所示:
航跡構造算法:
輸入:語義策略圖O_strategy,當前航跡λ及Stop序列集,最大偏角度ω和最大距離偏移閾值d
輸出:結果構造航跡λ*
(1)獲取當前無人機航線λ中位置采樣點并初始化λ*, {}→O_strategy, |λ|→n, {}→λ*;
(2)λ*∪{Stop1}→λ*;
(3)StopiStopi+1→labelMove;//標記第一個采樣點直接作為特征點向量
(4) while i (5) if 滿足式(1)則獲取特征點集合S; (6)S∪{si}→S構造特征點集合; (7) 對于特征點Si利用式(5)計算該位置的語義空間距離,即與語義策略圖O_strategy的空間語義計算; (8) 根據式(7)計算si的航跡評價值; (9) 采用式(8)得出策略回歸值計算信息素濃度稀疏 (10)sisi+1→labelMove用Move序列連接特征點; (11) end if (12)i+1→i (13) end while (14) returnλ* 本文以電力平臺為數據背景,將任務區域設為W×L=1000 km×1000 km,由Voronoi圖分解為600個子區域,每個子區域設有中心位置節點,4臺同構四旋翼無人機飛行速度為每秒40 m,最大的偏角度為65°,觀測距離為60 m,在netlogo平臺上進行仿真實驗驗證所提出方法的有效性,采樣周期為5 s。實驗中對語義策略圖中未出現的實例等不平衡現象,采取拉普拉斯平滑方法進行處理,并重復10次實驗消除誤差影響。 初始階段無人機對區域環境信息未知,1臺無人機從任務初始位置出發,對區域內擬定的13個電力桿塔進行飛行巡檢,如圖4所示,三角形代表當前桿塔,其通過線纜進行連接,陰影部門表示電磁干擾和樹障干擾等因素,共有①至⑥部分。當機載傳感器接收到任務信號時,當前無人機從001號桿塔開始巡檢,不僅規劃桿塔的三維特征點線路,還規劃線纜的巡檢位置。 圖4 基于語義服務的電力巡檢航跡規劃結果 圖4(a)為根據語義策略圖構造的歷史航線數據,其中每條航線均計算了對應航段的語義空間距離和賦予獎勵信號的航跡代價值,為巡檢航跡提供了數據基礎;圖4(b)顯示了在該區域內運用本文方法生成的航跡規劃結果,有效地規避了干擾區域,在飛行航跡規劃和干擾因素之間取得了良好的平衡。 (1)航線代價分析[23] 對于巡檢航線規劃的不斷調整和重構,使無人機局部線路選擇在強化學習過程中不斷迭代更新,采用航跡代價進一步說明本文方法在電力巡檢航線規劃的性能。航跡代價反映了無人機巡檢航跡的優劣程度,由沿航跡飛行代價分量Wf和受到干擾因素代價分量Wm決定,其評價指標如下 (9) 式中:γ∈[0,1] 為代價分量的權重系數,L(Route) 為特征點航跡段的航程,d(Sti,Sti+1) 為采樣特征點集任意兩點的距離,航段 (Sti,Sti+1) 與干擾因素的距離越近則干擾代價越大,航段中受到干擾的部分航程越長。而W本質上反映了無人機沿航線Route飛行時所消耗代價的大小,W越小則航跡性能越優,反之則航跡性能下降。 如圖5所示,通過與概率路標圖(PRM)方法[3]和快速隨機擴展樹(RRT)[4]方法比較,本文方法在每代最優值會出現小幅度的波動,這樣有利于跳出局部最優的情況,在第16次迭代時收斂速度趨于穩定,適應值為0.60左右,這種良好的情況受益于基于強化學習的路徑選擇機制,該方法將航跡評價作為獎勵信號對路徑選擇進行獎勵,采用交叉嫡計算輸出了穩定的監督信號;同時語義空間距離計算為每個特征點位置生成了一個與語義策略圖網絡相匹配的期望網絡,為基于強化學習的路徑選擇提供了有效的信息要素。而PRM方法在第25代時才逐步收斂穩定,收斂速度較慢;RRT方法航線代價值變化雖然與本文方法相近,可以解決巡檢航線規劃的局部優化問題,但隨著迭代次數的增加陷入了不穩定狀態。 圖5 航跡綜合評價曲線 (2)巡檢對象覆蓋率分析[23] 如圖6所示,隨著三維特征采樣點的規模不斷增加,語義規劃方法收斂所需時間也逐步增加,同時,語義規劃方法的覆蓋率也不斷提高,通過比較分析巡檢對象的覆蓋率,當仿真結束時,PRM方法的巡檢覆蓋率為82.5%,RRT方法的巡檢覆蓋率為86.6%,本文方法的覆蓋率達到92.3%,且優于其它方法,這是由于該方法在初始時提取了可重構航跡的特征點,并對巡檢區域進行差異劃分計算關聯比重,體現了語義策略圖模型對無人機巡檢航跡規劃的環境態勢感知優勢,從而提高了電力航線巡檢覆蓋效率。 圖6 巡檢對象覆蓋率比較 結合研究內容研發設計了一個面向航線規劃的語義服務模擬演示系統,在電力巡檢中初步實驗模擬,圖形控制界面如圖7所示。系統采用Visual Studio 2010和3D utility,地理數據源于麗水周邊山區電力路線數字地圖,通過protégé 中OWL SPARQL查詢語言返回所有結果;考慮到安全性所有飛行情景按規定模式執行,實驗環境下添加了干擾區域因素等外部環境狀態。 圖7 面向航跡規劃的語義服務模擬演示系統 由圖7可知,設定起始目標塔桿,無人機逐步檢測當前的語義信息,首先劃分區域獲取特征點,在特征點位置上觸發語義策略圖并計算機語義空間距離,形成一個策略網絡,將可視化特點上的顯示所有位置信息,為高空電力巡線提供了豐富的可視化語義服務。 無人機電力巡檢的航跡規劃很大程度上取決于巡檢對象位置的定位及其特征提取,在此基礎上進一步獲取語義分析的能力,與地面搜索方式的航跡規劃不同,無人機必須在三維空間中進行運行以滿足電力巡檢實體的對象的需求。本文針對巡檢環境要素需求和條件限制,提出了一種語義服務方法使無人機在滿足航向速率和空速的條件下,通過語義策略圖和強化學習方法可以有效判斷飛行特征點及干擾因素,同時語義規劃的航跡代價能夠快速收斂并趨于穩定,巡檢對象覆蓋率達到90%以上,各項性能比其它方法較優。下一步將考慮在時間上減少規劃時間,研究多無人機的方法解決電力巡檢的語義服務問題,以進一步提高巡檢效率和功能穩定性。4 實驗分析
4.1 實驗數據
4.2 航線構造分析

4.3 性能分析



4.4 可視化控制界面

5 結束語