唐錨 尹曉楠 李霞


摘 要:為解決河長制信息系統用戶數量大、應用環境復雜、終端型號多導致的實際業務問題,運用精準定位優化技術、大數據技術、人工智能技術及跨平臺系統集成技術,進行北京河長智慧移動終端應用的設計與開發,實現精準定位、事件智能上報、多平臺交互等功能。實踐表明,北京河長智慧移動終端應用為河長制業務管理工作提供了一種便捷、高效、智能的辦公方式。
關鍵詞:河長制;精準定位;巡河;AI智能交互;數據管理
中圖分類號:TV213.4?? 文獻標志碼:A
doi:10.3969/j.issn.1000-1379.2020.03.033
Application Design and Development of Smart Mobile Terminal of River Chief in Beijing
TANG Mao1, YIN Xiaonan1, LI Xia2
(1.Beijing Water Information Management Center, Beijing 100089, China;
2.Twenty-First Century Aerospace Technology Co., Ltd, Beijing 100096, China)
Abstract:In order to solve the operational problems caused by the large number of users, complex application environment and various models terminal of river chief system, the optimized technique of accurate location, big data and artificial intelligence technology, cross-platform system integration were applied in the application design and development of Beijing river chief smart system. Implemented functions included precise positioning, intelligent event reporting and multi-platform interaction. The practice proves that with the help of this system, the river chief office mode has becomes more convenient, more efficient and more intelligent.
Key words: river chief system; precise positioning; river patrol; artificial intelligence interaction; data management
1 引 言
2016年,中共中央辦公廳、國務院辦公廳提出在全國范圍內全面推行河長制,建立省、市、縣、鄉四級河長體系,分級分段進行河湖管理,各級河長以“保護水資源、防治水污染、改善水環境、修復水生態”為主要任務,構建責任明確、協調有序、監管嚴格、保護有力的河湖管理保護機制[1]。北京市為了進一步推進河長制、湖長制工作,建立市、區、鄉鎮(街道)、村四級河(湖)長管理體系,要求各級河長積極履職,解決河湖管理保護重難點問題,建立定期巡查制度,及時發現并協調解決河湖管理保護存在的問題,實現主要河湖水清、岸綠、安全、宜人[2]。
隨著移動互聯網和IT業的高速發展,移動辦公已經成為繼電腦無紙化辦公、互聯網遠程化辦公之后的新一代辦公模式,可以擺脫空間和時間的束縛,高效迅捷地開展工作。為了給各級河長提供便捷、智能、直觀的業務支撐工具,引入移動通信、人工智能、大數據分析等技術,以移動終端為載體,開發北京河長智慧移動終端應用,實現河長巡河在線記錄、巡河問題及時上報、成員單位聯合處置、河長履職監督考核以及河長工作可視化展示等功能,便于各級河長便捷、高效地開展綜合業務管理[3]。
2 設計要求
2.1 多對象、自適應、跨平臺的要求
北京河長智慧移動終端應用服務對象包括市、區、鄉鎮(街道)、村四級河(湖)長、河長辦工作人員及河湖巡查人員,涉及人員數量大,所使用的終端型號多,需要開發自適應的移動應用,方便用戶自行安裝與使用。同時,北京河長智慧移動終端應用需要與北京市河長制管理系統(PC端)、水利部河長制平臺以及環保、農業等各成員單位的應用系統間實現數據交互、服務調用等[4]。
2.2 數據及時精準、交互易用準確的要求
為解決巡河過程中信息的漏報、重報、誤報等操作導致上報信息歸檔和存儲不全面、不及時等問題,利用移動終端自動定位、便捷拍照、問題及時上報等功能,在巡河過程中自動匹配準確的河湖,并精準記錄巡河的軌跡。為解決基層河長、巡查員在巡河現場編輯文字效率低的問題,引入智能語音交互技術實現語音輸入,并轉換為文字存儲,實現信息推送及反饋,結合知識圖譜提升語意識別準確度,提供語音分析、深度語義理解、知識檢索和答案整合等功能,實現交互式問答,提升系統的易用性和智能性。
2.3 數據融合、可視化展示的要求
圍繞“巡查、受理、管理、監督、考核”等河長制核心業務所產生的數據具備大數據的特征,且時間與空間的關系多樣復雜,數據融合、分析和展示尤為重要。通過對河長制數據融合、河長巡河軌跡特征點抽稀、模型與模型融合以及可視化技術進行研究,建立“人—軌跡—事件—時間”的關聯關系,實現數據多維度互查。通過河長巡河軌跡特征點抽稀,實現巡河軌跡快速存儲和展示,利用空間分析模型結合規則引擎的空間數據挖掘分析單元支撐巡河覆蓋率的高效計算,支撐河長制數據的有效存儲、快速檢索以及河長制日常業務管理。
2.4 云端部署、安全穩定的要求
系統涉及多部門、多用戶、多業務、多數據的統籌協調,對硬件設備、網絡帶寬、使用環境要求高。采用云端部署模式,加強用戶認證、訪問控制、數據災備、安全保密等領域建設,確保平臺安全穩定運行,降低后期運行維護管理難度,并為拓展云計算、大數據分析等新一代信息技術做好對接[5]。
3 總體架構
隨著移動互聯網的不斷發展,智能手機已經成為工作交流和溝通的必要工具,北京河長智慧移動終端系統的開發與應用是“智慧治水、掌上治水”的有效工作方式。遵循國家政務信息化建設統一標準,按照水利部、北京市河長制的業務需求,設計了北京河長智慧移動終端應用建設總體框架,如圖1所示。
3.1 基礎設施與運行環境
北京河長智慧移動終端應用是運行在互聯網環境的應用系統,系統部署在云端,依托于北京市市級政務云平臺所提供的基礎軟硬件、網絡通信和系統運行安全等服務,涉及的基礎設施和運行環境主要包括Weblogic應用服務器、Oracle數據庫、互聯網IP地址租用服務、WAF防護、遠程接入服務、防病毒軟件服務、重要時期安全掃描服務以及操作系統加固服務等。
3.2 數據管理與應用支撐
數據管理是對數據的定義、傳輸、交換、存儲的統一管理,構建包含巡河數據、巡河軌跡數據、巡河問題數據、基礎地圖數據、非結構化數據、元數據等多種數據的數據庫,實現數據的標準化更新、維護和管理服務。應用支撐介于應用層與數據層之間,包括工作流、權限認證、日志操作、中間件、GIS服務等支撐組件。
3.3 應用體系與后臺管理
基于不同用戶層級在業務應用過程中的需求規格,結合軟件功能設計要求,形成北京河長智慧移動終端應用的業務應用體系,包括現在巡河、巡河統計、問題統計、河長名錄、河湖名錄、重點任務、日常監督、動態監測等各類業務應用。北京河長智慧移動終端應用后臺管理是對移動端應用的用戶、權限、版本、數據等進行管理以支撐前臺的業務應用。
3.4 標準與保障體系
標準與保障體系是支撐該系統順利實施、穩定運行的基礎。主要包括數據更新機制、標準規范體系、安全保障體系、運維體系等。北京河長智慧移動終端應用部署在北京市市級政務云平臺上,該平臺已按照等級保護要求,從物理安全、網絡安全、主機安全、虛擬化安全、應用安全、數據安全等6個方面進行了安全技術體系規劃,且所有設備全部冗余,可避免一臺設備宕機造成的單點故障。
4 關鍵技術及功能實現
4.1 精準定位及軌跡優化
巡河定位的精度和巡河軌跡的準確性直接關系到河長制業務考核及工作記錄,需在實現河道巡查和軌跡記錄的基礎上,進一步優化定位及軌跡記錄精度。本系統在抽稀-道格拉斯算法提升定位點精度的基礎上,采用蓄水池采樣算法和滑動窗口相結合的方法進行數據縮減糾偏,隨后通過自定義View,動態地繪制巡河軌跡。
4.1.1 定位點的抽稀-道格拉斯算法
北京河長智慧移動終端應用中的軌跡記錄功能是對抽稀算法的實例化,在應用中選擇了抽稀算法中的抽稀-道格拉斯算法(簡稱D-P算法)。該算法的特點是:給定曲線及閾值后,其抽樣結果是一定的,且該算法具有旋轉和平移不變性。
該算法的基本思路是:選定一定集合的曲線對應的點集后,選中曲線的起始點與終止點,并在兩點之間作一條直線,依次求取兩點間所有點到該直線的距離,找到所有點中距離該直線最遠的點并求取其距離dmax,指定限差D,將限差D與dmax相比,若dmax≥D,則保留該點對應的坐標點的值,且以該點為界限,將曲線分為兩部分,分別對這兩部分運行上述算法,依此循環,直到起點與終點間再無坐標點;若dmax 其具體實現步驟如下: (1)將起始點與終止點通過直線連接,并找出兩點間所有點到該直線的距離,通過比較找出其中距離該直線最遠的點,通過該點到直線的距離dmax與指定閾值D的比較,將大于閾值D的點保留,記錄其坐標點,并以該點為分界線,將曲線劃分為兩部分。 (2)將步驟(1)得到的兩部分曲線重復步驟(1)的操作,直到找到兩邊的最大閾值點。 (3)重復前面兩步操作,直到分出來的曲線內部再也找不到對應的dmax,此時按照順序,將這些點連接起來,得到抽稀以后的曲線,該曲線比圓更平滑更簡化。 4.1.2 數據縮減糾偏算法 北京河長智慧移動終端應用中的軌跡糾偏采用了蓄水池采樣算法與滑動窗口算法相結合的方法,高效地判斷當前點是否可以加入到擬合軌跡中,通過預測目標運動找出偏離軌跡較大的點,并盡可能多地將軌跡點擬合到軌跡中去[7]。 (1)蓄水池采樣算法該算法在非確定長度的數的集合中隨機取樣,保證取樣的概率相同。算法說明如下: 當m=1時,由于集合中只有一個,其取到概率為 P(A1)=1(1) 當m=k時,集合中有k個值,其隨機抽取到Ax的概率為 P(Ax)=1/k(2) 當m=k+1時,在k+1個數中取到Ak+1的概率為 P(Ak+1)=1/(k+1)(3) 所以取到Ax的概率為 P(Ax)=(1/k)k/(k+1)=1/(k+1)(4) 由于該算法只能用于隨機取樣,并未考慮到時間和空間等因素,因此需要與滑動窗口算法相結合來達到糾偏的目的。 (2)滑動窗口算法。算法說明如下:在一條軌跡曲線對應的坐標點的集合{P0,P1,P2,…,Pn,…,Ps}中,選定第一個點為起始點,記為P0,向右開始滑動窗口,依次加入坐標點,每加入一個坐標點Pn,就比較Pn-1和Pn間的距離和閾值,若距離小于閾值,則繼續向右滑動,并將Pn-1對應的坐標點從軌跡中舍去;若距離大于閾值,則消除Pn-1后,以Pn為新起點開始向右滑動窗口,重復前面步驟,直到滑動到Ps,若滑動過程中得到的大于閾值的軌跡點為Pi、Pm、Pn,則最終選取的近似軌跡點的集合為{P0,Pi,Pm,Pn,Ps}[7]。 4.1.3 自定義運動軌跡繪制 根據高德地圖提供繪制軌跡的API,在地圖上覆蓋一個自定義的View。由于地圖API提供經緯度轉換成移動終端的坐標,因此可以用地圖上點對應的屏幕位置,也就自然可以自定義一個View動態的繪制軌跡,當自定義View的動畫結束之后,隱藏自定義View然后在地圖上繪制軌跡。 在實現定位精度及巡河軌跡繪制優化后(巡河軌跡優化前后對比見圖2),系統對河長巡河軌跡的記錄已達到業務精度要求,能夠準確記錄河長的巡河行為,并以此作為數據基礎,對河長的日常工作進行考核,系統數據符合業務考核要求。 圖2 巡河軌跡優化前后對比 4.2 AI智能交互技術 為解決基層河長、巡查員在現場巡河過程中文字編輯效率低、人為問題分類標準不一致等問題,系統采用自然語言提取技術,將語音輸入的問題或舉報信息轉換為文字,并基于智能語料識別分析技術,實現語音交互和業務問題智能分類[8]。 4.2.1 語音識別技術 北京河長智慧移動終端應用采用的語音識別核心技術是統計模式識別。首先從輸入信號中提取特征,供聲學模型處理,在處理過程中,采用信號處理技術,盡可能降低環境噪聲、信道、說話人等因素對特征造成的影響。然后根據聲學模型尋找相關的語言模型及語料庫,語言模型尋找能夠以最大概率的詞串輸出。語音識別結果的準確率與語言學模型及語料庫的完善有直接關系。 4.2.2 業務語料庫更新及完善 智能語音交互在河長制中的應用屬于水務行業的首例中文應用,由于“河長制”業務相關的詞匯大多數屬于新詞匯,從語言學到計算機應用,在這方面的儲備都比較少,因此更新和完善基于北京市河流、湖泊等地理要素以及“河長制”業務范疇的詞匯語料庫是模塊開發的基礎。 語料庫通過對政府網站、新聞媒體網站以及行業相關方案文檔等進行信息抓取,選取20多萬篇文章作為河長制領域的基本語料庫,并在基本分詞詞典中加入北京地區河流、湖泊及水行業專屬詞匯1萬多個,完成基礎語料庫的初始化建設。 4.2.3 基于n-gram和詞向量匹配的智能糾錯算法 首先,基于n-gram檢測錯誤詞語。n-gram的思路為:假設一個字或詞的出現僅與前n個詞相關(n為人為給定),句子整體的概率等于所有詞語搭配概率的乘積。常用的有2-gram(bi-gram)和3-gram(Tri-gram),詞語概率的計算方法用到概率論中的條件概率,此外用頻數計算頻率代替概率。北京河長智慧移動終端應用的智能糾錯是通過計算一個詞語的n-gram分數來評估這個詞語是否合理,以此檢測錯誤詞語[9]。 在檢測出錯誤詞語之后,采用詞向量匹配的方法進行糾正詞替換。詞向量匹配的思路為:已知兩個向量的余弦值在[-1,1]區間內,兩個完全相同的向量余弦值為1,兩個相互垂直的向量之間余弦值為0,兩個方向完全相反的向量余弦值為-1,即相關性和余弦值大小成正比,我們可以計算兩個詞向量的余弦相似度,對前期語音識別輸出進行詞向量運算。例如:“坡岸有垃圾”,在專屬語料庫訓練的詞向量結果里“坡岸”和“垃圾”詞匯是接近的,而“破案”和“垃圾”的距離較遠,屬于邊緣詞匯,此時認為“破案”在此處出現是不恰當的。 將AI智能交互技術應用于北京河長智慧移動終端應用,實現河長巡河過程中的智能語音交互服務,方便河長(巡河員)通過移動終端以語音方式記錄巡河過程,并對巡河事件進行智能分類處置,提高河長戶外工作的便捷性和準確性。 4.3 綜合數據管理與交換 4.3.1 河長制多元數據存儲、更新與備份 基于成熟的Oracle高可用性架構技術(MAA,Maximum Availability Architecture),構建內網河長制基礎數據與互聯網河長制業務數據的獨立存儲、更新與備份[10]。 基于Oracle GoldenGate實現數據同步/異地備份,對水務綜合庫中的河長制基礎數據(空間數據、屬性數據)進行備份,并備份河長制基礎數據至交換平臺,從交換平臺將河長制基礎數據共享給互聯網,保證河長制基礎數據的安全及有效[11]。 采用Oracle MAA容災模式,即部署備用系統+數據復制,將應用(北京河長智慧移動終端應用、微信公眾號)與數據庫依據自身特點分別進行備份處置。 4.3.2 河長制基礎數據共享 采用基于Web Service的Web共享服務方式提供可信消息服務的調用接口,通過建立規范的數據接口標準和交換協議標準,以北京河長智慧移動終端應用為數據采集源,實現巡河軌跡、事件信息、河長更新信息等數據的采集,并在服務器端實現數據匯聚,為大數據分析及業務展示系統提供下行數據支撐[12]。 北京河長智慧移動終端應用設計過程中,通過建立標準化接口及數據通信規范,實現與河長制大數據分析及展示平臺、數據采集平臺、水利部河長制信息平臺、區級河長制平臺等業務平臺的數據對接和交互,為河長制業務的深入分析和業務挖掘提供核心數據保障。 5 系統應用效果 經過一年多的運行,北京河長智慧移動終端應用運行情況穩定,性能達到河長制信息化管理規定的技術指標,并在全市包括市級河長辦、16個區河長辦進行推廣應用,應用效果如下。 5.1 四級河長全覆蓋,系統推廣率高 以移動終端為載體的北京河長智慧移動終端應用,包括移動巡河、問題處置、河長名錄、河湖名錄、日常監督、動態監測及重點任務等功能,能夠滿足市、區、鄉鎮(街道)、村四級河長的移動辦公需求。目前,北京河長智慧移動終端應用用戶已達到1.2萬人左右,用戶覆蓋市、區、鄉鎮(街道)、村四級河長和第三方巡查人員,每天在線人數約2 500人,最大并發用戶達到500人。通過多次深入區和鄉(鎮)的使用培訓,基層用戶已熟練掌握系統的使用方法,并在實際業務管理中投入使用,截至目前,基于北京河長智慧移動終端應用開展的總巡河里程超過120萬km,巡河人次超過35萬,上報問題超過2 000件。 5.2 多元數據整合,助力實時監管 在北京河長智慧移動終端應用建設過程中,按照水利部、北京市水務局相關信息標準規范要求,制定河長制數據加工規范、信息分類與編碼規范、數據庫表建設規范,建立動態更新機制,暢通與環保局等成員單位的信息共享通道,集成水質監測信息、重點任務、河湖巡查等信息,實現實時監管。 5.3 河道巡查常態化,支撐河長高效履職 通過北京河長智慧移動終端應用的建設,將河道巡查、事件處置、污染源的管理落實到責任人,河長對所轄河道進行常態化巡查,發現問題后通過文字、照片、視頻、語音等方式反饋,實現巡查時間記錄、巡查路徑自動記錄、巡查事件上報、巡查統計、巡查情況分析等功能,支撐河道巡查工作日常管理,全面實現“工作留痕,有理有據”,把長效治水的監督管理工作落到實處,為落實河長工作的目標管理、任務督辦提供抓手。 5.4 強化考核問責,提升監督力度 北京河長智慧移動終端應用針對河長履職情況、事件處置與反饋及時性、問題治理成效、巡查里程等量化指標,按照行政區劃、河流河段等多種維度快速統計,實時公示各級河長、各相關部門的考核情況,為考核管理提供支撐,實現事件類型、處置效率、外部評價等多維度動態監督考核。考核數據在北京河長智慧移動終端應用中自動、實時獲取,不受人工干預,能夠確保考核數據的真實有效、客觀公正,減少“懶政”“怠政”現象,提升監督力度,推動河長制工作實現機制化和規范化管理。 5.5 基層治水智能化,推進治水常態長效化 北京河長智慧移動終端應用依托3S(GIS、GPS、RS)技術、移動互聯網、大數據、云計算、人工智能等多項信息化技術,將現有基礎數據、監測數據和現場圖片有效整合,實現巡河電子化、數據實時化、管理無紙化、考核自動化,有力地推動基層治水從“被動”轉向“主動”,從“突擊”轉向“長效”,為推進城市治理體系和治理能力現代化提供了新借鑒。 6 結 語 以支撐河長制業務管理為出發點,以實現精細化、智能化為技術切入點,采用精準定位與軌跡優化、AI智能交互、綜合數據管理與交互等關鍵技術,建設并推廣集移動巡河、問題上報、考核管理于一體的北京河長智慧移動終端應用,并基于大數據分析獲取巡河覆蓋率、事件處置率等考核指標,有效保障河長制考核評價工作的準確性,為河湖長制對河湖的日常管理提供科學便捷的管理手段,初步實現“明河長、抓問題、量考核、推服務”的河長制信息化工作目標。 大數據時代的信息化建設以數據為核心,由黨政一把手負責的河長制是進行水利內部數據整合及橫向部門相關數據獲取的一個重要契機。理論上,通過應用系統全面收集內外部數據資源,能夠進行河長制大數據的深度挖掘,但在實際應用過程中,系統對于信息資源的利用依舊處于低效的狀態。現有系統能夠實現的目標僅僅是河道日常數據監測、日常業務管理過程記錄、數據的報表匯總等功能,對于數據的深度挖掘依舊處于較弱的階段。 隨著河長制工作的深入推進,對配套技術的要求會越來越高,建議下一步繼續積累實際業務數據,開展大數據分析,提升有效信息獲取能力。同時結合新一代人工智能發展及持續累積的學習樣本數據,進一步優化擴充智能語音語料庫,提升智能交互的準確性,并將智能交互的服務模式推廣至河長制公眾服務,全面實現北京市河長制管理的智能化、便捷化、高效化,推動水務信息化技術的更快進步與長足發展。 參考文獻: [1] 陳雷.落實綠色發展理念 全面推行河長制河湖管理模式[J].水利發展研究,2016,16(12):1-3. [2] 韓中華.北京市全面推進河長制工作特點及建議[J].北京水務,2018(3):49-49. [3] 王戰友.基于互聯網思維的河長制信息化建設[J].水利信息化,2018(4):68-72. [4] 王妍,楊樸.北京市河長制信息系統設計與研發[J].水利信息化,2018(18):46-49. [5] 吳文會,李冰.基于云服務的河湖長制綜合信息管理平臺設計[J].測繪工程,2019,28(3):41-45. [6] 袁方.基于偽距差分GPS的行車軌跡線形擬合算法[J].中國水運(下半月),2015,15(9):143-144. [7] 王考杰,鄭雪峰,宋一丁,等.基于局部聚類的軌跡數據流偏倚采樣[J].計算機科學,2011,38(5):135-137. [8] 陳鵬,周辰光.人工智能技術在河長制管理中的應用[J].水利信息化,2018(3):58-60. [9] 張劍,屈丹,李真.基于詞向量特征的循環神經網絡語言模型[J].模式識別與人工智能,2015,28(4):299-305. [10] 潘偉.基于Oracle 10g數據庫系統高可用性框架研究與設計[D].大連:大連海事大學,2010:32-35. [11] 曲波,鄧旭東,姜鋒. OracleGoldenGate數據同步機制研究與應用[J].微型電腦應用,2014(6):55-58. [12] 楊郡,尹曉楠.北京河長制管理中的水普成果運用[J].中國水利,2018(22):38-40,20. 【責任編輯 張 帥】 收稿日期:2019-07-02 作者簡介:唐錨(1964—),男,河北秦皇島人,高級工程師,主要從事水務信息化相關工作 通信作者:李霞(1979—),女,山東青島人,高級工程師,主要從事水務遙感監測及信息化等方面的研究與應用工作 E-mail:lixia@21at.com.cn