張雨心,左 棟
(自然資源部地圖技術審查中心,北京 100830)
“問題地圖”,即指違反了《地圖管理條例》《公開地圖內容表示若干規定》《公開地圖內容表示補充規定》等法律法規,錯誤表示或表示了不允許表示的內容的地圖。對存在于互聯網上“問題地圖”的監管是國家互聯網地理信息監管工作的主體內容之一[1]。
近年來,傳統的媒體網站和新興的微博、微信等自媒體平臺上使用地圖配合相關新聞的報道呈明顯上升趨勢。據不完全統計,現在互聯網上登載使用地圖圖片的網站已超過3萬家[2]。
目前,我國行業主管部門已經建立了相應的軟件監管平臺,即互聯網地圖監管系統,并已在國家監管主節點和各省、區、市分節點投入使用,每天都有大量的“問題地圖”被系統監測到。
當“問題地圖”被監測到之后,系統會保存出現“問題地圖”的網頁鏈接及“問題地圖”的截圖[3]。但是,僅留存這些信息遠不能適應當今大數據時代多維度、立體式數字信息存儲、分析的發展潮流,既不能通過這些信息對“問題地圖”的發生情況進行多角度分析,更無法完成更深層次的“問題地圖”態勢感知(situation awareness,SA)、預警防控等工作。
綜上,本文通過對當今態勢感知技術的研究,結合互聯網“問題地圖”監管工作的具體特點,設計“問題地圖”模型的格式及“問題地圖”大數據庫規格,并以此為基礎模擬制定幾類“問題地圖”態勢分析模式,對態勢感知模式下的互聯網“問題地圖”監管工作進行探究,以期使國家互聯網地理信息監管的相關工作能夠得到進一步發展。
態勢感知是指在特定的時間和空間下,對環境中各元素或對象的覺察、理解,以及對未來狀態的預測,按照感知的過程可劃分為態勢要素采集、實時態勢理解和未來態勢預測,從數據角度可劃分為數據采集、數據分析、數據預判3個階段[4-5]。
態勢感知嚴格上說并不是一個新名詞。早在20世紀80年代,美國空軍就提出了態勢感知的概念,覆蓋感知(感覺)、理解和預測3個層次。20世紀90年代,態勢感知的概念開始逐漸被接受,并隨著網絡的興起而升級為“網絡態勢感知”,即在大規模網絡環境中對能夠引起網絡態勢發生變化的安全要素進行獲取、理解、顯示及最近發展趨勢的順延性預測,而最終目的是進行決策與行動[6-8]。
如今,態勢感知技術的應用已經不僅僅局限在網絡安全領域,而且逐漸在航天、核反應控制、空中交通監管、臺風預警及醫療應急調度等眾多領域被廣泛研究應用[9-12]。
對應態勢感知的態勢要素采集、實時態勢理解、未來態勢預測3個階段,“問題地圖”監管態勢感知可分別解決“互聯網(地圖表示)正在發生什么,問題地圖為什么發生,將要發生什么”等問題。同時,通過預設的報警邏輯對潛在發生的互聯網“問題地圖”事件風險進行及時預警,有關部門可及時作出相應處理以避免“問題地圖”事件的發生,消除危害國家利益的潛在風險。
因此,將態勢感知的概念引入到“問題地圖”的監管工作中將大大提升國家對互聯網地圖的整體監控水平,使監管工作進入智能化時代,具有十分積極的意義。
開展態勢感知的相關研究離不開對大數據庫的研究,二者有著密不可分的聯系。本文將圍繞建立互聯網“問題地圖”大數據庫及其平臺進行探討。
縱觀態勢感知的概念及各類應用,不難發現整個態勢感知系統的運轉緊密圍繞的核心就是數據,離開了數據,態勢感知的概念將不復存在。更進一步,這里所說的數據應當是大數據。關于大數據,麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征[13]。
大數據的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。近年來,利用大數據技術開展的應用數不勝數,如洛杉磯警察局和加利福尼亞大學合作利用大數據預測犯罪的發生;麻省理工學院利用手機定位數據和交通數據建立城市規劃等[14]。
事實上,開展互聯網地圖監管工作的本質就是對每天出現在互聯網上的海量圖片進行識別、分析、處理的過程。在圖片識別過程中,通過軟件和人工結合的方式篩選出地圖圖片,再篩選出存在各種錯誤的“問題地圖”,這實際上就產生了大量的數據。如果對這些數據進行更深層次有邏輯的加工處理,就形成了“問題地圖”大數據庫。因此,從某種角度上說,對互聯網“問題地圖”的監管工作就是一項數據分析工作,沒有數據,這項工作就沒有存在的意義。另一方面,如果數據分析的過程過于簡單,那么就不能發揮出這些數據的價值,從而進行更深一步的操作,如利用“問題地圖”的發生特點預判下一次“問題地圖”的發生情況,進行有效防治(這實際上就是態勢感知的內涵所在)。因此,要開展互聯網“問題地圖”態勢感知工作,就必須建立經過專業化數據處理的“問題地圖”大數據庫。
在建立“問題地圖”大數據庫之前,“問題地圖”只是一個抽象的概念。對“問題地圖”的記錄通常是通過截圖、網址和一段描述“問題地圖”錯誤情況的文字完成的。用這種方式記錄“問題地圖”是散亂無序、毫無邏輯的,也沒有使用價值。
要想科學管理“問題地圖”相關內容,將散亂、無邏輯的信息有效組織,形成邏輯嚴密的“問題地圖”大數據庫,就必須將“問題地圖”相關內容模型化,使之成為數據庫組成單元,再將這些單元大規模集合,形成具有科學性、邏輯性且具有使用價值的大數據單元集合。因此,建立“問題地圖”大數據庫的首先需要定義“問題地圖”數據模型。
通過對大量“問題地圖”相關內容的分析,可將“問題地圖”模型的相關字段定義為表3內容。

表1 “問題地圖”事件模型字段
需要說明的是,模型的建立是以一個“問題地圖”事件作為最小單元而非“問題地圖”本身。因為一個“問題地圖”事件的發生往往涉及不止一幅“問題地圖”。如某網站刊登的某篇新聞報道里存在“問題地圖”,這是一個“問題地圖”事件,而這篇新聞報道里或許存在N張“問題地圖”,因此,將“問題地圖”事件作為最小單元便于數據管理。
從表1中可以看出,“問題地圖”事件模型的字段設置大體上分為4個部分:字段1—8描述的是基本信息,用于記錄“問題地圖”事件發生的時間、地點、時間關鍵詞、傳播載體等內容,這些是描述一個事件的最基本字段;字段9—13描述的是事件主體單位的相關信息,包括事件主體單位的性質、是否為新聞媒體單位、是否為測繪資質單位等,這些內容能夠直接體現出事件主體單位的關鍵特征;字段13—15描述的是轉載相關信息,用來記錄該事件中所涉“問題地圖”是原創或是轉載;字段16—19描述的則是“問題地圖”本身的相關信息,包括錯誤類型、錯誤關鍵點等內容,需要特別說明的是“成因分析”字段能夠體現出某“問題地圖”產生的原因。
當定義了“問題地圖”數據模型,就可以對每一個“問題地圖”實例進行模型化,這就需要專業的數據庫管理模塊介入其中,并加以一定的用戶使用層面的設計,形成數據庫平臺,最終達到安全、可靠、便捷地存儲互聯網地圖監管過程中所發現的所有“問題地圖”數據模型。
可以說,“問題地圖”大數據庫平臺是開展態勢感知模式下的互聯網“問題地圖”工作的基礎,沒有“問題地圖”大數據庫平臺,后續工作將無法進行。
要開展態勢感知模式下的互聯網“問題地圖”監管工作,需要有專業的態勢感知軟件平臺作為支撐,監管工作應當圍繞平臺有序開展。態勢感知平臺的核心應包含4個部分,即數據庫模塊、態勢分析模塊、感知預警模塊及用戶交互模塊。
“問題地圖”態勢分析模塊是態勢感知平臺的核心模塊之一。基于上文中設計的“問題地圖”模型規格,根據需要設計相應的態勢分析模式,用戶即可通過平臺清楚地看到當前互聯網“問題地圖”反映出的實時狀態。
具體地說,通過對“問題地圖”大數據庫中各條記錄“事件發生時間”字段的提取及處理,即可得到按日、按月、按季度等任意區間的互聯網“問題地圖”發生趨勢;通過對“事件關鍵詞”字段的提取及處理,即可得到當前互聯網“問題地圖”發生的主題熱度情況;通過對“事件傳播載體”字段的提取及處理,即可得知哪種傳播載體是“問題地圖”的最主要傳播途徑。以上是對互聯網“問題地圖”一些基本情況的態勢分析。通過對“事件主體所屬單位”“事件主體單位是否為新聞媒體”等字段的提取和處理,可以對“問題地圖”進行溯源分析,掌握“問題地圖”產生源頭的相關情況。同理,通過對“問題地圖錯誤類型”“問題地圖錯誤關鍵點”等字段的提取和處理,可以清楚知道“問題地圖”最多發的錯誤集中在哪些方面等。
總之“問題地圖”模型的字段設計越細致,大數據庫中存儲的信息維度越豐富,可以得到的態勢分析模式就越多。不過過多的字段設計也會隨之產生過大的數據量和數據冗余,在一定程度上影響分析效率。因此,合理的字段設計及分析模式設計需要工作人員認真考慮。
有“問題地圖”大數據庫和態勢分析的支撐,就可以在其基礎上設計態勢感知模塊,進而實現對互聯網上可能要發生的“問題地圖”事件進行感知和預警。這也是態勢感知模式下互聯網“問題地圖”監管工作要達到的最終目標。
態勢感知、預警機制的設計應當基于前文所述“問題地圖”模型及態勢分析模式的設計情況并結合互聯網地圖監管工作實際工作需要進行。如可以設置預警條件為“當某關鍵詞主題相關‘問題地圖’在某一時間段連續發生次數大于N次”,或者為“同一頁面標題的正文內容中所涉及的‘問題地圖’在某一時間段內被轉載次數大于N次”等。當系統監測到的“問題地圖”事件發生情況滿足此條件時,立即啟動預警機制,提醒工作人員有異常情況發生,并能夠根據系統大數據庫的相關記錄分析出該事件還將有可能持續性地發生在哪些網站、哪些地域、哪些相關主體單位、持續時長等信息,使工作人員能夠及時地、有針對性地開展相關處理工作。同時,系統還將全程記錄此次預警過程及后續事件進展情況,并存入數據庫,為下次預警過程提供大數據支持。
隨著更多預警條件的設置及預警過程的記錄,態勢感知系統會通過持續地學習、訓練,預警將變得更加準確、智能。這也是當今各種智能化軟件系統所通用的設計邏輯[15]。
用戶交互模塊主要用于人與計算機的交互,應主要包括“問題地圖”數據相應的處理操作、對各種態勢分析情況的查詢操作、對態勢感知預警信息的處理操作等部分;此外還應有清晰易讀的信息顯示界面,用于顯示各類人機交互信息,包括各類態勢分析情況及預警情況等。其中,態勢分析情況可以通過趨勢圖、排名圖及地域分布圖、表格等多種形式展示,使用戶對當前的互聯網“問題地圖”發生情況一目了然。這也是當前主流的態勢感知系統較為常見的界面顯示模式。
一套完整的互聯網“問題地圖”態勢感知平臺邏輯體系建立完成之后,即可開展態勢感知模式下的互聯網“問題地圖”監管工作。
本文針對當前互聯網地圖監管系統的弊端,結合近些年來被諸多領域逐漸采用的態勢感知技術,提出了互聯網“問題地圖”監管的態勢感知應用方案。文中論述了將態勢感知技術應用到互聯網地圖監管及建立“問題地圖”大數據庫等相關內容的必要性,并結合實際需要提出了“問題地圖”數據模型詳細規格,對互聯網“問題地圖”態勢感知平臺中的態勢分析模塊與感知預警模塊等作了詳細探討,形成了一套完整的態勢感知平臺邏輯構想,以期能夠提升互聯網“問題地圖”監管的效率和能力,并促進我國對互聯網地理信息監管工作的進一步發展。