朱俊豐
重慶鏈圖信息技術有限公司 重慶 400021
按照我國突發事件的分類標準,公共安全風險分為自然災害、事故災難、公共衛生和社會安全四大類,這些公共安全風險的管理,一般是按照行政區劃和行業劃分進行屬地管理的。由于不同行業、不同地區有自己的數據標準或者管理規范,當要進行跨區域、跨部門、跨行業的公共安全風險統一管理時,往往需要將各類型、各區域的公共安全風險進行整合建庫。傳統的整合方式主要采用編碼映射表方式,將來源不同的各類公共安全風險信息進行邏輯上的統一整合,之后在實際使用時,通過建立好的編碼映射表去查找各類風險信息[1]。這種方式公共安全風險信息的管理和更新比較復雜,且沒有形成統一的管理標準,在實際應用中增加了管理復雜性和管理成本。
針對上述問題,一種常用的解決方法是在各類公共安全風險數據采集或者整合建庫的時候,統一通過計算機采用一定的計算規則編制一套唯一編碼,比如采用自然數順序編號或者采用時間序列和多位隨機數組合編號等方式,達到對所有公共安全風險進行唯一編碼標識的目的[2]。但是這種方式僅僅實現了計算機管理上的數字化編碼,除了對公共安全風險進行唯一標識外,不具有其他任何的實際應用意義,同時也沒有充分利用計算機資源進行信息化管理。
GeoHash全球剖分網格算法是由Gustavo Niemeyer發明的一種地理空間編碼方法,通過GeoHash算法,可以將一個經緯度的二維坐標轉化為一個可排序、可比較的字符串編碼。在GeoHash編碼中每個字符代表一個區域,并且前面的字符是后面字符的父區域,以某緯度坐標39.92324為例,采用GeoHash算法進行逼近編碼,將維度區間[-90,90]進行二分為[-90,0]和[0,90],稱為左右區間,可以確定39.92324屬于右區間[0,90],則標記為1,接著將區間[0,90]進行二分為[0,45]和[45,90],可以確定39.92324屬于左區間[0,45],則標記為0,遞歸上述過程39.92324總是屬于某個區間[A,B],隨著每次迭代區間[A,B]不斷縮小,可以產生一個序列為1011 1000 1100 0111 1001的二進制編碼,序列的長度與給定的區間劃分次數有關。
通過對地理空間坐標的GeoHash編碼,可以實現將空間坐標轉換為二進制方式的字符串編碼。可以將空間運算轉換為字符串比對運算,解決海量地理空間數據運算的性能瓶頸問題,有效提升地理信息系統使用效率[3]。目前,以Solr、Lucene等為代表的搜索引擎均采用上述方法和技術路線,實現對地理空間運算和分析的支持。
社會經濟活動中80%的內容均會與地理空間相關,近年來無論是數字城市還是智慧城市建設中,地理信息技術逐漸成為與大數據、云計算、物聯網技術同等重要的現代信息支撐技術。因為大量的社會經濟活動均可與地理空間掛鉤,因此地理信息系統或者地理空間相關應用也成為目前智慧城市建設的基礎工程或重要應用。
任何地理空間對象在幾何空間形態上可分為點、線、面三種形態,根據實際應用需求,可以用一種或多種表達方式。比如建筑物對象,在某些應用中可以用點形態表達,但在某些領域(比如城市規劃、城市建設等應用)還需用面形態表達,再如河流要素,在小比例尺地形圖中一般以線狀形態表達,但在大比例尺地形圖中一般以面形態表達[4]。在公共安全風險管理中,即存在上述情況,以地質災害風險為例,有的風險涉及范圍小,一般以點形態表達其地理空間特征,而有的風險涉及范圍大,則需要以面形態表達其地理空間特征。
如圖1流程圖所示,在公共安全風險編碼中編入的地理空間識別碼,由空間形態識別碼、行政區劃識別碼、GeoHash網格識別碼三部分組成。
圖1 地理空間識別碼編制流程圖
首先根據公共安全風險的地理空間表達形態,編制第一位空間形態識別碼。其中用阿拉伯數字1代表點形態,2代表線形態,3代表面形態。
其次,根據公共安全風險所屬的行政區劃,編制9位行政區劃識別碼。根據行政區劃級別不同,主要包括社區(村)、街道(鄉鎮)、區(縣)、地市州(省)、直轄市、自治區等5個級別,根據全國統一的行政區劃對照表,判斷公共安全風險屬于哪一級和哪一個行政區劃,將該行政區劃代碼作為公共安全風險的行政區劃識別碼。
再者,根據公共安全風險的地理空間位置,計算和編制GeoHash網格識別碼。首先,根據公共安全風險實際應用需求,判斷和確定公共安全風險的空間定位精度,如表1所示,不同空間定位精度對應著不同的GeoHash全球剖分算法層級,根據表中對應的級別,將全球剖分為幾個級別(n為大于1的整數),其中第n級會將全球剖分為4n個標準GeoHash網格。然后結合公共安全風險的地理空間形態,判斷和確定風險的地理空間標識特征坐標,其中點形態,公共安全風險直接取該點經、維度坐標作為其特征坐標;線形態公共安全風險則取該線形態要素的幾何中點經、維度坐標作為其特征坐標;面形態公共安全風險則取該面形態要素的幾何質點經、維度坐標作為其特征坐標。然后,以前文所述GeoHash全球剖分網格算法,將判定的公共安全風險地理空間標識特征坐標按照Morton編碼方式,轉換為二進制的Morton標準編碼,再將二進制GeoHash標準編碼轉換為32位進制的GeoHash網格識別碼。
表1 GeoHash全球剖分級別與地理空間精度對應表
最終將上述空間形態識別碼、行政區劃識別碼和GeoHash網格識別碼三部分組合即形成公共安全風險的地理空間識別碼。通過該編碼,即可獲得不同公共安全風險的形態、行政區劃、空間位置等地理空間特征,并支撐公共安全風險的空間運算和分析。
續表
在地理空間識別碼基礎上,結合公共安全風險的分類屬性和時間屬性,可以組合形成公共安全風險唯一編碼,作為公共安全風險的“身份證號碼”。其中分類屬性編制為公共安全風險的類別識別碼,根據判定的公共安全風險所屬突發事件分類編為5位長度類別識別碼。其中第一位用阿拉伯數字1、2、3、4分別代表自然災害、事故災難、公共衛生、社會安全四種大類,第二、三位用阿拉伯數字代表公共安全風險所屬突發事件分類標準中的小類,第四、五位用兩位阿拉伯數字代表公共安全風險所屬突發事件分類標準中的子類[5]。其次公共安全風險在數據庫中創建存儲的計算機記錄時間作為其時間屬性,編制為“YYYYMMDDHHmmSSXXX”形式的時序標識碼,YYYY代表公歷年份,MM代表公歷月份,DD代表公歷日,HH代表24小時制的時刻值,mm代表分鐘,SS代表秒,XXX則是由計算機自動生成的3位隨機數。如圖2所示,最終將地理空間標識碼、類別標識碼、時序識別碼組合形成公共安全唯一編碼。
圖2 公共安全風險唯一編碼結構示意圖
按照上述方式組合形成的公共安全風險唯一編碼,一是作為公共安全風險信息化管理中的唯一身份編號,可在計算機系統中唯一標識公共安全風險;二是通過對多源、復雜的公共安全風險進行規范、標準的統一編碼,可以為跨區域、跨部門、跨行業的公共安全風險數據整合提供有效的支撐;三是基于該編碼方法所包含的豐富編碼信息,可以按照風險類別、時序和空間距離快速查詢和分析公共安全風險數據,提高公共安全風險的信息化管理。
本文通過對自然災害、事故災難、公共衛生和社會安全四大類公共安全風險特征的分析和歸納,提出了一種基于時間特征、類別特征以及地理空間特征編制形成公共安全風險唯一編碼的方法。通過該方法,可以有效改變以往風險管理工作中分散、單一、間斷和封閉的狀態,在全新的風險唯一編碼支撐下,將不同分類、不同區域、不同時序的風險信息進行有效串聯管理,為公共安全風險的信息化、精細化、透明化管理奠定了基礎。