胡素平 帥向華
1)中國地震局地震預測研究所,北京 100036
2)中國地震臺網中心,北京 1000451
震后快速、動態地獲取準確的災情信息是地震應急工作的關鍵。目前,我國地震災情信息主要有:現場調查、電話上報、短信上報、遙感四種獲取手段,還不能滿足地震應急實際工作需要,亟需研究一些新的方法為地震應急工作的信息源進行補充。通常破壞性地震發生后,部分民眾和媒體作為地震事件的目擊者和直接參與者,對地震事件的把握比較準確,可以向政府提供大量的災情信息。伴隨著互聯網的迅速發展和廣泛普及,尤其在 Web2.0應用模式下,越來越多的人借助于互聯網平臺進行信息的獲取與共享。每當破壞性地震發生,互聯網上都會有大量的地震災情信息進行傳播,這些信息實時更新、不斷累積、類型多樣。就日本大地震來說,網絡媒體就成為本次地震災情信息獲取的一個重要渠道。
基于互聯網的災情獲取方法國內外已有相關研究。美國USGS基于網絡的社區烈度調查系統,通過互聯網平臺,依據修訂的麥氏烈度表不同烈度的判別指標,以電子問卷的形式調查地震有感范圍區網民對地震的感知情況,最后通過匯總和統計,給出以郵政編碼為統計單元的社區烈度結果(李巖峰等,2009)。國內基于網絡的山東地震災情收集分析處理系統,借助網絡資源,把人們對地震的感覺、看到建筑物震害程度、以及地表破壞和生命線破壞現象迅速地收集、處理和分析,快速驗證和修正地震應急指揮技術系統(帥向華等,2009a;2009b)基于地震應急數據庫給出的地震影響和災情評估結果(董翔等,2007)。目前已有的互聯網災情獲取是通過網民上報的方式進行的,信息源得不到保證。本文研究主動地去獲取互聯網上海量的地震災情信息,建立網絡地震災情信息智能處理模型,將互聯網上非結構化的災情信息轉化成結構化的災情信息,并研究地震烈度的判定方法,建立網絡地震災情信息與地震烈度之間的關系,破壞性地震發生之后,可以快速、實時地為地震應急工作提供地震災情信息和地震烈度信息。
地震災害發生后,首先需掌握災害的詳細情況,如地震的基本情況、人員傷亡、生命線工程破壞情況、發生次生災害的情況及災害的分布情況等,為地震應急提供依據。震后來自災區的災情信息種類繁多,綜合地震應急工作的實際需要,本文獲取的網絡地震災情信息主要有九類(表1)。

表1 網絡地震災情信息類別Table 1 Types of internet earthquake hazard information
本文從地震災情信息的互聯網抓取關鍵詞定義、互聯網來源、互聯網獲取的時間三個方面,對地震災情信息互聯網抓取進行研究。首先,地震災情信息獲取的準確性與關鍵詞定義是否恰當直接相關,關鍵詞定義越詳細,抓取的災情信息越精確。依據各類災情信息的定義以及在互聯網上的描述信息,本文定義的互聯網抓取關鍵詞包括兩部分內容:一部分是地震要素,這類關鍵詞隨著地震的不同而變化;另一部分是地震災情信息的描述關鍵詞,這類關鍵詞是通用的,適應于每個地震(表2)。

表2 地震災情信息互聯網抓取關鍵詞Table 2 Key words of acquiring internet earthquake hazard information

續表
其次,從互聯網上收集歷史地震災情信息,按時間和來源進行統計分析發現,災情信息主要集中在國內官方媒體和門戶網站、行業地震網、社區論壇;震情信息、人員傷亡、經濟損失信息主要集中在震后一個月,有感信息主要集中在震后1天,房屋破壞、交通中斷、通信中斷、斷水斷電、次生災害,集中在震后10天。依據《地震災情應急評估規范》(征求意見稿),特別重大地震災害不超過10天,重大地震災害不超過7天,其他地震災害不超過3天。綜上所述,本文定義了災情信息的互聯網來源(表3)和互聯網獲取的時間(表4)。

表3 地震災情信息的互聯網來源Table 3 Sources of acquiring internet earthquake hazard information

表4 不同震級區間的地震互聯網獲取災情信息時間Table 4 Time periods of acquiring internet earthquake hazard information for different magnitude interval
如何把互聯網上非結構化的災情信息轉化成便于管理和利用的結構化災情信息,是網絡地震災情信息智能處理模型研究的關鍵問題。首先,需要從災情信息中提取出地名信息,便于災情的追蹤和空間定位;其次,需要對災情信息進行分類,便于災情的應用。本文對地名提取和災情分類進行了重點研究,地名提取是通過確定不同震級地震地名提取的范圍,建立震中地名庫,通過震中地名庫去匹配互聯網上獲取的災情信息,從而提取出災情信息中包含的地名信息;災情分類是通過構建地震災情信息分類模型詞典來對網絡災情信息進行分類。
地名提取是指以全國地名庫為基礎,從互聯網上的災情信息中提取出災情信息中包含的地名信息,包括地名名稱及其地理坐標。全國地名庫較大,若進行全庫匹配,效率較低。且每次地震發生后,破壞范圍有限。所以,只需要獲取破壞范圍內的地名信息,建立震中范圍的地名庫,進行災情信息的地名提取。
2.1.1 地名提取范圍
地名提取范圍是指破壞性地震發生后,能完全包含實際地震烈度為6度及以上區的地名信息,包括地震烈度取值級別及各級烈度區的空間取值半徑和最低行政區劃級別,其中,地震烈度取值級別是指6度到宏觀震中烈度之間的各級地震烈度值;空間取值半徑是指各級烈度區的地名坐標與震中坐標的空間距離;最低行政區劃級別是指各級烈度區地名取值的最低行政區劃級別;實際取值是指取最低級別以上的行政區劃級別。
本文通過對歷史震例的統計分析,確定不同震級區間的地震的地名取值范圍。歷史震例的選取原則主要有:剔除沒有進行現場調查的震例或調查不夠詳細的震例;剔除在中國邊境、海域發生的地震;剔除震群型震例;剔除有較多的地震烈度異常區的震例;剔除最大地震烈度小于6度的震例;剔除震級相同或相近的震例中數據偏差較大的震例。依據此原則,從《中國大陸地震災害損失評估匯編(1990—2010)》(中國地震局監測預報司,1996;2001;2010)中,選取符合條件的震例有68個(表5)。
依據選取的歷史震例,選擇各震級區間地震烈度6度及以上地區長半軸最大的震例,來定義該震級區間的地震烈度取值級別及空間取值半徑,地震烈度取值級別為6度到該震例最大烈度之間的各級烈度,空間取值半徑為震例的長半軸長度。
對互聯網上歷史地震的災情信息分析發現,數據來源的最低行政區劃級別主要是鎮級,以村為單位的數據極少,綜合目前互聯網在中國的普及程度,本文選取最小的行政區劃級別為鎮級,即本文的行政區劃級別只取市、縣、鎮三級。行政區劃級別的定義結合震級的大小和烈度大小進行綜合考慮,地震烈度為Ⅷ度、Ⅸ度、Ⅹ度、Ⅺ度地區,最低行政區劃級別取到鎮級;震級在6級及以上的地震,地震烈度為Ⅶ度的地區,最低行政區劃級別取市,Ⅵ度地區最低行政區劃級別取縣;震級在6級以下5級及以上的地震,地震烈度為Ⅶ度的地區,最低行政區劃級別取鎮級,Ⅵ度地區最低行政區劃級別取縣;震級在5級以下的地震,地震烈度為Ⅵ度區的最低行政區劃級別取鎮級(注:表5中鎮指的是鎮級行政區劃,包括鄉)。

表5 不同震級區間各級烈度區的空間取值半徑(單位:km)和最低行政區劃級別Table 5 Radius and the lowest administrative level for different magnitude and intensity

續表
2.1.2 地名提取方法
破壞性地震發生之后,很快就能得到震級大小、震中坐標。根據震級大小確定地名提取范圍,根據地名提取范圍從全國地名庫中進行提名提取。以2012年5月28號灤縣4.8級地震為例說明。震級為4.8,從表5中查找出震級區間在4.0—4.9之間的地名提取范圍為:地震烈度取值范圍為6度,6度區的空間取值半徑為9km,最低行政區劃級別為鎮。
根據兩點經緯度坐標計算兩點距離的公式為:Distance (X1, Y1, X2, Y2)=sqrt ([(Y2–Y1)×PI×R×cos(((X1+X2)/2)×PI/180)/180]2+[(X2–X1)×PI×R/180]2),其中,PI是地球圓周率;R是地球半徑。
設震中坐標為(X中,Y中),鎮地名庫的坐標為(X鎮,Y鎮),縣地名庫坐標為(X縣,Y縣),市地名坐標為(X市,Y市),則該震例的震中地名庫滿足的條件有,市地名庫:Distance(X中,Y中,X市,Y市)≤9km;縣地名庫:Distance(X中,Y中,X縣,Y縣)≤9km;鎮地名庫:Distance(X中,Y中,X鎮,Y鎮)≤9km。依據建立的震中地名庫,對互聯網上獲取的災情信息進行地名的匹配,從中提取出包含的地名信息。
收集歷史震例的網絡地震災情信息,依據各類災情信息的定義,提取各類地震災情信息的描述性關鍵詞匯,形成分類模型字典,并以此為依據對網絡地震災情信息進行自動分類。

表6 網絡地震災情信息分類模型字典Table 6 Classification and dictionary of internet earthquake hazard information

續表
地震烈度作為地震應急工作的基礎數據之一,快速得到較為準確的地震烈度信息對地震應急工作很重要。從互聯網上獲取的非結構化的災情信息,經過智能處理轉化成結構化的災情信息,其中分類后的九類信息中的有感信息、房屋破壞信息和次生災害信息,可以用作地震烈度判定的數據基礎。
汶川地震是發生在中國中部的特別重大地震災害,互聯網上歷史災情數據非常豐富,本文以汶川地震的網絡災情信息為基礎,進行地震烈度判定研究。依據《中國地震烈度表(GB/T 17742—2008)》(中華人民共和國國家標準,2008)和《地震現場工作,第三部分:調查規范(GB/T 18208.3—2011)》(中華人民共和國國家標準,2011),提取歷史網絡災情信息中各級烈度區關于烈度的描述性詞匯,建立地震烈度語料庫,再從地震烈度語料庫中提取地震烈度的描述性詞匯,并賦予相應的地震烈度權值。通過這種方法建立網絡地震災情信息與地震烈度之間的定量關系來判斷地震烈度。
3.1.1 提取汶川地震各級地震烈度區的地名
將矢量化的汶川地震現場烈度調查圖和全國地名庫進行疊置分析,獲取各級烈度區的地名(表7)。地震烈度為Ⅵ度、Ⅶ度、Ⅷ度、Ⅸ度的地區,行政區劃級別取市和縣;地震烈度為Ⅹ度、Ⅺ度區,行政區劃級別取市。為了擴大數據源,提取了地震烈度小于Ⅵ度的地區的部分地名,這些地區在互聯網上的災情信息較多。

表7 汶川地震各級烈度區包含的地名Table 7 Place names within the different Wenchuan earthquake intensity areas
3.1.2 構建地震烈度語料庫
對汶川地震各級烈度區包含的地名的網絡災情信息(有感信息、房屋破壞、次生災害)按地震烈度進行匯總分析,依據中國地震烈度標準和地震現場調查規范,提取每條災情信息對應的烈度描述詞匯,構建地震烈度語料庫(表8)。

表8 構建的部分地震烈度語料庫Table 8 Part of terminology for seismic intensity description
對地震烈度語料庫中的烈度描述詞匯進行匯總分類,依據中國地震烈度標準,給每一個烈度描述詞匯賦一個地震烈度權值,烈度權值為0,表示無感,其他數字表示相應的烈度值,建立地震烈度判定字典(表9)。地震烈度判定字典主要由五大類組成:人的感覺、器物反應、房屋破壞情況、其他災害,其中人的感覺、器物反應、房屋破壞情況、地質災害的類別選擇主要依據是中國地震烈度標準和地震烈度現場調查表,其他災害中的烈度描述詞匯主要來源地震烈度語料庫,在構建地震烈度語料庫過程中,發現在高烈度地區有一部分詞匯出現頻率很高,可以用來作為地震烈度判定的依據之一。

表9 地震烈度判定字典Table 9 Dictionary of seismic intensity description
依據地震烈度判定詞典,從網絡地震災情信息中提取地震烈度描述詞匯和每個烈度描述詞匯的烈度權值,若一條災情信息中有多個烈度描述詞匯,對烈度描述詞匯對應的烈度權值進行取平均值計算,計算結果按四舍五入取整處理。同一地區的烈度判定值若有多個,取其平均值,結果按四舍五入取整處理。本文收集了汶川地震震后24小時的12982條災情數據,其中,帶有地名信息和烈度描述信息的數據有1204條,一共有112個地名來源。并依據地震烈度判定字典,對震后24小時的112個地區地震烈度進行判定,并將判定的地震烈度點和汶川地震現場調查烈度圖進行了對比(圖1),從圖1可以看出,各地震烈度判定點與現場調查的烈度基本上是一致的。

圖1 汶川地震震后24小時地震烈度點Fig. 1 Locations of the sites for intensity determination 24 hours after Wenchuan earthquake
近幾年破壞性地震災害頻發,社會民眾對地震的切身感受越來越真切,并且隨著互聯網的迅速發展和普及,越來越多的民眾會通過互聯網去發布自己了解到的地震信息,各網絡媒體也會及時地進行地震相關的專題報道。每當地震發生,互聯網上很快就有大量的地震信息,這些信息可為地震應急救援工作提供信息支持。本文通過對互聯網上歷史地震災情信息進行研究,建立網絡地震災情信息智能處理模型,將互聯網上非結構化的、雜亂的災情信息轉化成結構化的、有序的災情信息,并通過網絡地震災情信息進行地震烈度的快速判定,快速判定的地震烈度信息可以與基于經驗公式計算的等震線圖和美國USGS的ShakeMap震動圖進行對比和修正。
畢竟,互聯網上信息的匯集是無序而雜亂的,信息源很多,每個信息源的數據結構和描述都不統一,災情信息智能處理模型很難把互聯網上所有的災情信息考慮進去。此外地震烈度的判定帶有很強的主觀性,影響因素很多,互聯網上關于地震烈度的描述性語言非常不標準,本文研究的基于網絡地震災情信息判斷地震烈度的方法,忽略了很多的影響因素。本文的研究更多的是進行一些探索性的工作,為下一步進行深入的研究打下基礎。
董翔,肖蘭喜,杜憲宋等,2007. 基于網絡的山東地震災情收集分析處理系統. 華北地震科學,25(3):6—10.
李巖峰,王東明,李民等,2009. 基于網絡的地震災情信息時-空分布規律及啟示. 國際地震動態,(12):28—33.
帥向華,姜立新,王棟梁,2009a. 國家地震應急軟件系統研究. 自然災害學報,18(3):99—105.
帥向華,2009b. 國家地震應急指揮技術系統. 北京:地震出版社.
中華人民共和國國家標準,2008. 中國地震烈度表(GB/T 17742-2008).北京:地震出版社.
中華人民共和國國家標準,2011. 地震現場工作,第三部分:調查規范(GB/T 18208.3-2011).北京:地震出版社.
中國地震局監測預報司,1996. 中國大陸地震災害損失評估匯編(1990—1995).北京:地震出版社.
中國地震局監測預報司,2001. 中國大陸地震災害損失評估匯編(1996—2000).北京:地震出版社.
中國地震局監測預報司,2010. 中國大陸地震災害損失評估匯編(2001—2005).北京:地震出版社.
中國地震局監測預報司. 中國大陸地震災害損失評估匯編(2006—2010).北京:地震出版社,出版時間未定.