999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義模板的地震應急態勢圖自動標繪技術

2016-10-18 05:35:46陳通
中國科技信息 2016年18期
關鍵詞:語義文本信息

基于語義模板的地震應急態勢圖自動標繪技術

破壞性地震發生后,大量的地震應急信息匯集并傳播,在傳統的地震應急處置模式中,地震應急信息的傳播大多為信息簡報等文本形式。這類信息大多只有文字描述,無法以直觀、形象的圖形化方式表達災情震情信息。隨著GIS技術在地震應急中應用的不斷深入,近些年,基于GIS的地震應急態勢標繪技術(也稱為電子沙盤)得到了較快發展,能夠采用圖形符號在地圖上標繪各類地震應急信息,作為文本信息簡報的補充,有利于閱讀者快速理解材料,獲知各類信息的空間分布及關聯性,從而充分了解地震應急態勢,做出正確的應急指揮命令。徐敬海等(2011)結合地震應急的特點,論述了標繪元素的符號化表達和顯示;劉浩等(2013)論述了標繪框架設計和應急救援語義的標繪表達;王悅等(2010)從軟件應用的角度,論述了地震應急態勢標繪系統的功能設計與實現過程。然而,目前的地震應急態勢標繪技術與系統一般以人工標繪為主,通常需人工閱讀、理解文字材料,還需考慮文本信息與空間信息、應急態勢信息與標繪符號的對應關系等,存在實時性差,耗費較多人力等問題。基于自然語言處理的自動標繪技術是態勢圖標繪的一個發展方向,目前此類技術較多研究和應用于軍事領域,(胡斌等,2005;楊健等,2006;姜文志等,2007)從自動標繪關鍵的信息抽取、文本信息空間化等方面做了介紹。在地震應急領域,帥向華等(2013)對自動標繪關鍵的地震應急文本信息結構化、空間化技術進行了探討。本文結合地震應急文本信息的特點,基于自然語言處理概念,研究語義模板填充技術,并以此為手段,探討地震應急救援災情信息的自動標繪方法,為地震應急標繪時效性的提高提供有力支持。

地震應急態勢自動標繪模型

基于語義模板的地震應急態勢圖自動標繪技術利用中文信息抽取的概念,完成地震應急文本信息的結構化和空間化,并與標繪模型匹配,實現地震應急文本信息在地圖上的自動標繪。圖1給出了地震應急態勢圖自動標繪模型。

(1)以網絡,公文文本,短信獲取的地震應急文本信息為資料,對其分析,預處理形成地震應急專有詞典、地名詞典和指代詞典;其中地震應急專有詞典用于后續的文本結構化處理,地名詞典和指代詞典用于文本信息的空間化處理。

(2)結合預處理的結果,對地震應急原始文本進行結構化處理(包括中文分詞,詞性標注,語義標注、語義模板填充等)。此階段,中文分詞將一串連續漢字序列按照一定的規范重新組合成詞語序列。詞性標注可根據句子的上下文信息給句中的每個詞語確定一個最為合適的詞性標記,以便于語義標注的實現。語義標注可根據句子的句法結構和句中每個實詞的詞義推導出能夠反映這個句子意義的某種形式的結構化表示(程顯毅等,2010)。而語義模板定義了地震應急事件描述及文本匹配規則,可與原始地震應急文本信息匹配、抽取,形成結構化文本。

(3)對結構化信息中所包含的地名、中文實體名進行空間化處理。

空間化處理階段,把結構化處理后文本信息中包含的中文地名、中文實體名做空間定位處理,以建立文本信息與空間位置的關聯關系。盡可能多的把包含空間信息的本文與空間位置關聯決定了地圖標繪信息的豐富度與準確度。

(4)最終的信息表達階段,結構化文本映射為標繪符號,并與標繪模板進行匹配,調用標繪組件的繪圖接口,實現地震應急文本的自動標繪。根據地震應急需求,綜合運用點、線、面等形式來表達災情要素、救災行動、指揮調度等內容。目前,自動態勢標繪技術中標繪多集中于靜態化的表達。因此,還需對時態發展的地震應急信息賦予動態化顯示。

圖1 基于語義模板的地震應急態勢圖自動標繪模型

關鍵技術與實現

文本結構化技術與計算機實現

文本結構化技術本質上屬于中文信息抽取技術。中文信息抽取方法按照抽取原理分為四類。(1)基于自然語言處理方式的信息抽取。此類抽取方法利用子句結構建立語法和語義的抽取規則實現信息抽取。(2)基于規則的信息抽取。依賴于人們手工建立抽取模式,而這些規則較難保證具有整體的系統性和邏輯性。(3)基于統計模型的信息抽取。目前基于機器學習的方法是主要的研究熱點,但面臨無法快速獲取大規模標注語料的困難。(4)基于認知模型的信息抽取(程顯毅等,2010)。

基于地震應急領域詞匯量相對較少,文本句法結構較為固定的特點,本文采取第一與第二種方法相結合的方式實現原始文本的結構化。即采用自然語言處理方式對原始文本進行中文分詞、語義標注、中文命名識別等,再基于預定義的語義模板及匹配規則進行信息抽取。

使用LTP-Cloud語言云平臺對原始文本進行中文分詞、語義標注等處理。

目前的基于自然語言處理概念的文本處理軟件較多。本文利用實際文本進行驗證對比,選用LTP-Cloud語言云平臺作為中文分詞和詞性標注工具,LTP-Cloud語言云平臺提供了包括分詞、詞性標注、依存句法分析、命名實體識別、語義標注在內的豐富高效的自然語言處理服務。并支持添加自定義詞典,增強語義分析的可靠性和準確性。

如圖2所示,以文本“截至24日12點30分,甘肅岷縣地震共造成45人遇難。”為例,展示LTP-Cloud處理后的詞性標注與語句結構。其中TMP代表時間詞,ADV代表附加詞, A0 通常表示動作的施事,A1通常表示動作的影響等。

預定義語義模板及匹配規則

按照地震應急事件特點及文本描述習慣,把地震應急事件分成震情信息、災情信息、應急處置信息四大類二十幾小類,并按照事件分類構建語義模板和匹配規則。語義模板定義了地震應急信息的事件類型、主體、客體、主要行為,發生的時間、地點和其他特定屬性等。表1以“人員死亡”事件為例,展示了語義模板的定義及匹配規則的編寫。

表1 “人員死亡”事件語義模板及匹配規則

其中tmp表示時間詞,loc表示地名詞,mbar表示數量詞。在規則中每一對大括號“{……}”表示一個節點, 大括號前面的數字表示待抽取信息的編號, 帶有編號的為待提取內容,與語義模板中數字相對應。例如編號為2限制輸出為地名詞,對應語義模板中的地點屬性。節點中的“|”表示或的關系, 即節點中的詞有一個匹配成功則此節點匹配成功。如果某一段文本匹配了整個規則,并滿足輸出節點的限制,則認為匹配成功, 輸出該事件;如果該段文本不能完全匹配規則, 則匹配失敗(梁晗等,2006)。文本信息結構化的準確率和識別率取決于匹配規則編寫的全面性。因此同一地震應急事件的匹配規則需根據地震應急行業用語習慣,編寫多條,以最大程度與文本信息匹配。

模板匹配與信息提取

上述帶有結構信息的語句經合并與過濾后,簡化形成如下結構:

{TMP},{LOC}{地震/n}{造成}{45/m人/n}{遇難/v},關鍵字“遇難”與事件類型“人員死亡”匹配,檢索“人員死亡”事件的預定義語義模板匹配規則,經正則表達式等文本匹配技術進行對比,與上文語義模板中定義的匹配規則1完全匹配,并按照信息提取標示及對應信息,形成結構化信息。模板匹配后的結構化信息如圖2下半部分所示。

文本信息的空間化

包含空間位置的文本信息的分類

地震應急原始文本中直接或間接包含空間位置信息的詞主要有4類:

圖2 文本信息結構化流程圖

圖3 文本信息的空間化流程

第1類:具體行政名稱,行政區域名,如“蘆山縣太平鎮”。

第2類:自然地理名稱和人文地理名稱等,如山、河、湖、海島等自然地理名稱,也包含名勝古跡、紀念地、水庫、橋梁、電站等名稱。

第3類:間接包含地理位置的中文機構名。如位于蘆山縣隆興鄉的“蘆山縣龍門中心衛生醫院”。如果按照第一類詞來處理,只能定位到蘆山縣,而不能定位到蘆山縣隆興鄉。

第4類:包含地理信息的特殊指代名詞。如“震中”,“極災區”等,這類詞語根據地震的不同,代表的地理位置不同。

目前地震領域空間化技術或軟件系統一般還停留在第1類文本信息空間化,分析已有地震應急文本資料可知,空間信息除包含在第1類中,還可包含在第2、3、4類文本信息中。

文本信息空間化步驟

文本信息空間化包括識別包含空間信息的文本和文本向地理坐標轉換兩個步驟。

空間文本信息識別:包含空間信息的文本識別由前述LTP-Cloud語言云平臺處理完成,識別并標示出了原始文本中的地名及中文機構名。

文本信息地理轉換:文本信息向地理坐標的轉換屬于地理編碼的范疇,地理編碼是指將中文地址或地名描述轉換為地球表面上相應的位置。一般分為正向地理編碼和反向地理編碼兩種方式,分別表示中文地址或地名描述與空間地理坐標之間的雙向轉換過程(楊麗,2013)。本文所提及的文本信息空間轉換屬于正向地理編碼,即通過輸入一個中文地名地址信息來獲得對應的地理坐標。

地理編碼的大致流程為:創建標準地址數據庫,對標準地址數據庫中的標準地址進行解析和中文分詞,創建地址索引;然后將待匹配的地址數據在地址索引中進行地址匹配,從而完成地址的查詢與檢索。

本文利用地理編碼、位置檢索等互聯網公眾服務等技術,實現上文提及的前三類包含空間位置關系詞的空間定位,處理流程如圖3所示。

利用地理編碼或互聯網地圖Place檢索服務解析中文地名。解析后的中文地名坐標可能存在兩種情況:1 包含多個重名地名,根據地震震級與含行政區界的地理底圖確定的有效范圍,按距離遠近進行重名地名的篩選。2中文地名無法正常檢索到經緯度坐標。則以上一級地名進行重新檢索。例如“蘆山縣太平鎮衛生院”未檢索到經緯度坐標,則返回地理編碼和Place檢索服務以“蘆山縣太平鎮”重新檢索。最終形成以經緯度形式表示的空間位置信息。

圖4 地震應急文本自動標繪效果

結構化信息的地圖表達

應急文本信息的地圖表達實質是自然語言到地圖圖形的表示。地圖圖形是地圖的語言,它既能表示態勢標繪符號的形狀、位置、結構和大小信息,也表示了實體的類型、等級以及其他數量和質量特征(蘇科華等,2009)。本文面向地震應急分析與展示的實際需求,綜合運用各類標繪單元來表達地震災區范圍內各類災情、震情、應急處置信息等內容。關鍵的步驟有:

(1)建立應急信息事件到圖形的映射,目的是建立應急事件與圖形的對應關系,其中應急事件與圖形的對應關系一般為一對一的關系,但是事件模板的其他屬性決定了圖形的一些視覺參量(如大小、色相、方位、紋理等) 比如,地震造成人員死亡的事件模板中,包含死亡人數的屬性,根據人員死亡人數的由少到多,地圖圖形以及備注文本的顏色依次用淡紅、紅、暗紅表示;

(2)空間語義的表達。事件模板中的地點屬性決定了圖形在地圖上的顯示位置;

(3)動態標繪。除了用靜態圖形標示應急事件和信息外,還可用動態標繪來表達應急事件的過程性信息。例如圖形的移動,可用來表達救援隊行動路線。圖形的縮放或閃爍,可用來表示震后交通管制區域范圍。圖形的變形,可用來示意表示堰塞湖形成后的河水蔓延等。圖4為文本“魯甸縣龍門山鎮死亡45人”的自動標繪效果,經人工簡單調整后,可達到實際應用效果。

結語

基于語義模板的地震應急態勢圖自動標繪實現了傳統的手工標繪作業向自動或半自動作業的轉換,有助于提高標繪效率。本文提出的自動標繪技術方案已進行了初步驗證,但還需繼續完善語義模板和匹配規則,以提高文本信息的識別率與轉換率。本文中提到的地震應急文本信息結構化和空間化技術也可用于地震應急的其他領域,如利用網絡媒體快速獲取災情時,可從互聯網抓取內容中識別并提取災情、震情相關的文本信息,并自動按照預定義的語義模板進行格式化和空間關聯。

10.3969/j.issn.1001- 8972.2016.18.031

猜你喜歡
語義文本信息
語言與語義
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: 亚洲国产在一区二区三区| 国产资源免费观看| 欧美激情视频二区| 亚洲妓女综合网995久久 | 无码在线激情片| 国产打屁股免费区网站| 亚洲无码高清一区二区| 亚洲精品无码AV电影在线播放| 亚洲午夜福利精品无码不卡| 亚洲侵犯无码网址在线观看| 久久国产亚洲偷自| 91欧美在线| 91精品国产丝袜| 亚洲第一黄片大全| 国产中文在线亚洲精品官网| 色亚洲成人| 欧美一级高清视频在线播放| 亚洲精品人成网线在线 | 国产精品午夜福利麻豆| 91九色视频网| 伊人久综合| 日本久久免费| 欧美笫一页| 亚洲av无码牛牛影视在线二区| 国产综合亚洲欧洲区精品无码| 99ri国产在线| 亚洲天堂视频在线观看| 19国产精品麻豆免费观看| 狠狠色噜噜狠狠狠狠色综合久| 欧美精品另类| 无码福利视频| 91精品视频网站| 毛片久久网站小视频| 亚洲不卡影院| 久久天天躁夜夜躁狠狠| 国产午夜无码片在线观看网站| 波多野结衣在线se| 在线欧美一区| 99久久精彩视频| 中文字幕久久波多野结衣 | 永久免费av网站可以直接看的 | 国产成人精品一区二区三区| 波多野结衣国产精品| 午夜欧美在线| 日韩在线欧美在线| 国产白浆在线| 尤物成AV人片在线观看| 99草精品视频| 亚洲成肉网| 久久视精品| 超清人妻系列无码专区| 九九热这里只有国产精品| 亚洲愉拍一区二区精品| 丰满人妻被猛烈进入无码| 久久久久久午夜精品| 999精品色在线观看| 黄色福利在线| 一级高清毛片免费a级高清毛片| 欧美性精品不卡在线观看| 视频在线观看一区二区| 国产成人精品日本亚洲| 亚洲女同一区二区| 伊人色婷婷| 浮力影院国产第一页| 国产理论一区| 亚洲国产清纯| 成人毛片免费在线观看| 中国国产高清免费AV片| 欧美日韩成人| 麻豆精品在线播放| 色综合天天娱乐综合网| 国产极品粉嫩小泬免费看| 亚洲有无码中文网| 国产精品女人呻吟在线观看| 午夜人性色福利无码视频在线观看| 国产精品欧美激情| 国内精品伊人久久久久7777人| 精品一区二区三区无码视频无码| 亚洲av无码久久无遮挡| 91日本在线观看亚洲精品| 亚洲第一精品福利| 精品国产自在现线看久久|