999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于開源情報的海上大中型目標檢測與識別*

2021-08-12 09:02:28王景石何佳洲蔣丙棟
艦船電子工程 2021年7期
關鍵詞:艦艇一致性信息

王景石 喬 慧 何佳洲 蔣丙棟

(江蘇自動化研究所 連云港 222006)

1 引言

航空母艦、潛艇、驅逐艦、護衛艦、兩棲登陸艦等海上大中型目標是各國海軍作戰的主力,是實施全球海洋戰略的擔當。掌握海上大中型目標的位置,了解敵對國家的海軍動向,是洞悉全球海洋態勢,占據戰略有利地位的前提。當前針對大中型目標的探測,主要依賴于人力偵察、雷達探測與衛星可見光圖像偵察等手段,然而人力偵察成本大,風險高[1];雷達探測范圍有限,干擾信號多[2];衛星可見光圖像照射范圍太大、發現效率低[3]。這些缺點制約了大中型目標的檢測與識別。

開源情報因低成本、高回報的特點而日益受到各國的重視,據美國中央情報局的統計,2007年的情報收集總數中超過80%來自開源情報。曾任美軍中央司令部司令的安東尼·辛尼,在《新時代的指揮官》一書中寫道:“在作戰所需情報中,有4%來源于秘密渠道,而有95%的情報不是通過標準情報活動(秘密方法)獲得的,是從學術界、民間、商業、政府、執法機關、媒體、非政府組織等渠道公開、廉價地獲得的。”[4~5]互聯網技術的飛速發展,網站、論壇、網絡出版物等新型信息媒體不斷涌現,形成了縱橫交錯、無處不在的公開信息空間。以互聯網為主要獲取手段的開源情報,憑借其信息容量大、內容豐富、來源廣泛、不受時間地域限制等優勢,日益受到各國的關注,被視為最廣泛、最經濟、最安全和最迅速的情報搜集手段[6~8]。通過艦船自動識別系統(AIS)獲取的位置、身份等信息,結合互聯網上有關大中型艦艇的公開報道及論壇跟帖信息,為海面艦艇的動態檢測提供了詳細可靠的信息獲取渠道,是大中型目標檢測手段的有力補充。

在這樣的背景下,本文從遠海大中型目標檢測與識別的需求出發,在網絡公開信息搜集的基礎上,建立目標身份信息庫,利用信息庫中的AIS信息,通過船舶定位網站發現目標艦艇的位置和屬性信息。同時建立網絡爬蟲工具獲取目標艦艇的近期中英文通訊報道,利用實體識別工具,抽取公開報道信息中的目標艦艇名稱、時間和位置信息。最后將不同渠道獲得的目標艦艇身份信息、出現的時間和地點信息進行比對分析,對目標身份和活動事件進行一致性檢驗,最終實現海上大中型目標的檢測、識別與驗證。

2 目標檢測與識別

AIS系統作為船和岸、船和船之間的海事安全與通信的開放式數據傳輸助航系統,通過VHF通信機可自動交換船位、航速、航向、船名、呼號等重要信息,并通過與互聯網連接,構成海上交管和監視網絡,廣泛應用于民船、軍用艦艇等海上船舶的通信交流、導航避碰、海上救援等領域[9]。

AIS通信信息中的身份信息為識別海上大中型目標提供了開源渠道,通過互聯網等開源渠道獲取外軍軍用艦艇的身份信息,形成艦艇身份信息庫,結合庫中目標艦艇的身份信息,利用船舶方位查詢網站獲取目標艦艇的位置信息,并通過身份信息比對,實現大中型目標的檢測和識別。

2.1 建立艦艇身份信息庫

為了收集整理國外海上大中型目標的身份特征信息,通過互聯網新聞報道、軍事愛好者論壇和國外艦艇門戶網站等開源渠道獲取艦艇名稱和身份等相關信息,建立艦艇身份信息庫。該信息庫主要包含名稱、編號、特征及活動等四類信息,如圖1所示,名稱類信息包括英文名稱、中文名稱和英文別名;編號類信息包括MMSI號碼(水上移動通信業務標識碼)、呼號和船舶序號;特征類信息包括船體長度、最大寬度和艦艇類別;活動類型信息包括母港、歷史事件和活動區域。為保證數據庫的準確性和完整性,信息庫信息在目標檢測過程中不斷更新和完善。當前艦艇信息庫包含美、日、臺各軍航空母艦、潛艇、兩棲登陸艦、驅逐艦、瀕海戰斗艦和聯合高速艦等大中型艦艇526艘。隨著開源信息的不斷收集和整理,信息庫包含的艦艇數量和信息種類將不斷提升。

圖1 艦艇身份信息結構

2.2 目標發現及信息提取

根據AIS網站信息查詢特點及數據格式,目標發現及信息自動獲取流程主要分為以下四個步驟:艦艇身份信息獲取、AIS網頁解析、目標艦艇特征匹配和艦艇活動信息存儲,如圖2所示。

圖2 目標發現和信息獲取流程圖

大中型艦艇發現及信息提取主要流程如下所示。

1)選擇所需檢測的艦艇,通過艦艇身份信息庫獲取其MMSI號碼,并在AIS查詢Url庫中選取合適的船舶方位查詢網站,船舶方位查詢中文外文網站如表1所示;

表1 船舶方位查詢網站

2)利用MMSI號碼對相應的AIS查詢網站進行請求并得到響應,解析得到目標艦艇的位置信息、時間信息、特征信息和圖片信息。如查詢失敗,更新查詢Url,并重新請求,當遍歷Url庫仍然未得到解析結果,對該艦艇的AIS信息進行查驗并更新艦艇身份信息庫;

3)根據網站解析得艦艇的長度、寬度、呼號等身份信息和圖片信息與艦艇身份信息庫中的相關信息進行比對,如差別較大,對該艦艇的AIS信息進行查驗并更新艦艇身份信息庫;

4)如果Url反饋信息完整并且艦艇特征匹配成功,保存艦艇出現的時間、所在時區、經緯度、出現區域和附近港口等信息,否則艦艇位置查詢失敗。

3 公開信息采集與加工處理

因AIS信息具有時間滯后、身份信息可修改等特點,單純依賴AIS信息并不能保證信息的準確性,為增加艦艇活動信息的可靠性,還需多種信息來源對艦艇活動事件進行比對,輔助驗證事件的同一性。航空母艦、驅逐艦、兩棲登陸艦等海上大中型目標因在國防領域發揮重要作用而受到社會的廣泛關注,這些艦艇在駐留港口碼頭、靠港維修補給、出海訪問交流、國防公開教育等活動過程中,當地新聞媒體、軍事自媒體、軍事愛好者或者隨艦通訊記者會在網上進行相應的通訊報道、發帖和留言,這些獲取信息的網絡公開渠道為信息可靠性分析提供了另一個重要的信息來源。

隱藏在公開報道中的名稱、時間和位置等關鍵信息是驗證目標艦艇活動的關鍵,必須對其中的關鍵信息進行識別和提取。因通訊報道信息的權威性、準確性和完整性,本文以通訊報道為處理對象。中英新聞通訊中目標艦艇活動時間和地點等關鍵信息的提取,主要由以下三步完成。

1)公開信息獲取。利用艦艇身份信息庫獲取目標艦艇的名稱信息,通過商業搜索引擎,獲取目標艦艇最近的公開信息,并保存相關網址;

2)網頁關鍵內容抽取。結合網頁解析工具,完成正文、發表時間等網頁關鍵內容的抽取;

3)關鍵信息抽取。利用自然語言信息處理工具,實現公開信息正文中艦艇名稱、出現時間和地點等關鍵信息的獲取。

下面就各步驟進行詳細說明。

3.1 公開信息獲取

首先確定待檢測的目標艦艇,從艦艇身份信息庫中獲取中文名稱、英文名稱,利用爬蟲工具通過搜索引擎檢索目標艦艇名稱并將檢索結果以時間排序,同時剔除百度、維基等百科類網址,以當前時間為基準,檢索目標艦艇近三個月的新聞報道,如果未有相關信息,則檢索目標艦艇別名或簡稱,以此來獲取相關新聞通訊網址,最后將新聞網址進行保存,如圖3所示。

圖3 公開信息獲取流程圖

3.2 網頁關鍵內容抽取

本文從目標艦艇的開源情報信息內容要求出發,爬取的網站以英文網站為主,中文網站為輔,重點關注頁面標題、文章作者、發表時間、正文、關鍵詞、摘要、圖片、視頻等關鍵信息,忽略網頁無關信息。不同語言不同類別的網站語法規則不太相同,這為網頁適配帶來了額外的工作[10]。

傳統的 Xpath,Css,正則表達式,Beautifulsoup來解析新聞頁面的時候,網頁源碼中混有大量無用的語法信息,總是會遇到各種問題,嚴重影響工作進度。而開源python庫提供了豐富的網頁信息獲取工具,其中基于提取模板的newspaper庫就是優秀代表,不僅自動識別和處理包括中英文在內的10多種語言網頁,可以通過自然語言處理相關技術自動生成網頁關鍵詞和摘要。具體應用步驟如圖4所示。

圖4 Newspaper提取關鍵信息流程

3.3 關鍵信息抽取

目標艦艇相關情報發生的時間和地點是體現其情報價值的核心要素。在一般的開源新聞報道中,標題和正文通常包含關鍵的時間和地點信息。如何將隱藏在標題和正文中的關鍵信息進行正確識別和提取是從公開信息中提取高價值情報的關鍵。

本文通過斯坦福大學開發的開源自然語言處理工具Stanford CoreNLP,抽取標題和正文中時間地點信息,該工具支持英文、中文、西班牙語等六種語言的命名實體識別、詞性標注、情感分析等功能。在命名實體識別中,時間詞語被標注為“DATE”和“TIME”,地點詞語被標注為“LOCA?TION”,“CITY”,“COUNTRY”,“STATE OF PROV?INCE”。中文英文時間地點要素識別分別如圖5和圖6所示。

圖5 中文時間和地點要素識別示例

圖6 英文時間和地點要素識別示例

4 事件一致性檢驗

雖然通過檢索艦艇名稱獲取相關新聞報道,并利用Stanford CoreNLP較好地抽取文中艦艇出現的時間和地點,但是在新聞報道中目標艦艇活動信息的時間位置精度和通過AIS獲取的不相同,一般在新聞報道中時間精確到天、地點精確到城市或者港口,而AIS時間地點精度較高,一般時間精確到秒,地點以經緯度表示,因此不能判定AIS獲取的艦艇活動事件和新聞報道中的是同一個事件,必須對二者進行事件一致性檢驗。事件一致性檢驗是在身份一致性的基礎上,通過時間和地點一致性來判斷是否是同一事件[11]。具體流程如圖7所示。

圖7 事件一致性檢驗流程圖

4.1 身份一致性檢驗

從AIS獲取的名稱類信息指向性強,特指某艦艇,具有唯一性。而在利用名稱通過搜集引擎檢索網頁過程中,因搜索機制問題,可能出現正文或者標題中目標艦艇名稱出現了一次,而正文中的事件描述其他艦艇活動情況。為保證新聞報道的參考價值,必須驗證通訊報道中具有活動信息的艦艇與AIS目標艦艇是否為同一艦艇,即身份一致性檢驗。

根據自然語言處理工具處理結果,如果標題和正文僅出現目標艦艇的身份信息而未出現其他艦艇,則判定該新聞報道具有較高參考價值,無需人為檢閱,直接進行時間和地點一致性檢驗。如果標題和正文中不僅出現目標艦艇身份信息,還出現其他艦艇身份信息,則無法判斷該通訊報道是否具有參考價值,必須人為審閱對應通訊報道,判斷新聞是否描述目標艦艇的相關行動信息。

4.2 時間一致性檢驗

在進行時間一致性檢驗前,必須對時間信息進行預處理。主要分為三步:

1)針對不同時間粒度的規定。對于文中抽取時間大多數只具體到日期而無具體時間情況,統一將具體時間定為12:00;

2)將不同時區時間換算成統一時區時間。AIS時間通過獲取的時區符號換算,而文中抽取的時間所在時區因不確定性較大,因此必須通過詞性標注為“DATE”和“TIME”的短語人為確定;

3)統一時間格式。將時間統一為“年:月:日小時:分鐘”格式。

若AIS獲取時間和文中抽取時間之差的絕對值小于3×24h,則通過時間一致性檢驗,否則不通過。之所以選擇3×24h作為判斷標準,是由新聞報道的時間滯后性和模糊性所決定的[12]。

4.3 地點一致性檢驗

AIS獲取的位置精度較高,一般為經緯度信息和港口信息,而文中抽取的位置精度較低,一般為城市或港口信息,涵蓋范圍較大。如果AIS獲取的港口在文中抽取位置所在行政區范圍內或者AIS獲取的經緯度位于文中出現的海域或者區域內,則通過地點一致性檢驗,否則不通過。

5 試驗分析

尼米茲號航空母艦是美國海軍尼米茲級航空母艦首艦,以第二次世界大戰期間任太平洋戰區的盟軍總司令,美軍五星上將尼米茲的名字命名,為美軍現役核動力大型航空母,其艦艇身份信息庫資料卡片如圖8所示。

圖8 尼米茲號航空母艦資料卡片

5.1 目標發現與信息提取

利用尼米茲號航空母艦MMSI號通過爬蟲工具獲取其最近出現時間、地區、港口、經緯度等信息,如圖9所示。

圖9 通過AIS獲取的尼米茲號航空母艦行動信息

將爬取的尼米茲號航空母艦活動信息與通過marine-traffic網站人工檢索的信息,如圖10所示,進行比較分析,二者結果基本一致,證明了爬蟲工具的穩定和可靠性。

圖10 AIS信息檢索頁面

5.2 公開信息采集與關鍵信息抽取

首先利用航空母艦簡稱“USS Nimitz”,通過搜索引擎獲取搜索結果,同時將搜索結果中百科類、照片類和視頻類網頁信息剔除,然后根據發表時間遠近選取最近的新聞報道,篩選得到于2020年2月22日發表在網絡的“USS Nimitz Hosts Junior Navy ROTC Students”新聞稿[13],一篇關于尼米茲航空母艦邀請高中海軍預備軍官上艦參觀的新聞報道,并將新聞稿中含有時間和地點等關鍵信息的第一段文字內容單獨提取,最后利用自然語言處理工具將文字中的關鍵內容進行標注,同時提取相應的關鍵信息,如圖11所示。

圖11 關鍵信息提取過程

5.3 事件一致性檢驗

利用MMSI號通過AIS查詢網站獲取的船舶全長、寬度特征信息與照片資料和尼米茲號航空母艦信息相符,同時尼米茲號航空母艦被AIS檢測到的時間為當地時間2020年2月22日的1:17刻,地點為BREMERTON(布雷默頓,美國華盛頓州港口城市),該港口是尼米茲號航空母艦母港。新聞稿中報道的對象是USS Nimitz(CVN68),活動時間為當地時間2020年2月21日,地點為Puget Sound(普吉特海灣,美國華盛頓州西北部),目的地為Bremer?ton,Washington(華盛頓州布雷默頓)。

從時間上看,尼米茲號航空母艦被AIS檢測到的時間與新聞稿中被報道的時間間隔小于2天,時間較為接近;從空間上看,尼米茲號航空母艦被AIS檢測到出現在布雷默頓港口,該港口恰好位于新聞報道中出現的普吉特海灣,同時新聞中出現的目的地信息——布雷默頓與1天后被AIS檢測到的地點信息一致。結合以上判斷AIS于2020年2月22日檢測到的尼米茲號航空母艦信息是真實有效的。

6 結語

本文針對遠距離和超遠距離海上大中型目標的發現困難和識別模糊問題,從利用AIS信息的角度提出了一種基于開源情報的海上大中型目標檢測和識別方法,同時結合公開信息報道中出現的目標名稱、出現時間和地點,進行事件一致性檢驗,增強開源信息的可信度。本文最后通過對真實目標的檢測和識別對方法進行了實驗評估,實驗結果表明通過開源渠道對海上大中型目標進行檢測和識別是可行的。

猜你喜歡
艦艇一致性信息
艦艇入列
環球時報(2022-12-30)2022-12-30 15:15:00
關注減污降碳協同的一致性和整體性
公民與法治(2022年5期)2022-07-29 00:47:28
海戰中的蒙面殺手——隱形艦艇
注重教、學、評一致性 提高一輪復習效率
IOl-master 700和Pentacam測量Kappa角一致性分析
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
基于事件觸發的多智能體輸入飽和一致性控制
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
艦艇遠航中開展音樂健身操訓練探討
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 又粗又硬又大又爽免费视频播放| 日韩精品一区二区深田咏美| 中文字幕在线永久在线视频2020| 午夜一区二区三区| 久久婷婷六月| 爆乳熟妇一区二区三区| 嫩草影院在线观看精品视频| 亚洲日本中文综合在线| 蜜桃视频一区二区| 亚洲91精品视频| 欧美成人手机在线观看网址| 超清无码熟妇人妻AV在线绿巨人| 亚洲天堂日韩av电影| 亚洲欧美成aⅴ人在线观看| 国产女人爽到高潮的免费视频 | 色综合热无码热国产| 18禁不卡免费网站| 国产主播在线一区| 日韩东京热无码人妻| 思思99思思久久最新精品| 久久美女精品| 一本色道久久88亚洲综合| 91人人妻人人做人人爽男同 | 黄色污网站在线观看| 精品久久久久成人码免费动漫| 日韩一区精品视频一区二区| 美女啪啪无遮挡| 亚洲无码视频图片| 国产精品xxx| 91福利免费视频| 在线精品自拍| 欧美成人免费一区在线播放| 国产三级韩国三级理| 久久婷婷色综合老司机| 亚洲国产精品人久久电影| 99视频全部免费| 在线国产91| 四虎永久免费地址| 青青青国产在线播放| 99人妻碰碰碰久久久久禁片| 综合亚洲网| 在线欧美一区| 欧美激情网址| 欧美激情视频在线观看一区| 色综合国产| 亚洲Va中文字幕久久一区| 日韩麻豆小视频| 就去吻亚洲精品国产欧美| 自拍偷拍一区| 久久精品国产精品国产一区| 国产成在线观看免费视频| 成人韩免费网站| 中文字幕 欧美日韩| 国产99久久亚洲综合精品西瓜tv| 国产尤物在线播放| 欧美精品成人| 久久这里只有精品2| 91在线高清视频| 中文字幕乱码二三区免费| 青青草国产一区二区三区| 97在线国产视频| 99热这里只有精品5| 亚洲91精品视频| 国产丝袜一区二区三区视频免下载| 2021国产在线视频| 国产91视频观看| 高h视频在线| 国产成人艳妇AA视频在线| 亚洲黄色视频在线观看一区| 一级做a爰片久久毛片毛片| 在线视频97| 69视频国产| 亚洲午夜国产精品无卡| 久久情精品国产品免费| 日韩精品免费在线视频| 国产福利免费观看| 色综合日本| 韩国自拍偷自拍亚洲精品| 国产美女免费| 一级毛片a女人刺激视频免费| 青草视频网站在线观看| 精品国产99久久|