999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Bi-LSTM+CRF模型的航母情報實體識別方法應用

2023-01-30 04:08:10許山山史涯晴
計算機時代 2023年1期
關鍵詞:實驗模型

許山山,史涯晴

(陸軍工程大學指揮控制工程學院,江蘇 南京 210007)

0 引言

互聯網快速發展,信息量劇增,開源情報分析面臨巨大挑戰和困難。自然語言處理的基礎任務之一是命名實體識別NER(Named Entity Recognition),從航母編隊信息中識別實體是基礎環節,也是較難的環節。首先,航母情報信息的結構化數據不多,來自百科和新聞網站的半結構化、非結構化數據不能直接利用;其次,航母編隊可利用的已標注的數據集幾乎沒有。另外,航母編隊信息中包含軍事領域的專業名詞和表述,如艦艇領導者信息、艦艇指揮機構信息、航母戰斗群的任務記錄、航母艦載機信息等,直接將通用領域實體識別方法應用到艦船情報分析領域效果不佳。為了解決上述問題,本文構建了航母編隊實體識別語料庫,采用基于Bi-LSTM+CRF 實體識別算法,實現航母編隊情報信息的實體識別,輔助情報分析人員進一步挖掘和分析相關情報信息奠定基礎。

1 航母信息實體識別

命名實體的研究主要分為三大類。①基于詞典和規則的方法[1]。如果獲取的樣本數據較少,利用這種方法能夠提高精度和執行效率,但是該方法過度依賴詞典規模及詞典覆蓋率,同時需要耗費巨大時間和精力生成規則[2]。②基于機器學習算法的方法[3-4]。常用的算法模型有條件隨機場CRF(Conditional Random Field)和支持向量機SVM(Support Vector Machine)等。③基于深度學習策略的方法[5-6]。通過大量數據支持,利用神經網絡訓練,生成基于向量嵌入的特征表示,進而實現特定領域的實體識別。

1.1 模型框架

Bi-LSTM+CRF 模型方法綜合應用特征模板和神經網絡,其中,Bi-LSTM 是常見的的循環神經網絡,能夠解決中文“詞”在中文句子中的遠距離依賴問題;CRF(Conditional Random Field)是指條件隨機場模型,是一種鑒別式機率模型,可以利用之前標注過的標簽。該模型由三部分組成:輸入層、編碼層和預測層[7],如圖1所示。輸入層作用是對中文字符或詞語進行編碼,將文本向量化表示。編碼層作用是提取文本序列的抽象特征,尤其是字符或詞語的上下文聯系。雙向LSTM 包括前向LSTM 和反向LSTM,比單向LSTM 挖掘文本序列的整體隱含特征更加全面。預測層作用是處理編碼層的輸出,結合上下文向量的特征,輸出最終識別結果。

圖1 Bi-LSTM+CRF模型

1.2 Bi-LSTM結構

LSTM 是一種基于RNN 的被廣泛使用模型,可以有效地解決順序標記問題[8]。LSTM 網絡引入門的策略解決反向傳播過程中的梯度消失等問題。圖2 是Bi-LSTM 的細胞單元結構示意圖[7]。在時刻t,xt是輸入向量,它是一個輸入字符的嵌入,ht-1是前一時刻的隱藏狀態,神經元權重W和偏差b是可訓練參數,Γf、Γu、Γo分別表示t時刻的遺忘門、記憶門、輸出門。表示t時刻的單元狀態、其中σ(x)=、tanh=。LSTM 細胞單元計算存儲單元Ct和ht的過程如下:遺忘門決定應該丟棄多少先前的信息,0 表示全部丟棄,1 表示全部保留;記憶門決定應該向單元存儲器中添加多少信息,使用tanh函數可以更新臨時單元的狀態信息;t時刻的每個隱藏狀態Ct和ht都由輸出門決定。圖2中每個門結構的作用及數學表達式如表1所示。

圖2 Bi-LSTM細胞單元結構

表1 Bi-LSTM細胞單元結構數學表達式及門結構功能

1.3 CRF結構

由于不同文本屬于各個標簽結果的概率值計算相互獨立,CRF 解決局部標簽和上下文信息不會被歸一化函數計算的問題,通過融合相關標簽數據,將附近標簽的相關性納入計算范圍,實現較為準確的標注。

CRF 可以看作是一個線性鏈,給定一個詞序列,如下:

CRF 標記在w中的每個符號,并輸出相應的標記序列,如下:

定義一組K 個特征函數f(ti-1,ti,w,i),K 是特征函數的個數,如下:

i 是一個符號在句子w中的位置,yi是當前符號的標簽,yi-1是前一個符號的標簽,如果滿足特征函數的條件,則輸出為1,否則為0。利用特征函數對候選序列進行評分,最終得分是所有特征函數給出的得分之和:

根據得分,選擇最可能的序列作為輸出序列,即最大概率序列。借助于歸一化因子Z,獲得每個候選序列的概率。因此,條件概率P(t|w)計算如下:

通過學習,獲得最佳的權重λ,得到最佳的CRF,而CRF作為模型的輸出層,生成文本的序列標注結果。

2 實驗數據

2.1 數據集

針對航母實體識別分析研究,本文使用的航母編隊的專項領域BIO 標注集的原始數據來自百度百科[9],軍事特定領域文本標注數據集中命名實體的類型共有四種:人名PER(Person)、地名LOC(Location)、機構名ORG(Organization)和裝備EQU(Equipment),非命名實體組成部分記為O。利用BIO 三元集的標注方法進行標注,B-PER:人名(開頭),I-PER:人名(非開頭),B-LOC:地點(開頭),I-LOC地點(非開頭),BORG:組織機構(開頭),I-ORG:組織機構(非開頭),B-EQU:裝備(開頭),I-EQU:裝備(非開頭)。本文通過改造通用領域BIO 標注集,構建的航母編隊專項領域BIO 標注集的數據規模,通用領域Train_data 數據集2220533 字符,Test_data 數據集177231 字符,航母編隊專項領域數據集Train_data 和Test_data 數據集108969字符。

2.2 實驗評價標注與參數設置

對于航母實體識別模型的識別效果,本文采用命名實體識別的通用測試指標正確率、召回率和F1值,定義如下:

Bi-LSTM+CRF訓練模型的重要參數,如表2所示。

表2 訓練模型重要參數表

3 實驗

3.1 實驗設計

為了驗證Bi-LSTM-CRF 方法對航母信息實體的識別能力,本文進行兩類實驗:實驗類型Ⅰ:Bi-LSTM+CRF 識別效果檢測;實驗類型Ⅱ:通用數據集和專用數據集實體識別對比。

3.2 實驗結果分析

3.2.1 實驗一:Bi-LSTM-CRF識別效果檢測

圖3所示為模型訓練的總體情況,圖4至圖7分別所示EQU、LOC、ORG 及PER 四個類別的實體識別正確率(precision)、召回率(recall)和F1 值隨迭代次數(epoch)變化的曲線。根據曲線圖可以看出,在經過32 輪(epoch)迭代之后,正確率(precision)、召回率(recall)和F1 值都相對穩定在90%左右。對武器裝備類(EQU)實體的識別效果最好,達到95%以上;對人名(PER)實體的識別效果最差,僅85%左右。

圖3 ALL結果圖

圖4 EQU結果

圖5 LOC結果

圖6 ORG結果

圖7 PER結果

3.2.2 實驗二:通用數據集和專用數據集實體識別對比

為了驗證Bi-LSTM+CRF 模型對航母情報的實體識別效果,本文訓練了兩個Bi-LSTM+CRF 模型。模型Ⅰ的訓練數據為通用領域的BIO 標注集,在此基礎上通過改造,形成模型Ⅱ的通用領域的BIO 標注集+航母編隊的專項領域BIO標注集。這兩個模型識別出的實體數和識別正確的實體數,模型Ⅰ標注實體總數9977,返回實體總數9879,識別正確總數6665,模型Ⅱ標注實體總數9977,返回實體總數9760,識別正確總數9090。這兩個模型對于總體和分類別的實體識別正確率(precision)、召回率(recall)、F1 值和返回的實體數(found)的結果如表3所示。

表3 不同模型針對不同類別實體識別結果

通過表3 中數據對比,可得出以下結論:①在模型Ⅱ中,非實體被識別為實體和實體名稱識別不全的數量比模型Ⅰ有所減少;②在模型Ⅱ中,將實體類別識別錯誤的數量比模型Ⅰ少;③在模型Ⅱ中,沒有識別出B 標簽的情況比模型Ⅰ少;④在模型Ⅱ中,正確識別的實體數目明顯多于模型Ⅰ識別出的數目,特別是與航母密切相關的武器裝備類(EQU)實體。綜合以上實驗分析和結論,Bi-LSTM+CRF 航母實體識別模型的性能達到了預期目標。

4 結束語

基于改造的BIO 標注集,構建了航母情報信息中文實體識別語料庫,通過BI-LSTM+CRF 模型算法訓練出航母實體識別模型,實現了對航母情報信息的有效實體識別。實驗證明,Bi-LSTM+CRF 航母實體識別模型的性能可以達到預期目標,本研究有效提高了航母編隊情報信息領域命名實體識別的效率和正確率。在未來的研究中,將考慮實體間的關系抽取,為進一步實現提高航母情報分析能力和效率奠定堅實基礎。

猜你喜歡
實驗模型
一半模型
記一次有趣的實驗
微型實驗里看“燃燒”
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
做個怪怪長實驗
3D打印中的模型分割與打包
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 精品人妻一区无码视频| 在线观看国产小视频| 亚洲第一黄片大全| 欧美19综合中文字幕| 青青青国产免费线在| 毛片免费在线| 国产网友愉拍精品| 亚洲精品动漫| 日本高清免费不卡视频| 免费无码网站| 黄色网址免费在线| 欧美国产日产一区二区| 亚洲A∨无码精品午夜在线观看| 无码免费的亚洲视频| 午夜国产不卡在线观看视频| 91高清在线视频| 91无码人妻精品一区二区蜜桃| 亚洲精品国产综合99久久夜夜嗨| 国产精品主播| 国产精品视频a| 91精选国产大片| 孕妇高潮太爽了在线观看免费| 国产成人精品高清不卡在线| 国产AV无码专区亚洲精品网站| 亚洲水蜜桃久久综合网站| 成人年鲁鲁在线观看视频| 精品自窥自偷在线看| 国产精品19p| 日本91在线| 精品国产一二三区| 中文无码日韩精品| 成人在线天堂| 伊人婷婷色香五月综合缴缴情| 国产黄在线免费观看| 午夜性刺激在线观看免费| 99精品视频九九精品| 色亚洲激情综合精品无码视频 | 少妇精品久久久一区二区三区| 欧美日本视频在线观看| 欧美精品1区| 免费在线成人网| 精品国产Av电影无码久久久| 噜噜噜久久| 国产免费羞羞视频| 91精品国产一区自在线拍| 亚洲欧美极品| 国产制服丝袜91在线| 真实国产乱子伦高清| 亚洲熟妇AV日韩熟妇在线| 国产在线视频欧美亚综合| 小说 亚洲 无码 精品| 久久99热66这里只有精品一 | 综合色区亚洲熟妇在线| 久久综合久久鬼| 成年人久久黄色网站| 高清视频一区| 女人18毛片一级毛片在线| 亚洲美女久久| 亚洲精品国产自在现线最新| 欧美在线黄| 久久精品娱乐亚洲领先| 亚洲精品国产综合99| 国产激爽大片高清在线观看| 国产国拍精品视频免费看| 国产激爽大片高清在线观看| 亚洲a级在线观看| 午夜天堂视频| 深夜福利视频一区二区| 99人妻碰碰碰久久久久禁片| 国产一区在线观看无码| a色毛片免费视频| 欧洲在线免费视频| 91亚洲视频下载| 伊人色综合久久天天| 国产女主播一区| 久爱午夜精品免费视频| 青青青国产精品国产精品美女| 国产激情第一页| 成人一级黄色毛片| 国产亚洲欧美在线中文bt天堂 | 日本a级免费| 一级毛片免费播放视频|