999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的軍事知識演化技術研究*

2019-07-08 01:54:22
艦船電子工程 2019年6期
關鍵詞:關聯語義

(海軍駐大連地區第一軍事代表室 大連 116000)

1 引言

2012年,谷歌官方博客發布了谷歌知識圖譜(Google knowledge graph)智能化搜索功能。知識圖譜旨在描述真實世界中存在的各種實體或者概念,每個實體或者概念可以用一個全局唯一確定的標識符來標識;每個屬性-值對用來刻畫實體的內在特征;關系則用來連接兩個實體,刻畫它們之間的關聯。知識圖譜則可被看做是一張巨大的圖,圖中的節點表示實體或概念,圖中的邊由屬性或關系構成[1]。與谷歌知識圖譜搜索類似,微軟在必應(Bing)的基礎上提供了Satori,社交網絡Facebook也推出了類似的基于知識圖譜的搜索功能。與此同時,國內著名的搜索引擎也相繼推出了類似的產品,例如百度的實體搜索通過查詢詞直接觸發得出相關的實體推薦,搜狗的知立方則側重于基于圖搜索知識索引的邏輯推理計算[2]。

目前知識圖譜的成熟系統多來自于民用領域,主要來自于搜索引擎公司或者大型互聯網平臺企業,然而對于軍事指揮,軍事情報分析等特殊領域,軍用知識圖譜的構建工作則發展相對緩慢,一方面受限于軍事百科知識庫資源以及專業軍事領域的海量用戶檢索日志等信息資源的相對匱乏,導致知識學習過程中的樣本資源不足,另一方面也源于在面向特殊領域知識圖譜演化技術有待突破。

軍事大數據環境下不僅數據的規模大,而且數據更新頻繁,傳統基于線下處理的方式很難獲得時效性的數據,難以滿足面向作戰的軍事知識圖譜的時效性信息需求。另一方面,互聯網上的數據常常以不同的模態存儲于不同的站點,比如事件相關的百科信息和視頻信息通常來源于不同的垂直站點。為了獲取及時更新的大規模數據資源,不僅需要挖掘多源、動態、異質、碎片化知識,更需要以一種在線學習的方式動態地融合不同來源、不同模態和不同結構的知識,因此,本文對基于知識圖譜的軍事知識演化技術進行研究,以支持用戶即時的精準化信息需求。

2 知識演化技術

2.1 信息抽取技術

戰場軍事信息呈指數級地增長,如何對這些多源異構的數據進行有效地組織管理及利用成為一個亟需解決的問題。自動數據分類技術就是一個解決該問題的有效技術手段。面對軍事知識圖譜不斷增加的新數據,傳統的對全部數據進行學習的方法將會耗費大量的時空資源。在線學習作為一種增量的機器學習技術,在對數據的更新上比傳統方法更加靈活、輕量和高效[3]。本文采用在線學習技術對動態化的軍事知識抽取結果進行分類。面對軍事大數據知識處理需求,知識分類模型需要解決以下優化問題:1)目前對樣本權值計算方法都是在基于確定樣本批量學習模式下設計的。將這些方案直接推廣到在線學習無疑會產生許多問題,如何設計魯棒而高效的在線加權方法[4];2)網絡更新速度快,就要求在線學習算法擁有低時間復雜度和快速的收斂率[5]。此外在線學習和傳統的數據分類方法要求訓練數據與測試數據的同分布,這就使得僅通過在線學習分類的應用受到限制[6~7]。遷移學習作為一種新的學習機制,放松了數據分布相同的要求,能夠從相關領域發掘對目標領域有用的知識,進而幫助完成目標任務[8~12]。

2.2 語義特征關聯方法

獲取軍事知識圖譜知識單元的復雜關聯語義鏈網絡的主要目的之一,就是希望以此為“情景”載體,對軍事知識圖譜知識單元演化機理進行研究。對復雜關聯語義鏈網絡統計與語義特征的研究,是全面了解與深入分析軍事大數據知識體系演化過程的切入點;其可為軍事知識體系演化機理的定量分析提供最原始的變量。進而,還要對復雜關聯語義鏈網絡所呈現出的統計與語義特征的關聯機制進行分析;以期能發現復雜關聯語義鏈網絡的統計特征及其與語義特征的關聯函數,為面向作戰的軍事大數據知識體系演化技術提供理論支撐。

3 軍事知識圖譜演化技術研究方案

軍事知識圖譜演化技術采用關聯語義鏈網絡,通過語義互聯將松散的不斷更新的軍事知識有機融合的軍事知識圖譜中區,并且給予關聯語義進行語義鏈的構造。作為一個數據的組織模型,軍事知識圖譜演化技術框架如圖1所示。

圖1 軍事知識圖譜演化技術框架

軍事知識圖譜演化技術框架主要包含以下幾個部分:

1)軍事知識語義抽取模塊。該模塊主要負責抽取軍事信息網絡中不斷新增的多源異構軍事信息。和網絡爬蟲相類似,該模塊通過在線學習和遷移學習融合的信息抽取技術,收集關聯語義鏈網絡的相關知識信息,詳見4.1節。

2)語義表示模塊。該模塊主要負責將抽取到的軍事知識進行基于語義的表達,以使軍事知識富含語義,并且符合人類的認知表達方式。本文采用模糊認知圖(Fussy Cognitive Map,FCM)來對軍事知識進行語義表示。

3)規則挖掘模塊。該模塊主要用來挖掘關鍵詞之間的關聯關系,以挖掘出的關聯關系為基礎,來構建不同層面的關聯語義鏈網絡。

4)關聯語義鏈網絡生成模塊。該模塊是關聯語義鏈網絡的核心模塊,用來對抽取的軍事知識進行關聯語義鏈的構造。同時利用一些構造范式對原始關聯語義鏈網絡進行簡化等操作。使得關聯語義鏈網絡能夠更好地將新增的軍事知識融入軍事圖譜中現有的知識結構。

5)關聯語義鏈應用模塊。該模塊主要將構造好的關聯語義鏈網絡應用到實際的知識服務任務當中。并且按照用戶的認知機理與其進行交互。可以看做是關聯語義鏈網絡與軍事戰場環境的一個中間件模塊。

6)物理空間存儲模塊。該模塊主要起到數據存儲的作用。將抽取的軍事知識進行相應數據庫存儲,包括索引建立等。

3.1 軍事語義信息抽取方法

不斷更新的軍事知識經過基于主題模型的信息抽取和知識表示學習,從原先規模龐大的原始數據,已經轉化為稠密低維實值向量,但是不同來源的數據質量仍然參差不齊,需要清理低質、高噪聲數據,并且需要對抽取的碎片化數據進行結果判定,使復雜數據中的隱含規律更加突顯,找到真正有用的知識。傳統的人工知識構建方式和靜態知識獲取方法已經不能滿足需求,基于在線學習的知識抽取方法應運而生。在線學習方法的核心是利用新的帶標注訓練數據不斷更新現有分類器。由于在訓練過程中只需要訪問新的數據,使得在線學習的方法既能適用于不斷更新的數據又能保證學習效率。本文在融合基于主題模型的信息抽取和知識表示學習基礎上,圍繞如何在已有知識框架的引導下,結合表示學習向量化結果,從多源、動態、異構、高噪聲的大數據環境中,采用在線學習獲取碎片化知識并對動態化知識進行抽取結果分類。

但是,在線學習過程要求測試數據和用于訓練模型的樣本數據獨立同分布,這一定程度上限制了在線學習對不斷更新的數據的學習效率。通過將遷移學習對數據分布的寬松性引入到在線學習中,有效地提升了軍事知識圖譜對新增的軍事信息的抽取效率。

3.1.1 在線學習機制

圖2 信息抽取在線學習框架

在線學習的應用場景為樣本序列學習。數據基礎是逐漸產生的新的訓練數據和之前訓練數據所學到的最優解(決策模型)。最終結果是隨著對數據的不斷訪問而逐步逼近的某個最優解(決策模型)。其基本框架可以描述為:每輪中,在線學習機都被詢問一個問題并要予以作答,例如學習機接收到一個向量表示的實體或者三元組信息,問題是實體或者三元組是否為知識?為此,學習機需要應用預測模型將問題集映射為答案集。例如,我們可以將其映射為輸入x(實體或者三元組的向量表示),輸出y(是否為知識)的形式。在給出預測答案后,學習機將得到問題的正確答案。這時學習機回答的精確性則由衡量預測答案與真實值間差異的損失函數評估。學習機的最終目標是最小化每輪中累積的損失函數值。因此,每輪中學習機選擇更新預測機制以求在之后的過程中做出更精確的預測。本文對軍事知識信息抽取所采用的在線學習框架如圖2表示。

在線學習框架主要分為三個模塊:

1)預測模塊

預測機制的輸入為樣本數據序列X,輸出為預測結果Y。預測機制的主要功能是根據輸入樣本x,產生對應的預測值y(x)。

2)評估模塊

評估模塊的輸入為預測模塊的預測結果Y和真實結果Y^,輸出為損失函數評估值。損失函數的主要功能是衡量預測模塊做出不正確判斷時,所遭受的損失。y(x)與y^(x)的差距越大,損失越大。

3)更新模塊

更新模塊的輸入為損失函數的評估值,輸出為更新策略或數據請求信號。更新模塊首先通過觸發更新條件判斷是否要對預測機制進行更新,若需要,則通過更新預測機制產生合適的更新策略對預測機制進行更新,之后請求下一樣本數據。否則,直接請求下一樣本數據。依次循環,直到找到最優的預測機制。

3.1.2 遷移學習機制

正如前文所述的,將遷移學習融入到在線學習信息抽取的目的是,利用輔助訓練數據去幫助源訓練數據來構建一個更可靠的分類模型,使得這個模型在測試數據上的分類準確度盡可能地高。本文是從輔助訓練數據中找出那些適合測試數據的實例,并將這些實例遷移到源訓練數據的學習中去。采用AdaBoost的改進算法,Transfer AdaBoost算法(簡稱TrAdaBoost算法)解決該問題[4]。

TrAdaBoost算法的關鍵思想是利用Boosting的技術過濾掉源領域數據中那些與目標領域中少量有標簽樣本最不像的樣本數據。傳統的AdaBoost的基本思想是,當一個訓練樣本被誤分類后,它認為這是一個比較難的訓練樣本。于是,AdaBoost增加這個訓練樣本的權重,用來強調這個樣本。下一次分類訓練的時候,這個樣本被分錯的概率就會減小。在AdaBoost推廣版本TrAdaBoost中,AdaBoost仍然被應用在源訓練數據集上。但是,對于輔助訓練數據,當它們被誤分類后,我們認為這些數據是和目標數據很不同的,因此,我們減小這些數據的權重以降低它們在分類訓練中的影響。這就相當于建立了一種自動調整權重機制,于是重要的源領域樣本數據權重增加,誤分類的輔助訓練數據權重減小。這一降低權重的操作是根據Hedge(β)來設計的?;舅枷牒退惴C制分別如圖3、4所示。

圖3 TrAdaBoost基本思想

圖4 TrAdaBoost算法機制

從上述分析中不難看出,AdaBoost和TrAda-Boost的區別在于對輔助訓練數據的權重調整策略。一個嚴格的TrAdaBoost算法描述在算法1中給出。從中,我們可以看出,在每一輪迭代中,如果一個輔助訓練數據被誤分類,那么這個數據可能和源訓練數據是矛盾的。那么我們降低這個數據的權重,因此,在下一輪迭代中,被誤分類的訓練數據就會比上一輪少影響分類模型一些。于是,在若干輪迭代后,輔助訓練數據中符合源訓練數據的那些數據就會擁有更高的權重,而那些不符合源訓練數據的權重會降低。那些擁有更高權重的數據將會幫助源訓練數據訓練一個更好的分類模型。

算法1:TrAdaBoost算法

輸入:源領域樣本集:Da={(xa,ya)},目標領域樣本集Db={(xb,yb)},

合并的訓練樣本集D=Da∪Db,基本分類算法fb,最大迭代次數M

輸出:各個測試數據的分類結果和置信度

1:初始化權矢量 (ωa,ωb)

3:for t=1 to M do

4:調用fb,尋找最終分類器,使得合并訓練集D的誤差最小

5:利用Hedge(β)更新源矢量以減少錯誤分類樣本的權重

7:將合并訓練集D的權重歸一化

8:end for

3.2 軍事知識的語義特征關聯函數研究

語義特征函數可以通過關聯語義鏈網絡模型來表示。關聯語義鏈網絡是一個多層次的語義模型。多層次語義模型最底層為語義元素層。由于關聯語義鏈網絡模型的主要應用環境為大數據環境,因此首先我們介紹如何挖掘這些大數據的語義元素。

語義區分能力可以幫助我們挖掘出一個給定文本集合的關鍵詞,并且可以將這些關鍵詞集合進行相應的語義區分能力排序。我們可以認為那些具有較高語義區分能力的關鍵詞應當可以作為關聯語義鏈網絡模型中的語義元素。語義元素的挖掘流程如圖5所示。

圖5 關聯語義鏈網絡語義元素挖掘流程圖

從圖5我們可以看出,關聯語義鏈網絡語義元素的挖掘流程大致為

1)詞性標注。采用詞性標注的原因是去除那些不必要的廢詞,介詞等沒有實際意義的詞匯。詞性標注的目的是將文本集合中的名詞都保留下來,以此來作為文本集合的語義元素集合。

2)語義區分能力計算。將詞性標注節點保留的名詞,計算其語義區分能力,并按照語義區分能力進行排序。語義區分能力高的關鍵詞可以用來較好的描述文本集合。通過語義元素的挖掘,我們可以構造出文本空間中的關鍵詞集合,并按照這些關鍵詞的語義區分能力對其進行排序。

在提取了文本集合的語義元素之后,我們對語義節點進行相應的語義表示。由于關聯語義鏈網絡是基于關聯語義的模型,因此如何對語義節點進行富含語義的表示,并且有利于節點之間關聯語義鏈的構造,便是關鍵問題。原子模糊認知圖(Element Fuzzy Cognitive Map,E-FCM)是一個模糊認知圖(FCM),它的基本概念由關鍵詞(Keywords)來表示。

相較于語義元素的挖掘與語義節點的表示,語義規則的挖掘同樣重要。因為有了關鍵詞層次的語義規則,我們才能構造知識層次的關聯語義鏈網絡。同時,如何使語義規則具有關聯語義,符合人類的認知特點也是另外一個需要考慮的問題。我們利用關聯規則挖掘算法來挖掘語義元素之間的關聯語義規則。具體算法流程如圖6所示。

圖6 關聯語義規則挖掘流程圖

關聯語義鏈網絡模型的核心問題是如何構建知識之間的關聯關系,換句話說,就是如何建立語義節點之間的關聯語義鏈接。前面我們分別提取了語義元素,對語義節點進行了表示,并且挖掘出了語義元素之間的關聯語義關系。如何將關鍵詞之間的關聯語義關系擴展到語義節點層面,如何使得這種擴展在保證準確度的情況下又適合于軍事大數據環境,是需要考慮的兩個問題。圖7給出了語義節點之間的關聯語義鏈構造算法的示意圖。

從圖7中可以看出,由于語義節點已經由關鍵詞進行了語義的表示,因此建立兩個語義節點之間的關聯語義關系,等價于尋找它們所擁有的關鍵詞之間的關聯規則。圖7中語義節點P有三個關鍵詞,語義節點Q有四個關鍵詞。通過查詢規則庫,發現兩個語義節點之間存在三個關聯語義規則,因此語義節點P與語義節點Q的關聯語義鏈可以由這三個關聯語義規則的和得到。

圖7 語義節點之間的關聯語義鏈構造算法示意圖

4 結語

本文從復雜網絡統計特征和語義特征切入,研究了基于知識圖譜的軍事知識演化技術。研究主要包括:1)基于在線和遷移學習的信息抽取機制;2)復雜關系語義特征的關聯。給出了基于關聯語義鏈網絡的軍事知識圖譜演化研究方案和技術體系架構。但是,目前所作的工作還處于起步階段,演化模型的完備性的還需要更進一步的研究,以面對不斷更新的、復雜多變的軍事知識。

猜你喜歡
關聯語義
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
語言與語義
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
“深+N季”組配的認知語義分析
當代修辭學(2011年6期)2011-01-29 02:49:50
語言學與修辭學:關聯與互動
當代修辭學(2011年2期)2011-01-23 06:39:12
主站蜘蛛池模板: 亚洲精品国产精品乱码不卞| 天天摸天天操免费播放小视频| 久久久精品无码一区二区三区| 国产成人精品一区二区秒拍1o| 91色老久久精品偷偷蜜臀| 国产精品视屏| 中文字幕调教一区二区视频| 欧美视频二区| 欧美精品亚洲精品日韩专区| 国产素人在线| 中文字幕亚洲精品2页| 亚洲中文字幕久久无码精品A| 制服丝袜无码每日更新| 女人一级毛片| 国产成人亚洲欧美激情| 精品一区二区三区自慰喷水| 欧美性精品不卡在线观看| 久久久久夜色精品波多野结衣| 在线精品亚洲国产| 国产精品一区在线麻豆| 人妻无码一区二区视频| 91久草视频| 韩日无码在线不卡| 激情综合五月网| 波多野结衣二区| 91精品小视频| a欧美在线| 囯产av无码片毛片一级| 蜜桃视频一区| 妇女自拍偷自拍亚洲精品| 国产在线观看99| 成人在线不卡视频| 国产18在线| 偷拍久久网| 扒开粉嫩的小缝隙喷白浆视频| 免费无码网站| 亚洲a免费| 亚洲综合色婷婷| 免费A∨中文乱码专区| 99久久精品久久久久久婷婷| 国产玖玖视频| 免费午夜无码18禁无码影院| 在线日韩日本国产亚洲| 国产精品人成在线播放| 久久久久青草线综合超碰| 国产精品v欧美| a在线观看免费| 国产h视频在线观看视频| 久操线在视频在线观看| 中国一级特黄视频| 欧美第九页| 一级毛片高清| 国产小视频a在线观看| 亚卅精品无码久久毛片乌克兰| 99re热精品视频中文字幕不卡| 国产精品3p视频| 亚洲嫩模喷白浆| 国产伦精品一区二区三区视频优播| 精品国产美女福到在线不卡f| 丁香婷婷激情综合激情| 欧美区日韩区| 手机精品视频在线观看免费| 啪啪永久免费av| 亚洲精品777| 亚洲免费黄色网| 国产人人乐人人爱| 欧美a在线看| 国产亚卅精品无码| 亚洲乱码在线播放| 91丝袜乱伦| 青青草a国产免费观看| 无码啪啪精品天堂浪潮av| 久久一本日韩精品中文字幕屁孩| 亚洲AV永久无码精品古装片| 精品欧美日韩国产日漫一区不卡| 黄色片中文字幕| 特级aaaaaaaaa毛片免费视频| 福利一区在线| 日韩无码黄色| 亚洲Av综合日韩精品久久久| 国产在线第二页| 三上悠亚一区二区|