999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

作戰(zhàn)試驗(yàn)數(shù)據(jù)知識(shí)圖譜構(gòu)建方法研究

2022-05-18 11:05:56王小龍劉小朋王磊王宏
中國軍轉(zhuǎn)民 2022年3期

王小龍 劉小朋 王磊 王宏

摘要:為解決作戰(zhàn)試驗(yàn)信息化過程中出現(xiàn)的信息過載、知識(shí)搜索效率低下等問題,提出將知識(shí)圖譜應(yīng)用于作戰(zhàn)試驗(yàn)知識(shí)庫的構(gòu)建。利用作戰(zhàn)試驗(yàn)內(nèi)部數(shù)據(jù)源進(jìn)行關(guān)鍵信息的抽取,給出作戰(zhàn)試驗(yàn)知識(shí)圖譜的構(gòu)建流程;知識(shí)圖譜技術(shù)利用海量數(shù)據(jù)建立知識(shí)庫,可有效整合分散的數(shù)據(jù)信息,來提高作戰(zhàn)試驗(yàn)領(lǐng)域知識(shí)的利用率和使用價(jià)值,具有重要的軍事應(yīng)用前景。

關(guān)鍵詞:作戰(zhàn)試驗(yàn);知識(shí)圖譜;本體構(gòu)建

引言

目前作戰(zhàn)試驗(yàn)還存在很多問題需要解決,通過作戰(zhàn)試驗(yàn)采集、積累了大量的試驗(yàn)數(shù)據(jù),這些海量試驗(yàn)數(shù)據(jù)包括表格、文本文件、音視頻、運(yùn)動(dòng)軌跡等各種類型數(shù)據(jù),其以原始數(shù)據(jù)的形式存儲(chǔ)起來,沒有進(jìn)行有規(guī)劃地存儲(chǔ)和處理,使數(shù)據(jù)不能成為可以利用的數(shù)據(jù)資源。當(dāng)面對海量試驗(yàn)數(shù)據(jù)時(shí),相關(guān)業(yè)務(wù)人員無法從中獲取有用知識(shí),也無法依據(jù)數(shù)據(jù)進(jìn)行更精準(zhǔn)的分析決策。導(dǎo)致價(jià)值信息繼續(xù)沉睡的首要問題是,在海量數(shù)據(jù)中人們還不能找到其關(guān)鍵知識(shí)及相互關(guān)系,導(dǎo)致數(shù)據(jù)挖掘無從下手。

知識(shí)圖譜(knowledge graph)提供一種可以從海量文本數(shù)據(jù)中抽取結(jié)構(gòu)化知識(shí)手段,從而成為數(shù)據(jù)分析關(guān)鍵技術(shù),目前在各個(gè)領(lǐng)域均有廣泛應(yīng)用,因此,將知識(shí)圖譜技術(shù)引入到作戰(zhàn)試驗(yàn)領(lǐng)域是解決目前無法從大量維度的數(shù)據(jù)中獲取關(guān)鍵知識(shí)的創(chuàng)新思路。本文將從作戰(zhàn)試驗(yàn)數(shù)據(jù)知識(shí)圖譜構(gòu)建方法開展研究,充分利用現(xiàn)有已采集數(shù)據(jù)資源進(jìn)行知識(shí)圖譜構(gòu)建,并分析其在作戰(zhàn)試驗(yàn)領(lǐng)域的應(yīng)用。

1 知識(shí)圖譜的定義與架構(gòu)

1.1 本體的概念

隨著知識(shí)圖譜技術(shù)的不斷發(fā)展,本體建模技術(shù)已應(yīng)用于眾多領(lǐng)域,準(zhǔn)確地建立本體模型有助于領(lǐng)域知識(shí)的存儲(chǔ)、表達(dá)和管理。由于軍事領(lǐng)域的特殊性,其知識(shí)體系復(fù)雜,要實(shí)現(xiàn)本體模型與領(lǐng)域之間表達(dá)一致,機(jī)器與軍事指揮技術(shù)人員之間理解一致,必須為知識(shí)體系構(gòu)建準(zhǔn)確、專業(yè)的本體。本體定義其中較著名的是由Gruber等人提出的:“本體是概念化的明確的規(guī)范說明”。

對于本體的形式化定義,得到廣泛認(rèn)可的是Gruber 在1995年提出的本體形式化五元組:

{C,R,HR,Rel,A}(2.1)

其中,C代表本體的概念,R代表本體關(guān)系的集合,HR代表概念間的層次關(guān)系,Rel表示概念間的非層次關(guān)系,A為公理。

結(jié)合作戰(zhàn)試驗(yàn)知識(shí)的自身特點(diǎn)以及未來知識(shí)體系、知識(shí)庫的擴(kuò)展和進(jìn)化需求,在本研究中,采用如下形式定義本體模型:

O={C,A,R,X,TI}(2.2)

即一個(gè)本體模型O包括了如下5個(gè)方面:C(Concept)表示本體中的概念,A(Attribute)表示概念及其實(shí)例的屬性的集合,R(Relation)表示概念間的關(guān)系集合,X(Axiom)表示本體的公理與規(guī)則集合,TI(TypicalInstance)表示本體的典型實(shí)例集合。

其中,概念集合C結(jié)合知識(shí)結(jié)構(gòu)與元素與頂層概念模型產(chǎn)生;關(guān)系集合R分為分類關(guān)系Rt和依賴關(guān)系Rd兩大類,分類關(guān)系如繼承關(guān)系(is-a、kind-of)和整體部分關(guān)系(part-of)等,依賴關(guān)系表示概念間存在的其他語義關(guān)系。

采用這種定義的優(yōu)勢在于,強(qiáng)化了“本體-屬性-關(guān)系”這種常用于表現(xiàn)事物和事件的整體邏輯關(guān)系,將關(guān)系、屬性和規(guī)則公理劃分為獨(dú)立的方面,使得本體模型中的定義更加模塊化,利于實(shí)際工程化構(gòu)建本體模型。

1.2 知識(shí)圖譜的概念

知識(shí)圖譜是結(jié)構(gòu)化的語義知識(shí)庫,用于以符號(hào)形式描述物理世界中的概念及其相互關(guān)系。知識(shí)圖譜從邏輯上可以劃分為2個(gè)層次:數(shù)據(jù)層和模式層。在知識(shí)圖譜的數(shù)據(jù)層,知識(shí)以事實(shí)為單位存儲(chǔ)在圖數(shù)據(jù)庫中。圖數(shù)據(jù)中主要有“實(shí)體-關(guān)系-實(shí)體”或者“實(shí)體-屬性-屬性值”兩種三元組,所有數(shù)據(jù)構(gòu)成龐大的實(shí)體關(guān)系網(wǎng)絡(luò)。模式層在數(shù)據(jù)層之上,是知識(shí)圖譜的核心。模式層存儲(chǔ)的是經(jīng)過提煉的知識(shí),通常采用本體庫來管理知識(shí)圖譜的模式層。

知識(shí)圖譜的構(gòu)建過程是從原始數(shù)據(jù)出發(fā),采用一系列自動(dòng)或半自動(dòng)的技術(shù)手段,從原始數(shù)據(jù)中提取出知識(shí)要素,并將其存入知識(shí)庫的數(shù)據(jù)層和模式層的過程。這是一個(gè)迭代更新的過程,每一輪迭代包含3個(gè)階段:信息抽取、知識(shí)融合以及知識(shí)加工。目前,在這三個(gè)階段的方法研究中,有大量的自然語言智能處理算法,可以支撐信息抽取、知識(shí)融合以及知識(shí)加工。

2 作戰(zhàn)試驗(yàn)知識(shí)領(lǐng)域構(gòu)建方法

圍繞作戰(zhàn)試驗(yàn)知識(shí),按照知識(shí)體系構(gòu)建范圍,可將知識(shí)劃分形成6大知識(shí)板塊,分別是:軍事概念知識(shí)、武器裝備知識(shí)、戰(zhàn)場環(huán)境知識(shí)、作戰(zhàn)運(yùn)用知識(shí)以及試驗(yàn)評估分析知識(shí)。作戰(zhàn)試驗(yàn)知識(shí)結(jié)構(gòu)與要素構(gòu)建,主要是梳理構(gòu)建每個(gè)劃分領(lǐng)域的知識(shí)要素、要素層級(jí)以及要素關(guān)系,最終形成該領(lǐng)域的知識(shí)結(jié)構(gòu),為后續(xù)的概念模型、本體模型設(shè)計(jì)提供專業(yè)化、系統(tǒng)化的基礎(chǔ)知識(shí)。如表1所示。

以試驗(yàn)評估要素為例,試驗(yàn)評估知識(shí)結(jié)構(gòu)與要素主要圍繞試驗(yàn)、評估與研討分析及相關(guān)業(yè)務(wù)展開,其中,試驗(yàn)評估分析知識(shí)包括4個(gè)方面的核心要素:仿真試驗(yàn)、實(shí)裝試驗(yàn)、作戰(zhàn)評估以及試驗(yàn)分析。每一點(diǎn)核心要素下又細(xì)分為多個(gè)子要素。這些要素之間有些相互關(guān)聯(lián),具備一些遞進(jìn)、包含關(guān)系,詳細(xì)結(jié)構(gòu)與要素如表2所示。

又如武器裝備知識(shí)結(jié)構(gòu)與要素主要圍繞武器裝備分類體系、描述模型展開,形成的知識(shí)結(jié)構(gòu)與要素,其中,武器裝備知識(shí)包括7個(gè)方面的核心要素:裝備分類體系、裝備屬性與能力、裝備戰(zhàn)技指標(biāo)、裝備作戰(zhàn)效能、裝備使用保障要求、裝備編配關(guān)系以及裝備演化關(guān)系。每一點(diǎn)核心要素下又細(xì)分為多個(gè)子要素。這些要素之間有些相互關(guān)聯(lián),具備一些遞進(jìn)、包含關(guān)系,詳細(xì)結(jié)構(gòu)與要素如表3所示。

3 武器裝備領(lǐng)域本體模型設(shè)計(jì)

通過對武器裝備知識(shí)結(jié)構(gòu)與要素進(jìn)行概念分析,可以發(fā)現(xiàn),武器裝備知識(shí)領(lǐng)域中,存在如下本體概念:武器裝備、裝備能力、裝備戰(zhàn)技指標(biāo)、裝備保障環(huán)境、裝備保障崗位以及裝備使用崗位。其中,武器裝備、裝備能力、裝備戰(zhàn)技指標(biāo)是裝備領(lǐng)域主要的本體,裝備保障環(huán)境、裝備保障崗位以及裝備使用崗位是和組織編制領(lǐng)域、戰(zhàn)場環(huán)境領(lǐng)域交疊的本體。

下面將以履帶自行榴彈炮為子類本體模型舉例:

定義:履帶自行榴彈炮本體模型

O<履帶自行榴彈炮>={ C<履帶自行榴彈炮>,A<履帶自行榴彈炮>,

R<履帶自行榴彈炮>,X<履帶自行榴彈炮>,TI<履帶自行榴彈炮>}

其中,各元素詳細(xì)定義如下:

① 概念 C<履帶自行榴彈炮>:自行榴彈炮的一種,采用履帶式機(jī)動(dòng)方式。

②屬性 A<履帶自行榴彈炮>:

③ 關(guān)系 R<履帶自行榴彈炮>:

④ 公理規(guī)則 X<履帶自行榴彈炮>:暫無

⑤典型實(shí)例TI<履帶自行榴彈炮>:【155mm自行榴彈炮】等

4 知識(shí)庫結(jié)構(gòu)設(shè)計(jì)

在邏輯上,通常將知識(shí)庫劃分為兩個(gè)層次:數(shù)據(jù)層和模式層,也可稱為實(shí)體庫和本體庫。

數(shù)據(jù)層:數(shù)據(jù)層主要是由一系列的事實(shí)組成,而知識(shí)將以事實(shí)為單位進(jìn)行存儲(chǔ),通常通過(頭實(shí)體,關(guān)系,尾實(shí)體),(實(shí)體,屬性,屬性值)這樣的三元組來表達(dá)事實(shí)。

模式層:在數(shù)據(jù)層之上,是知識(shí)庫的核心,存儲(chǔ)經(jīng)過提煉的知識(shí),通常通過本體模型來構(gòu)建這一層(本體模型可以理解為面向?qū)ο罄锏摹邦悺边@樣一個(gè)概念,本體模型形成的本體庫就儲(chǔ)存著知識(shí)庫的類)。例如:

模式層:實(shí)體-關(guān)系-實(shí)體,實(shí)體-屬性-性值;

數(shù)據(jù)層:斯特賴克步兵營-配備-M1127裝甲偵察車 M1127裝甲偵察車-最大公路行駛速度-100km/h。

4.1知識(shí)庫構(gòu)建技術(shù)路線

從原始的領(lǐng)域數(shù)據(jù)到形成知識(shí)庫,必須經(jīng)過數(shù)據(jù)整合與處理、知識(shí)抽取、知識(shí)融合、知識(shí)加工等步驟。

對于領(lǐng)域內(nèi)的結(jié)構(gòu)化、非結(jié)構(gòu)化以及半結(jié)構(gòu)化數(shù)據(jù),通過一系列自動(dòng)化或半自動(dòng)化的技術(shù)手段,利用對應(yīng)工具進(jìn)行數(shù)據(jù)整合與處理。然后根據(jù)建立的本體模型以及相應(yīng)的智能模型庫,從整合后的數(shù)據(jù)中提取知識(shí),包括提取實(shí)體、屬性和關(guān)系。接著將對提取到的知識(shí)進(jìn)行知識(shí)融合,將提取的知識(shí)與知識(shí)庫進(jìn)行匹配融合,形成可以入庫的知識(shí)。然后對可以入庫的知識(shí)進(jìn)行加工,從中發(fā)現(xiàn)新的本體、推理新的知識(shí)以及校驗(yàn)評估知識(shí)的質(zhì)量。完成加工后,即可將知識(shí)入庫存儲(chǔ)。

4.2知識(shí)庫構(gòu)建流程

構(gòu)建知識(shí)庫是一個(gè)迭代更新的過程,根據(jù)知識(shí)獲取的邏輯,每一輪迭代包含知識(shí)抽取、知識(shí)融合和知識(shí)加工三個(gè)階段:

4.2.1知識(shí)抽取

領(lǐng)域知識(shí)提取是領(lǐng)域知識(shí)圖譜構(gòu)建過程中最核心的一環(huán),是后續(xù)圍繞領(lǐng)域知識(shí)圖譜開展應(yīng)用研究的重要基礎(chǔ),能夠有效提取領(lǐng)域知識(shí)直接關(guān)系到最終系統(tǒng)應(yīng)用的效果。領(lǐng)域知識(shí)提取主要包含:實(shí)體抽取、關(guān)系抽取和屬性抽取。

4.2.1.1實(shí)體抽取

實(shí)體是知識(shí)圖譜中的基本單元,實(shí)體抽取是指從文本數(shù)據(jù)集中自動(dòng)識(shí)別出命名實(shí)體,是自然語言處理中的一個(gè)經(jīng)典問題,其目的就是從一段自然語言文本中找出相關(guān)實(shí)體,并標(biāo)注出其位置以及類型。在軍事領(lǐng)域中,命名實(shí)體識(shí)別的作用是識(shí)別出領(lǐng)域內(nèi)各種非結(jié)構(gòu)化文檔中的軍事相關(guān)實(shí)體,具體包括基本軍事概念、作戰(zhàn)運(yùn)用、組織編制、作戰(zhàn)能力、武器裝備、作戰(zhàn)評估、教育訓(xùn)練、戰(zhàn)場環(huán)境、試驗(yàn)評估等多類實(shí)體。比如在下面一段文本中,通過實(shí)體抽取我們可以從其中抽取出實(shí)體——“斯特賴克旅”“旅部”“旅部連”“斯特賴克步兵營”“旅保障營”和“步兵連”,其類型都為組織架構(gòu)。

“斯特賴克旅下轄旅部及旅部連,3個(gè)斯特賴克步兵營和一個(gè)旅保障營,斯特賴克步兵營由三個(gè)相同編制的步兵連組成,是該旅的作戰(zhàn)主體,保障營向作戰(zhàn)營提供伴隨保障,向全旅部隊(duì)提供后勤與維修保障。”

實(shí)體識(shí)別包括預(yù)處理階段、特征向量的選取、模型訓(xùn)練、結(jié)果評估和模型改進(jìn)五個(gè)階段:

①處理。包括空格處理、字符大小轉(zhuǎn)換、復(fù)雜數(shù)據(jù)結(jié)構(gòu)的解析和格式轉(zhuǎn)換、上下文異構(gòu)的消除等。

②特征向量是指能夠識(shí)別實(shí)體的屬性集合。特征向量的選取方法包括領(lǐng)域?qū)<沂止ぶ付ê蜋C(jī)器學(xué)習(xí)方法等。

③對于處理好的數(shù)據(jù)作為輸入,構(gòu)造訓(xùn)練集,進(jìn)行模型的訓(xùn)練,以便能夠?qū)?shí)體進(jìn)行識(shí)別。

④對于提取出的實(shí)體的結(jié)果,主要根據(jù)兩個(gè)評價(jià)指標(biāo)衡量實(shí)體識(shí)別模型的性能:召回率和準(zhǔn)確率。召回率(REC)等于系統(tǒng)正確識(shí)別的結(jié)果占所有可能正確結(jié)果的比例;準(zhǔn)確率(PRE)等于系統(tǒng)正確識(shí)別的結(jié)果占所有識(shí)別結(jié)果的比例。為了綜合評價(jià)系統(tǒng)的性能,通常還計(jì)算召回率和準(zhǔn)確率的加權(quán)幾何平均值,即F指數(shù),計(jì)算公式如下:

其中,β是召回率和準(zhǔn)確率的相對權(quán)重。β等于1時(shí),二者同樣重要;β大于1時(shí),準(zhǔn)確率更重要一些;β小于1時(shí),召回率更重要一些。

⑤根據(jù)實(shí)體識(shí)別結(jié)果的評估,如果存在指標(biāo)過低的情況,需要對模型進(jìn)行改進(jìn)。

4.2.1.2關(guān)系抽取

實(shí)體之間的關(guān)系是知識(shí)圖譜中不可或缺的部分,不同的關(guān)系將獨(dú)立的實(shí)體連接在一起編織成知識(shí)圖譜。如何從非結(jié)構(gòu)化的數(shù)據(jù)中識(shí)別出實(shí)體之間的關(guān)系是知識(shí)圖譜構(gòu)建的核心任務(wù)之一。軍事領(lǐng)域?qū)嶓w關(guān)系抽取的主要目的在于通過各種關(guān)系抽取模型和技術(shù)手段將非結(jié)構(gòu)化文檔中的各類軍事相關(guān)實(shí)體之間的關(guān)系抽取出來,諸如,組織架構(gòu)和武器裝備之間的配備關(guān)系,武器裝備之間的配套關(guān)系,組織架構(gòu)之間的隸屬關(guān)系,武器裝備與軍事環(huán)境之間的適用關(guān)系。通過關(guān)系抽取技術(shù),將彼此孤立的各類軍事相關(guān)實(shí)體相互連接起來形成軍事領(lǐng)域知識(shí)圖譜,為之后的智能問答,知識(shí)推理,知識(shí)推薦,智能決策輔助等應(yīng)用提供重要的知識(shí)支撐。

關(guān)系抽取任務(wù)被廣泛應(yīng)用于數(shù)據(jù)簡化和構(gòu)建知識(shí)圖譜中。在上階段正確識(shí)別實(shí)體的基礎(chǔ)上,抽取它們之間的關(guān)系就是亟待解決的重要問題。該任務(wù)的定義是,給定標(biāo)注了兩個(gè)實(shí)體的句子,返回兩個(gè)實(shí)體之間的語義關(guān)系。比如,給定句子“斯特賴克輪式裝甲車是美國陸軍最新一代主戰(zhàn)裝備,也是陸軍部隊(duì)轉(zhuǎn)型的重要標(biāo)志。”,其中,“斯特賴克輪式裝甲車”代表武器裝備實(shí)體,“美國陸軍”代表組織架構(gòu)實(shí)體,返回關(guān)系“武器裝備-配備給-組織架構(gòu)”。關(guān)系抽取任務(wù)得到的結(jié)果常用于問答系統(tǒng)和知識(shí)圖譜等應(yīng)用,是基礎(chǔ)且重要的自然語言處理任務(wù)。

文本語料經(jīng)過實(shí)體抽取之后,得到的是一系列離散的命名實(shí)體,為了得到語義信息,還需要從相關(guān)語料中提取出實(shí)體之間的關(guān)聯(lián)關(guān)系,通過關(guān)系將實(shí)體聯(lián)系起來,才能夠形成網(wǎng)狀的知識(shí)結(jié)構(gòu)。

關(guān)系抽取包括數(shù)據(jù)標(biāo)注、模型訓(xùn)練、結(jié)果評估和模型改進(jìn)四個(gè)階段:

①數(shù)據(jù)標(biāo)注:是對識(shí)別出的實(shí)體和實(shí)體之間的關(guān)系進(jìn)行標(biāo)注。

②模型訓(xùn)練:使用已標(biāo)注好的數(shù)據(jù)集進(jìn)行模型訓(xùn)練。

③關(guān)系抽取的結(jié)果,也是根據(jù)兩個(gè)評價(jià)指標(biāo)衡量關(guān)系抽取模型的性能:召回率和準(zhǔn)確率。為了綜合評價(jià)系統(tǒng)的性能,通常也計(jì)算召回率和準(zhǔn)確率的加權(quán)幾何平均值,即F指數(shù),計(jì)算公式如式(5.1).

④根據(jù)關(guān)系抽取結(jié)果的評估,如果存在指標(biāo)過低的情況,需要對模型進(jìn)行改進(jìn)。

4.2.1.3屬性抽取

屬性抽取的目標(biāo)是從不同信息源中采集特定實(shí)體的屬性信息,如針對美國陸軍裝備主戰(zhàn)坦克“M1A2主戰(zhàn)坦克”,可以從網(wǎng)絡(luò)公開信息中得到其長度,高度,行動(dòng)距離,重量,乘員等屬性信息。將實(shí)體的屬性視作實(shí)體與屬性值之間的一種名詞性關(guān)系,將屬性抽取任務(wù)轉(zhuǎn)化為關(guān)系抽取任務(wù),因此可以通過關(guān)系抽取方法來進(jìn)行屬性抽取。常見的抽取方法包含:

①基于規(guī)則和啟發(fā)式算法,抽取結(jié)構(gòu)化數(shù)據(jù)。

②基于百科類網(wǎng)站的半結(jié)構(gòu)化數(shù)據(jù),通過自動(dòng)抽取生成訓(xùn)練語料,用于訓(xùn)練實(shí)體屬性標(biāo)注模型,然后將其應(yīng)用于對非結(jié)構(gòu)化數(shù)據(jù)的實(shí)體屬性抽取。

③采用數(shù)據(jù)挖掘的方法直接從文本中挖掘?qū)嶓w屬性和屬性值之間的關(guān)系模式,據(jù)此實(shí)現(xiàn)對屬性名和屬性值在文本中的定位。

4.2.2知識(shí)融合

通過知識(shí)抽取,已經(jīng)能夠?qū)④娛骂I(lǐng)域內(nèi)各種內(nèi)部,外部海量數(shù)據(jù)中的實(shí)體,關(guān)系,屬性抽取出來,但是由于領(lǐng)域數(shù)據(jù)采集的來源廣泛,知識(shí)質(zhì)量良莠不齊,存在不同數(shù)據(jù)源知識(shí)重復(fù),層次結(jié)構(gòu)缺失等問題,必須進(jìn)行知識(shí)的融合,使得不同知識(shí)源的知識(shí)在同一框架規(guī)范下進(jìn)行異構(gòu)數(shù)據(jù)整合,消歧,加工,推理驗(yàn)證,更新等步驟,形成高質(zhì)量的知識(shí)庫。知識(shí)融合的技術(shù)主要包括共指消解結(jié)束和實(shí)體鏈接技術(shù)。

4.2.2.1共指消解

共指消解是自然語言處理的重要問題,旨在發(fā)現(xiàn)非結(jié)構(gòu)化文本中指向同一實(shí)體的不同文字表達(dá)(指稱語)。

從軍事領(lǐng)域內(nèi)各種內(nèi)外部文檔中提取出的實(shí)體,在文檔中往往存在不同的指稱語,比如,在段落“斯特賴克旅下轄旅部及旅部連,3個(gè)斯特賴克步兵營和一個(gè)旅保障營,斯特賴克步兵營由三個(gè)相同編制的步兵連組成,是該旅的作戰(zhàn)主體,保障營向作戰(zhàn)營提供伴隨保障,向全旅部隊(duì)提供后勤與維修保障。”中,對于組織編制類實(shí)體“斯特賴克旅”,在文中存在另外兩個(gè)不同的指稱:“該旅”,“全旅部隊(duì)”,確定不同指稱語在真實(shí)世界中所指向的同一實(shí)體的過程稱為共指消解,共指消解對于知識(shí)圖譜的構(gòu)建十分重要,它能檢測出同一實(shí)體在文本中的的各種不同或相同的表述,包括普通名詞短語,專有名詞和代詞等,豐富了實(shí)體在文本中的上下文環(huán)境,完善了實(shí)體的屬性,關(guān)系等信息,同時(shí)避免了在進(jìn)行知識(shí)圖譜構(gòu)建時(shí),誤將同一實(shí)體的不同指稱當(dāng)做不同的實(shí)體而存儲(chǔ)到知識(shí)圖譜中,保證了知識(shí)圖譜中實(shí)體的唯一性。

4.2.2.2實(shí)體鏈接

實(shí)體鏈接是指將文本中的實(shí)體鏈接到指定的知識(shí)庫。其基本思想是首先根據(jù)給定的實(shí)體指稱項(xiàng),從知識(shí)庫中選出一組候選實(shí)體對象,然后通過相似度計(jì)算將指稱項(xiàng)鏈接到正確的實(shí)體對象。通過將外部非結(jié)構(gòu)化文檔中的實(shí)體與現(xiàn)有知識(shí)圖譜中的實(shí)體進(jìn)行鏈接,然后融合二者的屬性關(guān)系到現(xiàn)有的知識(shí)圖譜中,可以幫助現(xiàn)有知識(shí)圖譜的不斷更新和完善。

4.2.3知識(shí)加工

4.2.3.1本體自動(dòng)構(gòu)建

本體可以人工手動(dòng)構(gòu)建,也可以采用數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)化方式構(gòu)建本體。因?yàn)槿斯し绞焦ぷ髁烤薮螅液茈y找到符合要求的專家,因此當(dāng)前都是從一些面向特定領(lǐng)域的現(xiàn)有本體庫出發(fā),采用自動(dòng)構(gòu)建技術(shù)逐步擴(kuò)展得到的。自動(dòng)化本體構(gòu)建過程包括三個(gè)階段:

①實(shí)體并列關(guān)系相似度計(jì)算

②實(shí)體上下位關(guān)系抽取

③本體的生成

4.2.3.2知識(shí)推理

知識(shí)推理,就是根據(jù)已有的數(shù)據(jù)模型和數(shù)據(jù),依據(jù)推理規(guī)則,獲取新的知識(shí)或結(jié)論,新的知識(shí)或結(jié)論應(yīng)該是滿足語義的。知識(shí)推理,依據(jù)描述邏輯系統(tǒng)實(shí)現(xiàn)。一個(gè)描述邏輯系統(tǒng)由四個(gè)基本部分組成:最基本的元素:概念、關(guān)系、個(gè)體;TBox術(shù)語集:概念術(shù)語的公理集合;Abox斷言集:個(gè)體的斷言集合;描述邏輯涉及到的內(nèi)容也比較多,比如,根據(jù)句子中的實(shí)體關(guān)系“M1A2主戰(zhàn)坦克是美國陸軍裝備的主要的主戰(zhàn)坦克。”,“美國軍隊(duì)由美國陸軍,美國海軍,美國空軍,美國海軍陸戰(zhàn)隊(duì),美國海岸警衛(wèi)隊(duì)所構(gòu)成”可以直接推理出關(guān)系:“美國軍隊(duì)-武器裝備-M1A2主戰(zhàn)坦克”。通過推理發(fā)現(xiàn)新的知識(shí),應(yīng)用比較多,說明知識(shí)圖譜很多時(shí)候會(huì)應(yīng)用推理。

4.2.3.3質(zhì)量評估

質(zhì)量評估,就是對最后的結(jié)果數(shù)據(jù)進(jìn)行評估,將合格的數(shù)據(jù)放入知識(shí)圖譜中。對于經(jīng)過融合的新知識(shí),需要經(jīng)過質(zhì)量評估之后(部分需要人工參與甄別),才能將合格的部分加入到知識(shí)庫中,以確保知識(shí)庫的質(zhì)量。質(zhì)量評估的方法,根據(jù)所構(gòu)建的知識(shí)圖譜的不同,對數(shù)據(jù)要求的差異而有所差別。總的目的是要獲得合乎要求的知識(shí)圖譜數(shù)據(jù),要求的標(biāo)準(zhǔn)根據(jù)具體情況確定。比如對于公共領(lǐng)域的知識(shí)圖譜,知識(shí)的獲取采用了眾包的方法,對于同一個(gè)知識(shí)點(diǎn),可能會(huì)有很多人來完成,如果這個(gè)知識(shí)點(diǎn)只有一個(gè)答案,可以采用的一種策略是,將多人的標(biāo)注結(jié)果進(jìn)行比較,取投票多的結(jié)果作為最終的結(jié)果。當(dāng)然,這是不嚴(yán)謹(jǐn)?shù)模驗(yàn)檎胬硗莆赵谏贁?shù)人的手里,特別是針對一些行業(yè)的知識(shí)圖譜,表現(xiàn)尤為突出。行業(yè)內(nèi)的一條知識(shí),可能只有行業(yè)專家能夠給出權(quán)威正確的答案,如果讓大眾投票來決定,可能會(huì)得到一條錯(cuò)誤的知識(shí)。所以,針對行業(yè)知識(shí)圖譜,可能會(huì)采用不同于公共知識(shí)圖譜的策略,來進(jìn)行知識(shí)的質(zhì)量評估。

5 結(jié)束語

作戰(zhàn)試驗(yàn)實(shí)施過程中的海量數(shù)據(jù)帶來了信息過載的問題,降低了參試人員獲取知識(shí)的效率。作戰(zhàn)試驗(yàn)知識(shí)圖譜提供了一種管理與利用海量異構(gòu)數(shù)據(jù)源的有效方式,大量的作戰(zhàn)試驗(yàn)數(shù)據(jù)能夠得到良好的表達(dá)與組織。將其應(yīng)用到作戰(zhàn)試驗(yàn)領(lǐng)域內(nèi)的智能搜索、深度問答、輔助決策等方面,有助于決策和分析人員快速準(zhǔn)確地獲取知識(shí),增進(jìn)知識(shí)的共享,提高信息化條件下的決策分析能力。本文在對知識(shí)圖譜的定義及架構(gòu)進(jìn)行闡述的基礎(chǔ)上,研究了作戰(zhàn)試驗(yàn)數(shù)據(jù)知識(shí)圖譜的構(gòu)建技術(shù)流程,能夠支撐作戰(zhàn)試驗(yàn)大規(guī)模分析、統(tǒng)一籌劃、輔助決策等多種應(yīng)用,具有重要的軍事應(yīng)用前景。

參考文獻(xiàn)

[1]陳乘風(fēng),何宇,趙偉.加強(qiáng)作戰(zhàn)數(shù)據(jù)建設(shè)的思考[J].軍隊(duì)信息化建設(shè),2012,(2):16-17.

[2]張引, 陳敏, 廖小飛. 大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(s2):216-233.

[3]曹會(huì)智, 李沛, 劉俊杰, 等. 大數(shù)據(jù)時(shí)代背景下裝備保障建設(shè)發(fā)展研究[J]. 中國管理信息化, 2014(17):52-54.

[4]阮彤, 王夢婕, 王昊奮, 等. 垂直知識(shí)圖譜的構(gòu)建與應(yīng)用研究[J]. 知識(shí)管理論壇, 2016(3):226-234.

[5]徐增林, 盛泳潘, 賀麗榮, 等.知識(shí)圖譜技術(shù)綜述[J].電子科技大學(xué)學(xué)報(bào), 2016, 45(4):589-606.

[6]劉嶠, 李楊, 楊段宏, 等. 知識(shí)圖譜構(gòu)建技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展, 2016, 53(3):582-600.

[7]嚴(yán)紅, 黃穎, 應(yīng)勵(lì)志. 面向軍事信息系統(tǒng)結(jié)構(gòu)化數(shù)據(jù)的信息匯聚方法[J]. 指揮信息系統(tǒng)與技術(shù), 2015, 6(1):29-34.

[8]李濤, 王次臣, 李華康. 知識(shí)圖譜的發(fā)展與構(gòu)建[J]. 南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017, 41(1):22-34.

(作者單位:王小龍,中國人民解放軍陸軍工程大學(xué);劉小朋,中國人民解放軍陸軍工程大學(xué)、中國人民解放軍63861部隊(duì);王磊,中國人民解放軍63861部隊(duì);王宏,中國人民解放軍陸軍工程大學(xué)、云南省臨滄軍分區(qū))

主站蜘蛛池模板: 人妻丰满熟妇AV无码区| 亚洲国产清纯| 无码精油按摩潮喷在线播放| 91人妻在线视频| 亚洲精品少妇熟女| 永久天堂网Av| 亚洲最新网址| 国产黄色免费看| 久久a级片| 久一在线视频| 免费国产一级 片内射老| 日韩欧美国产成人| 欧美日韩一区二区三区在线视频| 成AV人片一区二区三区久久| 狠狠色婷婷丁香综合久久韩国| 又粗又大又爽又紧免费视频| 国产香蕉国产精品偷在线观看| 中文字幕亚洲精品2页| 国产后式a一视频| 精品中文字幕一区在线| 国产欧美日韩另类精彩视频| 特级精品毛片免费观看| 久久黄色小视频| 日日拍夜夜嗷嗷叫国产| 国产乱人激情H在线观看| 黄色网址免费在线| 在线观看免费黄色网址| 日本欧美精品| 国产精品亚洲天堂| 国产毛片高清一级国语| 国产白浆视频| 天天综合天天综合| 一区二区三区成人| 国产精品网址你懂的| 国产极品美女在线观看| 午夜天堂视频| 无码中文字幕加勒比高清| 日韩二区三区无| 亚洲第一色网站| 久久成人免费| 国产精品第| 亚洲天堂网在线观看视频| 国产一区二区三区免费| 亚洲 日韩 激情 无码 中出| 中文字幕在线看| 国产在线精品99一区不卡| 亚洲欧美另类视频| 四虎影院国产| 在线视频亚洲色图| 久无码久无码av无码| 久久久噜噜噜久久中文字幕色伊伊| 精品国产aⅴ一区二区三区| 日本午夜三级| 亚洲三级电影在线播放| 久久国产精品娇妻素人| аv天堂最新中文在线| 成人亚洲视频| 免费一级毛片不卡在线播放| 在线观看免费国产| 国产精品一老牛影视频| 亚洲精品在线观看91| 久久香蕉国产线看观看精品蕉| 精品国产欧美精品v| 996免费视频国产在线播放| 欧美日韩中文国产va另类| 亚洲无线一二三四区男男| 女人毛片a级大学毛片免费| 亚洲综合中文字幕国产精品欧美| 免费一级α片在线观看| 午夜福利亚洲精品| 国产一级小视频| 国产乱人伦偷精品视频AAA| 日韩欧美国产中文| 日韩av无码精品专区| 一本大道香蕉中文日本不卡高清二区| 亚洲欧美自拍一区| 第九色区aⅴ天堂久久香| 亚洲欧美一区二区三区图片 | 伊人网址在线| 在线国产91| 久久成人国产精品免费软件| jizz国产在线|