999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

作戰(zhàn)目標(biāo)數(shù)據(jù)質(zhì)量評價體系和模型構(gòu)建?

2019-12-26 11:33:06賀文紅
艦船電子工程 2019年12期
關(guān)鍵詞:數(shù)據(jù)庫評價信息

賀文紅

(海軍裝備部 北京 100071)

1 引言

作戰(zhàn)數(shù)據(jù)質(zhì)量評價是作戰(zhàn)數(shù)據(jù)工程建設(shè)與實踐應(yīng)用的重要組成部分。隨著我海軍戰(zhàn)略從近海防御向遠海防衛(wèi)跨越式的調(diào)整,在軍事作戰(zhàn)和演習(xí)過程中,作戰(zhàn)海域范圍將明顯擴展,作戰(zhàn)環(huán)境更為復(fù)雜,海戰(zhàn)場的作戰(zhàn)面積廣闊,敵我雙方的作戰(zhàn)單位分布稀疏,交戰(zhàn)距離多發(fā)生在視距外,同時還存在需要使用聲吶進行探測的水下戰(zhàn)場。因此海戰(zhàn)場上的作戰(zhàn)單位自身不僅需要具備探測目標(biāo)的能力,還需要具備自主計算分析和超視距協(xié)同作戰(zhàn)的能力。復(fù)雜戰(zhàn)場環(huán)境下,各種干擾層出不窮,如有源電子干擾、反輻射導(dǎo)彈、隱身與反隱身技術(shù)等等,此外,大量的背景噪聲和測量誤差的存在,使得測量系統(tǒng)獲取的目標(biāo)數(shù)據(jù)帶有大量的模糊性和不確定性,為構(gòu)建目標(biāo)特性數(shù)據(jù)庫以及目標(biāo)特性數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量帶來嚴(yán)峻的考驗[1,4]。

2 作戰(zhàn)數(shù)據(jù)評價體系建設(shè)需求

2.1 預(yù)警探測目標(biāo)識別精準(zhǔn)化需要

未來信息化戰(zhàn)爭中,對前端探測設(shè)備探測目標(biāo)的精準(zhǔn)需求越來越突出,而作為支撐目標(biāo)識別的探測目標(biāo)特性數(shù)據(jù)庫建設(shè)顯得尤為重要。海戰(zhàn)場環(huán)境復(fù)雜而多變,僅僅依靠當(dāng)前實時探測信息已無法滿足作戰(zhàn)需求,通過目標(biāo)特性數(shù)據(jù)庫進行匹配分析識別,其識別結(jié)果的可信度依賴于目標(biāo)特性數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量。

2.2 多源異構(gòu)情報數(shù)據(jù)綜合識別能力需要

依據(jù)海戰(zhàn)場目標(biāo)來源的特點將目標(biāo)特征數(shù)據(jù)分為三類,分別包括探測獲取數(shù)據(jù)、計算獲取數(shù)據(jù)、情報獲取數(shù)據(jù)。探測獲取數(shù)據(jù)主要包括雷達、聲吶、紅外、電子戰(zhàn)、衛(wèi)星目標(biāo)等需要通過傳感器設(shè)備探測獲取的目標(biāo)數(shù)據(jù),主要包括目標(biāo)的運動特征數(shù)據(jù),聲光電特征數(shù)據(jù);計算獲取數(shù)據(jù)主要包括作戰(zhàn)系統(tǒng)、傳感器系統(tǒng)根據(jù)自身接收到的探測數(shù)據(jù)、導(dǎo)航信息以及其他作戰(zhàn)信息計算出的數(shù)據(jù),主要包括目標(biāo)數(shù)據(jù),電子對抗特征數(shù)據(jù)、輻射特征信息、歷史航跡軌跡信息等信息;情報獲取數(shù)據(jù)主要包括其他作戰(zhàn)節(jié)點、岸基指揮所通過數(shù)據(jù)鏈通過指揮文電發(fā)送的目標(biāo)動向信息、敵情信息。

2.3 目標(biāo)特性數(shù)據(jù)庫形成有效產(chǎn)品需要

目標(biāo)特性數(shù)據(jù)庫的建設(shè)和管理對目前我軍提升現(xiàn)有裝備作戰(zhàn)效能有著非常重要的作用。為了保障目標(biāo)特性數(shù)據(jù)庫的發(fā)布和共享,支撐目標(biāo)特性工程建設(shè)任務(wù),需要提出一套權(quán)威可行的目標(biāo)特性數(shù)據(jù)質(zhì)量評價體系作為目標(biāo)特性數(shù)據(jù)庫的信息數(shù)據(jù)質(zhì)量評價的原則、準(zhǔn)則、流程、指標(biāo)和方法,最終形成支撐數(shù)據(jù)產(chǎn)品的生產(chǎn)和評估[1]。

3 美軍作戰(zhàn)數(shù)據(jù)質(zhì)量評價體系現(xiàn)狀分析

美國等西方海軍強國,長期高度重視數(shù)據(jù)庫及其數(shù)據(jù)質(zhì)量建設(shè),各國對非合作目標(biāo)特性的獲取和研究都非常重視,特別是美、俄等軍事強國,起步早,投入大。如蘇聯(lián)早在20世紀(jì)50年代專門研制用于偵測非合作目標(biāo)物理場特性的測量裝置,布放于一定的水域,記錄大量的非合作目標(biāo)物理場數(shù)據(jù),美國經(jīng)常在海上投放浮標(biāo)或建造測量船,偵察非合作目標(biāo)特性數(shù)據(jù),正是對于非合作目標(biāo)的充分了解,美國對一些國家的潛艇能做到單個識別,英國某型水雷經(jīng)過精心的引信設(shè)計專攻特定目標(biāo)。在數(shù)據(jù)庫建設(shè)方面,美軍為了建立數(shù)據(jù)共享基礎(chǔ)設(shè)施,國防部早在20世紀(jì)90年代就啟動了數(shù)據(jù)工程,創(chuàng)建了國防數(shù)據(jù)詞典系統(tǒng)(DDDS)、數(shù)據(jù)共享環(huán)境(SHADE)和聯(lián)合公共數(shù)據(jù)庫(JCDB),為美軍在C4I系統(tǒng)之間實現(xiàn)數(shù)據(jù)重用和數(shù)據(jù)共享奠定了基礎(chǔ)。聯(lián)合公共數(shù)據(jù)庫是多個數(shù)據(jù)庫的公共部分,綜合了國防情報局(DIA)軍事情報數(shù)據(jù)庫(MIDB)中有關(guān)敵軍的信息以及海、空軍數(shù)據(jù)庫中有關(guān)聯(lián)合作戰(zhàn)的部分信息。該數(shù)據(jù)庫是用于支持三軍共享的基礎(chǔ)數(shù)據(jù)庫。此外,在聯(lián)合公共數(shù)據(jù)庫的體系結(jié)構(gòu)下,美國每年都投入大量經(jīng)費建設(shè)業(yè)務(wù)數(shù)據(jù)庫。目前已在世界各大洋及中國周邊海域建立了海洋環(huán)境立體監(jiān)測系統(tǒng),搜集、調(diào)查海洋環(huán)境參數(shù),開展海洋環(huán)境特性方面的研究工作,已具備全球和局部海域的多尺度、多要素業(yè)務(wù)化保障能力,并建立了相當(dāng)規(guī)模的數(shù)據(jù)庫系統(tǒng)。如海洋學(xué)和氣象學(xué)數(shù)據(jù)庫(OAML)、聲學(xué)數(shù)據(jù)庫、美國國家氣象資料中心(NCDC)海洋氣候數(shù)據(jù)庫、艦隊任務(wù)規(guī)劃地球物理數(shù)據(jù)庫系統(tǒng)(GFMPL)等。依托上述數(shù)據(jù)庫建設(shè),采用多種(類)技術(shù)、手段和裝備來增強艦艇編隊的目標(biāo)識別能力,海灣戰(zhàn)爭結(jié)束后,美國專門成立了聯(lián)合目標(biāo)識別計劃辦公室,組織和指導(dǎo)建立以信息融合為核心的C4I系統(tǒng)。已裝備的識別系統(tǒng)達百余種,如非合作性目標(biāo)識別(NCTR)、多傳感器目標(biāo)識別系統(tǒng)(MUSTRS)、作戰(zhàn)識別(CID)、聯(lián)合戰(zhàn)斗識別(CCID)等。其他西方國家也研制出一批具有代表性的系統(tǒng),如英國的飛機敵我識別系統(tǒng)(ZFFF)、歐洲的BETA系統(tǒng)(戰(zhàn)場維護與目標(biāo)探測系統(tǒng))等[1,3]。

4 作戰(zhàn)數(shù)據(jù)質(zhì)量評價體系和模型構(gòu)建

4.1 作戰(zhàn)數(shù)據(jù)質(zhì)量評價體系構(gòu)建

由于作戰(zhàn)數(shù)據(jù)來源于不同系統(tǒng)間作戰(zhàn)數(shù)據(jù)的有效集成,各子系統(tǒng)在數(shù)據(jù)存儲、傳輸與集成過程中,必須符合某種評估指標(biāo),形成統(tǒng)一標(biāo)準(zhǔn),再經(jīng)過數(shù)據(jù)清洗剔除無關(guān)數(shù)據(jù)或壞數(shù)據(jù),確保作戰(zhàn)數(shù)據(jù)的有效性與可靠性。靜態(tài)作戰(zhàn)數(shù)據(jù)質(zhì)量主要是作戰(zhàn)數(shù)據(jù)質(zhì)量本身所固有的、本征指標(biāo),即上述所提到的評估標(biāo);而動態(tài)作戰(zhàn)數(shù)據(jù)質(zhì)量主要是從作戰(zhàn)數(shù)據(jù)的整個生命周期來展開研究的,是作戰(zhàn)數(shù)據(jù)在實際應(yīng)用中數(shù)據(jù)質(zhì)量的價值體現(xiàn),包括作戰(zhàn)數(shù)據(jù)的采集、傳輸、存儲、處理、集成、使用和開發(fā)質(zhì)量,每一個環(huán)節(jié)的質(zhì)量高低都直接關(guān)系著整個作戰(zhàn)數(shù)據(jù)質(zhì)量的好壞,都會直接或間接的影響著整個作戰(zhàn)的結(jié)果[2]。作戰(zhàn)數(shù)據(jù)質(zhì)量評估指標(biāo)體系如圖1所示。

圖1 作戰(zhàn)數(shù)據(jù)質(zhì)量評價指標(biāo)體系

圖2 作戰(zhàn)目標(biāo)數(shù)據(jù)質(zhì)量評價體系總體框架圖

在數(shù)據(jù)質(zhì)量評價體系方面,以美國麻省理工學(xué)院、美國國防部為代表的研究機構(gòu),建立數(shù)據(jù)質(zhì)量評價和管理的綜合數(shù)據(jù)質(zhì)量管理體系(TDQM),以及數(shù)據(jù)質(zhì)量管理成熟度模型。TDQM是以“計劃-執(zhí)行-檢查-處理”(PDCA)管理過程4階段循環(huán)方式為基礎(chǔ),其主要特點是專注于數(shù)據(jù)質(zhì)量的目標(biāo)達成和過程控制[3,6]。

4.2 評價體系總體方案

依據(jù)目前數(shù)據(jù)質(zhì)量評價的基礎(chǔ)研究,結(jié)合目標(biāo)特性的特點,采用“面向場景動態(tài)評價、面向?qū)ο髠€性定制”的設(shè)計思想,從數(shù)據(jù)質(zhì)量問題的產(chǎn)生環(huán)節(jié)著手,建立全過程評價指標(biāo)。根據(jù)評價結(jié)果,推動目標(biāo)特性數(shù)據(jù)庫的建設(shè)管理;依據(jù)數(shù)據(jù)清洗,推動前端數(shù)據(jù)產(chǎn)品的生產(chǎn)為目標(biāo)綜合識別和武器打擊提供信息保障需求[6,9]。

結(jié)合目標(biāo)識別和武器打擊的軍事要求,對目標(biāo)特性數(shù)據(jù)信息要素進行提取獲得物理特性、運動特性、光/電/聲特性、易損性等度量指標(biāo);針對探測數(shù)據(jù)、計算數(shù)據(jù)、情報數(shù)據(jù)制定不同的原則和準(zhǔn)則。在此基礎(chǔ)上,結(jié)合目標(biāo)特性要素,構(gòu)成混合式的評價流程模式;同時分析外部環(huán)境對目標(biāo)特性數(shù)據(jù)的影響,選取適應(yīng)的評價指標(biāo)。

依據(jù)前期分析目標(biāo)特性的原則/準(zhǔn)則/流程/指標(biāo),依托大數(shù)據(jù)平臺,對提取的目標(biāo)特性要素數(shù)據(jù)進行評價方法適配并進行評價;同時結(jié)合專家知識庫的評價,形成目標(biāo)特性數(shù)據(jù)庫信息的綜合評價。

最后通過目標(biāo)特征數(shù)據(jù)產(chǎn)品庫對各類目標(biāo)的識別程度,進行數(shù)據(jù)質(zhì)量的總體評價,促進目標(biāo)特征數(shù)據(jù)產(chǎn)品庫的建設(shè)完善及后續(xù)產(chǎn)品發(fā)布。

通過建立目標(biāo)特性數(shù)據(jù)信息的數(shù)據(jù)質(zhì)量綜合評價和總體評價構(gòu)成對目標(biāo)特性數(shù)據(jù)的數(shù)據(jù)質(zhì)量評價全要素全過程覆蓋。

4.3 作戰(zhàn)目標(biāo)數(shù)據(jù)質(zhì)量評價流程

數(shù)據(jù)質(zhì)量評價流程,實際是針對數(shù)據(jù)質(zhì)量問題的生成過程進行評價。

為了實現(xiàn)保證全面數(shù)據(jù)質(zhì)量分析,多層次評估數(shù)據(jù)質(zhì)量性質(zhì),我們提出了如圖2所示的混合型數(shù)據(jù)質(zhì)量評估分析模型。

通過這種多層次的多維度指標(biāo)的評估準(zhǔn)則,可以建立完善的針對不同場景的目標(biāo)特性數(shù)據(jù)質(zhì)量的數(shù)據(jù)質(zhì)量評估流程模型。

數(shù)據(jù)質(zhì)量問題包括單數(shù)據(jù)源和多數(shù)據(jù)源。單數(shù)據(jù)源分析更多處理單個數(shù)據(jù)集合的數(shù)據(jù)質(zhì)量分析問題,多數(shù)據(jù)源分析問題滿足本項目要求的數(shù)據(jù)多樣化融合的要求。

4.3.1 單一數(shù)據(jù)(源)的評價流程

單一數(shù)據(jù)(源)的評價流程研究主要是針對單一數(shù)據(jù)或單一數(shù)據(jù)源本身的評價流程進行分析,建立不同類別的評價流程模式,構(gòu)筑整體目標(biāo)特性數(shù)據(jù)質(zhì)量評價流程的基石。

4.3.2 多數(shù)據(jù)(源)的評價流程

多數(shù)據(jù)(源)的評價流程研究主要是針對數(shù)據(jù)與數(shù)據(jù)之間以及不同來源數(shù)據(jù)之間的評價流程進行分析,建立綜合評價流程模型,形成目標(biāo)特性數(shù)據(jù)質(zhì)量評價流程范式。

圖3 作戰(zhàn)數(shù)據(jù)質(zhì)量評估流程圖

4.4 作戰(zhàn)數(shù)據(jù)質(zhì)量評價模型構(gòu)建

4.4.1 基于矩陣式的目標(biāo)特性數(shù)據(jù)質(zhì)量評價指標(biāo)模型

作戰(zhàn)目標(biāo)數(shù)據(jù)質(zhì)量可以從數(shù)據(jù)源質(zhì)量、數(shù)據(jù)可用性、數(shù)據(jù)內(nèi)容、數(shù)據(jù)管理、數(shù)據(jù)價值等幾個維度指標(biāo)上進行質(zhì)量的評估。考慮到在不同場景、不同類型的目標(biāo)特性數(shù)據(jù)存在著較為明顯的差異,因此需要研究出一套基于多維度指標(biāo)的矩陣式的目標(biāo)特性數(shù)據(jù)質(zhì)量評價指標(biāo)模型。該模型可以完成對目標(biāo)特性數(shù)據(jù)質(zhì)量的指標(biāo)確定,提供權(quán)威的數(shù)據(jù)質(zhì)量評價結(jié)果支撐[4~5]。

考慮到在不同場景、不同類型的目標(biāo)特性數(shù)據(jù)存在著較為明顯的差異,對于數(shù)據(jù)質(zhì)量評價也隨之不同。因此需要研究出一套針對這類特點的評價指標(biāo)模型,稱之為基于矩陣式的目標(biāo)特性數(shù)據(jù)質(zhì)量評價指標(biāo)模型。該模型可以完成對目標(biāo)特性數(shù)據(jù)質(zhì)量的指標(biāo)確定,提供權(quán)威的數(shù)據(jù)質(zhì)量評價結(jié)果支撐。模型示意如下:

Ak表示某類目標(biāo)的評價指標(biāo)集,aij表示在i項條件下,第j項指標(biāo)的是否可用。

4.4.2 基于有監(jiān)督模式識別的數(shù)據(jù)質(zhì)量總體評價模型

數(shù)據(jù)質(zhì)量是“滿足應(yīng)用需求的程度”,目標(biāo)特性數(shù)據(jù)庫的建立主要是用于目標(biāo)識別,因此需要針對經(jīng)過目標(biāo)特征原始數(shù)據(jù)庫信息篩選而獲得的目標(biāo)特征產(chǎn)品數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量進行總體性評價,通過某類個體的目標(biāo)特征信息在目標(biāo)特征產(chǎn)品數(shù)據(jù)庫識別后得到識別結(jié)果的程度,對整個數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量整體進行評價研究。先用一組已知類別的化合物作為訓(xùn)練集,建立判別模型,再用建立的模型根據(jù)相似性原則來對未知樣本進行識別,稱為判別分析。判別分析是在事先知道類別特征的情況下建立判別模型對樣本進行識別歸屬,是一種有監(jiān)督模式識別。

目標(biāo)特征數(shù)據(jù)庫中一共有n個個體實例,可以表示為S={D1,D2,…,Dn},其中Di為每一個個體實例,該對象中一共有mi個特征,可以表示為Ci={<K1,V1>,<K2,V2>,…,<Kmi,Vmi>}。

其中,K表示該特征的屬性,V表示該特征的值,由于獲取信息存在不全面,每個個體的mi可能是不一樣的。

BP神經(jīng)網(wǎng)絡(luò)是一種基于有監(jiān)督的學(xué)習(xí),使用非線性可導(dǎo)函數(shù)作為傳遞函數(shù)的前饋神經(jīng)網(wǎng)絡(luò)。

BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、輸出層組成。以多屬性指標(biāo)訓(xùn)練數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入,訓(xùn)練過程分為網(wǎng)絡(luò)輸入信號正向傳播和誤差信號反向傳播,按有監(jiān)督學(xué)習(xí)方式進行訓(xùn)練[7~8]。

圖4 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖

step 1:相鄰層之間結(jié)點的連接有一個權(quán)重Wij;

step 2:每一個神經(jīng)單元都有一定量的能量,我們定義其能量值為該結(jié)點j的輸出值Oj;

step 3:除輸入層外,每一層的各個結(jié)點都有一個輸入值,其值為上一層所有結(jié)點按權(quán)重傳遞過來的能量之和加上偏置;

step 4:除輸入層外,每一層都有一個偏置值,其值在[0,1]之間;

step 5:除輸入層外,每個結(jié)點的輸出值等該結(jié)點的輸入值作非線性變換;

基于神經(jīng)網(wǎng)絡(luò)的回歸分析,根據(jù)全局誤差極小來判定學(xué)習(xí)完成,從而確定網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)。

根據(jù)樣本數(shù)據(jù)訓(xùn)練得到的權(quán)值參數(shù),對新的目標(biāo)特性數(shù)據(jù)進行質(zhì)量評估,可以對最終的數(shù)據(jù)質(zhì)量評估設(shè)置一個閾值,在神經(jīng)網(wǎng)絡(luò)中輸入目標(biāo)特性數(shù)據(jù)多維度評價指標(biāo)的數(shù)值,自適應(yīng)地利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),從模型的輸出得到目標(biāo)特性數(shù)據(jù)的評價結(jié)果,根據(jù)設(shè)置的閾值可以初步評估該數(shù)據(jù)的質(zhì)量。

4.4.3 大數(shù)據(jù)環(huán)境下的數(shù)據(jù)質(zhì)量評價模型

在大數(shù)據(jù)環(huán)境下,對于矩陣式的數(shù)據(jù)質(zhì)量評價指標(biāo)模型,針對不同場景維度,需要對多維度指標(biāo)引入權(quán)重要素并研究自適應(yīng)調(diào)整上述指標(biāo)權(quán)重的方法;針對目標(biāo)特性數(shù)據(jù)源的特點,開展基于時空序列數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、多源異構(gòu)數(shù)據(jù)等數(shù)據(jù)質(zhì)量評價方法研究,建立融合情境與類別的評價方法體系,支持精準(zhǔn)化和個性化的數(shù)據(jù)質(zhì)量評價,提供更為準(zhǔn)確的數(shù)據(jù)質(zhì)量評估。

面對海量的目標(biāo)特性數(shù)據(jù)資源,數(shù)據(jù)質(zhì)量評價同樣面臨著大數(shù)據(jù)帶來的挑戰(zhàn)。對于“大數(shù)據(jù)”(Big data)研究機構(gòu)Gartner給出了這樣的定義:“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)為數(shù)據(jù)質(zhì)量評價問題帶來了存儲、計算和通信方面的挑戰(zhàn),這與大數(shù)據(jù)在其他領(lǐng)域帶來的挑戰(zhàn)具有共性,而同時由于數(shù)據(jù)質(zhì)量評價方法的獨特性,大數(shù)據(jù)對這些方法的可擴展性帶來了獨特的挑戰(zhàn)。

并行與分布式是解決大數(shù)據(jù)問題的主要思路,并行計算(Parallel computing)是指同時使用多種計算資源解決計算問題的過程,而分布式計算(Distributed computing)則是將計算過程分配到集群中的不同節(jié)點執(zhí)行。大數(shù)據(jù)問題在工業(yè)界已經(jīng)存在比較成熟的解決方案,一些大的互聯(lián)網(wǎng)公司和組織構(gòu)建了一系列的基礎(chǔ)架構(gòu),比如Hadoop、Spark和Kafka等項目,結(jié)合這些技術(shù)和數(shù)據(jù)質(zhì)量評價問題我們構(gòu)建了大規(guī)模數(shù)據(jù)質(zhì)量評價的方法。大數(shù)據(jù)具有以下四大特征:數(shù)據(jù)量大、數(shù)據(jù)類型繁多、流動速度快、價值密度低。針對大數(shù)據(jù)質(zhì)量評價數(shù)據(jù)訪問量大和大數(shù)據(jù)本身的“海量化”特性,我們設(shè)計分布式存儲訪問系統(tǒng)以滿足數(shù)據(jù)存儲和快速訪問的需求。針對大數(shù)據(jù)“多樣化”的特性,擬采用多維度關(guān)聯(lián)分析實現(xiàn)數(shù)據(jù)的統(tǒng)一管理和使用。針對大數(shù)據(jù)“流動速度快”的特點,擬采用流式數(shù)據(jù)處理框架(比如Apache Storm)實現(xiàn)數(shù)據(jù)傳輸過程不落地進行實時數(shù)據(jù)質(zhì)量評價。針對數(shù)據(jù)“價值密度低”的特點,擬采用PCA等降維方法去除數(shù)據(jù)噪音保留關(guān)鍵屬性[9~10]。

以大規(guī)模序列數(shù)據(jù)質(zhì)量評價為例,基于概率后綴樹模型進行數(shù)據(jù)質(zhì)量評價的方法難以實現(xiàn)對大規(guī)模數(shù)據(jù)的處理,而基于Apache Spark平臺的STALK算法能夠利用大規(guī)模序列數(shù)據(jù)高效建立生成模型,并根據(jù)生成模型對查詢序列的數(shù)據(jù)質(zhì)量進行快速評價。

因此基于當(dāng)前已建立的大數(shù)據(jù)處理平臺和并行與分布計算的思路,可以構(gòu)建多種面向大數(shù)據(jù)的數(shù)據(jù)質(zhì)量評價方法,應(yīng)對大數(shù)據(jù)對數(shù)據(jù)質(zhì)量評價帶來的挑戰(zhàn)。

4.4.4 基于專家知識庫的數(shù)據(jù)質(zhì)量評價模型

在目標(biāo)特性數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量研究中,不可缺少專業(yè)背景知識的支持,不可脫離領(lǐng)域知識實現(xiàn)數(shù)據(jù)質(zhì)量評價。開展基于專家知識庫的數(shù)據(jù)質(zhì)量評價方法研究主要基于專家知識面向數(shù)據(jù)質(zhì)量工作構(gòu)建專家知識庫,通過定量指標(biāo)閾值、邏輯組合和推理,以及定量指標(biāo)的語義化規(guī)范表達等方式進行評價。

知識庫系統(tǒng)是知識管理的工具和平臺,借助于這個平臺,各單位、部門可以更好的進行經(jīng)驗的積累、組織間的學(xué)習(xí)、知識的更新和共享,提高對不同數(shù)據(jù)生成場景下的應(yīng)變能力。“知識庫”不僅僅是狹義的存放知識的機構(gòu),它同時包括了知識庫的管理系統(tǒng)、用戶接口、知識獲取接口等部件,相當(dāng)于一個知識庫系統(tǒng)平臺。平臺上的應(yīng)用服務(wù)包括數(shù)據(jù)集成、數(shù)據(jù)挖掘、數(shù)據(jù)質(zhì)量在線分析等[11,13]。

數(shù)據(jù)集成和數(shù)據(jù)挖掘,按一定規(guī)則共享或合并分布在各個主體數(shù)據(jù)庫的信息,系統(tǒng)化、有序化進行分類存儲,用戶可按不同的需求提取平臺數(shù)據(jù)庫中的信息。數(shù)據(jù)質(zhì)量在線分析以平臺數(shù)據(jù)質(zhì)量知識庫為支持,把智能技術(shù)引入事故的分析處理工作中,重組基于平臺的數(shù)據(jù)質(zhì)量處理流程,用戶可實現(xiàn)事故處理的在線專家支持。用戶把數(shù)據(jù)相關(guān)信息錄入,在平臺質(zhì)量控制設(shè)置知識庫的支持下,完成數(shù)據(jù)質(zhì)量的初步分析,最后再根據(jù)特定的要求進行相應(yīng)修訂和調(diào)整,并為用戶提供數(shù)據(jù)質(zhì)量報告的參考方案。質(zhì)量管理原則中提到:基于事實的決策方法,即對數(shù)據(jù)和信息的邏輯分析或直覺判斷是有效決策的基礎(chǔ)。要對數(shù)據(jù)進行分析判斷,首要的問題就是要解決大量數(shù)據(jù)和信息的收集問題。因此,對分布在各責(zé)任主體內(nèi)部的廣泛質(zhì)量信息的采集是質(zhì)量控制平臺的基礎(chǔ)。數(shù)據(jù)集成就是共享或者合并兩個或多個應(yīng)用間的數(shù)據(jù),平臺中的數(shù)據(jù)集成是平臺質(zhì)量信息采集的實現(xiàn)方式。數(shù)據(jù)分布的各個主體,其內(nèi)部管理信息系統(tǒng)的結(jié)構(gòu)、平臺各異,交換的數(shù)據(jù)結(jié)構(gòu)、格式和要求也不一樣,要實現(xiàn)各主體間的數(shù)據(jù)信息交換、共享和集成,擬通過XML實現(xiàn)數(shù)據(jù)庫之間的數(shù)據(jù)交換。除了平臺主體的相互交互外,平臺上的數(shù)據(jù)倉庫和數(shù)據(jù)集市也以同樣的方式向平臺內(nèi)的各責(zé)任主體采集和調(diào)用后期進行數(shù)據(jù)挖掘所需的數(shù)據(jù)[12~13]。

大量廣泛的數(shù)據(jù)集成到了平臺上的數(shù)據(jù)倉庫中,數(shù)據(jù)的豐富帶來了對強有力的數(shù)據(jù)分析工具的需求,決策者迫切需要從海量數(shù)據(jù)中提取有價值的信息和知識。有針對性地進行數(shù)據(jù)提煉,數(shù)據(jù)挖掘技術(shù)在一些事實或觀察數(shù)據(jù)的集合中尋找模式的決策支持,發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系;統(tǒng)計一定時期內(nèi)質(zhì)量驗收合格率、優(yōu)良率統(tǒng)計信息,也是為了把握質(zhì)量發(fā)展的整體趨勢。知識庫通過數(shù)據(jù)集成,把數(shù)據(jù)和信息從不同的數(shù)據(jù)源取出來,然后轉(zhuǎn)換成公共的數(shù)據(jù)模型和數(shù)據(jù)倉庫中已有的數(shù)據(jù)集成在一起,當(dāng)各責(zé)任主體和用戶按不同的需求進行數(shù)據(jù)的分析挖掘時,需要的信息已經(jīng)準(zhǔn)備好了,數(shù)據(jù)沖突、表達不一致等問題得到解決,這使得各主體的決策查詢更容易、更有效。

基于知識庫的質(zhì)量分析處理流程的目標(biāo),是質(zhì)量責(zé)任主體將數(shù)據(jù)信息輸入計算機,質(zhì)量處理知識庫系統(tǒng)自動分析數(shù)據(jù)質(zhì)量,并提供相關(guān)的處理措施,達到智能化的專家支持。數(shù)據(jù)質(zhì)量的知識推理是知識庫依據(jù)對質(zhì)量的定量和定性的描述而推導(dǎo)出結(jié)論的過程[14]。

5 結(jié)語

數(shù)據(jù)質(zhì)量評價的指標(biāo)計算、獲取難度大,對于數(shù)據(jù)質(zhì)量評價在不同環(huán)境下的理論方法的研究程度并不相同,需要進行全局的綜合考慮;采用多層次數(shù)據(jù)質(zhì)量評價體系,進行統(tǒng)一的形式化定義,采用有監(jiān)督模式識別、專家知識庫體系與BP神經(jīng)網(wǎng)絡(luò)理論相結(jié)合的方法對作戰(zhàn)數(shù)據(jù)質(zhì)量進行評估。在評估模型構(gòu)建上,依次確定評估指標(biāo),組建評估網(wǎng)絡(luò)。該方法增強了評估的科學(xué)性與客觀性,評估誤差性較小,評估模型與評估方法簡單實用。

猜你喜歡
數(shù)據(jù)庫評價信息
SBR改性瀝青的穩(wěn)定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
基于Moodle的學(xué)習(xí)評價
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
保加利亞轉(zhuǎn)軌20年評價
多維度巧設(shè)聽課評價表 促進聽評課的務(wù)實有效
體育師友(2012年4期)2012-03-20 15:30:10
主站蜘蛛池模板: 成年午夜精品久久精品| 蜜臀AVWWW国产天堂| 国产一级毛片yw| 亚洲天堂.com| 爱色欧美亚洲综合图区| 欧美亚洲欧美| 人妻夜夜爽天天爽| 蝴蝶伊人久久中文娱乐网| 亚洲国产精品不卡在线| 日韩欧美国产综合| 国产成人成人一区二区| 国产18在线| 国产永久在线视频| 99九九成人免费视频精品 | 97超碰精品成人国产| 午夜小视频在线| 欧美曰批视频免费播放免费| 亚洲成a人在线观看| 91国内在线观看| 亚洲精品你懂的| 午夜性刺激在线观看免费| 东京热av无码电影一区二区| 国产成人久视频免费| 97久久免费视频| 亚洲精品视频免费| 视频二区欧美| 香蕉久久国产精品免| 精品国产成人高清在线| 午夜啪啪福利| 亚洲日韩欧美在线观看| 不卡无码h在线观看| 91亚洲视频下载| 欧美狠狠干| 播五月综合| 天天躁日日躁狠狠躁中文字幕| 在线观看国产小视频| 欧美精品影院| 九九视频在线免费观看| 澳门av无码| www.亚洲国产| 麻豆精品国产自产在线| 久久久久久久97| 丁香六月综合网| av尤物免费在线观看| 午夜国产大片免费观看| 亚洲AV电影不卡在线观看| 亚欧乱色视频网站大全| 国产成人综合日韩精品无码不卡 | 亚洲国产高清精品线久久| 免费人成视网站在线不卡| 亚洲第一香蕉视频| 一级毛片免费播放视频| 18黑白丝水手服自慰喷水网站| 小说区 亚洲 自拍 另类| 国产精彩视频在线观看| 亚洲激情99| 国产亚洲日韩av在线| 精品91自产拍在线| 亚洲αv毛片| 老司机久久99久久精品播放| 精品欧美日韩国产日漫一区不卡| 毛片网站在线播放| 精品国产成人av免费| 国产亚洲精品自在线| 午夜限制老子影院888| 美女视频黄又黄又免费高清| 不卡网亚洲无码| 欧美色香蕉| 精品人妻一区无码视频| 亚洲女同欧美在线| 99资源在线| 精品人妻一区无码视频| 亚洲日韩AV无码精品| 一区二区偷拍美女撒尿视频| 国产资源站| 国产精品污视频| 国产视频你懂得| 亚洲国产精品一区二区第一页免 | 久久久精品无码一区二区三区| 青草视频网站在线观看| 福利在线不卡一区| 成人午夜精品一级毛片 |