肖楠
(西安交通工程學(xué)院公共課部,陜西西安 710300)
大數(shù)據(jù)檢測(cè)是一種相對(duì)有效的機(jī)器學(xué)習(xí)型信息處理手段,可在已知數(shù)據(jù)存儲(chǔ)行為的基礎(chǔ)上,將信息參量整合成全新的應(yīng)用傳輸形式[1-2]。傳統(tǒng)的數(shù)據(jù)檢測(cè)手段可在局部離群因子的作用下,確定局部異常點(diǎn)所處的實(shí)際位置,再通過信息復(fù)雜度對(duì)比的方式,實(shí)現(xiàn)對(duì)異構(gòu)型數(shù)據(jù)參量的反饋與對(duì)比[3],如基于兩級(jí)分段模型的異構(gòu)數(shù)據(jù)處理與檢測(cè)方法[4],但此方法并不能完全規(guī)避大數(shù)據(jù)網(wǎng)絡(luò)中的風(fēng)險(xiǎn)性信息傳輸行為,易導(dǎo)致數(shù)據(jù)穩(wěn)定抵抗能力的持續(xù)下降。
數(shù)據(jù)轉(zhuǎn)換服務(wù)(Data Transformation Service,DTS)特指DTS 解碼原理,可以直接對(duì)數(shù)字信號(hào)源進(jìn)行分類處理,然后再按照既定順序?qū)⑿畔⒘堪l(fā)送至核心應(yīng)用主機(jī)之中。與其他數(shù)據(jù)處理手段相比,DTS 解碼可在無接入設(shè)備作用的前提下,將原始信息參量直接轉(zhuǎn)存至數(shù)據(jù)庫(kù)結(jié)構(gòu)體中,再借助輸入、輸出信道,將這些文件參量轉(zhuǎn)換成其他存儲(chǔ)形式,從而滿足與多模態(tài)異構(gòu)數(shù)據(jù)相關(guān)的檢測(cè)處理需求[5-6]。
因此,針對(duì)傳統(tǒng)方法存在的不足,提出基于DTS的多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法,在深度置信網(wǎng)絡(luò)的基礎(chǔ)上,建立必要的線性映射條件,再通過數(shù)據(jù)參量清洗的方式,實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)的降維處理。
基于DTS的多模態(tài)異構(gòu)大數(shù)據(jù)提取由深度置信網(wǎng)絡(luò)搭建、異構(gòu)數(shù)據(jù)編碼、DTS 線性映射條件設(shè)置3 個(gè)環(huán)節(jié)共同組成。
深度置信網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。

圖1 深度置信網(wǎng)絡(luò)結(jié)構(gòu)圖
深度置信網(wǎng)絡(luò)由RBM1、RBM2、RBM3 3 個(gè)模塊單元結(jié)構(gòu)共同組成。其中,RBM1 單元負(fù)載一列y0節(jié)點(diǎn)和一列y1節(jié)點(diǎn),前者能夠判斷DTS 環(huán)境下,多模態(tài)異構(gòu)大數(shù)據(jù)是否具備繼續(xù)傳輸?shù)哪芰?,后者可根?jù)既定檢測(cè)指令的傳輸行為,將已打包的信息參量由頂層異構(gòu)結(jié)構(gòu)體反饋至底層異構(gòu)結(jié)構(gòu)體之中[7-8]。RBM2 單元負(fù)載一列y1節(jié)點(diǎn)和一列y2節(jié)點(diǎn),兩者互相聯(lián)合,形成完整的異構(gòu)型大數(shù)據(jù)傳輸單元,并可在DTS 解碼原理的作用下,實(shí)現(xiàn)對(duì)信息參量的整合與處理。RBM3 單元位于深度置信網(wǎng)絡(luò)底層,可在多模態(tài)節(jié)點(diǎn)的作用下,將散亂分布的大數(shù)據(jù)信息整合成異構(gòu)型傳輸形式。
異構(gòu)數(shù)據(jù)編碼可在深度置信網(wǎng)絡(luò)的基礎(chǔ)上,對(duì)DTS 型信息參量進(jìn)行初步的整合處理,一般情況下,需要原編碼節(jié)點(diǎn)、過度法則、多模態(tài)結(jié)構(gòu)體三類執(zhí)行結(jié)構(gòu)的共同配合[9]。原編碼節(jié)點(diǎn)同時(shí)存在于深度置信網(wǎng)絡(luò)的兩端,可在過度法則的作用下,變更多模態(tài)異構(gòu)體的現(xiàn)有連接形式,并可遵照DTS 信道傳輸行為,將這些信息參量反饋至核心數(shù)據(jù)庫(kù)存儲(chǔ)單元之中。過度法則對(duì)異構(gòu)數(shù)據(jù)編碼原則進(jìn)行了集中化約束,可在聯(lián)合原編碼節(jié)點(diǎn)與多模態(tài)異構(gòu)體的同時(shí),感知DTS 環(huán)境中大數(shù)據(jù)信息參量的現(xiàn)有傳輸形態(tài),并可按照信息檢測(cè)機(jī)制的作用形式,對(duì)各項(xiàng)大數(shù)據(jù)結(jié)構(gòu)體進(jìn)行集中化處理[10]。
異構(gòu)數(shù)據(jù)編碼原理如圖2 所示。

圖2 異構(gòu)數(shù)據(jù)編碼原理
DTS 線性映射條件是與多模態(tài)異構(gòu)大數(shù)據(jù)相關(guān)的信息檢索標(biāo)準(zhǔn),可在已知數(shù)據(jù)存儲(chǔ)權(quán)限值的基礎(chǔ)上,對(duì)待檢測(cè)信息存儲(chǔ)形式進(jìn)行重新安排,從而實(shí)現(xiàn)對(duì)大數(shù)據(jù)異構(gòu)模態(tài)行為的規(guī)劃與協(xié)調(diào)。數(shù)據(jù)存儲(chǔ)權(quán)限值可表示為λ,在既定檢測(cè)時(shí)長(zhǎng)內(nèi),該項(xiàng)物理量的實(shí)值水平越高,多模態(tài)異構(gòu)大數(shù)據(jù)的待處置應(yīng)用量也就越大。xn代表最后一個(gè)輸入的大數(shù)據(jù)異構(gòu)體參量,n代表與該指標(biāo)匹配的多模態(tài)系數(shù)指標(biāo)。x1代表第一個(gè)輸入的大數(shù)據(jù)異構(gòu)體參量,聯(lián)立上述物理量,可將大數(shù)據(jù)網(wǎng)絡(luò)中的DTS 線性映射條件定義為:

其中,χ代表DTS 環(huán)境下與多模態(tài)大數(shù)據(jù)相關(guān)的異構(gòu)處理應(yīng)用量,Δq代表單位檢測(cè)時(shí)長(zhǎng)內(nèi)大數(shù)據(jù)檢測(cè)行為指標(biāo)的實(shí)際變化量。
在DTS 提取原理的支持下,按照數(shù)據(jù)參量清洗、二值化轉(zhuǎn)換、異構(gòu)數(shù)據(jù)降維的處理流程,實(shí)現(xiàn)新型多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法的順利應(yīng)用。
數(shù)據(jù)參量清洗流程如圖3 所示。

圖3 數(shù)據(jù)參量清洗流程圖
數(shù)據(jù)參量清洗是與多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)相關(guān)的重要信息處理流程,常以獲取DTS應(yīng)用背景作為起始執(zhí)行環(huán)節(jié)。一般情況下,隨著信息多模態(tài)異構(gòu)形式復(fù)雜度的增加,數(shù)據(jù)信息的存儲(chǔ)參量值也會(huì)隨之增大,直至將檢測(cè)數(shù)據(jù)庫(kù)的存儲(chǔ)空間完全填滿11-12]。若多模態(tài)異構(gòu)大數(shù)據(jù)的連接形式始終保持不變,最終信息檢測(cè)結(jié)果的有效性只與參量之間的編碼原則相關(guān),且在DTS 線性映射條件的作用下,待處理的大數(shù)據(jù)總量越多,最終所獲得的參量清洗結(jié)果也就越明顯,反之則難以獲取到理想化的信息檢測(cè)結(jié)果[13-14]。
二值化轉(zhuǎn)換是一種有效的多模態(tài)異構(gòu)信息處理行為,可在大數(shù)據(jù)網(wǎng)絡(luò)中聯(lián)合所有待編碼的DTS 節(jié)點(diǎn),一方面降低異構(gòu)數(shù)據(jù)之間的關(guān)聯(lián)度水平,另一方面縮短信息與信息之間的實(shí)際傳輸距離[15-16]。在不考慮其他干擾條件的情況下,二值化轉(zhuǎn)換結(jié)果只受數(shù)據(jù)參量清洗基向量、數(shù)據(jù)存儲(chǔ)方向權(quán)值兩項(xiàng)物理量的直接影響。
將數(shù)據(jù)參量清洗基向量表示為αn,在既定檢測(cè)條件下,隨著已輸入信息數(shù)量級(jí)水平的提升,該項(xiàng)物理指標(biāo)的實(shí)際數(shù)值等級(jí)也會(huì)隨之增大。數(shù)據(jù)存儲(chǔ)方向權(quán)值可表示為Kˉ,一般情況下,若該項(xiàng)指標(biāo)的表現(xiàn)實(shí)值不超過自然數(shù)1,則可認(rèn)為最終的檢測(cè)執(zhí)行結(jié)果可取。聯(lián)立式(1),可將多模態(tài)異構(gòu)大數(shù)據(jù)的二值化轉(zhuǎn)換結(jié)果表示為:

其中,s0代表最小的信息多模態(tài)異構(gòu)系數(shù),sn代表最大的信息多模態(tài)異構(gòu)系數(shù),f代表兩個(gè)相鄰大數(shù)據(jù)信息參量間的實(shí)際傳輸距離值,ξ代表冪次項(xiàng)應(yīng)用指標(biāo),d代表常性轉(zhuǎn)換系數(shù)。
異構(gòu)數(shù)據(jù)降維是多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法應(yīng)用的末尾處理環(huán)節(jié),可在DTS 環(huán)境中,根據(jù)二值化轉(zhuǎn)換原理的作用權(quán)限,確定數(shù)據(jù)信息在單位時(shí)間內(nèi)的實(shí)際存儲(chǔ)數(shù)量值。規(guī)定ΔT代表一個(gè)單位檢測(cè)時(shí)長(zhǎng),隨著多模態(tài)異構(gòu)信息輸入量的增加,與之相關(guān)的檢測(cè)時(shí)間消耗實(shí)值也會(huì)逐漸增大,直接與大數(shù)據(jù)應(yīng)用主機(jī)的處置權(quán)限完全相符。設(shè)L~ 代表符合DTS 環(huán)境存儲(chǔ)標(biāo)準(zhǔn)的數(shù)據(jù)消耗權(quán)限值,一般情況下,如果不出現(xiàn)明顯的差異化數(shù)據(jù)異構(gòu)行為,該項(xiàng)物理量的實(shí)際數(shù)值水平也不會(huì)出現(xiàn)明顯的變化狀態(tài)。在上述物理量的支持下,聯(lián)立式(2),可將多模態(tài)異構(gòu)大數(shù)據(jù)的降維處理結(jié)果表示為:

其中,a0代表與多模態(tài)大數(shù)據(jù)參量相關(guān)的最小連接異構(gòu)條件,an代表多模態(tài)大數(shù)據(jù)參量相關(guān)的最大連接異構(gòu)條件,gn、g1分別代表兩個(gè)非同時(shí)輸入的待檢測(cè)信息參量指標(biāo)。至此,實(shí)現(xiàn)各項(xiàng)參量系數(shù)指標(biāo)的計(jì)算與處理,在DTS 解碼原理的支持下,完成新型多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法的搭建。
為驗(yàn)證基于DTS 多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法的實(shí)際應(yīng)用價(jià)值,設(shè)計(jì)如下對(duì)比實(shí)驗(yàn)。
在大數(shù)據(jù)網(wǎng)絡(luò)中,截取兩組等長(zhǎng)的傳輸數(shù)據(jù)參量,分別作為實(shí)驗(yàn)組、對(duì)照組檢測(cè)處理對(duì)象。令實(shí)驗(yàn)組執(zhí)行主機(jī)搭載基于DTS 多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法,對(duì)照組執(zhí)行主機(jī)搭載傳統(tǒng)的基于兩級(jí)分段模型的異構(gòu)數(shù)據(jù)處理與檢測(cè)方法,在確保其他干擾條件保持不變的情況下,記錄各項(xiàng)實(shí)驗(yàn)指標(biāo)的實(shí)際變化情況。
出于實(shí)驗(yàn)公平性考慮,除所用檢測(cè)方法不同外,實(shí)驗(yàn)組、對(duì)照組所有應(yīng)用指標(biāo)全部保持一致。實(shí)驗(yàn)參數(shù)設(shè)置情況如表1 所示。

表1 實(shí)驗(yàn)參數(shù)設(shè)置
IID 指標(biāo)能夠反映與檢測(cè)主機(jī)匹配的信息傳輸行為風(fēng)險(xiǎn)性規(guī)避能力,一般情況下,指標(biāo)數(shù)值越大,檢測(cè)主機(jī)所具有的規(guī)避能力也就越強(qiáng),反之則越弱。表2 記錄了實(shí)驗(yàn)組、對(duì)照組IID 指標(biāo)的具體變化情況。

表2 IID指標(biāo)對(duì)比表
分析表2 可知,隨著實(shí)驗(yàn)時(shí)間的延長(zhǎng),實(shí)驗(yàn)組IID 指標(biāo)始終保持先上升、再穩(wěn)定的變化趨勢(shì),全局最大值能夠達(dá)到95%,且能夠出現(xiàn)10 min的數(shù)值穩(wěn)定狀態(tài)。對(duì)照組IID 指標(biāo)則在20 min的穩(wěn)定狀態(tài)后,開始不斷下降,全局最大值僅能達(dá)到70%,與實(shí)驗(yàn)組極值相比,下降了25%。綜上可知,應(yīng)用基于DTS 多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法,可大幅提升IID 指標(biāo)的數(shù)值水平,從而增強(qiáng)與檢測(cè)主機(jī)匹配的信息傳輸行為風(fēng)險(xiǎn)性規(guī)避能力。
PEI 指標(biāo)能夠反映多模態(tài)異構(gòu)數(shù)據(jù)的穩(wěn)定抵抗能力,一般情況下,前者的數(shù)值指標(biāo)越大,后者的穩(wěn)定抵抗能力也就越強(qiáng),反之則越弱。表3 記錄了實(shí)驗(yàn)組、對(duì)照組PEI 指標(biāo)的實(shí)際數(shù)值變化情況。
分析表3 可知,隨著實(shí)驗(yàn)時(shí)間的延長(zhǎng),實(shí)驗(yàn)組PEI 指標(biāo)始終保持上升、下降交替出現(xiàn)的變化趨勢(shì),全局最大值能夠達(dá)到82%。對(duì)照組PEI 指標(biāo)則保持先上升,再穩(wěn)定,最后下降的變化趨勢(shì),全局最大值僅能達(dá)到56%,與實(shí)驗(yàn)組極值相比,下降了26%。綜上可知,應(yīng)用基于DTS 多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法,可使PEI 指標(biāo)數(shù)值得到有效提高,滿足增強(qiáng)多模態(tài)異構(gòu)數(shù)據(jù)穩(wěn)定抵抗能力的實(shí)際應(yīng)用需求。

表3 PEI指標(biāo)對(duì)比表
與傳統(tǒng)的異構(gòu)數(shù)據(jù)檢測(cè)手段相比,新型多模態(tài)異構(gòu)大數(shù)據(jù)檢測(cè)方法可在DTS 編碼原理的作用下建立必備的線性映射條件,也可在聯(lián)合深度置信網(wǎng)絡(luò)的同時(shí),確定與異構(gòu)數(shù)據(jù)相關(guān)的實(shí)際編碼原則。若能夠保障數(shù)據(jù)參量的清洗能力,則能夠在二值化轉(zhuǎn)換技術(shù)的作用下,實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)的降維處理。從實(shí)用性角度來看,IID 指標(biāo)與PEI 指標(biāo)數(shù)值的提升,能夠大幅加強(qiáng)與檢測(cè)主機(jī)匹配的信息傳輸行為風(fēng)險(xiǎn)性規(guī)避能力,且可實(shí)現(xiàn)對(duì)多模態(tài)異構(gòu)數(shù)據(jù)穩(wěn)定抵抗能力的有效保障。