劉春偉



摘要:當前的分布式文件數(shù)據(jù)并行訪問矩陣多為單結構,且訪問的識別范圍較小,導致訪問耗時延長。為此,本文對基于BS架構的分布式文件數(shù)據(jù)并行訪問方法進行設計與分析,根據(jù)實際的訪問需求和標準,進行基礎并行訪問數(shù)據(jù)預處理;采用多階的形式,擴大訪問的識別范圍,設計多階交叉并行訪問矩陣,構建BS架構分布式文件數(shù)據(jù)并行訪問模型;采用自適應轉換修正實現(xiàn)并訪問處理。測試結果表明,對比于傳統(tǒng)Spring分布式文件數(shù)據(jù)并行訪問測試組、傳統(tǒng)CP-ABE分布式文件數(shù)據(jù)并行訪問測試組,此次設計的BS架構分布式文件數(shù)據(jù)并行訪問測試組最終得出的分布式文件數(shù)據(jù)并行訪問耗時均被較好地控制在0.2s以下,說明此種訪問方法的針對性和穩(wěn)定性更高,在BS架構的輔助下,可以加強對訪問誤差的控制,具有實際的應用價值。
關鍵詞:BS架構;分布式文件;文件數(shù)據(jù)處理;并行訪問;訪問方法;文件識別
一、引言
文件數(shù)據(jù)的并行訪問是一種多維訪問方式,具有一定的針對性,可以在不同的環(huán)境下對數(shù)據(jù)和信息進行協(xié)同處理整合,進而達到預期訪問目標。當前,較為常用的文件數(shù)據(jù)并行訪問方式一般為單程序,例如參考文獻[1]和文獻[2]設定傳統(tǒng)Spring分布式文件數(shù)據(jù)并行訪問方法、傳統(tǒng)CP-ABE分布式文件數(shù)據(jù)并行訪問方法。這類訪問方法雖然可以實現(xiàn)預期目標和任務,但是缺乏穩(wěn)定性和轉換性,所述訪問目標也不明確,容易造成訪問失敗、文件數(shù)據(jù)丟失、文件丟失等情況,產生不可控的損失[3]。此外,單結構文件數(shù)據(jù)并行訪問形式執(zhí)行效率較低,覆蓋的訪問范圍也受到限制,約束較多,容易影響最終的訪問結果[4]。為此,本文對基于BS架構的分布式文件數(shù)據(jù)并行訪問方法進行設計與驗證分析。BS架構指的是瀏覽器、服務器架構模式,在實際應用過程中隨目標變化作出對應的改進調整,形成三層邏輯結構,為日常生產生活提供了極大的便利條件[5]。將該項技術與分布式文件數(shù)據(jù)并行訪問方法相融合可以進一步擴大訪問范圍,形成更靈活、多變的訪問結構,同時,面對復雜的訪問環(huán)境,也可以逐步強化訪問程序,與初始數(shù)據(jù)庫搭接,形成更安全、穩(wěn)定的文件數(shù)據(jù)訪問環(huán)境,便于交互的同時,為后續(xù)相關訪問技術和行業(yè)發(fā)展奠定基礎[6]。
二、設計分布式文件數(shù)據(jù)BS架構并行訪問方法
(一)基礎并行訪問數(shù)據(jù)預處理
通常情況下,分布式文件數(shù)據(jù)量十分龐大,因此在對其進行并行訪問之前,需要搭建多維訪問結構的支撐,并對基礎并行訪問數(shù)據(jù)進行預處理[7]。傳統(tǒng)的訪問格式是單向的,對數(shù)據(jù)、信息的采集效率較低,導致后續(xù)訪問指令執(zhí)行出現(xiàn)阻礙[8]。因此,首先進行基礎數(shù)據(jù)的采集和設置,設置并行訪問數(shù)據(jù)指標,分別是并行柵格數(shù)量/個、獨立訪問次數(shù)/次、數(shù)據(jù)讀入比、吞吐力變動比、訪問映射點/個;接著,依據(jù)指標設置基礎參數(shù)標準值,分別為5、12、6.33、3.2、10;最后,依據(jù)指標設置實測參數(shù)標準值,分別為8、18、7.15、4.2、16。其次,在完成對并行訪問數(shù)據(jù)采集的設置與分析后,結合分布式文件數(shù)據(jù)的訪問需求及標準,在標定的范圍之內設置多個訪問節(jié)點。需要注意的是,節(jié)點在設置時互相獨立,需要建立對應的接入關系,以形成循環(huán)式的數(shù)據(jù)采集形式,提升后續(xù)的并行訪問效率。最后,以此為基礎,將獲取的并行訪問數(shù)據(jù)進行分類、篩選,消除采集的數(shù)據(jù)誤差及相關問題,確保數(shù)據(jù)的真實性和可靠性,實現(xiàn)對文件數(shù)據(jù)并行訪問的預處理。需要注意的是,采集數(shù)據(jù)一般是實時的,所以在進行預處理時,設置的標準也不固定,需要隨著實際訪問需求和標準作出定向調整,以此提升數(shù)據(jù)訪問處理的靈活度。
(二)設計多階交叉并行訪問矩陣
在完成基礎并行訪問數(shù)據(jù)預處理后,設計多階交叉并行訪問矩陣。當前應用的訪問矩陣多為單結構,雖然可以完成對分布式文件數(shù)據(jù)的并行訪問目標,但是訪問效率及速度均有待提升,且有不可控性。而多階交叉訪問矩陣在實際處理過程中可將訪問誤差降至最低,確保訪問結果的真實可靠。以下建立基礎的并行訪問測定結構,并計算出訪問互斥比,如公式1所示:
在上式中,M表示并行訪問互斥比,A表示轉換訪問定值差,θ表示訪問總范圍,C1和C2分別表示定向訪問單元值和實測訪問單元值,λ表示分離訪問節(jié)點數(shù)量,ε表示并行處理極限值。結合計算得出的并行訪問互斥比,調整矩陣的訪問基準值,并設定并行訪問約束條件,形成更完整、具體的訪問矩陣結構。
以此為基礎,結合BS架構,設計多維的并行訪問空間,以訪問目標為引導,設置多個文件訪問層級,每個層級均需設置對應訪問標準,目的是強化矩陣訪問精準度,消除過程中存在的并行訪問誤差。同時,采用交叉方式執(zhí)行矩陣中的訪問目標,以此輸出模糊的訪問結果。
(三)構建BS架構分布式文件數(shù)據(jù)并行訪問模型
在完成多階交叉并行訪問矩陣設計后,結合BS架構,構建分布式文件數(shù)據(jù)并行訪問模型。首先,對所選分布式文件進行分類和篩選,保障數(shù)據(jù)信息的真實與穩(wěn)定;隨即利用設置的矩陣進行數(shù)據(jù)格式轉換,重新調整并行訪問標準;最后,再結合BS架構,構建分布式文件數(shù)據(jù)并行訪問模型的執(zhí)行結構。
通過BS架構來建立分支式并行訪問結構,可以輸出模糊的訪問處理結果。需要注意的是,每個訪問結果均為初始結果,在模型中構建分布式并行訪問邏輯需要利用BS架構進行多維限制,針對每個目標進行排序處理,獲取結構后,并對模糊結果做修正及整合處理,以提升并行訪問結果的精準度和可靠性。
(四)自適應轉換修正實現(xiàn)并訪問處理
在完成BS架構分布式文件數(shù)據(jù)并行訪問模型的設計后,采用自適應轉換修正方式實現(xiàn)并行訪問處理。為了更好解決分布式文件數(shù)據(jù)并行訪問的一致性問題,需要建立相對的訪問修正關系,采用自適應方式建立智能修正程序。具體流程是:首先,進行基礎數(shù)據(jù)采集,并根據(jù)基礎數(shù)據(jù)設定緩沖區(qū)域和基礎訪問目標;接著,進行日志修正處理和數(shù)值讀取;最后,輸出自適應修正結果。
依據(jù)上述流程對并行訪問獲取結果進行修正,接著進行并行訪問修正限值差的計算,具體如公式2所示:
在上式中,X表示訪問修正限值差,τ表示并行約束值, 表示單元修正比,μ表示單元修正次數(shù),ρ表示堆疊值。結合訪問修正限值差,進行訪問結果比對,最大程度地降低并行訪問誤差,確保最終訪問結果的可靠性和穩(wěn)定性。
三、方法測試
本次主要對基于BS架構的分布式文件數(shù)據(jù)并行訪問方法的應用效果進行分析驗證,考慮到測試結果的真實性和可靠性,采用對比方式展開分析,選定A企業(yè)平臺的分布式文件作為測試的主要目標對象,參考文件設定傳統(tǒng)Spring分布式文件數(shù)據(jù)并行訪問測試組、傳統(tǒng)CP-ABE分布式文件數(shù)據(jù)并行訪問測試組以及此次所設計的BS架構分布式文件數(shù)據(jù)并行訪問測試組,根據(jù)當前測試需求和標準的變化,對最終的并行訪問結果進行對比研究。
(一)測試準備
結合BS架構,對A企業(yè)平臺分布式文件數(shù)據(jù)并行訪問測試環(huán)境進行搭建與關聯(lián)。首先,在A企業(yè)平臺中隨機定位4個分布式,標定出所屬的分布式文件,匯總整合后以待后續(xù)使用。調整當前平臺的控制基礎數(shù)值,采用I5 CPU、12 GB 內存及 Linux 操作系統(tǒng)作為本次測試的主要支撐,調整E3-1230 處理器的運行頻率為 3.5 GHz,調用 MIRACL 庫與測試的訪問程序進行搭接,形成循環(huán)性的并行處理結構。設置主控節(jié)點和I/O雙向控制節(jié)點。為了確保訪問處理結果的真實性和可靠性,將設置的節(jié)點相關聯(lián),構建并行訪問矩陣,同時計算基礎并行效率,具體如公式3所示:
在上式中,D表示訪問并行效率,θ表示覆蓋訪問范圍,m表示轉換并行比,n表示訪問次數(shù), 表示網(wǎng)絡運行效率。結合當前測試需求,將計算得出的訪問并行效率設置為對應的并行訪問標準。
接下來基于BS架構,構建初始并行訪問結構:第一,設置訪問目標和訪問標準;第二,設置訪問矩陣并調整訪問需求;第三,使用bs架構進行訪問引導;第五,進行分布式文件標定和數(shù)據(jù)匯總整合;第六,輸出訪問結果。
在完成對BS架構文件數(shù)據(jù)并行訪問結構的設計后,在此基礎上,設置分布式數(shù)據(jù)并行訪問指標及參數(shù),具體如表1所示:
根據(jù)表1,首先設置分布式數(shù)據(jù)并行訪問指標及參數(shù);接著,以此為基礎,進行基礎測試環(huán)境的調整,確保測試過程中的穩(wěn)定與安全;最后,綜合BS架構,對A企業(yè)平臺中的分布式文件數(shù)據(jù)的并行訪問方法進行測試研究。
(二)測試過程及結果分析
在上述搭建的測試環(huán)境中,結合BS架構,對A企業(yè)平臺中的分布式文件數(shù)據(jù)的并行訪問方法的實際應用效果進行分析和驗證研究。首先,利用設定的節(jié)點進行實時數(shù)據(jù)以及信息的采集,針對選定的4個區(qū)域,標定出一定數(shù)量的為分布式文件,分別為12份、16份、21份、25份,利用專業(yè)的軟件及設備進行分布式文件中基礎性數(shù)據(jù)以及信息的提取,匯總整合后,測算出單元文件數(shù)據(jù)訪問并行量,具體如下公式4所示:
在上式中,K表示單元文件數(shù)據(jù)訪問并行量,γ表示訪問基準值,α表示訪問次數(shù), 表示運行時間,ψ表示并行效率,y表示并行加速比。結合當前的單元文件數(shù)據(jù)訪問并行量,針對選取的文件數(shù)據(jù),進行并行訪問耗時,具體如下公式5所示:
在上式中,P代表訪問所耗時間,?代表覆蓋的范圍,π代表單次訪問的效率,w代表訪問的頻次, 代表讀取的次數(shù),ω代表讀取訪問的單元值。結合當前的測試需求,對測試結果比照研究,如圖1所示。
分析上圖測試結果可知,對比于傳統(tǒng)Spring分布式文件數(shù)據(jù)并行訪問測試組、傳統(tǒng)CP-ABE分布式文件數(shù)據(jù)并行訪問測試組,此次所設計的BS架構分布式文件數(shù)據(jù)并行訪問測試組最終得出的分布式文件數(shù)據(jù)并行訪問耗時均被較好地控制在0.2s以下,說明此種訪問方法的針對性與穩(wěn)定性更高,在BS架構的輔助下,可以加強訪問誤差控制,具有實際的應用價值。
四、結束語
本文基于BS架構的分布式文件數(shù)據(jù)并行訪問方法進行設計與驗證分析,與初始的訪問結構相對比,此次結合BS架構設計的針對文件數(shù)據(jù)的并行訪問方法具有更加靈活、更加多變的特性,同時具有更強的針對性。在復雜的環(huán)境背景下,當前的訪問程序可以精準定位到對應的訪問區(qū)域以及位置,存在多任務、綜合化、模塊化、統(tǒng)一網(wǎng)絡、高度集成等特點,結合分布式文件數(shù)據(jù)的訪問需求及標準,加強對文件數(shù)據(jù)并行訪問誤差的控制,推動數(shù)據(jù)并行訪問技術邁入新的發(fā)展臺階。
參考文獻
[1]張彤,嚴南.基于Spring的輕量級數(shù)據(jù)訪問框架擴展點研究[J].計算機仿真,2023,40(02):380-384.
[2]朱莉.基于CP-ABE的云存儲數(shù)據(jù)訪問控制方案研究[J].船舶職業(yè)教育,2023,11(01):74-77.
[3]趙慧.命名數(shù)據(jù)網(wǎng)絡中基于CP-ABE算法構建區(qū)塊鏈數(shù)據(jù)訪問控制系統(tǒng)[J].數(shù)字通信世界,2023(01):46-48.
[4]韓剛,王嘉乾,羅維,等.公共衛(wèi)生事件中醫(yī)療數(shù)據(jù)訪問控制與安全共享研究[J].信息安全學報,2023,8(01):40-54.
[5]劉秋明,許澤峣,姚哲鑫,等.融合屬性基加密和信用度的水利數(shù)據(jù)訪問控制模型[J].科學技術與工程,2023,23(01):263-273.
[6]王洪亮,葉翔.數(shù)據(jù)訪問權的構造——數(shù)據(jù)流通實現(xiàn)路徑的再思考[J].社會科學研究,2023(01):71-84.
[7]李靜元,張珂,楊東裕.基于霧計算的工業(yè)互聯(lián)網(wǎng)安全數(shù)據(jù)訪問方法[J].計算機與現(xiàn)代化,2022(12):118-122.
[8]蔣偉進,羅田甜,楊瑩,等.物聯(lián)網(wǎng)環(huán)境下基于區(qū)塊鏈技術的私有數(shù)據(jù)訪問控制模型[J].物聯(lián)網(wǎng)學報,2022,6(04):169-182.