段平
(西北工業大學計算機學院,陜西 西安 710072)
區塊鏈是信息技術領域的專業術語,從數據本質角度來講,它屬于一種標準化共享數據庫,能公開追溯存儲信息或數據的具體來源,具有公開性、透明性、維護性、集體性等多項應用特征。在分布式數據存儲空間內,區塊鏈是屬于比特幣技術的重要物理概念,可在加密算法、共識機制等應用模式的支持下,去除位于數據庫中間位置的特征信息,再聯合底層比特處置技術,生成一連串與查詢密碼相關的數據塊組織,從而使每一個區塊單元都能獲得一個獨立的信息交互密碼本[1-2]。
通常情況下,隨著數據存儲量水平的提升,既定信息之間調取與應用會受到查詢密碼條件的影響,從而導致數據傳輸準確性不斷下降。為解決上述問題,傳統MySQL數據庫查詢方法通過信息分級處理的方式,建立必要索引條件,再根據已存儲文檔的結構類型,生成符合大數據分析需求的查詢語句。但該方法匹配的信息調取占用時間過長,針對此問題,設計基于區塊鏈技術的多維大數據交互式查詢方法。在NoSQL多維數據庫、Limit FIFO交互調度器等硬件設備結構的支持下,配置必要的關聯查詢系數,達到增強既定信息調取精準性的目的。
基于區塊鏈技術的多維大數據遷移調度包含NoSQL數據庫連接、遷移引擎設置和調度節點牽引3個必要步驟,具體操作及處理方法如下。
NoSQL多維數據庫是實現大數據交互式查詢的重要應用元件,由上層主機、中層多維數據結構、下層處置設備共同組成。其中,NoSQL主機、區塊鏈主機作為頂層查詢指令生成設備,可按照多維大數據的實際傳輸需求,分布交互式節點所處位置,同時將區塊鏈信息參量傳輸至多維數據層結構之中[3]。下層處置結構包含數據交互設備、數據查詢設備、信息集成設備3類應用元件。在信息集成設備保持交互式傳輸行為的情況下,數據交互設備會自發建立與數據查詢設備的物理連接,從而縮短相鄰數據節點間的傳輸距離,縮短調取既定信息占用的時間[4-5]。
大數據遷移引擎是與NoSQL多維數據庫相匹配的區塊鏈應用元件,具有MyISAM、InnoDB、MEMORY、MERGE、NDB 5種常見型號。從常規存儲權限的角度來看,InnoDB遷移引擎的信息承載能力最弱,僅能達到64 TB;MERGE遷移引擎的信息承載能力最強,在實際查詢過程中有時可超過1 024 TB。NDB遷移引擎支持的多維大數據結構體類型相對較少,設置多個獨立的交互式索引條件,僅允許區塊鏈信息在個別NoSQL數據庫空間內自由連接[6-7]。表1反映了必要的大數據遷移引擎設置條件。

圖1 NoSQL多維數據庫連接原理

表1 大數據遷移引擎設置條件
在多維大數據環境下,區塊鏈調度牽引是實現查詢節點交互式協調的重要處理手段,能根據一個特定信息的基礎查詢效率,推斷完成既定信息調取的理想占用時長,從而實現對交互數據結構的讀取與調用。節點牽引組織是一個相對獨立的區塊鏈數據結構,可按照多維數據庫中列表信息的排列順序,建立與交互式查詢行為相關的結構主體,再根據區塊鏈存儲位置處的數值注明條件,轉存查詢處置所必須的大數據結構信息,從而滿足既定信息的精準調取應用條件[8-9]。在不考慮其他調度節點牽引因素的情況下,設y代表大數據參量的多維計數條件,β代表區塊鏈組織所承載的大數據查詢調度系數,聯立上述物理量,可將區塊鏈調度節點的牽引公式定義為:

在區塊鏈技術原理的支持下,設置Limit FIFO交互調度器,通過多維大數據流集成、關聯查詢系數配置的處理流程,完成基于區塊鏈技術的多維大數據交互式查詢方法的搭建。
Limit FIFO交互調度器可根據區塊鏈組織間的調度節點牽引關系,建立合理的大數據查詢集合[10]。在n個多維大數據源同時向Limit FIFO設備輸出待查詢信息的情況下,交互節點與調度節點會自發建立與數據交互層結構和調度處理層結構的物理連接,存在于兩個層級單元中的Job節點會根據信息參量的數量級水平,更改連接所處的具體位置條件,再通過協調相鄰節點間位移權限的方式,來滿足不同大數據信息的交互式查詢需求。完成交互調度處理后,Limit FIFO設備會以區塊鏈處置的方式,將多維信息轉化成大數據腳本,以供其他設備元件的調取與應用[11-12]。

圖2 Limit FIFO交互調度器結構圖
多維大數據流集成可按照區塊鏈信息的連接方式,更改待查詢參量的排列行為,從而滿足交互式處置的基本應用需求。假設多維信息始終保持由起始位置指向結束位置的傳輸方向,則可將大數據流集成操作轉化為Table節點、External節點、Partition節點間的查詢關系已確定[13-14]。若區塊鏈組織的交互傳輸關系始終保持穩定,Table節點可直接作為多維大數據的起始查詢位置,且在External節點的促進下,交互式查詢結構會變更至Partition節點所在位置,并釋放暫存于其中的待處理參量信息,直至最終輸出的多維大數據能夠保持穩定的柱狀流體狀態。圖3反映了完整的多維大數據流集成處理流程。

圖3 多維大數據流集成處理流程圖
關聯查詢系數配置是多維大數據交互式查詢方法的末尾處理環節,可在區塊鏈調度節點牽引關系的促進下,計算多級維度條件的最大和最小限定系數[15]。在不考慮既定信息集成作用的前提下,關聯查詢系數配置結果只受到大數據存儲總量及區塊鏈交互系數的直接影響[16]。區塊鏈交互系數常表示為f,在大數據查詢處理過程中,該項物理量的數值水平始終保持穩定,且能夠促進交互式處理信息出現明顯的累積變化行為。聯立式(1),可將關聯查詢系數的配置結果表示為:

式(2)中,i0代表多維大數據的下限極值條件,i1代表多維大數據的上限極值條件,u代表大數據流的平均集成系數,u′代表Limit FIFO交互調度器所承載的交互式查詢系數,代表大數據遷移引擎的調度權限平均值。至此,完成基礎執行環境建立及各項指標參數計算,在區塊鏈組織結構的支持下,實現多維大數據交互式查詢方法的順利應用。
為驗證基于區塊鏈技術多維大數據交互式查詢方法的實際應用價值,設計如下對比實驗。在海量數據存儲環境下,選取存儲波長完全相同的多維大數據作為實驗對象,分別以搭載交互式查詢方法和傳統MySQL數據庫查詢行為的檢測計算機作為實驗組、對照組數值記錄元件,在相同實驗環境下,根據實驗指標的具體變化情況,分析信息傳輸的準確性、信息調取占用時間的實際表現行為。
以圖4所示數據生成主機作為海量數據提供元件,再借助傳輸導線,將多維信息參量導入圖5所示的查詢控制設備中,更改支配主機的數據查詢方法,分別獲取實驗組、對照組的實驗數據指標。

圖4 數據生成主機

圖5 查詢控制設備
以75 min作為實驗時長,分別記錄在該段時間內,實驗組、對照組信息傳輸準確性的數值變化情況,實驗詳情如圖6所示。

圖6 信息傳輸準確性對比圖
分析圖6可知,實驗組、對照組信息傳輸準確性均保持上升、下降交替出現的變化趨勢,從極大值角度來看,實驗組數值達到89%,而對照組數值僅達到58%,二者差值為31%;從平均值角度來看,實驗組數值接近55%,而對照組數值僅為45%,二者差值為10%。綜上可知,應用基于區塊鏈技術多維大數據交互式查詢方法,能夠在一定程度上提升信息傳輸的準確性。
分別記錄大數據總量處于1×109~9×109T時,信息調取占用時間的具體變化情況,實驗詳情如表2所示。

表2 信息調取占用時間對比表
分析表2可知,隨著大數據總量數值的增加,實驗組信息調取占用時間先小幅度波動、再持續下降,全局最大值僅達到0.88 ms;對照組信息調取占用時間則始終保持不斷上升的變化趨勢,全局最大值達到1.63 ms,遠高于實驗組極值水平。綜上可知,應用基于區塊鏈技術多維大數據交互式查詢方法,可有效降低信息調取所需的基礎占用時間。
在區塊鏈技術的支持下,多維大數據交互式查詢方法在傳統MySQL數據庫查詢行為的基礎上,聯合大數據遷移引擎、Limit FIFO調度器等執行設備,同時實現數據流量的集成與節點組織的牽引。從實用角度來看,信息傳輸準確性與信息調取占用時間均向著理想化方向發展,海量數據存儲環境下,既定信息應用調取不精準的問題也得到了有效解決。