楊毅

摘要:通過對Web大數據庫的訪問,提高數據庫的查詢和信息調度能力。傳統方法采用基于信息流減法聚類和模糊C均值調度的數據庫訪問算法,對數據庫訪問過程中的稀疏度均衡能力不好。提出一種基于稀疏度均衡調度的數據庫優化訪問算法,分析了數據庫中海量數據存儲結構模型,進行數據融合和冗余信息濾除處理。采用稀疏度均衡調度方法進行特征提取和數據庫訪問過程中的均衡調度,提高數據查準率。仿真結果表明,利用該算法進行數據庫訪問的均衡性能較好,數據的查準率和查全率較高。
關鍵詞:數據庫;稀疏度;均衡調度;數據庫優化訪問
DOIDOI:10.11907/rjdk.161065
中圖分類號:TP392
文獻標識碼:A 文章編號:1672-7800(2016)005-0166-03
0 引言
隨著信息技術和大數據技術的快速發展,大數據庫作為存儲數據信息的重要載體,對數據庫的優化訪問是提高數據查詢和調度性能的關鍵。Web大型數據庫廣泛應用于大型的網絡信息數據和云存儲信息數據的存儲和調度架構中。對Web大型數據庫的頻繁訪問過程中,進行特征分區和數據文本的指向性索引,有利于提高數據庫訪問性能。研究大型Web數據庫的優化訪問技術,在數據庫優化設計和數據傳輸存儲等領域中具有重要的應用價值,相關算法研究也受到人們的重視。
傳統方法中對Web大型數據庫的訪問方法主要有基于自適應波束形成的特征分區方法、基于粒子群濾波的遺傳算法、基于相關度特征分析的數據庫訪問方法等,通過提取大型數據庫的級聯相關匹配語義信息特征,采用文本索引和關鍵字數據查詢方法,進行相關度匹配來實現數據庫的訪問[1-3]。上述方法在數據庫訪問過程中,通過遺傳散布執行算子進行特征分區,對數據庫中的語義信息進行融合和濾波處理,以提高數據庫訪問過程中的分辨能力和查準率。但是上述方法需要在高維的子空間中進行特征重構,隨著數據增多,對數據庫訪問的效能下降,計算開銷較大。對此,相關文獻進行了算法改進設計。其中,文獻[4]提出一種基于信息流減法聚類和模糊C均值調度的數據庫訪問算法,通過粗糙集索引實現數據庫訪問,但是該方法對數據庫訪問過程中的稀疏度均衡能力不好;文獻[5]提出一種基于關鍵字有向圖模型的數據庫訪問算法,然而該算法對非線性MIMO級聯數據庫頻繁訪問特征分區性能不好。針對上述問題,本文提出一種基于稀疏度均衡調度的數據庫優化訪問算法,首先構建數據庫的分布結構模型,然后進行數據庫訪問的信息流特征提取和數據信息融合處理,并以此為基礎,采用稀疏度均衡調度方法實現數據庫的詞頻信息指向性分析,提高數據庫訪問能力。仿真實驗進行了性能測試,得出有效性結論,并展示了較好的應用價值。
1 數據庫存儲結構與數據特征分布
1.1 數據庫存儲結構模型
2 算法改進實現
在數據融合和存儲機制分析的基礎上,進行數據庫訪問優化,通過對Web大數據庫的訪問,提高數據庫的查詢和信息調度能力。傳統方法采用基于信息流減法聚類和模糊C均值調度的數據庫訪問算法,對數據庫訪問過程中的稀疏度均衡能力不好。為了克服傳統方法的弊端,本文提出一種基于稀疏度均衡調度的數據庫優化訪問算法,算法的改進實現過程描述如下:在數據庫訪問過程中,通過對語義波束指向性特征臨界狀態進行數學建模,得到稀疏度均衡調度指令為一個控制輸入信號,稀疏度均衡調度的矢量特征為u*j (s;tk )。對于Web分布式數據庫系統,由于稀疏度均衡調度的控制函數J*(.)的收斂性是保證數據庫優化訪問的前提條件,在系統相鄰狀態之間進行迭代循環,得到稀疏度均衡調度矢量表示為J*i(.)。在有效的存儲空間內,計算最佳的基函數,使x(T)∈Wp,稀疏度均衡調度的穩定性得以保證。通過數據庫中海量數據的語義信息融合,從多狀態數據結構中進行數據挖掘,得到數據挖掘的特征分解變換式R3表示為:
3 仿真實驗與結果分析
為了測試本文算法在實現Web數據庫訪問中的性能,進行仿真實驗。仿真環境為:Inter Pentium 4 3 000MHz內存,操作系統為Windows 7。數據訪問中,數據存儲節點分布帶寬為1 024Kbps,語義信息流時間序采樣的中心頻率為f0=1 000Hz,離散采樣率為fs=10*f0Hz=10KHz,數據傳輸延時20ms,數據庫訪問的采樣點N=1 100。根據上述仿真環境和參數設定,進行數據庫訪問,首先進行稀疏度特征提取,基于稀疏度均衡調度實現數據庫查詢和索引,得到采用本文算法和傳統算法的數據庫訪問的稀疏度調度均衡性能對比結果如圖1所示。
由圖可見,原始的數據庫訪問的稀疏度特征雜亂無章,具有較強的非線性特征,難以形成有效的訪問結果,而采用本文方法進行稀疏度均衡調度處理后,數據庫中的信息流分布均衡,提高了數據庫訪問的查準率,展示了較好的性能。
4 結語
本文提出一種基于稀疏度均衡調度的數據庫優化訪問算法,首先構建數據庫的分布結構模型,進行數據庫訪問的信息流特征提取和數據信息融合處理,然后以此為基礎,采用稀疏度均衡調度方法實現數據庫的詞頻信息指向性分析,提高數據庫訪問能力。仿真結果表明,利用該算法進行數據庫訪問的均衡性能較好,查準率較高,性能優越。
參考文獻:
[1]衛星,張建軍,石雷,等.云計算數據中心服務器數量動態配置策略[J].電子與信息學報,2015,37(8):2007-2013.
[2]侯森,羅興國,宋克.基于信息源聚類的最大熵加權信任分析算法[J].電子學報,2015,43(5):993-999.
[3]羅亮,吳文峻,張飛.面向云計算數據中心的能耗建模方法[J].軟件學報,2014,25(7):1371-1387.
[4]辛宇,楊靜,湯楚蘅,等.基于局部語義聚類的語義重疊社區發現算法[J].計算機研究與發展,2015,52(7):1510-1521.
[5]陸興華,陳平華.基于定量遞歸聯合熵特征重構的緩沖區流量預測算法[J].計算機科學,2015,42(4):68-71.
[6]王小英,劉慶杰.關系型數據庫中數值數據的密文檢索模型研究[J].計算機仿真,2013,30(11):409-411.
(責任編輯:黃 ?。?/p>