陳 荔,申 健
(長安大學信息與網絡管理處,陜西 西安 710064)
目前,網絡已經變成了人們生活中不可或缺的一部分,其發揮的作用也越來越大。隨著網絡技術的突飛猛進,網絡的功能越來越完善,其內部架構也變得越來越復雜,在復雜網絡數據庫內,經常存在大量的異常信息或冗余信息,這些信息會占用大量寬帶資源,干擾用戶的上網體驗,甚至會對用戶產生經濟損失,對網絡的安全也造成了較大威脅。所以,怎樣對復雜網絡數據庫內信息資源進行有效的調度,已經成為了計算機網絡領域中較為重要的核心問題。
為了解決這種復雜網絡數據庫內信息資源所帶來的困擾,研究者們提出相應的資源調度方法。而信息資源調度方法實際上就是一種分類問題,把信息資源分成重要信息與異常信息,進而實現信息資源的分類[1]。目前階段,主要的網絡數據庫內信息資源調度方法有:使用支持向量機、關聯規則以及模糊聚類的信息資源調度方法。其中,較為典型的即基于模糊聚類的信息資源調度,方法簡便、能效低[2]。
由于網絡數據庫中信息資源的調度對于確保網絡安全具有更為重要的利用價值,因此發展前景更為廣闊,同時它也成為眾多學者研究的重點課題。但是,依靠現階段的方法已經很難適應日益復雜的網絡環境下信息資源特征的高度動態變化,從而導致網絡系統的運行效率和使用上的不方便。因此針對傳統算法的缺點,本文提出了一種復雜網絡數據庫中信息資源的調度方法,通過對信息資源的深度值進行排序,并對信息資源進行基礎區分,隨后添加信息原則,使其能夠被徹底地分類,最后依靠改進的粒子群算法對信息資源進行集群調度。仿真結果證明,本文方法能夠有效地對信息資源進行調度,并且分類的過程中不會影響到網絡系統的正常運作。
在復雜網絡環境下,構建數據庫內信息資源調度模型,復雜網絡的多源信息資源服務本體、服務提供者均構建對應的網絡環境,在某種程度上完成了資源共享,用戶與服務商可以經過間接或直接的形式進行交互,為復雜網絡環境下的運行模式提供了強有力的支持[3]。
復雜網絡數據庫在進行大數據量訪問時都存在運算速度不高問題,磁盤與一些硬件設備不能實現高效的讀寫訪問,過長的延時可能會致使系統運行性能的嚴重下滑[4]。
為了實現復雜網絡信息資源的大數據特征集成調度提供數據基礎,在信息管理系統里,針對不同的信息源[5],能夠通過ω來表示可信度,擬定第i種信息源的可信度是ωi,獲得資源調度置信區間為
m′i([pH,pL])=ωi×mi([pH,pL])
(1)
m′i([0,1])=ωi×mi([0,1])+1-ωi
(2)
針對n種不同的信息源提出命題,擬定FDR代表p,共存在N組先驗數據,建造基于復雜網絡信息管理資源信息共享網絡系統,進而實現復雜網絡信息數據節點分裂歷史記錄方法,獲得資源先驗分布的描述式為

(3)
每種數據點p,依靠第k距離重新進行排列,這種排列會干擾空間內的數據對象,擬定s={p1,p2,…,pr+1}代表數據對象,r代表ISk(p)的元素總量,e={e1,e2,…,er}代表與之相對應的相似k距離鄰居序列軌跡。擬定s={p1,p2,…,pr+1}代表數據對象p的相似k距離鄰居序列,r代表ISk(p)的元素總量,e={e1,e2,…,er}代表與之相對應的相似k的距離鄰居序列軌跡,那么p的鏈距離,能夠描述成c-distance(p),定義如下

(4)

(5)
經過上述方法,系統使用的是樹形架構設計,進一步,設計子網格分區,對資源信息流進行信號模型建造,為最后實現對復雜網絡信息管理資源的稀疏性聚類調度提供精確的數據基礎。
在同一種資源上啟動的兩種信息資源都要滿足DAG圖規定的邏輯關聯,如果Si,Sj都在某種序列內,且Si,Sj滿足Si→Sj,那么任務i要在j之間運行。但是如果序列內信息j先于信息i啟動,那么就會產生死鎖狀態。所以一定要利用適當的方法,來免除死鎖狀態的發生。
2.3.1 深度值排序
上述的全部信息資源之間的邏輯關聯可以依靠一張DAG圖進行表示,設定對DAG圖進行分層處理,每層具有自身一定的深度值,深度值越小,就說明優先級越高,深度值的運算方程如下所示。
(6)
式中,parent(sbi)傳輸的是信息sbi的父節點集合,max(level(parent(sbi)))的傳輸值是sbi父節點集合里具有最大深度值的父節點,可以憑借深度遍歷的方法獲得DAG圖節點的深度信息[6]。采集復雜網絡深度信息后,對運行同等數據庫上的信息序列,就可以依靠層次深度值從小到大進行排列,這樣優先級越高的信息資源,在運行時順序就會靠前,對于同種數據庫上的所有信息,經過排序之后得到的信息資源運行序列就不會出現死鎖狀態的發生。
2.3.2 短資源優先原則
在同一數據庫上啟動不同深度值的信息,依靠深度值排序可以保證信息之間數據邏輯關聯的合法性,但是同等深度值的信息之間不具有依賴關聯,可以并行運行[7]。如果在數據庫內出現了多個同等深度值的信息,它們會以任意的次序運行,可能會致使堵塞的狀態發生,信息sb3,sb4,sb5的深度值同等,且它們占用的資源狀況是不存在序列的,那么信息sb4將被信息sb3堵塞,并且因為信息sb6是信息sb4的子節點,因此sb6也會出現堵塞狀況,如果對數據庫上運行的同深度值可以并行的子信息,使用短信息有限的調度原則,短信息會被有限運行,就能夠解決長信息堵塞短信息的問題,即假如sb4優先于sb3運行,那么sb6與sb3能夠并行運,信息R0上子信息的啟動的時間不變,而信息R2上的啟動時間由于sb6的提前啟動而縮減[8]。
2.3.3 父節點優先原則
對于一些子信息節點,其本身即父節點,具有自己的子節點,也可能不存在子節點,或是本身即子節點[9]。針對一組在數據庫上可以并行的子信息,除了要考慮其運行的時長外,還需要考慮它們是否具有自己的子節點,存在子節點的子信息會優先運行,擬定子信息sb3,sb4,sb5具有同等的深度值,子信息占據的資源也是同等的,sb4具有子節點,sb3本身即子節點,這時由于sb3有限運行,所以sb6的運行就會被堵塞,如果提前運行sb4,那么sb6,sb3就可以并行運行,信息R0上的子信息的運行時間不變,而信息R2上的運行時間因為sb6的提前運行而出現減少。
依靠上述的有限原則,對每一種信息憑借資源編號進行區分,得到所有信息上啟動的子信息集合,依據上述的原則取得所有信息上子信息的運行序列,利用子信息之間的邏輯關聯和子信息的運行序列,就可以運算出信息資源完成該資源上所有任務需要消耗的時間,取最大消耗時間的倒數描述適應值的大小,因此消耗的時間越長,適應值就會越小[10]。
運算適應值要先運算全部任務的完成時間,設定任務i在信息j上的消耗時間為fin[i][j],那么
fin[i][j]=start[i][j]+E[i][j]
(7)
式中,start[i][j]代表任務i在信息j上的運行開始時間,start[i][j]通過三種因素評定:信息的空閑時間、任務i的父節點最晚消耗時間、最晚父節點任務所在的信息資源與任務i所在的資源之間的通信延遲,估算公式如下所示:
start[i][j]=max{r[j]max(fin(p(i)))+Tr[m][j]}
(8)
式中,r[j]代表信息資源j上最近一次空閑時間,max(fin(p(i)))返回值為任務i的每一種父節點任務完成時間的最大值,Tr[m][j]代表該父節點所處信息資源m與任務所處信息資源j之間存在的通信延遲。
PSO方法具有較多的優點,但是因為傳統方法隨機性較大,所以存在較多不完善的地方,本文主要從動態多群體協作與變異粒子逆向飛行兩種方向進行優化改進。動態多群體協作提高了算法的收斂效率與求解精度,變異粒子逆向飛行可以在一定程度上剔除陷入局部最優的影響,維持與增加了種群的多樣性,對調節系統的負載平衡具有一定的幫助[11]。這種改進粒子群優化方法,復雜網絡集群可以完成信息交互、資源搜索、次群推薦最優資源至主群、變異粒子逆向飛行與主群篩選全局最優。
2.5.1 改進粒子群優化方法
針對每個資源請求者,復雜網絡集群一定要推薦出一種比較優質的資源。每一代,所有子群都會把最優的單獨信息傳送至主群,主群從中挑選最優子群個體并優化。方法內主、次群的架構如圖1所示。

圖1 主、次群體架構
主群方法公式如下

(9)

2.5.2 信息資源調度
在復雜網絡平臺上,具有一種Datacenter類的軟件對主機體進行管理,這些主機體遵照一定的分配策略能夠被分配到多種或一種虛擬機內,它們能夠模擬與復雜網絡存在關聯的基礎設施服務。因此,在平臺上不需要基礎設施,可以優先考慮集群資源調度策略。整體的復雜網絡數據庫集群,首先需要初始化虛擬資源池,將資源池分為n種,其中,1為主群,n-1為次群。運行多群協作方法,主群運行式(8)與(9),ω經過式(10)線性遞減獲得

(10)
式中,ω∈[0.4,0.9],ωs=0.4,ωe=0.9,T代表最大的迭代數量,t代表目前的迭代次數。
出現下一代主群與次群離子的當前坐標、搜索速度、全局最優坐標與最優坐標,之后產生變異粒子,變異粒子的總量由隨機數產生。更改方向逆向飛行,更新整體信息量,如果沒有到達最優解或是沒到達迭代閾值,就繼續進行迭代。為了確保資源在分配時能夠保持負載平衡,變異粒子逆向飛行時,給其增添權重因子,測量節點網絡,導致負載失衡。
二是企業內部市場開發工作的學習活動不系統,很多企業或者部門忙著抓生產而忽視了市場開發活動,把經濟效益放在第一位,而當時效益不那么明顯的市場開發工作放在后面,造成企業內部人員矛盾重重,市場開發沒有影響力和號召力,遇到問題的時候一盤散沙,無法真正處理和解決問題,影響了企業的公信力[1]。
仿真環境為Intel Celeron Tulatin1GHz CPU和384MB SD內存的硬件環境和MATLAB6.1的軟件環境。
為了證明本文方法的實用性,擬定實驗模型,如圖2所示。

圖2 實驗模型
首先利用查詢產生器憑借隨機數搜索查詢與其所需處理的節點,之后將搜索到的查詢信息傳送到查詢隊列里,為了讓查詢隊列內不存在太多查詢,在查詢隊列的前面設定調度窗口,只有進入調度窗口內查詢才會進入下次調度,最后使用本文調度方法,從調度窗口內搜索能夠共同運行的查詢組合,將選取的查詢傳輸到服務單元里運行。
首先設定調度窗口的尺寸為33,每次調度是查詢隊列前的33個查詢,節點的數量分別是17、33、65與129,通過本文方法與傳統方法的對比來驗證,不同方法在調度信息資源時對系統利用率的影響,結果如圖3所示。

圖3 不同方法調度信息資源時對系統利用率的影響
通過圖3能夠看出,本文方法存在較好的系統利用率。為了了解調度窗口的大小對系統效率的干擾,把處理節點數量固定成33,然后改變調度窗口的大小,結果如圖4所示。

圖4 不同方法的調度窗口對系統利用率的影響
算法系統利用率均隨窗口大小的增大而上升,因隨窗口大小的增加,調度存在了更多的查詢選擇空間,因此可以找到更為優質的查詢組合,其中,本文方法的效率最高,在大多數狀況下,能夠使用到所有處理節點,很少會出現閑置處理的節點。
為了降低復雜網絡中節點查詢量的負載情況,提升網絡系統的處理效率,本文提出了一種復雜網絡數據庫中信息資源的調度方法。
1)構建短資源優先原則與父節點優先原則,憑借上述的有限原則,對每一種信息憑借資源編號進行分類,獲得每種信息上運行的子信息集合。
2)對傳統的PSO方法進行優化,并將優化后的算法添加上述原則,依靠該算法對信息集合進行集群調度。
3)本文方法能夠有效地對信息資源進行調度,存在較好的系統利用率。
4)本文方法的調度效率最高,在大多數狀況下,能夠使用到所有處理節點,很少會出現閑置處理的節點。