韋昌有
(南寧學院 藝術設計學院,南寧 530020)
在信息技術和互聯網技術快速發展的今天,為了實現海量異構數據的高效處理,同時為了提高實驗室的科學化、精細化管理,需要借助先進的軟硬件系統建立相應的信息處管理系統[1]。云計算[2-3]技術的產生與不斷進步,為大量數據的快速、精確處理帶來了有效的解決手段。
文獻[4]介紹了大規模流數據集成和實時處理所面臨的挑戰,并分析了相應的解決方案的可行性。文獻[5]針對大量數據處理中所產生的任務調度問題,提出一種基于貓群優化算法的調度控制策略,實現了云環境下系統任務的高效管理。文獻[6]利用整數線性規劃方法解決計算中的計算資源分配問題,并對資源分配中的關鍵參數選取進行了優化。文獻[7]針對基于云存儲的數據中心的能量管理問題,提出一種基于虛擬機和整數二次規劃的新型控制方法,對包含多臺數據處理器的數據中心能量使用進行了科學規劃。文獻[8]提出了一種用于圖書館讀者信息安全管理系統,利用云計算實現了系統信息的可靠檢索與保護。
在以上研究的基礎上,針對實驗室信息管理系統性能亟需改善的事實,提出一種采用云計算思想的實驗室信息系統升級方案:利用高性能計算機搭建用于分布式存儲與分布式計算的終端配置,用于替換目前性能較低的硬件平臺;基于免疫遺傳算法建立云數據備份方案,用于故障發生時的應急處理,提高信息存儲的可靠性;設計基于粒子群算法的任務分配與查詢機制,實現信息系統的有效管理。在實驗室實物平臺上進行了實驗,結果表明提出的架構和算法可以實現實驗室信息的高效管理。
計算機硬件系統是實現云計算存儲、運算與查詢的物理基礎。鑒于目前實驗室計算機運算性能較低,很難兼容云環境下的眾多先進軟件與算法,因此需要對硬件設備進行全面升級,從而為構造高性能實驗室學生實驗系統打下基礎。
以目前較為先進的計算機系統配置信息為依據,選用的主要軟硬件設備及基本配置如下表1和2所示。需要注意的是,單臺計算機服務器的配置信息,如表1、2所示。
在選定實驗室計算機服務器配置之后,需要將相同配置的多臺計算機進行合理部署和連接,從而形成能夠進行協調配合與統一調度的云計算互聯系統。該實驗室云計算硬件系統為由40個物理節點構成的云系統,包括2個控制節點、30個由主機構成計算節點(網絡節點位于計算節點上)、8個存儲節點。云系統硬件部署架構,如圖1所示。

表1 計算機服務器配置信息

表2 計算機軟件配置

圖1 云計算物理架構
完整的硬件系統可以確保各類高級應用的有效實現,為云計算提供了可靠的物理支撐。由圖1可知,該系統由計算機/服務器,監控中心,數據云,交換機,通信線纜組成。采用高性能服務器并利用由內網、外網組成的通信網絡,形成了完整的云計算物理系統的設計。
在實驗室環境下,為了確保各類數據的安全可靠,除了憑借性能優異的硬件存儲設備,還需要設計相應的故障冗余機制,從而提高系統應對突發情況的能力。此外,針對信息系統中數據的查詢與任務調度,也需要配置相應的算法來實現系統的高效管理。
免疫遺傳算法是一種基于免疫原理與遺傳算法的復合尋優算法,可以有效避免搜索陷入局部最優,廣泛應用于多目標自適應尋優問題中[9]。數據安全性是云計算系統中極為重要的問題,為了避免故障造成的數據丟失,必須建立相應的冗余方法。
在建立包含存儲成本、通信價格與帶寬價格的數據恢復成本函數的基礎上,設計基于適應度函數的免疫遺傳算法,從而求解最優數據備份方案。
數據恢復成本函數C的表達,為式(1)。
(1)
式中i=1,…,n代表第i個數據塊,Ri為數據塊的數據量,Si為數據塊存儲成本,Ti為數據塊存儲時間,Ei為通信價格,Fi為帶寬價格。
適應度函數f(s)的表達式為式(2)。
f(s)=αC+(1-α)D
(2)
式中s代表染色體,α為權重因子,D為數據恢復時間。
基于免疫遺傳算法的云計算數據存儲故障冗余方法的原理圖如圖2所示。

圖2 基于免疫遺傳算法的故障冗余原理
由圖2可知,通過設置初始樣本、適應度函數等,借助迭代算法,即可實現數據存儲的冗余備份,提高實驗室學生實驗系統的數據安全性。
粒子群算法是一種新型的進化算法[10],可以通過迭代運算搜索問題的全局最優解[11]。在實驗室學生實驗系統中,為了實現任務的精確分配與海量數據的快速查詢,需要設計高效的分配與查詢機制。
在建立包含任務調度模型與數據查詢模型的復合模型的基礎上,利用粒子群算法對實現該復合模型的最優值搜索,從而實現云計算系統任務與數據的優化管理。
任務調度模型P的表達為式(3)。
(3)
式中m為云系統中的節點數,κ為任務數,δj為第j個節點的任務進度值,τj代表第j個節點正在執行的任務,λj為第j個節點的任務結束時間。
數據查詢模型Q的表達為式(4)。
(4)
式中γj為第j個節點的數據量,ηj為第j個節點的數據完整度,φj為第j個節點的數據查詢效率。
云計算系統任務調度與數據查詢的復合表達為式(5)。
Z=P+Q
(5)
為了尋找式(5)所示的任務調度與數據查詢的最優解,采用粒子群算法進行迭代運算,如圖3所示。

圖3 基于粒子群算法的任務分配與數據查詢方法
由圖3可知,通過對任務及數據進行隨機分配,借助虛擬機技術和種群迭代算法,即可實現分配與查詢的最優解,從而實現云計算中任務與數據的高效管理。
為了證明所提實驗室學生實驗系統的硬件架構、通信網絡與軟件算法的優越性,對技術改造之前和改造之后的實驗室信息管理系統的主要性能進行了對比分析。改造之前實驗室學生實驗系統僅包含5臺服務器,每臺服務器的配置為如表3所示。
此外,改造前的系統并不具備任何云計算功能與高級算法,僅可以實現簡單的數據存儲與查詢。
利用同一組任務和數據對改造前后的實驗室學生實驗系統的性能進行了實驗分析,結果如圖4所示。
圖4為與硬件性能直接相關的性能對比分析,由圖4可知,改造后的實驗室學生實驗系統具有更高的運行速度和數據處理速度,因此更加適應云計算環境。

表3 改造前實驗室服務器配置信息

圖4 系統主要硬件性能對比
圖5、圖6分別為正常、故障情況下改造前后系統的數據存儲性能對比分析,由實驗結果可知,改造后基于云計算技術的系統在對數據進行存儲和提取時的精度要遠高于改造前的系統,且隨著數據量的不斷升高,基于云計算技術的系統仍保持著非常高的精度。反之,改造前的系統由于缺乏相應的信息處理能力,在故障發生時,其數據處理精度會大大降低,很難滿足現代信息處理要求的快速增大。

圖5 正常情況下改造前后系統數據存儲性能對比
圖7、圖8分別為任務分配與數據查詢精度對比圖,由實驗結果可知,改造后的系統在應對大量任務與數據時,具有更為優異的處理性能,在處理多線程并行任務時具有更高的工作效率,而在對大量數據進行實時檢索時具有更高的精度。

圖6 故障情況下改造前后系統數據存儲性能對比

圖7 改造前后系統任務分配精度對比

圖8 改造前后系統數據查詢精度對比
云計算技術的快速發展極大地推動了數字技術、工業系統、機器人、無人駕駛、人工智能等新型領域的快速發展。為了適應技術進步的需求,本文基于云計算技術對實驗室學生實驗系統進行了全方位的優化升級,已達到充分整合各類軟硬件計算資源,提高實驗室學生實驗系統運行效率的目的。首先,利用高性能計算機搭建了分布式存儲與計算物理平臺,為云可計算的應用打下堅實的物質基礎;其次,利用免疫遺傳算法建立了數據故障應對方案,提高系統的在故障魯棒性,提升了系統的安全運行水平;最后利用粒子群算法設計了云計算中任務的分配與數據的查詢方法,實現了信息系統的高效管理。在實驗平臺上對所體系統及相關算法進行了實驗驗證,結果表明與傳統實驗室信息系統相比,提出的架構和算法可以實現實驗室信息的高效管理。