張連堂+嚴運廣+周珂+黃祥志+陳前程+方鑫+李響



DOI:10.16644/j.cnki.cn33-1094/tp.2016.02.005
摘 ?要: 為輔助集群管理,根據Stuart K. Card等人提出的CARD信息可視化模型,對集群節(jié)點的連接信息進行實時展示,提出一種單中心集群中節(jié)點連接信息的動態(tài)可視化設計方案,簡化了集群連接狀態(tài)管理的復雜程度。實驗表明,該方案在實現(xiàn)時消耗的內存資源較少。為大規(guī)模集群連接的信息可視化設計和實現(xiàn)奠定了方法基礎。
關鍵詞: 集群節(jié)點; 集群管理; 連接信息; 可視化
中圖分類號:TP391 ? ? ? ? ?文獻標志碼:A ? ? 文章編號:1006-8228(2016)02-14-04
Design of connection information visualization for cluster nodes
Zhang Liantang1, Yan Yunguang1,2, Zhou Ke1,2, Huang Xiangzhi2, Chen Qiancheng1,2, Fang Xin1,2, Li Xiang3
(1. School of Computer and Information Engineering Henan University, Kaifeng, Henan 475004, China;
2. Institute of Remote Sensing and Digital Earth Chinese Academy of Sciences; 3. Beijing Institute of Spacecraft System Engineering)
Abstract: To assist the cluster management, this paper put forward a dynamic visualization proposal of the nodes in single center cluster to show the connection information of the cluster nodes dynamically and timely according to the CARD information visualization model. It simplified the complexity of the connection state management. The experiment result shows that this method is less resource consumption. It laid the foundation for the design and implementation of connection information visualization for large scale cluster.
Key words: cluster nodes; cluster management; connection information; visualization
0 引言
集群是一組連接在一起完成特定功能的計算機的集合[1]。集群可以在成本較低的情況下獲得較好的性能、較高的可靠性和靈活性。與集群交互時,集群像是一個獨立的服務器提供服務。集群的一大特點是高可用性和靈活的伸縮擴展性[2],可以根據需要增加或減少集群中計算機的數量。
集群的組成一般可分為中心節(jié)點計算機(以下簡稱中心節(jié)點)和并行節(jié)點計算機(以下簡稱并行節(jié)點)。
中國科學院遙感與數字地球研究所研制的衛(wèi)星遙感基礎共性產品一體化處理系統(tǒng)是專門用來處理遙感信息數據的集群系統(tǒng)(下文所說的集群和集群系統(tǒng)都指該一體化處理系統(tǒng))。本系統(tǒng)中的中心節(jié)點由三個模塊組成,分別是通訊立方體、計算立方體、存儲立方體。如圖1所示,圖中的總控調度服務器即是文中提到的中心節(jié)點,其他機器是并行節(jié)點。集群系統(tǒng)中的計算機都放在42U標準型機柜里,形成一種整機柜柔性服務器。集群系統(tǒng)是一種優(yōu)化型系統(tǒng),可以快速完成數據整編、共性產品生產、可視化檢索等功能。系統(tǒng)主要采用自動化、標準化和業(yè)務化遙感數據處理模式,其中計算節(jié)點自動執(zhí)行多項任務,簡化了對服務器、存儲器、網絡及其他資源的管理與配置流程,是標準產品的高自動化生產系統(tǒng),其可用性、容量和性能可滿足行業(yè)不斷增長的計算需求,為用戶提供從硬件環(huán)境設計,到軟件功能按需重組的一體化遙感產品處理系統(tǒng)整體解決方案。為了輔助集群的管理,根據常見的星型網絡拓撲模型[3]提出一種集群節(jié)點的連接信息可視化設計的方法,用于直觀的描述集群節(jié)點的連接信息。本文方法根據美國研究者Stuart K. Card等人提出的CARD信息可視化模型[4]對集群節(jié)點的連接信息進行可視化設計。信息的可視化可以使數據的呈現(xiàn)效果得到增強,讓用戶以非常直觀的方式實現(xiàn)對數據的觀察和瀏覽,亦可進行交互操作,發(fā)現(xiàn)數據中隱藏的特征、關系和模式[5]。參考CARD可視化模型的過程,將集群節(jié)點連接信息的可視化設計分為以下過程:首先要進行集群節(jié)點連接信息的獲取,接著對獲取到的集群節(jié)點信息進行數據預處理,根據這些信息建立節(jié)點連接信息表[6],中心節(jié)點根據可視化區(qū)域的信息生成一張可視化結構信息表,最后根據這兩個表進行節(jié)點連接圖的繪制[7],當用戶把鼠標放置在圖中的節(jié)點區(qū)域的上方時,顯示該節(jié)點計算機的詳細信息[8]。
1 集群節(jié)點連接信息的獲取
本集群主要有中心節(jié)點和并行節(jié)點兩種角色。首先運行中心節(jié)點上的程序,當中心節(jié)點的服務進程開啟后,建立一張連接表,中心節(jié)點利用TCP協(xié)議開啟監(jiān)聽進程,被動的等待連接;再依次打開并行節(jié)點,當并行節(jié)點上的程序打開后,就會主動向中心節(jié)點的程序發(fā)出連接請求。中心節(jié)點程序接收到連接請求后,將收到的連接信息進行預處理提取有用信息后放入連接表中,如有其他并行節(jié)點打開時,按照上述過程依次放入到該表中。建立連接表到繪圖的整個過程都在中心節(jié)點上進行,當有3個節(jié)點連接時建立的連接信息表如表1所示。
表1中的各個字段都有其具體的意義和作用:編號字段為當繪圖的時候統(tǒng)計共有多少個并行計算節(jié)點;IP為各個并行節(jié)點的IP地址,端口號為該并行節(jié)點和中心節(jié)點通信的端口;CPU利用率、內存大小、內存利用率和GPU信息可以作為集群決定為哪個并行節(jié)點分配任務的一個參考,輔助集群管理。
2 集群節(jié)點連接信息可視化的設計與實現(xiàn)
獲取到節(jié)點的連接信息后,生成連接信息表格。集群的中心節(jié)點獲取可視化區(qū)域的大小等信息后,生成一張可視化結構表的格式如表2所示。然后根據連接信息表和可視化結構表進行繪制,如圖2所示。
設可視化區(qū)域的寬度為CW,高度為CH;中心加載圖片的寬度為PW,高度為PH;邊緣圖片的寬度為pw,高度為ph。
可以求出中心點O的X坐標Ox=CW/2,點O的y坐標Oy=CH/2。
因中心需要加載的圖片以O為中心點,可以求出要加載圖片的左下角和右上角的坐標,從而把圖片固定在中心位置。左下角設為A,其X坐標為:Ax=CW/2-PW/2,其Y坐標為: ?⑴
同理可知右上角B的坐標為:
⑵
假設有n個節(jié)點連接,連接線的長度為r,如果想使節(jié)點均勻地分布在可視化區(qū)域內,連接線的一端是中心點O,根據三角函數算出連接線的另一個端點,這里先設第I(0
⑶
⑷
最后得出邊緣各個圖像的左下角坐標為:
⑸
右上角的坐標為:
⑹
半徑r的取值范圍為:
⑺
在參數pw和ph固定的情況下支持的連接數(也就是避免視覺混淆現(xiàn)象)的范圍為:
⑻
本段描述實現(xiàn)快速計算圖片中各個重要的繪圖坐標點。
3 運行測試與結果分析
3.1 測試環(huán)境
本集群使用的是42U標準型機柜,機柜共放置10臺機器,用其中1臺作為中心節(jié)點,其余為并行節(jié)點。它們之間連接的網絡拓撲為10臺計算機與1臺交換機直接相連的星型拓撲結構。
機器中的各個機器配置都相同,它們的IP配置如表2所示。交換機的配置如表3所示。
3.2 測試結果及其分析
由于集群系統(tǒng)中機器數目和交換機接口的限制,在測試時,分別取0個、1個、3個、5個、7個和9個并行節(jié)點進行連接測試:當無并行節(jié)點連接到中心節(jié)點的時候,只顯示一個中心節(jié)點;當有一個節(jié)點計算機連接的時候,根據上述計算可以得到節(jié)點相對于中心節(jié)點的坐標,可得該節(jié)點處在連線的正右邊位置,即處在以中心為相對坐標原點的正右方;當有三個節(jié)點的時候,這三個節(jié)點之間的夾角是2π/3,當有九個節(jié)點的時候,每兩個相鄰節(jié)點的夾角是π/3,當分別有1個、3個和9個節(jié)點的時(測試環(huán)境中可視化區(qū)域的長和寬分別是456像素和385像素。連線半徑取值為192像素),當并行節(jié)點個數分別為1、3和9這三種情況下,連接圖如圖3所示。第三張圖中一個IP為192.168.10.242的并行節(jié)點連接發(fā)生異常,節(jié)點失效,由此可見,集群節(jié)點連接信息的可視化設計可以方便的觀察集群節(jié)點連接狀態(tài)信息并發(fā)現(xiàn)失效節(jié)點,幫助更好的完成集群的管理。
當集群的并行節(jié)點分別有0、1、3、5、7、9個連接到中心節(jié)點計算機的時候,資源占用情況如表5所示。
綜上,集群系統(tǒng)由于運行操作系統(tǒng),開始會占用CPU和內存資源(CPU占用8%,內存占用190M),每連接上一個并行節(jié)點就會消耗一定的CPU和內存資源,通常情況下,當機器的負載超過80%以后,機器性能會迅速下降,影響任務的執(zhí)行,接受測試的中心節(jié)點機器的內存是5824MB,CPU是八核心的,當連接個數不是很大時,經測定對CPU幾乎無影響,可以忽略不計。經理論計算,目前理論上所支持的最大并行節(jié)點的連接數是(5824*1024-192500)/(10740)=537臺。
4 ?結束語
集群節(jié)點連接信息的可視化設計采用一種動態(tài)繪制方法使集群中心節(jié)點和并行節(jié)點有規(guī)則的排列,這種方法可以用于集群節(jié)點的管理,方便用戶及時查看集群節(jié)點的連接狀態(tài)信息,幫助集群管理者及時了解集群節(jié)點的連接狀態(tài),更有效的對集群的節(jié)點進行管理。但是目前僅支持單機柜中的集群節(jié)點連接信息的可視化設計,下一步工作將通過使用分層和級聯(lián)方法支持更多機柜中的集群節(jié)點連接信息的可視化,實現(xiàn)大規(guī)模集群管理的可視化。
參考文獻(References):
[1] 向文.集群管理系統(tǒng)的研究與設計[D].遼寧師范大學,2008.
[2] 李敬.集群系統(tǒng)集中管理平臺的研究與實現(xiàn)[D]. 西北工業(yè)大
學,2004.
[3] 田建勇.析星型拓撲設計組建校園局域網[J].安順學院學報,
2011.13(1):90-93
[4] 楊彥波,劉濱,祁明月.信息可視化研究綜述[J].河北科技大學
學報,2014.35(1):91-102
[5] CARD SK, MACKINLAY J D, SHNEIDERMAN B.
Readings in Information Visualization: Using Vision to Think[M].San Francisco; Morgan Kaufmann,1999.
[6] 陳建軍,于志強,朱昀.數據可視化技術及其應用[J].紅外與激
光工程,2001.30(5):339-342.
[7] 任磊,王威信,周明駿等.一種模型驅動的交互式信息可視化
開發(fā)方法[J].軟件學報,2008.19(8):1947-1967
[8] 劉大海.海量數據可視化方法的研究[D].天津大學,2009.