孟令霞 吳瓊
[摘 要] 在介紹了目前集群系統應用情況及xCAT軟件的基礎上,提出了一種利用xCAT軟件進行系統部署與安裝配置的方法,分別描述了系統部署和軟件配置的具體過程,介紹了應用方法。
[關鍵詞] xCAT;集群系統;系統部署;軟件配置
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 11. 058
[中圖分類號] TP311 [文獻標識碼] A [文章編號] 1673 - 0194(2018)11- 0133- 03
1 應用背景
集群系統憑借其超強計算能力、高性價比使得其應用越來越廣泛,對于集群管理的研究也成為越來越熱門的一個方向[1-2]。其中,在集群系統中集中定制部署操作系統及應用軟件更是提高集群系統利用效率,節省運行成本的重要方向[3-4]。本文通過研究xCAT軟件,實現集群中操作系統和應用軟件系統個性化定制,使其可以快速在不同的應用中切換。
2 xCAT軟件介紹
2.1 xCAT 簡介
xCAT (Extreme Cluster Administration Toolkit)是一個可伸縮的linux集群管理和配置工具,xCAT 最先是為IBM xSeries 系列的Linux Cluster做的第三方軟件,但后來它沒有發展成為一個產品,而是做成了包含一系列有用的腳本的軟件包。使用者可以自己修改,但是不能重新發布。
2.2 xCAT功能及特性
全自動化的安裝;基于網絡的,無人看管的安裝;遠程管理和監視;遠程電源管理和遠程控制系統;軟件管理;并行管理工具和高性能軟件。
xCAT 的特性:硬件管理和監控;支持IBM eServer xSerie 系列服務器遠程電源控制的高級系統管理特性;支持遠程系統狀態檢測分析(風扇速度,溫度,電壓等);遠程詳細檢測系統狀態設備型號和BIOS 等;硬件事件日志記錄;SNMP 認證警報;軟件管理;以及并行的shell 和其他工具同時的運行在xCAT 管理范圍內的節點等。
3 定制部署
3.1 定制操作系統
定制操作系統的第一步是將操作系統導入到xCAT軟件管理中,本文以Red Hat Enterprise Linux Server 6.5版本為例進行說明。導入操作如下:
copycds -n rhels6u5 /tmp/rhel-server-6.5-x86_64-dvd.iso
導入完成后,利用xCAT軟件提供的命令得到如下導入結果:
[root@ibmgt ~]# lsdef -t osimage | grep rhels6u5
rhels6u5-x86_64-install-compute (osimage)
rhels6u5-x86_64-install-service (osimage)
rhels6u5-x86_64-netboot-compute (osimage)
利用xCAT軟件提供的命令對導入結果進行查詢,結果如下:
[root@ibmgt ~]# lsdef -t osimage -z rhels6u5-x86_64-install-compute
#
rhels6u5-x86_64-install-compute:
objtype=osimage
imagetype=linux
osarch=x86_64
osdistroname=rhels6u5-x86_64
osname=Linux
osvers=rhels6u5
otherpkgdir=/install/post/otherpkgs/rhels6u5/x86_64
pkgdir=/install/rhels6u5/x86_64
pkglist=/opt/xcat/share/xcat/install/rh/compute.rhels6u5.pkglist
profile=compute
provmethod=install
synclists=/install/custom/install/rh/compute.rhels6u5.x86_64.synclist
template=/opt/xcat/share/xcat/install/rh/compute.rhels6u5.tmpl
通過上面對導入結果的查詢可以看到若干配置文件,其中compute.rhels6u5.tmpl可以對操作系統的分區及分區的大小進行定制配置,compute.rhels6u5.pkglist對操作系統安裝過程中,安裝哪些文件包進行定制配置。通過對這兩個文件就可以實現對操作系統的定制安裝與部署。
3.2 定制軟件系統
在上面介紹的compute.rhels6u5.tmpl配置文件結尾有一行腳本調用post.rh配置文件,通過對post.rh文件的修改可以實現對操作系統上各種文件的配置,包括創建新的目錄和文件,修改文件權限,修改系統文件,打開關閉系統服務,在操作系統上批量安裝軟件系統等。配置文件內容如下:
#INCLUDE:#ENV:XCATROOT#/share/xcat/install/scripts/post.rh.common#
#INCLUDE:#ENV:XCATROOT#/share/xcat/install/scripts/post.xcat#
cd /
mkdir /soft /u /proj
chmod 777 /scr01
ln -s /soft/geovation /cgg
echo "gctadmin:/proj /proj nfs exec,rw,bg,nointr,noatime,async,nfsvers=3,suid,dev 0 0" >> /etc/fstab
mount /proj
cd /opt
tar zxvfp /soft/install/intel.tar.gz
echo NISDOMAIN=gctnis >> /etc/sysconfig/network
echo "ypserver gctadmin" >> /etc/yp.conf
rpm -ivh /tmp/paramon-pro-6.2.0-2046.el6.x86_64.rpm
cp /etc/rc.local /etc/rc.d/
cd /soft/install/RHEL65
./readme
chkconfig ypbind on
chkconfig iptables off
exit 0
從上述配置文件的描述中可以看到,其創建了若干目錄和鏈接并進行了掛載目錄的操作,修改了某些系統文件,啟動了某些服務,在操作系統中安裝了應用軟件等。這些工作都在完成操作系統安裝后自動進行,無須人工干預,在系統完成安裝的同時也完成了系統上應用軟件的配置。
3.3 應用方法
在確定安裝節點后,首先設置安裝節點的操作系統類型,其次修改節點啟動順序,最后重新啟動節點即可。操作步驟如下:
[root@ibmgt ~]# nodeset node254 osimage=rhels6u5-x86_64-install-compute
node254: install rhels6u5-x86_64-compute
[root@ibmgt ~]# rbootseq node254 net
node254: net,none,none,none
[root@ibmgt ~]# rpower node254 reset
node254: reset
在節點安裝完成操作系統安裝后會自動調用上文提到的配置文件,對節點進行操作系統和軟件部署和配置。
4 結 論
目前,該方法在生產實踐當中已經開始使用,在應用了xCAT軟件定制部署操作系統及應用軟件后,提高了集群系統的利用效率,保證了集群系統的高效、穩定運行。
主要參考文獻
[1]Sandip Agarwala,Christian Poellabauer,Jiantao Kong. System-Level Resource Monitoring in High-Performance Computing Environments[J]. Journal of Grid Computing,2003(2):273-289.
[2]Rajermani Thinakaran,Elankovan Sundararajan. Cluster Control Management as Cluster Middleware[C]//Asian Conference on Intelligent Intormation and Database Systems,2012:73-82.
[3]吳瓊,王穎,梁金鈐,等.Linux環境下基于Qt和xCAT的集群部署系統[J].計算機系統應用,2013,22(7) :27-30.
[4]王海斌.動態虛擬集群部署與管理[D].長春:吉林大學,2011.