黃明亮
摘要:SKYNET-X空管自動化系統包括多種類型的節點,每種類型節點所需的系統環境,網絡配置,驅動等均有所差異,人工安裝操作系統不僅工作量巨大且極易出錯。我們通過EHCT工具可以輕松完成全系統節點操作系統安裝工作。本文詳細闡述了SKYNET-X自動化設備通過EHCT工具遠程安裝操作系統的原理和步驟,并結合系統安裝過程中常見的故障進行分析,為全國SKYNET-X自動化系統用戶提供了較好的THALIX 12操作系統裝機經驗參考。
關鍵詞:SKYNET-X、EHCT、THALIX
正文:
SKYNET-X空管自動化系統采用基于Linux系統開發而成的THALIX 12操作系統。SKYNET-X空管自動化系統包括多種類型的節點,每種類型節點所需的系統環境,網絡配置,驅動等均有所差異,人工安裝操作系統不僅工作量巨大且極易出錯,為了解決批量安裝各節點操作系統的問題,THALIX廠家提供了一套強大的在線安裝操作系統工具EHCT,通過EHCT工具,可以輕松完成全系統節點裝機工作。
SKYNET-X自動化系統通常將DBM工作站配置為EHCT服務器,在該服務器中部署EHCT工具及相關腳本、系統RPM包、驅動等。通過以下幾個步驟完成全系統節點自動裝機工作:
一、在EHCTServer上開啟DHCP、NFS和TFTP服務
系統裝機前,需確保以下系統服務已經開啟,開啟這些服務需要root權限,并通過指令service dhcpd start 、service nsf start和 service xinetd restart開啟對應系統服務。
(一)DHCP服務
動態主機設置協議(Dynamic Host Configuration Protocol,DHCP)是一個局域網的網絡協議,使用UDP協議工作,主要有兩個用途:給內部網絡或網絡服務供應商自動分配IP地址,給用戶或者內部網絡管理員作為對所有計算機作中央管理的手段。
(二)NFS服務
NFS(Network File System)即網絡文件系統,它允許網絡中的計算機之間共享資源。在NFS的應用中,本地NFS的客戶端應用可以透明地讀寫位于遠端NFS服務器上的文件。
(三)TFTP服務
TFTP(Trivial File Transfer Protocol,簡單文件傳輸協議)是TCP/IP協議族中的一個用來在客戶機與服務器之間進行簡單文件傳輸的協議,提供不復雜、開銷不大的文件傳輸服務。
二、在EHCTServer上進行相關參數配置
EHCT工具裝機前需對以下兩個文件夾中的文件參數進行詳細配置,其中Database_HDMT目錄下的文件定義了系統節點安裝系統所需的各項配置;machine_types目錄下文件定義了系統各種機器類型。
(一)Database_HDMT目錄下關鍵配置文件解析
1.Configuration.hcs:定義系統需安裝的節點名稱。
2.Environment_linux.hcs:定義系統環境:系統名,版本,用戶和登錄密碼以及用戶對應的SHELL目錄。
3.eurocat.hcs:定義系統各節點和系統分區的對應關系。
4.graphic.hcs:定義機器類型對應視頻圖像顯示。
5.hardware_params.hcs:定義安裝操作系統的硬盤分區,此處路徑需與各節點機器/dev/disk/by-path/中定義保持一致。
6.hdmt_hosts.txt:存儲具有關聯IP地址的主機名的文本文件,所有節點/etc/hosts文件通過這個文件生成。
7.hdmt_networks.txt:是給計算機各網段起的一個名字,裝機時所有節點的/etc/networks通過這個文件生成。
8.hosts_linux.hcs:定義節點名字,編號(編號為該節點ip地址最后一位),機器類型,ntp服務配置和分配網段。
9.interface.hcs:定義各節點網卡配置和網卡工作模式。
10.mac.hcs:節點S網的網卡mac地址,裝機時EHCT服務器通過mac地址找到相應的節點,安裝操作系統。
11.machine_types.hcs:定義不同機器類型裝機所需安裝組件
12.master_slave_standby.hcs:定義EHCTserver備份服務器
13.xxx.ntp:定義系統時鐘同步。
(二)machine_types目錄下關鍵配置文件解析
1.+_etc_X11_xorg.conf:定義系統顯示輸出,視頻輸出接口以及視頻輸出分辨率等
2.+__lib__kbd__keymaps__lk461.map:定義系統鍵盤映射
3.hardware_params.txt:定義該類型節點安裝操作系統默認pci編號
完成以上文件配置后,通過指令build_platform.sh,執行平臺編譯腳本,結合以上配置的各項參數,生成kickstart文件,kickstart文件位于/EHCT_data/built/GL/12/kickstart文件夾內,每個節點均有對應的kickstart文件。kickstart文件為安裝系統指引,文件內容包括裝機過程中需要執行的腳本,命令以及需要從EHCTserver中獲取的軟件包,通過kickstar可以自動完成節點系統安裝,網絡設置,硬盤分區等操作。
三、客戶機安裝操作系統
(一)將客戶機板載網卡在bios中禁用,設置USB啟動為最高優先級,接上usb_key,啟動機器進入U盤引導操作系統安裝進程。
(二)客戶機eth0網口接入與EHCT服務器S網同一網絡后,客戶機會在網絡中廣播DHCP Discover報文,報文中包含客戶機eth0的mac地址。EHCT服務器收到客戶機的報文后,并通過DHCP服務為節點分配IP地址。
(三)客戶機通過NFS服務,從EHCT服務器中下載kickstart文件,自動完成操作系統的遠程安裝和系統配置。
四、常見故障排查
(一)裝機過程提示WARNING:THE “—no-network” option is deprecated:nvidia-installed will ignore this option。
當節點顯卡型號不一致時,系統裝機過程中容易出現這個告警提示,原因是由于該節點從EHCT服務器上獲取的顯卡驅動與當前的顯卡不適配造成,我們首先需要查看安裝節點的顯卡型號,并從廠家獲取對應顯卡THALES系統驅動包,將對應的顯卡驅動放置在/EHCT_data/misc/EX_PACKAGE_T12/Drivers/目錄下,重啟機器后完成節點操作系統安裝。
(二)裝機過程提示warning:dracut-initqueue timeout – starting timeout scripts后,自動退出裝機。
1.安裝節點eth0網卡mac地址與服務器配置參數不一致
取下安裝節點eth0所在網卡,記錄下網卡mac地址。在EHCT服務器上,進入到/EHCT_data/database/GL/12/Database_HDMT目錄下,編輯mac.hcs文件,將節點的eth0網卡的mac地址填寫到對應的節點名后,重新執行build_platform.sh腳本,以更新kickstart文件,重啟節點后完成操作系統安裝。
2.安裝節點eth0網卡所在pci設備地址與服務器默認配置不一致
該問題經常出現在機器型號與原安裝節點機器型號不一致時,此時系統引導安裝文件kickstart中pci設備地址和實際不一致,我們需要通過指令ls–al /dev/disk/by-path 查看并記錄下sda1對應地址信息。在EHCT服務器上打開位于/EHCT_data/built/GL/12/kick start目錄對應節點的kickstart文件,編輯并替換掉kickstart文件里兩處pci地址信息,由于是直接編輯的kickstart文件,所以不需要執行腳本編譯,可以直接重啟節點完成操作系統安裝。
五、結束語
本文從原理和配置出發,詳細闡述了SKYNET-X自動化設備通過EHCT工具遠程安裝操作系統的原理和步驟,并結合操作系統安裝過程中常見的故障進行分析,為全國SKYNET-X自動化系統用戶提供了較好的THALIX 12操作系統裝機經驗參考。
參考文獻:
[1]蔣增恒 THALIX操作系統網絡安裝服務原理分析,《空中交通》,2016