葉雅泉
?
GPFS在省級(jí)通信系統(tǒng)中的應(yīng)用
葉雅泉
新疆氣象信息中心,新疆 烏魯木齊 830002
GPFS并行文件用于氣象通信系統(tǒng)后,可極大地提高群集系統(tǒng)傳輸效率和速度,滿足地面氣象觀測(cè)中海量數(shù)據(jù)運(yùn)算系統(tǒng)的大吞吐量、存儲(chǔ)容量和較高的可靠性要求。基于此,主要介紹了GPFS優(yōu)勢(shì)和在國家中心和省級(jí)中心放入部署情況,并認(rèn)為應(yīng)用GPFS并行文件系統(tǒng)后極大地提高了數(shù)據(jù)處理效率。
GPFS并行文件;部署;應(yīng)用
GPFS文件系統(tǒng)結(jié)合Linux群集使用時(shí),可明顯表現(xiàn)出其優(yōu)勢(shì):
(1)系統(tǒng)性能得到提高。GPFS允許在同一nodeset內(nèi)的多進(jìn)程或應(yīng)用使用標(biāo)準(zhǔn)文件系統(tǒng)調(diào)用,并同時(shí)訪問同一個(gè)文件。可將nodeset內(nèi)讀寫操作分布在多個(gè)磁盤上,這樣就極大地增加了文件系統(tǒng)的帶寬,而且通過整個(gè)系統(tǒng)的負(fù)載均衡可以避免某個(gè)磁盤出現(xiàn)過大的讀寫。
(2)數(shù)據(jù)一致性。GPFS能利用一套復(fù)雜的信令管理機(jī)制提供數(shù)據(jù)一致性,并允許任意節(jié)點(diǎn)通過各自獨(dú)立的路徑到達(dá)同一個(gè)文件,即使節(jié)點(diǎn)出現(xiàn)異常無法正常工作,GPFS也可找到其他路徑到達(dá)文件。[1]
(3)數(shù)據(jù)安全性。GPFS屬于日志文件系統(tǒng),可為不同節(jié)點(diǎn)建立各自獨(dú)立的日志,日志中記錄了metadate的分布,如果出現(xiàn)了節(jié)點(diǎn)故障問題,日志可幫助其快速地恢復(fù)數(shù)據(jù),確保數(shù)據(jù)的安全性。GPFS fail-over功能通過規(guī)劃后能將數(shù)據(jù)分布到不同failure group內(nèi),實(shí)現(xiàn)其較高的可用性,并降低單點(diǎn)故障的影響。GPFS還可在多個(gè)failure group內(nèi)對(duì)每個(gè)數(shù)據(jù)實(shí)例作備份。這樣,即使在創(chuàng)建文件系統(tǒng)時(shí),沒有要求復(fù)制,GPFS也會(huì)自動(dòng)在不同failure group內(nèi)復(fù)制恢復(fù)日志。
(4)系統(tǒng)可擴(kuò)展性。通過GPFS可以對(duì)系統(tǒng)資源作動(dòng)態(tài)調(diào)整,在文件系統(tǒng)掛載情況下添加或刪除硬盤。有系統(tǒng)處于相對(duì)空閑時(shí),用戶可重新對(duì)已配置的硬盤進(jìn)行文件系統(tǒng)均衡分配,從而提高系統(tǒng)吞吐量,添加新節(jié)點(diǎn)不需要重新啟動(dòng)GPFS服務(wù)。
(5)管理簡(jiǎn)單。GPFS可以自動(dòng)在同一個(gè)nodeset內(nèi)各個(gè)節(jié)點(diǎn)之間同步配置文件和文件系統(tǒng)信息,對(duì)GPFS的管理可以在任一個(gè)節(jié)點(diǎn)上進(jìn)行。
2.1 國家中心部署情況
國家中心核心區(qū)和Internet區(qū)各配置一套版本為3.3的GPFS。在核心區(qū)提供應(yīng)用支撐與共享服務(wù)器組、監(jiān)控與內(nèi)網(wǎng)FTP服務(wù)器組、數(shù)據(jù)處理服務(wù)器組和存儲(chǔ)管理服務(wù)器組對(duì)高性能磁盤陣列和大容量磁盤陣列的并行文件訪問。Internet區(qū)GPFS集群提供Internet共享服務(wù)器組對(duì)Internet區(qū)磁盤陣列的并行文件訪問。GPFS分成兩個(gè)集群,其中所有的IBM SystemP 刀片組成一個(gè)高性能計(jì)算集群,共21個(gè)節(jié)點(diǎn);其他節(jié)點(diǎn)(包括P520/550主機(jī)和聯(lián)想PC Server)組成一個(gè)數(shù)據(jù)訪問集群,共15個(gè)節(jié)點(diǎn)。在高性能計(jì)算集群中,NSD Server訪問GPFS文件系統(tǒng)時(shí),數(shù)據(jù)流在自身的光纖卡上;NSD Client訪問GPFS文件系統(tǒng)時(shí),數(shù)據(jù)流在IB網(wǎng)上。在數(shù)據(jù)訪問集群中,除登錄節(jié)點(diǎn)(mgmtsw)之外,所有節(jié)點(diǎn)訪問GPFS文件系統(tǒng)時(shí),數(shù)據(jù)流在自身的光纖卡上。在數(shù)據(jù)訪問集群中,登錄節(jié)點(diǎn)訪問GPFS文件系統(tǒng)時(shí),數(shù)據(jù)流在以太網(wǎng)絡(luò)上。兩個(gè)集群的控制數(shù)據(jù)流在以太網(wǎng)絡(luò)上。所有的文件系統(tǒng)都在高性能計(jì)算集群上創(chuàng)建,數(shù)據(jù)訪問集群通過GPFS的互信方式,遠(yuǎn)程掛載高性能計(jì)算集群所有的文件系統(tǒng),且數(shù)據(jù)訪問集群所有的文件系統(tǒng)都不是自動(dòng)掛載文件系統(tǒng)。[2]
國家中心核心區(qū)GPFS集群共包含應(yīng)用支撐與共享服務(wù)器8臺(tái)服務(wù)器,監(jiān)控和FTP服務(wù)器組4臺(tái)服務(wù)器,數(shù)據(jù)處理服務(wù)器組21個(gè)刀片服務(wù)器和2個(gè)管理服務(wù)器,存儲(chǔ)管理服務(wù)器組2臺(tái)服務(wù)器,通過SAN網(wǎng)絡(luò)連接到磁盤陣列。
2.2 省級(jí)中心部署情況
省中心核心區(qū)GPFS集群共包含應(yīng)用支撐與共享服務(wù)器4臺(tái)服務(wù)器,監(jiān)控和FTP服務(wù)器組4臺(tái)服務(wù)器,數(shù)據(jù)處理服務(wù)器組2服務(wù)器,存儲(chǔ)管理服務(wù)器組2臺(tái)服務(wù)器,通過以太網(wǎng)相連,作為GPFS通訊網(wǎng)絡(luò),通過SAN網(wǎng)絡(luò)連接到磁盤陣列,所有服務(wù)器都連到SAN存儲(chǔ)網(wǎng)絡(luò),可共享存儲(chǔ)劃分出的磁盤。
采用df-k命令可看到磁盤列表中每個(gè)節(jié)點(diǎn)都有一個(gè)相同的文件系統(tǒng)/gpfs,23個(gè)I/O節(jié)點(diǎn)直接與磁盤陣列相連,所有數(shù)據(jù)讀寫通過I/O節(jié)點(diǎn)并行完成,提高了數(shù)據(jù)的帶寬及交互能力。對(duì)比NFS及GPFS文件系統(tǒng)環(huán)境下的通信運(yùn)行狀況,即在相同的節(jié)點(diǎn)下,運(yùn)行相同的流程和數(shù)據(jù),使用不同的并行文件系統(tǒng)得到的結(jié)果。使用NFS文件系統(tǒng)時(shí),CPU運(yùn)算效率較低,大多數(shù)時(shí)間都是CPU在等待數(shù)據(jù)I/O,但采用GPFS系統(tǒng)后,CPU運(yùn)算效率提高,I/O占用CPU時(shí)間較少。可見將GPFS并行文件用于通信系統(tǒng)后,可極大的提高群集系統(tǒng)傳輸效率和速度,用于對(duì)I/O操作頻繁的常規(guī)地面觀測(cè)數(shù)據(jù)資料處理時(shí),明顯提升了I/O效率,而且穩(wěn)定性增加,滿足了地面氣象觀測(cè)中海量數(shù)據(jù)運(yùn)算系統(tǒng)的大吞吐量、存儲(chǔ)容量和較高的可靠性要求。
[1]田銳,田晏嘉.基于集中式I/O技術(shù)的兩階段I/O算法優(yōu)化[J].內(nèi)蒙古科技與經(jīng)濟(jì),2009(20):12.
[2]歐陽慎.GPFS在鄭州鐵路局信息系統(tǒng)中的應(yīng)用[C]//鄭州鐵路局“十百千”人才培育助推工程論文集,2011.
The Application of GPFS in Provincial Communication System
Ye Yaquan
Xinjiang Meteorological Information Center,Xinjiang Urumchi 830002
GPFS parallel file for meteorological communication system,can greatly improve the cluster system transmission efficiency and speed,to meet the requirements of surface meteorological observation in massive data computing system throughput and storage capacity and higher reliability.This paper mainly introduces the advantages of GPFS and the deployment of the National Center and the provincial center,it is considered that the data processing efficiency is greatly improved after the application of GPFS parallel file system.
GPFS parallel file; deployment; application
P414.4
A
1009-6434(2016)6-0113-02
葉雅泉(1991—)男,漢族,安徽省合肥市人,本科學(xué)歷,助理工程師,新疆氣象信息中心,從事通信網(wǎng)絡(luò)保障工作。