張銘蕾, 儲 君
(中國民生銀行總行信息科技部,北京 101300)
在信息技術快速發展的背景下,數據中心基礎設施的關鍵性日益凸顯,對于金融系統的數據中心而言,重要業務系統連續穩定運行對基礎設施安全可靠性的要求更加苛刻,大型金融數據中心如遇宕機造成的業務損失、聲譽等間接損失每小時可達數億元人民幣。
為保證金融業數據中心基礎設施的可靠性與安全性,目前設計標準大多采用Uptime TierⅣ等級,并滿足GB 50174-2017中A級數據中心標準,本文主要從滿足TierⅣ等級的數據中心空調系統控制架構展開分析。
Uptime Institute機構發布的標準中TierⅣ等級為其最高等級,主要從設備容錯、分配路徑物理隔離、可并行維護、連續制冷等角度作出要求(表1)。

TierⅣ等級要求 表1
對于空調系統而言,要滿足以上要求,并同時考慮到節能的要求,目前多采用“2N”架構的冷凍水空調系統,如圖1所示,從冷源部分(包含冷水機組、冷凍水泵、冷卻水泵、板式換熱器、冷卻塔、蓄冷罐等)到機房專用精密空調末端設備的數量均為2N,即從設備配置上滿足容錯的要求。
同時,對每套制冷單元,從冷源到空調末端及每套制冷單元的空調水管路,均應布置在不同的物理空間,滿足防火防水的物理隔離要求。

圖1 2N配置的空調系統示意圖
基于Uptime TierⅣ等級搭建的數據中心空調系統及機房環境溫濕度控制系統主要包括:設備監控系統(BAS系統)、空調末端的群控系統、環境監控系統。
通過以上控制系統可以自動識別空調系統中故障設備或故障點,并自動隔離故障,同時另一套空調系統自動加載,保證機房環境溫度在15min內的波動值不超過5℃,同時滿足空調系統的制冷容量一直達到“N”的要求。
(1)針對制冷單元一、二設計兩套獨立的BAS系統,如圖2所示,每套BAS系統接入各自制冷單元內的冷水機組、冷凍水泵、冷卻水泵、冷卻塔、蓄冷罐、水處理器、漏水探測器及水管路上的電動控制閥門、壓力和溫度傳感器等設施。
(2)兩套BAS系統的服務器和操作站放置于獨立的自控室內,兩套系統之間完全獨立運行。

圖2 BAS系統示意圖
(1)機房專用精密空調群控管理系統采用的是模塊化主從形式,如圖3所示,通過RS485通訊方式來實現聯網群控。選擇一臺精密空調機組當作主控機組,將精密空調機組聯網,并將各個空調的地址分別設置在精密空調內置智能通訊接口上。
(2)精密空調采用2N架構,因此群控①與群控②對應的空調機組也獨立聯網。當任何一套精密空調系統出現故障時,另一套精密空調系統可正常運行,從而保證N配置的精密空調可靠運行。

圖3 群控系統示意圖

圖4 環境監控系統示意圖
與空調系統相關的環境監控主要包括IT機房模塊及配電用房內的溫濕度采集、機房專用精密空調的狀態采集、加濕機狀態采集等。
監控系統中的核心交換機、監視主機均為2N架構,一主用一備用,分別設置于獨立的監控室內,主備機相互檢測,雙機熱備。環境監控系統示意圖如圖4。
(1)設備監控系統(BAS系統)
1)BAS系統中的控制器用以檢測室外濕球及干球溫度、水流量、供回水溫度、壓力等參數,向制冷單元內的各設備(冷水機組、水泵、冷卻塔、電動閥門等)發出控制命令,并接受各設備的狀態反饋信號,即同時實現“監測與控制”的功能。
因Uptime TierⅣ等級要求“2N”配置的空調系統均需同時在線運行,當監測到任意一套制冷單元的某個設備故障的情況下,應能自動識別故障點并隔離故障設備,同時根據設定的控制邏輯,另外一套制冷單元中相應的設備自動加載運行,如:某TierⅣ等級的數據中心,冷水機組數量為1+1(2N配置),在滿負荷的情況下,兩臺冷水機組運行負載率均為50%+50%,在某一臺冷水機組因制冷劑泄漏或其他故障的情況下,BAS系統自動識別故障的冷水機組并發出報警,按照控制邏輯自動關閉故障的冷水機組及其對應的冷凍水泵、冷卻水泵、冷卻塔及相應的管路電動閥;此過程中另一套制冷單元根據冷負荷的需求自動加載,直至達到100%的運行工況。
2)對于冷凍水空調系統,冷凍水或冷卻水的泄漏對數據中心服務器等設備的危害極大,因此Uptime TierⅣ等級要求所有室內水管路都應探測到漏水故障,需要通過布置漏水繩及其他壓力傳感器等設施,保證任意位置的漏水探測器報警時,輔以管路中的壓力傳感器,判斷水管路是否發生局部泄漏或者爆管,控制系統自動關閉相應區域的電動閥,防止出現持續性的漏水。
實際在設計過程中,則需根據空調系統冷凍水及冷卻水管路環狀/枝狀布置的不同,設定不同的控制邏輯,枝狀布置的管路可能因管路泄漏而關閉整套空調系統。
(2)空調末端群控系統
1)群控管理系統具有的功能包括群組內的空調末端自動分工、順序加載、數據同步等,以及對各臺空調機組運行參數進行精準控制,當主控機組停機后,其他從機具有主控功能,會及時接管系統,完成相應的管理控制任務。
2)群控功能應能保證精密空調所有機組運行的持續性,避免主控機組故障影響到其他機組,從而保證整體“N”配置的精密空調可靠運行。
(3)環境監控系統
1)環境監控系統主要是采集機房專用精密空調的送回風溫度和濕度測量值,送回風溫度和濕度設定值,偏移量、運行狀態,風機轉速、水閥開度、供回水溫度、手/自動和故障狀態等數值,以及機房模塊、配電用房內的溫濕度情況。
2)Uptime TierⅣ等級要求環境監控系統只能進行數據及狀態采集,不能參與設備控制。
(1)對于設備監控系統(BAS系統),不僅要滿足系統內各設備容錯的要求,同時對于各自監控系統的控制器、交換機、服務器、監控器、操作站等設備及主干布線、水平布線的橋架路由等,均需布置在不同的物理空間,以保障當任何一套系統因火災或水管路漏水導致故障時,另外一套系統仍然可以工作,監控其對應的制冷單元,保證制冷系統滿足“N”容量的要求。
(2)對于空調末端群控系統,因每個IT機房模塊內的精密空調為2N配置,同時已經布置在滿足物理隔離要求不同的空調間內,因此空調末端的群控系統已經滿足物理隔離的要求。環境監控系統“只監不控”,則其設備及橋架路由可不要求物理隔離,但建議其核心交換機及監視主機進行雙機熱備。
(1)任意一個控制系統中的控制器及交換機、通信線路故障時,均可以直接斷開該設備,其所控制的設備將繼續保持當時的運行狀態,不影響正常使用。
(2)BAS系統應監測控制器的“心跳”,如果檢測到控制器故障,則應立即報警并維持故障之前的運行模式及狀態。
(3)控制系統中應有設備的手/自動控制狀態顯示,冷水機組、水泵、冷卻塔、機房專用空調等設備均需自帶手動控制模式,在設備故障時切為手動控制模式,此時控制系統中顯示設備手動控制狀態,直至設備維修完成后切為自動控制模式。
(4)控制系統中的控制線連接類型需為插拔式連接頭,即支持熱插拔,保證可以在線檢修維護。
通過以上分析,可知基于Uptime TierⅣ等級的數據中心空調系統控制架構與GB 50174-2017中的最高A級標準,在一些細節上,尤其設備監控系統(BAS系統),有較大的區別。本文所分析的是基于實現設備及路徑的物理隔離而采用“2N”配置的架構,但其實“N+1”的配置也能實現相同的功能,但難度更大。同時,此架構需要犧牲一定的建筑面積,降低了數據中心的出機柜率,整體的投資造價也相對較高,但卻可以提高數據中心的安全性與可靠性。若為了獲得Uptime Institute機構頒發的設計認證證書,則需要通過該機構嚴苛的審核,因此國內通過TierⅣ認證的項目相對較少。
