肖 鑫
(成方金融信息技術服務有限公司,北京 100032)
電源分配單元(Power Distribution Unit,PDU)是數據中心配電系統的最末端一級設備和最基本供電單元。近年來,隨著數據中心基礎設施設備的迭代發展,PDU也從最初的普通型逐漸升級為智能型,給機柜微環境監測和數據中心精細化管理提供了新的技術支撐。但是PDU選型和使用過程中也存在一些問題,給數據中心供電安全帶來了新的挑戰,本文對當前數據中心PDU使用情況、存在的問題進行了剖析,并對PDU技術創新內容進行了研究。
許多數據中心同時運行著普通PDU和智能PDU,但存量中普通PDU在逐漸被智能PDU替換,近幾年新建設的機房則普遍選擇配置智能PDU。雖然智能PDU較普通PDU成本要高,但是智能PDU具備端口級電量監控的顯著優勢,有助于規模化部署設備的運行功率監視分析及電量精細化管理,銀行、通信、互聯網等向全社會提供高并發實時服務的行業快速接受了智能PDU產品。
定制符合機房特質的PDU并規模化部署在新落成的數據中心屢見不鮮,已經成為數據中心建設的常態化需求。客戶往往根據數據中心單機柜功率設計值、機柜型號和外形尺寸、電纜走線方式、擬上架IT設備的電源線插頭數量與規格、供電安全性級別等因素提出定制化PDU的具體技術指標要求。
近年來新建數據中心數量和規模迅猛擴展,老機房電源更新改造情況也較為普遍,PDU市場需求旺盛,眾多PDU品牌激烈競爭。在產品質量方面,市場占有率高的頭部企業產品質量口碑較好,品牌優勢明顯,帶動整個行業的產品質量水平持續不斷提升。
PDU本體開關的配置一般由采購方的使用習慣和使用場景決定,開關的選擇本質上是一個管理問題:對于業主自用的機房而言,不選配PDU開關既可以節約成本又可以解決誤操作問題;但對于IDC機房而言,同一臺列頭柜后端的機柜可能承租給不同用戶,這種情況下配置PDU本體開關便于用戶自主控制機柜的電源,減少對列頭柜開關操作的頻率,避免客戶間的相互影響。
數據中心規模化、標準化發展趨勢下,基礎設施設計過程中色彩管理的原則和方法運用具有區分空間、強化辨識度和提升管理效率的作用,而智能PDU系統的色彩管理往往被忽視。通過兩路智能PDU本體及其相關網線采用不同的明亮度和顏色,不僅使機房內部整體感觀規范有序,還有助于運維人員快速確認電氣故障信息,在數據中心設計和設備選型過程中應優先在智能PDU系統應用色彩管理。
同一個機房區域內可能存在多個品牌的普通PDU,但很難同時存在多個品牌的智能PDU,因為智能PDU的聯網監測涉及到通信數據包的一致性問題,各品牌都有自己的監控管理系統,不同品牌的設備很難在一個監控系統下完美融合。另外,同一品牌不同型號的智能PDU混用時,也有可能存在軟、硬件版本變化導致的通信故障。未來兼容性問題可能隨著產品的進一步發展、通信數據格式的逐漸統一而減少,但使用方不應忽視這一情況。
對于直接將智能PDU接入動環監控平臺的設計方案,如需管理2個以上品牌的智能PDU,則需在前期確定好數據接口開放事宜,避免在施工階段出現無法對接的情況。大型數據中心在設計階段必須考慮智能PDU監控數據規模的問題,確保動環監控主機性能滿足要求。
常見的PDU附屬功能模塊包括溫濕度、煙霧感應、水浸感應、門禁管理、資產管理等模塊,可根據機房管理的具體需求進行選配。以溫濕度模塊為例,機柜級的溫濕度探測數據對機房整體而言作用有限,因為基本上機房投產前都會對氣流組織進行專業的CFD模擬分析,機房內各處的溫濕度應處在合理水平,但是在出現局部熱點或者個別位置濕度偏高的特殊情況下,利用PDU附屬功能模塊可實現近距離及時探測,所以總體沒有為全部PDU統一配置溫濕度模塊的必要性。其他附屬模塊同樣也應根據實際使用需求和場地具體情況綜合評估選配種類和數量。
智能PDU需通過網線實現組網管理,若采用每條PDU單獨引網線直接連接至交換機的方式,不僅對交換機的需求量非常大,對網線的數量需求和敷設工作量也會成倍增加,所以一般采取“手拉手”級聯的方式進行組網:使用1臺智能PDU作為主機,3臺智能PDU作為從機,通過網線將4臺智能PDU串聯起來即可將2臺機柜的配電信息最終通過1條網線傳輸至交換機。通過級聯方式可以串聯多個機柜,但串聯的機柜數量增加會使得監控信息更新時間變慢,且一旦串聯路徑上某個PDU出現故障,會導致后端PDU的信息無法上傳,因此在智能PDU組網過程中應根據實際情況合理選擇組網方式和級聯數量。
由于智能PDU每個插口都增加了電氣參數采集模塊,而且智能PDU集成的網口、USB口等硬件也占用了一定位置,所以智能PDU的電源插口數量比同長度的普通PDU要少,導致在當前IT設備普遍配置4路電源的情況下,機柜內智能PDU電源插口數量越來越緊張,甚至不得不配置“一拖二”電源線和插口轉換電源線以滿足插口數量不足的需求。
當IT設備電源故障引發列頭柜分閘開關跳閘使整條PDU停電時,若不能及時判定機柜內具體電源故障位置,只能先維持單路電源供電,存在一定的運行風險。智能PDU具備故障錄波功能,可以將開關跳閘前每個電源插口的電壓和電流波形進行記錄,有助于及時精準判定故障點位,大幅縮短故障處置時間。在智能PDU已有信號采集硬件基礎上,故障錄波功能依靠軟件改進即可實現。
相較于普通PDU彼此獨立沒有互聯互通的網絡關系,智能PDU通過網線連接進行組網集中管理后就形成了一個局域網,可實現配電信息精細化管理,但這也帶來了信息安全的挑戰。大型數據中心數萬條智能PDU組成的局域網應強化防病毒、防攻擊、防控制的信息安全防護能力,通過增加防火墻、配置網絡訪問策略等措施提升信息安全防護水平。
考慮到當前智能PDU通過網線進行組網方式的施工難度和施工成本,可以從供電側進行技術革新:首先,保留智能PDU網口,僅作為設備調試使用;其次,智能PDU連接線在火線、零線和地線基礎上增加1條信號線,監控信息通過信號線直接傳輸給列頭柜,列頭柜初步處理后上傳給動環監控系統;最后,對配電柜的中央處理器進行升級,確保其可以滿足十幾條智能PDU監控數據的快速處置。按照這一思路將列頭柜和智能PDU設備進行配套改造,省去交換機和網線配置,避免接入動環系統的二次開發,可大幅降低施工成本,減輕運維壓力,提升數據中心末端供電管理的可靠性和安全性。
