杜志煒
(中國電信廣州分公司,廣東 廣州 510620)
近年來,伴隨著5G、人工智能以及邊緣計算等新技術的出現和發展,互聯網進入快速發展模式。基礎設施重構是運營商網絡數字化、智能化的重要前提。在改造之前,網絡都是專用設備,很多都是黑盒組成,相互之間的操作性和可配置性周期較長[1]。將通用設備加上服務器承載,然后云化,是運營商數字化、智能化或者項目演進最基本的前提。傳統通信機房需向DC化機房方向轉變,作為數字化轉型過程中的核心基礎設施——數據中心也掀起了建設的熱潮。無論是改造傳統機房還是新建數據機房,核心局站基礎配套的機房面積、機房承重、高低壓系統、油機系統、空調系統、開關電源系統、UPS系統等方面需要基于當前情況做統一規劃、統一布局[2]。
新形勢下,核心局站基礎配套的設計要求已有相關文章進行了深入全面的論述,在此不再做全面的分析和論述。本文主要想從運營維護人員的角度,對傳統機房基礎配套存在的缺陷進行分析,提出適應新形勢下,核心局站機房基礎配套的優化方案。以期能在核心局站基礎配套的升級換代大潮下,解決運維人員多年詬病的機房配套缺陷,使新技術新設備能有更為精準和有效的應用,把工具交到真正會使用的人手中。
核心局站低壓配電系統大量使用了抽屜式開關柜作為集中控制的配電中心,有較高的可靠性、安全性和互換性。抽屜式開關是能將電源斷路的斷路器。把斷路器本體置于抽屜座中,就成為抽屜式斷路器。設計抽屜式斷路器的目的:其一,更換斷路器方便,當正在運行的斷路器一旦出現故障損壞,可用備用的斷路器快速替換。這時只要把損壞的斷路器從抽屜座中搖出,裝上新的斷路器即可,減少了停電時間;其二,可作為隔離器用。當電路或設備需要檢修時,為安全隔離起見,把斷路器本體搖出,電路即分斷隔離[3]。
1.1.1 難點分析
抽屜式開關斷路器的品牌、型號、種類很多,如果全部都進行購置備品備件,其采購成本較高,若不事前準備備件,在開關出現故障時,又可能得不到及時更換,通過應急電纜的駁接,操作較繁瑣和困難,時間也較長,可能危及供電安全。通過引入“非全尺寸”抽屜開關的備品備件管理,可以解決這個矛盾。
1.1.2 改進措施
“非全尺寸”和“全尺寸”抽屜開關的區別:
(1)配置不同
全尺寸抽屜開關備件比較好理解,就是規格型號性能與在用的開關完全一致;非全尺寸抽屜開關備件則是原有在用型號的簡化版,只保留最簡單的電路接通功能。
(2)功能不同
非全尺寸抽屜開關對使用有限制(只能起到臨時接通電路的作用),只能起到暫時頂替原開關的作用。其他保護性功能和耐用性不需具備。
(3)重量不同
全尺寸抽屜開關的規格與原抽屜開關規格完全相同,重量比非全尺寸的抽屜開關要沉重很多。非全尺寸抽屜開關由于簡化了許多功能,其重量更輕便,應急使用更方便。
“非全尺寸”抽屜式開關的應用降低了抽屜式開關備件的采購成本,提高了故障搶修的時效性。“非全尺寸”抽屜式開關只作為應急搶修用,搶修完成后仍需盡快采購“全尺寸”產品進行更換,保證抽屜式開關功能性的完整。引入“非全尺寸”的備品備件管理可以擴展到其他非常用的備品備件,如空調系統的止回閥、自動清洗器、Y格等,既能減少運營成本,又能提高供電供冷的安全性[4]。
核心機房末端配電的范圍指從通信電源設備輸出配電柜輸出端引出至機架列頭柜,再從列頭柜輸出端引出至機柜PDU插座端。列頭柜處于這個“承上啟下”的關鍵環節,對于保障機柜內的重要核心設備正常供電起到關鍵的作用。
1.2.1 難點分析
由于歷史原因,列頭柜處于動力專業和設備專業維護交接面,以往的功能單一和監測內容簡單(一般只有列柜總電壓和總電流的數據,以及簡單的通斷告警功能),關鍵保障作用未能正常發揮。此外,核心IT設備和服務器通常供電采用A/B雙路供電模式,如圖1所示。服務器內雙電源模塊其中一個故障不影響服務器正常運行,但也造成其單一電源模塊故障不易被發現,造成供電隱患,及時發現該隱患,提醒專業設備維護工程師及時維修,是提高業務保障能力的關鍵[5]。

圖1 列頭柜A/B雙路配電示意
1.2.2 改進措施
一方面,機柜端通過列頭柜配置智能電能儀表、開關狀態監控單元、通訊接口、單元等元件實時監測電流、電壓、功率和電量,實時顯示每個機柜PDU的運行狀態,實現對機柜的監控和能效管理,如圖2所示。可實現故障報警,實時監控電能質量,包括負載系數、諧波含量等,所有監測參數將匯集到監控總單元模塊,通過開放通訊協議接口可與機房綜合監控系統進行對接,可實時查看數據中心機房運營狀況,任何監測點出現故障,均可在系統顯示界面找到其對應編號,以便維護人員迅速作出響應,大大減少檢修工作量。

圖2 列頭柜智能監測系統
此外,通過A/B雙路PDU供電電流的實時監測,及時比對出服務器單路電源模塊故障造成的電流變化情況,準確定位故障服務器位置,快速排除故障。
另一方面,列柜智能監測系統針對核心機房末端設計,能夠綜合采集所有能源數據的智能系統,為交直流電源配電柜提供電參量信息,并可通過通訊將數據上傳到動環監控系統,實現對整個核心機房的用電情況實時監控和有效管理,通過精確計量單機柜的用電量,將服務器和IT設備的用電精確計量到機柜,有利于精確分析機柜用電能耗與機柜收入之間的匹配程度,提供經營分析依據,如IDC收入與成本的分析決策;精確計算效益分攤和代墊電費成本的回收等。
對于影響局站PUE值的電源、空調兩大基礎設施而言,雖然空調系統的制冷效率提升和能耗減少直接對PUE值產生影響,但電源系統的能效才是問題的根本,為了保障IT設備的不間斷供電,電源供電系統必須通過能量轉換,其轉換效率的低效,伴隨轉換熱量的產生加劇了空調系統的負擔,加倍地導致PUE指標的攀升。而局站所有營運的重要負載幾乎都是通過通信電源系統(包括UPS、高壓直流和48 V直流系統)來供電的,因此如何進一步提高通信電源的工作效率,將是快速改善局站供電系統乃至整個局站PUE指標的核心途徑。
1.3.1 難點分析
因為以下的原因,一般情況下,通信電源系統的實際負載率通常較低,其中UPS系統比直流系統更低。
(1)超前規劃
因為通信電源系統不易改造,機房在規劃時會考慮到未來3~5年的業務擴容,常常需要提前規劃好擴容容量的通信電源系統。
(2)冗余配置
為保障可靠性,通信電源系統需要冗余配置,采用N+1或2N的配置。直流系統一般為模塊配置,需要考慮后備電池的充電容量和每10個模塊增加一個模塊的冗余配置。UPS系統常采用N+1配置,部分核心負載甚至采用2N或2(N+1)配置,保證供配電系統任何一條線路出現問題時都不會導致負載掉電。
目前使用的工頻UPS系統工作模式為雙變換在線工作模式,其目的是通過“AC/DC和DC/AC的雙變換”給IT負載提供穩定的凈化電源。但負載率對UPS的效率影響很大,一般情況下,UPS的效率會隨著負載率的提高而提高,并且會在負載率達到70%時達到效率最高點,如圖3所示。然而實際場景中UPS負載率無法工作在最佳負載區間,對于2N系統,單機40%的負荷率已經是算系統滿載了,冗余越高的,負載率越低,一些機房UPS負載率會低到20%左右甚至存在負載率極低,導致UPS效率極低的情況,如圖4所示,這導致了能源的極大浪費,并降低了整個局站的PUE指標。

圖3 工頻UPS不同負荷率下的運行效率

圖4 不同配置下的負荷率和運行效率
1.3.2 改進措施
直流系統無論是傳統的48 V系統還是高壓直流系統,目前均采用模塊式供電,結合模塊休眠、輪休等技術,很好地解決了上述問題,在低負荷情況下,其工作效率可以達到90%以上。
UPS系統建議參考直流系統的供電模式,工頻機向高頻塔式機、高頻模塊化UPS方向發展,高頻機和工頻機區別如下文所述。
高頻機:利用高頻開關技術,以高頻開關元件替代整流器和逆變器中工頻變壓器的UPS,體積小、效率高。
工頻機:采用工頻變壓器作為整流器與逆變器部件的UPS,主要特點是主功率部件穩定可靠、過負荷能力和抗沖擊能力強。
高頻機的輸入特性指標好于工頻機,不但可以極大地減少對電網的污染,并且可以減小對前端柴油發電機容量的需求。由于高頻機采用IGBT整流器技術和無變壓器設計,使高頻機的效率有所提高,特別是在輕載(50%以下)時,效率提高更加明顯。相對地,高頻機在性能穩定性上稍弱于工頻機。但是由于UPS供電系統配置采取了較多的冗余設計,這點穩定性的差異是可以覆蓋的。此外,有的UPS推出了ESS高效運行模式,其技術是,正常情況下,UPS運行在靜態旁路回路上,逆變器和整流器處于“休眠”狀態,能無間斷地從靜態旁路回切到逆變輸出狀態。與目前的UPS正常供電模式,兩者的控制邏輯指向相反,切換方向也相反。但其低負荷情況下的工作效率得到了大幅度的提升,PUE值得到明顯優化,如圖5所示。

圖5 不同UPS對PUE值和運行效率的影響
本文從運營維護人員的視角出發,對傳統機房基礎配套在關鍵環節的備份應急、機柜內服務器等核心設備的用電監測、通信電源設備在低負荷下的運行效率等方面存在的缺陷進行分析,在適應“云改數轉”形勢下,核心局站機房基礎配套改造升級中,就使用“非全尺寸”備品備件的應急管理措施、加強機柜級的用電監測功能以及低負荷情況下使用高效率通信電源設備,優化局站的PUE值,提出了自己的意見和建議。以期能起到拋磚引玉的作用,激發同行在核心局站基礎配套的升級換代大潮下,多多思考,解決運維人員多年詬病的機房配套缺陷問題,使新技術新設備找到其更加適配的位置。