橋架走線如圖1所示,機架配線的布線施工如圖2所示。兩張圖中的布線系統理線非?!耙幏丁保踔量梢援斪鞴に嚻房创?。如果作為優秀布線施工的樣板圖,相信多數讀者都會贊同。但從數據傳輸可靠性上看,這兩張樣板圖卻有可能在傳輸萬兆甚至更高數據流時出現誤碼率超標的問題。主要的原因有三:一是線捆太大、線纜平行過長、線間隔離不足(如圖1所示);二是捆扎密度太高(如圖2所示);三是捆扎太緊(圖1、2中不存在此問題)。下面逐一分析這三種情況導致誤碼率上升的成因及預防措施。


我們知道,電磁波信號在電纜中向前傳輸時也會同時向電纜周圍的空間直接輻射一部分電磁波能量,這些能量同樣也會被周圍的電纜通過電磁感應的方式接收,從而進入鄰近的電纜中,這種感應信號將作為干擾信號擾亂電纜中正常傳輸的數據信號。TIA 568C和ISO 11801等標準化組織將其定義為外部串擾(AXT)。單根電纜對鄰近電纜造成的外部串擾數量有限,一般不會引起誤碼率上升。但如果一根被干擾的電纜周圍有多根電纜存在并且也在傳輸數據信號,則此時累積起來的干擾能量就可能改變原來的信號能量結構和信號波形,從而造成波形失真和抖動,導致對端信號接收電路誤識別,形成“誤碼”。如果數據電纜用于運行10G以上應用,數據碼傳送的密度會越來越高,數碼信號占用的基帶帶寬就越高。標準中要求電纜的基帶帶寬上限頻率要達到500MHz。由于頻率越高,信號傳輸時對外輻射越強,所以速度越高的應用對周圍電纜的干擾就越大,換一個角度看,則是信號傳輸電纜受到來自周圍其他高速電纜的影響越大。因此,在實際敷設支持高速應用的電纜(比如10G)時,一般每個電纜捆的數量不宜過大。TIA 568C等標準則要求對實際的干擾程度進行實地測量,并納入驗收文件。圖1中左側布放的電纜只有平行的一層,不必擔心外部串擾的問題。而右側電纜被大量堆積在了一起,雖然布放非常整齊,但卻很可能出現外部串擾測試不合格的問題。如果手里有福祿克公司的DTX-1800電纜分析儀,則可以選配外部串擾測試模塊進行外部串擾測試。外部串擾測試是抽樣測試,通常挑選一捆電纜中干擾情況預估最嚴重的幾根做代表來進行測試。對于外部串擾測試不通過的鏈路,如果判斷是線束太大,則需要改小。比如,48根一捆測試不通過,則需要改成24根一捆,還不通過,則改成12根一捆,甚至6根一捆。
每根電纜的結構是大致相同的,所以兩根鄰近電纜中的對應的雙絞線對(比如A電纜中的線對A1/2和B電纜中的線對B1/2)也是平行關系,兩者之間的絞接率是一樣的,這導致彼此輻射的信號因為持續的平行關系而很容易被對方吸收,從而引起誤碼率上升。所以,布放電纜的走向并不是越平行、整齊越好,反而是適當的錯亂有助于消除外部串擾信號的累積。不過,習慣于布線時使用穿孔板的“高水準”的施工人員會自然地傾向于將平行距離盡量延長,在一片贊揚聲中,設下高速應用的誤碼率陷阱。如果改小線束直徑仍然不能解決問題,則可以嘗試打亂理線的平行距離,此時很可能使問題得到解決。
雖然改小線束可以很好地解決多數外部串擾不合格的問題,但大量改小的線束仍然可能堆疊在橋架和地板下,彼此之間的干擾雖然有所減弱,但畢竟還存在。此時需要適當增加線束之間的間距,并允許線束排放不那么“整齊”。增加間距可以使用一些類似支架一類的布放設施,或者采用混疊排放的方法。后一種方法需要承擔一定風險,那就是如果測試仍然不合格,則事后進行追加隔離支架的施工難度就會明顯增加。
為了良好地固定布放的電纜,捆扎是必要的。通常捆扎密度高,有利于整齊理線,不過你也許需要謹慎對待這種看似增加外觀漂亮的高水準施工行為。因為捆扎過緊會令電纜的線對與線對之間、電纜與電纜之間的間距空間被壓縮,為內部串擾和外部串擾提高了輻射效率,使得干擾量增加,并且,捆扎處的特性阻抗值通常也會改變。所以,捆扎過緊和過高的捆扎密度都會導致串擾增加,在贏得美觀的同時犧牲的是速度。一般建議如下:如果一定要提高捆扎密度,則選擇松散捆扎,盡量避免因為捆扎應力過大改變線纜的特性阻抗和串擾系數。這兩個參數可以通過測試NEXT和RL等參數直接、間接地反映出來。其他的建議來自經驗豐富的工程商和集成商,比如,采用間密捆扎——多數捆扎較松,僅少量關鍵位置(比如上下橋架和進出機柜)的捆扎稍緊一些。對于由于捆扎過緊、過密造成的串擾和回波損耗參數超標,可以在不影響捆扎效果的情況下適當剪開一些扎帶,這通常會使測試結果得到改善。測試的時機:剪開扎帶后立刻進行測試并不是最好時機,而應于次日再進行測試,以免因電纜擠壓變形后恢復慢、應力消除不徹底令改善效果不明顯。
萬兆及以上速度的光纖布線目前主要局限于在數據中心布線系統中采用。數據中心中使用的高速光纖在新的國際標準中已經不再采用OM1、OM2選項,直接建議采用OM3和OM4光纖。這給光纖質量的檢測帶來了一些挑戰和新要求。由于設備的高速度、高密度和多次跳接結構使其布線系統與普通布線系統相比有比較明顯的特點,比如預端接布線、高密度布線、短距離布線、超短距布線(跳線直接連接)、多跳接/轉接鏈路布放等。這些特點大大提高了設備的空間效率,但也給布線系統的質量保證增加了難度。需要工程商、集成商和設備供應商更關注以下四個“質量控制因素”:
第一,要盡量避免預端接光纖的“一廢俱廢”問題。預端接布線使得安裝光纜的工作大大簡化,安裝質量和安裝速度明顯提高,受CIO們的歡迎程度較高。但在運輸、拆裝、布放、開通等環節對規范施工的要求明顯提高,這是因為一旦這些環節(特別是拆裝、布放環節)出問題造成光纖鏈路質量測試驗收不通過,則可能需要批量廢棄光纜(比如MPO光纜布線)——此即常說的“一廢俱廢”,如圖3所示。造成預端接光纜現場廢棄的原因主要是布放時牽拉過度、沒有做好現場保護、路由過度彎曲、捆扎過緊、受力不均勻、端面損傷等。預端接光纜由于訂貨時間普遍較長,由此造成的返工延誤會成為工程商驗收時的一大麻煩。

第二,檢測驗收或設備開通前要遵循較嚴格的安裝操作規范。高密度布線普遍采用MPO端接,如果按照以前習慣常規方法而不是規范的方法進行安裝,則因端面污漬導致10G/40G設備很容易出現誤碼率過高、端口頻繁重啟等現象。規范的安裝必須進行現場端面清潔、檢查和測試后再安裝設備,空余的布線端口要嚴格做好防塵、防潮和固定。
第三,短距離、多跳接光纖鏈路只考察鏈路損耗值是不夠的,還需要將反射值(ORL光回波損耗)納入考察范圍,以確保鏈路誤碼率達到要求。由于數據中心的設備密度和速度的快速增加,與空間局促的矛盾日益明顯,采用設備分區、頂置機架、MPO布線等改善方案導致短距離、多跳接光纖布線的大量出現。短光纖鏈路由于本身損耗值較小,常給人一種錯覺,那就是損耗測試很容易通過——即便因為施工不規范造成損耗偏大也不會引起設備工作出問題。但事實是,一方面,10G/40G/100G應用為光纖鏈路預留的“損耗預算”本身就比較緊張,如果“粗糙施工”再加上檢測的時候使用耦合誤差比較大的光源誤差可達40%,經常會被誤判為不合格。為提高測試精度,新的標準(TSB 4979)建議損耗測試宜采用光環通量(Encircled Flux)控制的光源和專用測試參考跳線(TRC)來進行測試。圖4所示的垂直光纖路由轉彎點內側與機架接觸點的部分光纖由于缺少緩沖支撐,長時間受力后可能出現裂紋,且損耗也可能增大,將影響到高速鏈路的誤碼率。

第四,較大的回波損耗會導致光傳輸碼出錯及誤碼率不合格。這是因為來自光纖連接器的多次反射回波會增加色散且破壞正常傳輸的光脈沖波形,造成誤碼率上升。如圖5所示,LC接口的設備使用MPO預端接光纜,須先在設備端口前使用MPO-LC轉接盒,再用現在最常用的LC設備跳線接入鏈路,這樣會人為增加連接器/跳接點的數量,如果再加上忽視LC-LC跳線的進貨質量,那么習慣于“粗放施工”的工程商/集成商在數據中心項目中必然會遭遇“不合格”的高風險事件。引入高解析度的OTDR測試來幫助確定跳接點/連接點質量水平是一個很有效的現場測試解決方案,可以識別反射較強的連接點/跳接點,并給出通過/失敗判斷。目前ISO 11801給出的光回波損耗ORL的判別門限是-20dB,雖然有些偏低,但也算是一個較大的進步。

數據中心高速鏈路承擔的計算數據流很大,涉及的用戶數量眾多,為避免總是在設備開通或檢測驗收階段才發現大量因產品選型不過關和粗放施工等引發的質量問題,以及在系統使用維護階段出現高頻率的升級困難和故障率,提高系統可靠性,減少總體擁有成本,從設計選型階段就要將質量控制觀念和措施納入整個工程流程。但因為我國設計標準和施工規范普遍落后于設備創新和突破的速度,按部就班、循規蹈矩的質量控制方式在機房建設中一直都存在風險,給用戶帶來的損失也是無以計數的。
這個階段比較簡單,除了設計規范、產品手冊和供應商推薦的方案外,應搭建仿真鏈路進行測試,這樣可以把產品存在的缺陷、一致性問題、匹配性問題在安裝施工事前就排除掉。比如電纜是否能通過6包1測試,光纖、跳線、耦合器等是否匹配。
施工安裝階段的前期是進場檢測,這個環節是對采購的“入網”合格產品進行抽測,確保采購的產品和選用的產品質量一致,并排除運輸、轉存過程中的質量風險(比如過度擠壓損傷、彎折損傷、雨淋等)。然后是施工環節的自檢自糾和監理測試,這個環節主要是考察施工工藝是否合格。建議的方案是小批量“預驗收檢測”,這樣可以及時發現施工過程中存在的問題,避免后期檢測驗收“批量問題”的出現,導致項目停工延期,造成巨大損失。
電纜鏈路存在各廠商之間不兼容的問題,雖然居中性的永久鏈路測試可以保證電纜鏈路支持后續的跳線互換,但如果跳線本身不支持互換,則仍可能引起鏈路誤碼率超標甚至不能聯通的問題。所以對采購待用的銅纜跳線也要進行“進場檢測”,只有居中性檢測也符合要求的跳線才能支持跳線的任意互換。對于光纖跳線,則需要在“進場檢測”時,測試損耗值和回波損耗值,有條件時還要進行兼容性測試,只有這樣才能確保待用光纖跳線上架后的100%可用。ORL兼容測試需要使用OTDR和補償跳線,如果被測跳線和約定的補償跳線之間有較大差異,則存在異質光纖的可能性較大。比如使用OM2光纖跳線仿冒OM4光纖跳線,僅看外觀和測試損耗值是不能發現問題的。
由于數據中心設備變更比較頻繁,所以TIA 942A要求備用物理鏈路也要100%檢測合格,并需定期進行檢測,以確保100%的可用性。目前標準中均沒有規定定期檢測的周期,業界給出的建議是根據布線系統的開通、增刪、變更、擴容頻繁程度,可以選擇1.5~3年為定期測試周期。對更新、擴容、拓撲結構調整、故障診斷恢復運行前,均要求進行開通測試,確保布線系統100%可用。