文|施炎
時鐘同步網現狀及改進思路
文|施炎
作為電信網絡的支撐網,同步網的安全性和可靠性不言而喻。因此,設計和建設方面對節點設備的保障考慮尤其周全。這一方面說明了其具有較高的生存力,另一方面卻總因不出“問題”而疏忽了對它在理論和維護上的研究。實際上,目前同步網絡存在的隱患不少,主要體現在網絡結構的不合理方面。現在又將面臨著SDH設備即將逐步退網時期,網絡的局部改動可能會造成全網同步架構發生變更,使原有不合理的組網暴露,進而對尚未退網設備上的承載業務造成影響。如何避免此類問題?必須了解出現同步問題時網絡呈現出來的各種現象和相關機理,才能做到心中有數。
20世紀80年代,程控交換機的規模應用使通信網第一次有了“網同步”的概念:邊緣交換機通過2 048 kb/s通道跟蹤上級交換機的時鐘,組成由中心交換機向邊緣交換機輻射的層級結構的同步網。這個2 048 kb/s通道是傳輸專業的PDH(準同步數字體系)通道,但此“網同步”并非本文所提的專用同步網。在通信專業教科書中,同步的定義是指兩個或多個信號之間在頻率或相位上保持某種嚴格的特定關系。同步網伴隨SDH同步發展而來,20世紀90年代中開始大規模建設。SDH即“同步數字體系”,是SDH對同步要求更趨嚴格帶來的結果。
一般而言,通信的同步方式有三種。
點同步。任何數字通信系統發送端和接收端都必須同步工作。一般為接收端在接收信號中提取定時信號,產生一個與發送端時鐘同步的本地時鐘來對接收信號脈沖序列進行判決,以正確接收信號,完成通信過程。因此,點同步又稱“接收同步”或“主從同步”。
線同步。低速率信號復用成高速率信號時,必須將互不同步的獨立信號變換成唯一的、單一速率的線路信號,又稱為“復用同步”。例如,PDH復用器(DWDM中的T-MAX可以做到子速率透傳,不屬于這里的復用)。
網同步。程控交換機使用后,要求交換機之間的2M數字中繼線互連構成交換網。同時,為保證有效交換,要求各交換點的節點時鐘同步。此外,還規范了互同步的從屬關系——要求邊緣交換機同步于核心交換機,這是網同步。目前,國家同步網架構節點均為BITS(Building Integration Timing System)設備機架,BITS核心部分為高穩定的振蕩器。其中,首都國家備用中心為銫(銫133)原子鐘+GPS(全球定位系統衛星)接收的外定時信號(一級BITS滿足ITU-T G.811),大區或省會、市級中心為銣原子鐘結合GPS或無GPS(二級BITS,滿足ITU-T G.812),城區或縣中心為受控石英晶體鐘(三級BITS,滿足ITU-T G.812)。
數字信號脈沖在傳輸鏈路上受到損傷和衰減時除了引起脈沖變形外,還會在接收端的理想位置(最佳抽樣點)上左右“搖擺”。當擺動頻率大于10 Hz時稱“抖動”;當小于10 Hz時稱“漂移”。其中,單位可以是相位單位(UI,即脈沖寬度,隨速率而變),也可以是時間單位s。
一般而言,同步時鐘信號傳送網全程存在以下多個損傷因素:
標準同步源本身存在相位噪聲和漂移。例如,“高穩定”時鐘源都配有高性能的恒溫控制電路來減少溫漂影響;測試用的便攜式銫鐘源需要預熱24小時以上,方可作為標準參考時鐘源。使用時,還必須全程記錄環境溫度的變化曲線加以參照,以避免測量誤差等。
傳輸路徑中與溫度相關的傳輸時延變化。它們導致緩慢的、經常周期性的相位波動(通常稱為漂移)。其中,網元同步振蕩器的溫度漂移和光纖折射率隨溫度變化的漂移強度最大。后者因為折射率變化,會導致信號相位變化,因為在光纖中光信號相位 與折射率 有函數關系,而 又受溫度影響。
本地多個PRC(Primary Reference Clock)的運用、不合理連接或跟蹤配置等,會導致設備網元無所適從。
國家與國家之間,國內不同運營商之間會形成獨立的“同步島”效應,因此島與島之間的接口信號也存在不同步問題。不同的GPS接收域,也可以看成不同的同步島。
這些損傷顯然難以避免。為了避免長鏈路傳輸使同步時鐘信號在送達目的后變為不可用,ITU-T G.803對此進行了規范。顯然,漂移具有較長期指向性特點,可以用股票交易術語。抖動是隨機的“小幅震蕩”,漂移則是用頑固的“長期看衰”來比喻。
同步鏈上的所有設備(網元)在通信過程中依不同地位遵循以下5種工作方式,以保證定時信號的送達。這5種工作方式包括外同步接入同步方式(源)、通過定時方式(再生中繼站)、線路定時方式(OTM/ADM)、環回定時方式(保護時)、內部定時方式(故障狀態下至少保持48小時以上時鐘信號符合標準ITU-T G.803)。除源外的各網元線路,接收接口均有PLL(Phase-Locked Loop)提取同步定時信號來同步網元自身的晶體振蕩器,并向網元內各工作機盤分發工作定時信號。注意,這5種工作方式是同步信號均不通過網元的凈負荷管理器(SDH網元交叉矩陣模塊)完成的,即5種工作方式僅與線路或支路接口/外同步接口/PLL/內部晶體振蕩器/內部數據總線有關。
前面說到,同步網是為SDH誕生而誕生的,因為SDH對同步要求更嚴格。比較PDH中準同步2M信號與同步2M信號對頻偏要求,前者是2 048 kb/s±50 ppm,后者是2 048 kb/s±4.6 ppm。直觀地講,即對于2 048 kHz信號,前者允許偏差≤±102.4 Hz,后者僅允許偏差≤±9.2 Hz。可見,兩者存在一個數量級的差異。
SDH得到大規模發展,是因為其較PDH具有巨大優勢。其中,各種優點離不開豐富的開銷,以保證這些工作字節嚴格正確的解讀,即必須“對仗工整”以嚴格同步解讀。然而,同步時鐘信號“不能走SDH”,這已是大家的共識,且眾所周知是由于SDH中有指針調整機制。2010年版《固定網絡設備分冊》同步網設備篇第二章第一節第4條規定:“同步定時鏈路傳送定時信號的方式可分為三種:PDH專線、PDH業務碼流及SDH線路碼流(即STM-N)。”也就是說,系統不是不能經SDH傳輸,而是不能經SDH凈負荷管理器處理后再傳輸,只能通過線路編碼使同步定時信息攜帶傳送。
為深入解析,先了解SDH與PDH在接收端口各自應對頻偏的相同點和不同點,如表1所示。

表1 PDH接口與SDH接口(凈負荷)的一些差異
從表1可以看出,不同步時的抑制機制有:采用滑動存儲器、加入填充比特和指針調整。前兩種組合為PDH接口,而SDH接口為異步映射(國內采用),滑動緩存機制不使用。不使用帶來的好處是對映射入的2 048 kb/s信號無嚴格幀結構要求,只需滿足偏差≤±102 bit/s要求,即可通過碼速調整和加入低階開銷及指針而達到快速變換為VC-12的要求。缺點是交換側不能直接在C-12信號中提取或插入64 kb/s信號。使用的好處是可以吸納部分輸入抖動和漂移,當然也帶來了輸出時延和滑動損傷。對于填充比特機制的區別,則只在于PDH只能正調整(填充),而SDH可以正調整也可以負調整。當輸入信號的抖動和漂移超過容限時,PDH接口的滑動緩存器將產生溢出和下溢,這樣漂移損傷就轉變為滑動損傷,即每次滑動丟棄或重復一幀,從而給PDH幀帶來一個字節(8 bit)的差錯。若以接口為SDH的線路STM-1幀為例(這是大多數的情況),則會帶來每次3個字節(24 bit)的調整。每次調整會使2M信號在凈負荷位置發生更大突變。另外,高階信號指針調整還會連帶其下低階信號指針調整的連鎖反應。這是SDH不能傳同步定時信號的原因——帶來同步信號大幅度的相位突變。
另外,PPL內的晶體振蕩器由于有一定的Q值(品質因素:振蕩器參數之一,品質因素高則振蕩器輸出頻率精度高,但跟蹤/鎖定能力差;反之,相反),可以吸納一定快速抖動,這是時鐘定時鏈路可以在PDH業務碼流中傳遞的因由(其原理是通過高阻提取HDB3編碼規律進行)。目前,大多數邊緣交換機都采用此種機制。因為晶體振蕩器振蕩頻率不會隨外部控制信號突變而突變(信號分析理論中壓控振蕩器的控制電壓是其輸入信號的積分,即它是一個連續函數,不會隨輸入的跳變信號而突變),所以PLL可理解為是具有一定“惰性”的元器件。因此,信號的高頻抖動幾乎不積累,而低頻抖動和漂移一般都會積累。
同樣,由于滑動緩存和Q值因子的影響,使PLL內的晶體振蕩器對漂移(抖動速率≤10 Hz)在判決點上具有一定的跟蹤能力——判決點會“被迫”跟著漂移,這是漂移容限遠大于抖動容限的原因。但是,一旦超過1.5UI的漂移最低門限,一次調整帶來的抖動傳遞使后續抖動輸出可能突破0.5UI的容限,因而造成后面網元會連續多次指針調整。因此,有“漂移對同步信號損傷大于抖動帶來的損傷”的說法。此外,還有更有力支持該說法的理論,如既然漂移是小于10 Hz的抖動,對于SDH幀長125 μs信號而言,每秒變化10次以下的漂移在時間周期上是一個相當長的過程,即在這一時間段內已包含了多個125 μs幀,需有多次指針調整發生才能彌補。SDH指針調整機理:調一幀,等三幀,即平均4幀調一次,且按每4幀周期后漂移強度均突破調整指標門限和最快速的10 Hz漂移計算。STM-1信號每秒最少需有 次調整,式中分母10代表漂移頻率。顯然,漂移頻率越低,指針調整次數越多。通過Matlab 7.0軟件分析信號頻譜得知,指針調整帶來的相位突變具有使信號低頻分量幅度增大的影響,這些都是難以彌補的損傷(信號能量發生頻譜轉移)。
下面以實際案例為基礎,說明當前同步網存在的一些問題。
(一)案例1
本地一些數據DDN電路大約每周一次出現大面積“閃斷”,查相關電路路徑無規律可尋。由于本地有一新建樞紐局BITS啟用時間不長,分析原因是本地存在兩個中心BITS引起的。老BITS建設在前且無GPS天線,以省中心BITS作為同步跟蹤信號,且傳輸鏈路不支持SSM。數據局早期設備(DPN100)均采用其提供的同步信號。新BITS建設在后,以GPS接收作為跟蹤信號,但其伴隨建設的一級干線是新開通不久的數據跨省電路的通道。對于傳輸而言,電路卻是同步于新BITS的,這樣等同于數據設備跟蹤了多個同步源。將老BITS第一跟蹤源修改為跟蹤新BITS后,故障現象消失。
(二)案例2
相關部門反映:一段時間以來,一些大用戶電路“時好時壞”。本地傳輸查看發現,受影響用戶群地域分散;長途傳輸查電路,發現有來自本地的單向AIS告警,因此未懷疑自身存在問題,導致故障處理進入盲區。后經深入會診,發現電路均由長途和本地之間樓層中繼電纜承載,而長途上游又與某個網元有關,但該網元上開放的電路遠不止這些。再查看網元的同步質量等級,發現其已降到最低(Current_ ql=0)。它已指向內部時鐘(最后一個語句),即已進入自由振蕩狀態。重新將其跟蹤配置修改指向線路后,業務反饋恢復正常。事后分析該設備不支持SSM(同步狀態信息)功能,因其他故障倒換電路后(155M線路倒換),該網元同步源丟失。顯然,維護人員也被未申告的用戶和單向AIS告警所迷惑。
(三)案例3
大客戶響應反映本地至某國外大用戶電路頻繁“不好”,導致該國用戶意見很大。但是,各自國內電路環回測試后,都稱自身電路沒有問題。該國電信部門通過集團大用戶與我方建立三方通話,以探討處理此故障。我方了解情況后,告知這是一個典型的同步島問題。于是,向其說明其中緣由后,與對方達成共識,在相關電路國際接口修改配置,將其變為偽同步方式(去映射再同步)后,問題得到解決。
(四)案例4
全程涉及兩個專業:交換和傳輸。交換反映:“C局業務接口近期出現大量滑碼告警,估計同步出了問題,C局設定通過2 Mb/s電路同步跟蹤A局,且外部兩個跟蹤的同步源均不好,請傳輸處理。”傳輸答復:“電路環測均未發現問題,待查中。”
實際查看C局的外同步源和電路,其均經過該局的Metro2500+網元,且同步源通過SDH凈負荷傳輸。顯然,傳輸網與交換網實際上采用了不同的同步源,交換局C日常跟蹤的實際上是傳輸的同步源PRC-B。當PRC-B因某些原因與PRC-A有誤差且同步信號通過SDH凈負荷傳輸時,這兩個原因會互相作用而加劇這個故障表象。事后發現,C局Metro2500+的STM-N接口有大量歷史指針調整事件。傳輸在處理此故障過程中用儀是無法查出問題——儀表內部時鐘精度無法對PRC的微小差異進行測量,且環測方法對同步問題無效。
(五)案例5
本地PHS(小靈通)業務大面積不明原因中斷,在參加故障分析會時,了解到該電路均承載于特定設備上。會后,筆者提交了故障原因報告和改進措施。究其原因,在于該廠家設備所組的五個SDH環的同步時鐘嚴重不合理,如圖6所示,主時鐘和備用時鐘不在一個環上,主用BITS接在R8環上,備用BITS接R9環上。當主時鐘接入的環R8發生開環故障時,備用時鐘不能發揮作用,且其他環與主環R8的DCC通道也不能互通。經一段時間后(48小時以上),故障環網元時鐘進入自由振蕩狀態,同步指標劣化導致全部承載電路出現間歇中斷,歷時較長。
(六)相關問題總結
從以上典型故障可以察覺網絡存在以下問題。
問題1:網絡設計者對時鐘同步網的拓撲結構是否合理隨意性很高,不嚴謹。建設新網絡或擴展網絡時,本地設計文件缺乏深入而準確的描述和剖析。這個剖析不但要指明規劃網絡的各種設備的同步時鐘拓撲,還要逐個對出現故障和保護倒換時的情況進行研究,要求網絡即使處于保護倒換的情況時,全網定時信號也不能出現問題。
問題2:新網絡建設時必須考慮與老網絡的同步信號無縫對接。
問題3:對問題的嚴重性重視不足,表現在:許多用于定時信息傳送的電路,仍然經SDH凈負荷傳輸,且這樣的問題至今還在不斷重復;多次故障后,基層反映的問題未引起重視;一些維護人員未注意故障與同步有關的各種現象,導致自查時間過長、信息不通、理解不透,影響面積大;對關鍵部位設備的更新不積極,存在諸多隱患;有時同步問題引起的故障時間長會“消失”,促使維護人員進一步產生麻痹心理。
問題4:核心鏈路的PDH網絡老化嚴重,存在故障隱患。因此,這部分設備應該明確服役年限,以嚴格杜絕設備超期服役。
問題5:交換部門大量使用SDH 2M通道作為同步定時鏈路,應予立即改為PDH或SDH的STM-N線路信號,或者SDH網元的外同步接口。
問題6:BITS資源的使用審核不細致。
定時故障具有影響面大、隱蔽性強、查找難度大、周期長的特點,且絕大部分基層維護單位沒有相關的診斷儀表可用。鑒于此,給出如下建議:
提高對同步網的重視程度,從建設和維護兩個環節確保同步網的合理布局與使用。
同步支撐網是傳輸專業維護的網絡,傳輸專業維護人員迫切需要提高技術水平。
定時同步鏈路優先考慮PDH通道,其次考慮攜帶業務的PDH通道,再次之是STM-N線路碼提取方式。使用SDH外同步接口的缺點是一般一個網元僅有一個輸出接口,且必須考慮保護倒換后的時鐘信號環回問題,還要要求該型設備支持SSM傳遞,不支持的不能使用。
及時整改同一網絡鏈上有多個同步源的問題。錯誤典型是:網元建設時設定跟蹤一個同步源,但后期網元上開放電路時又指定該電路跟蹤一個上級同步源。
當SDH網絡本身的定時與其需要承載定時鏈路發生沖突時,必須優先考慮承載的定時鏈路。
堅持開通新的定時電路的路由審核和開通測試(網管上進行)。
同步網是至上而下,跨專業、跨部門、跨區域的支撐網,需要得到有關部門的支持和資源信息共享,從而做到建設、規劃、維護的完美統一。
必須梳理全部同步網的資源,檢查核心網元的同步配置情況,排除不合理的定時鏈路路由和各種保護機制可能帶來的問題,同時建立完善的同步網共享資源庫。
故障搶修時,臨時調度電路路由和故障時的保護倒換后要密切關注同步鏈路的改向問題,避免時鐘信號環回和路由不合理事件發生,如發現沖突時必須立即處理或修正。
全部同步鏈路必須是放射狀結構(單向樹型網)。
建立一個電子平臺,共享維護經驗和互通故障信息。
杜絕BITS私接和亂接問題。
對于網絡合并或拆分等事宜,需考慮兩網的再同步問題。
許多非傳輸業務人員對同步網的傳輸機制不了解,普遍認為自己的同步體系已自成一體,認為傳輸信道既然對用戶是“透明”的,那么可以視為傳輸環節已經“隱身”。實際上,大多數情況下,它們只要依托于傳輸網,這種上下級的同步關系就已被割裂。這種割裂往往是隱含的,業務開通時或一段時間內只要指標在合格范圍內就不會被察覺,因此帶來安全隱患。城域網是同步問題的“重災區”,因為其網絡變動頻繁。尤其當前SDH向IP化轉變,將面臨SDH退網問題。在這個過程中,它打亂了原有同步網絡鏈路架構,會給未退網的設備帶來問題。鑒于此,下一步同步網的研究方向應是同步信號如何與城域IPRAN和DWDM結合,以實現頻率/相位-時鐘/時間的傳輸鏈路問題。
作者單位:中國聯合網絡通信有限公司大連分公司