江 陵
(中國聯通江蘇省分公司,江蘇 南京 210000)
云計算作為物聯網的重要組成部分,受到了各國政府的青睞。它開啟了IT產業界的技術革命,為行業今后的發展提供更多的機遇和可能。美國作為技術大國,也將云計算技術納入其IT戰略中。美國國防信息系統部門根據國家發展需要在數據中心加強云環境系統更新,利用先進的科學技術構建虛擬云環境。在西雅圖華盛頓州會議中心舉行的微軟Build 2018開發者大會上,微軟CEO薩提亞·納德拉聲明,到2020年,全球智能設備將超過200億臺,每個人每天會產生1.5 GB的數據,而每個智能家庭產生的數據會高達50 GB[1]。在“世界是一個超級計算機”前提下,AI與云計算是微軟最為重點的話題。此外,日本也順應時代發展潮流,計劃建立名為“Kasumigasek iCloud”的大規模云計算基礎設施。該設施能夠幫助日本財政部、內務部和監管部等各個職能部門收集數據信息,完善工作機制[2]。在“十三五”信息規劃中,中國對云技術作出全面剖析,提出要將云計算納入發展綱要,并將其作為下一個五年計劃中信息化領域的重要發展任務[3]。
在2016年年底,工業與信息化管理部出臺關于信息軟件產業發展的指導意見,劃定出行業的十個重點發展領域,包括基礎軟件、信息安全軟件、工業軟件、嵌入式軟件、行業應用解決方案、系統集成和支持服務、軟件服務外包、各類創新型服務、數字內容加工處理與服務以及IC設計服務。為響應國家號召,積極發展信息產業,北京啟動祥云工程,江蘇無錫則希望通過產業振興打造“中國云谷”。除政府部門外,經濟、文化、科技等各行各業都掀起一股“云浪潮”。
現階段,云計算技術正逐步走向開放包容和互聯互通,服務器普遍選用X86機群,儲存技術則向SAN+NAS一體化發展。隨著互聯網寬帶提速的增效,小型機廠商更加重視PC服務器的發展,未來網絡也會逐漸實現虛擬化、網格化和扁平化。當前,網絡用戶的參與門檻降低,獲取信息的渠道增加,且成本不高,每個人都可以根據興趣選擇個性化內容。同時,公共計算網絡逐步興起,可以有效感知用戶位置,擴大移動用戶規模。在云計算逐步向公共計算網過渡的過程中,對集約化規模化計算技術的要求增高,促使行業明確開放的云標準,在虛擬計算的同時合理調配信息資源。
在業務方面,電信業務的發展更加集約化和專業化。隨著信息技術的快速發展和社會資源的日益增多,網絡用戶正呈現爆發式增長,對信息服務的要求也在不斷提高。當今,計算機技術的運用成為通信行業發展的重要憑借。企業應不斷加強信息服務供給,實現計算和通信的融合發展,各大運營商也要把握發展機遇,提出明確的發展目標,即成為綜合信息服務提供商。云計算技術的廣泛運用不僅能夠幫助運營商轉變經濟發展模式,優化產業升級,還可以促進通信技術的發展與創新,完善信息基礎設施建設。
20世紀初,移動通信技術已在世界各國得到廣泛應用。運營商可以將每一個電源設備和配套設施布局到合適位置,并采用專業的監控技術實施統一管理。由于設備生產廠家的規模和發展程度存在差異,動力系統的開關電源配置也會有所不同,因此在系統維護過程中必須接入統一電源開關。
現實發展的需求往往會引發信息革命和技術革新,不同企業應根據實際操作和信息保密需求采用不同功能和類型的監督管理系統。在選擇過程中,不可盲目擴張動力監控系統,更不能脫離生產實際遑論發展,而是要把握不同系統的功能機制,適當整合系統,避免因信息干擾、技術混亂等管理問題導致各部分無法互聯互通,整個系統走向癱瘓和崩潰。
當前,通信設備監控系統多采用綜合性管理平臺,并逐漸向無人操控的自動化方向發展。通信企業可以逐步撤銷監管人員,通過遙控和遙調等“遙控制”手段掌握監督管理的主動權。這要求基站的內部系統必須具備動態化、智能化、安全系數高和穩定性強等特點,保證監控系統能夠自動收集并實時更新數據信息。通過統一的管理平臺,移動基站的信息設備和數據資源實現在網絡環境下的集中整合,不僅減少人力、物力和成本,還可以將數據輸送到監控中心,避免出現信息泄露、數據遺失和操作故障等問題。
江蘇聯通自三期工程開通后,便著手動力環境監控系統的構建。其實施方案先后由中興和艾默生開關電源供應商提供,但兩者在運行過程中都容易問題。比如,中興系統不穩定,經常出現亂報和錯報警的技術故障。而且中興的監控系統無法覆蓋艾默生電源,無法對其實際操作進行控制,導致監控設備存在不匹配問題。為更好地解決監控系統的管理問題,又先后采用了以下方式[4]。
2.1.1 干接點告警
該方式主要采用分組劃分,通過接入重要開關告警數據,如基站停電、電池電壓低告警、主要負載熔斷器斷和門碰等,實現開關量告警。當接收到報警數據,信息數據在匯總后會被輸送到基站操作臺,并選擇一組接點進行信息對接,以便及時判斷是哪組在報警[5]。
該方式存在一定的缺陷,例如,實施具有很強的依附性,一旦離開基站的網管系統,便立即喪失信息和數據來源,使動力監控系統無法發揮告警預知作用。此外,如采用此方式監控動力設備的運行情況,故障信號需要通過多層菜單方可被系統獲得,存在輸送損耗與告警延遲問題。當前,由于包括江蘇聯通在內的很多運營商仍采用無線和動力維護人員分開值班的制度,愈發給系統的優化完善帶來困難。
2.1.2 公務信道組網
現階段,大部分聯通移動基站采用公務信道光傳輸組網方式構建動力環境監控系統,且監控信號傳輸方式為光傳輸。江蘇聯通的長期供應商是中興公司,他們為聯通移動基站的動環監控提供專門開發的F2口,傳輸速度可達64 kb/s。
該方式也存在較大弊端。首先,在監控系統組網后傳輸速率明顯緩慢,造成嚴重的傳輸限制。其次,公務信道組網采用輪巡的數據采集方式,一個環上的基站只能在同一個通道進行最大速率為64 kb/s的數據傳輸,運行效率大大降低,而且當一個環節出現故障,整個通道就會陷入癱瘓。如果對基站傳輸數據稍作修改,又會導致大批的基站信息無法有效上傳[6]。為解決以上難題,聯通公司后期采用了變大環為小環的方式,能夠避免速度變慢。但是這也帶來種種缺點,如傳輸資源占用較大,對整個網絡的傳輸構成很大壓力,維護人員壓力倍增。
2.1.3 時隙分插復用組網
在移動基站與控制器中存在一條輸送數據和信息的2M通道。它被進一步劃分為32條傳輸速度為64 kb/s的傳輸通道,其中,除時隙0用于傳送同步信號和時隙16用于傳送信令信號外,其余30個時隙全部用于承載其他業務。由于其承受能力大于目前聯通的用戶規模,業務承載仍有富余。在數據傳輸過程中,動環監控系統可以從中抽取一個時隙進行數據傳輸,并可以將不用的時隙還回交換機使用,實現監控數據通過時隙分插復用的傳輸。如果把同一模塊下的基站監控系統進行整合,并將其分配到一個或多個控制中心,控制中心便可以通過前置機對各項數據進行梳理匯總。在信息處理完之后,會存儲最終結果,并在顯示設備上實時顯示,有助于系統操作員和維護人員對各種設備進行信息的“遙控”,實現對每一個基站的監控與控制。
隨著信息行業的快速發展,網絡覆蓋范圍日益擴大。對江蘇聯通而言,由于用戶數量大,分布范圍廣,且業務需求復雜,設備的維護和監控要求變得更高,企業面臨更多的困難和挑戰。傳統的管理模式和人員巡檢方式存在時效性低和安全性問題,無法滿足“互聯網+”時代的發展要求。為保證各環節實施的優質高效,聯通應該采取網絡化和動態化的統一管理模式,構建智能動力監控系統。同時,在設備操作、動力供給、環境維護和人員配置等方面應進行綜合監控,積極滿足聯通“不間斷,高質量,經濟效益強”的安全需求。
當前,電信行業的競爭日益激烈,安全性已成為企業脫穎而出的重要法寶。運營商應將增強網絡安全作為企業業務開展的重要前提,確保平臺運營的穩定性,保證網絡用戶的利益。為提升網絡安全性,企事業單位應該根據自身發展要求設計出不同的方案。例如,單位可以精細化管理為切入點,在規劃總體布局的同時做到精準定位,并投入大量的人力物力對保障網絡安全,在設備管理、資產統計、發電效率和基站巡檢等投入大量物資。此外,還可聘請專業技術人員進行網絡維護,提升檢測的準確性和可靠性,為網絡用戶營造安全信息環境。
伴隨著現代動環設備的發展和日益普及,傳統監控系統的不足逐漸顯現。先前的監控中心(Supervision Center,SC)需要耗費大量的人力,幾乎所有問題的處理都需要人工的參與。而且,各監控服務器缺少溝通和對接,數據的處理能力和遠程操控能力不斷下降,無法保障管理的有效性和精準性。在大數據時代,為響應共享互通的時代趨勢,對各行各業都提出了相應的改造要求,其中通信系統尤為突出。隨著機房數量的不斷增加和分布區域的日益擴大,如何改善和維護機房內外部環境成為行業發展的新方向和新要求。當前,數據信息的處理呈現多元化和個性化的需求,較常采用的解決技術為云計算、云技術和智能統計等,它們皆可以幫助更多的服務站點實現分工合作,提升實際工作效率[7]。
相關人員應立足于當前研究背景,以現有研究成果為切入點,提出一種可應用于動環監控系統的云架構系統。整個系統采用二級架構,對每一部分具體的工作職能進行了重新設計,此外在系統設計階段,積極結合聯通公司的性質,使系統具有更好的擴展性,順利應對聯通用戶不斷增長的實際問題。筆者參考云技術的發展思路和操作方法,以江蘇聯通機房環境監控系統為研究對象,闡述實施的具體優化方案。
當前,江蘇聯通發展較快,網絡技術已經普及到各個城區和鄉鎮,各地對機房環境的要求和智能管理的需求也日益明確。基于此,江蘇聯通發揮自身的技術優勢,結合平臺體系打造出可監控和檢測的標準化云計算管理系統。
通常,云計算統一整理各個資源,形成資源池,實現對各個資源的統一處理與管理。它是一種虛擬化技術,在架構上分為三個基本的層次:應用層、平臺層和資源層。云計算主要用于提供基礎設施即服務(IaaS)、平臺即服務(PaaS)和軟件即服務(SaaS),且各類服務相互關聯、相互影響。云計算平臺可以分為3個邏輯層次和1個云管理平臺,憑借完整的服務體系,不僅能實現各司其職,也可為用戶提供有效專業的信息供給。其具體架構如圖1所示。
最底層是基礎資源層。資源層主要提供各級服務中最基本的服務,除供應實體資源和虛擬資源外,還可對感應器、報警器和控制器等物理資源進行抽象處理,實現對物理資源的計算和存儲。在該層內能夠完成對資源管理的自動化優化,使對各個信號設備的采集和訪問變得更加便利。
中間層是平臺層,處于資源層與應用層之間。它以環境監控系統軟件為核心,在資源層之上運行,可用于提供各種應用服務,包括各子系統、WEB和應用服務器的開發、測試和運行等。
最上層為應用層,是考察云計算架構功能和成效的試驗田。所有層次的信息數據都將在該層匯總,并提供包括聯通內網登陸查詢數據、報警匯總和數據智能分析在內的各種業務應用。在應用層同樣可實現對WEB和客戶端的訪問。
保證云管理平臺的有效性、高效性和整合性,能為各個系統提供便利的運營環境,促使各服務系統能夠靈活部署、運行與管理,及時調整工作方案,優化管理環境。云管理平臺的應用,不僅帶來了系統性能方面的增益,在提升系統安全性方面效果同樣立竿見影。運用云管理平臺還可以增加系統的可擴展行,為整個監控系統提供全方位保障。此外,選用這種系統架構在開發過程中可以降低成本,后期的系統維護也更加方便快捷,極大地節約人力成本。云管理是云計算的“中樞神經”,具有管理、用戶服務和調度監控功能。運行該平臺可以采集到大量的技術信息和信號資源,及時發現并處理系統故障,在系統出現問題時,也可以通過智能化的手段與其他服務系統進行對接,保證管理的自動化。
系統的設計形式采用分層設計,主要包括三個層次:聯通機房動環監控平臺;各種傳感器組成的信息采集層;包含交換機的瀏覽層。其具體結構如圖2所示。

圖2 聯通環境監控系統結構
在監控系統中,集中監控系統平臺主要負責監督和調配光電設備、FTTx網管和系統溫濕度,并對聯通機房的整體數據實施分析、管理和輸出。當設備出現故障時,該平臺會自動啟動報警裝置,處理緊急情況,記錄突發信息,并借助語音等多媒體手段實現實時輸出。管理人員在接到信號后能夠立即啟動緊急預案,及時整修和維護機房設備。
現場設備采集層主要負責對光電設備、FTTx網管和溫濕度信息進行全方位采集,利用專業化操作系統進一步篩選和處理,并通過內部服務器將信息輸送到監控云平臺。
遠程WEB瀏覽站的主要功能是進行遠程WEB瀏覽,通過遠程系統幫助管理人員實時了解機房運行情況,遠程操控服務設備,實現管控一體化。工作人員選擇IE瀏覽器,以LAN或VPN方式實時觀看監控畫面,也可以遠程瀏覽機房的工作狀態和設備使用狀況。
如圖3所示,機房監控系統主要由環境監控、動力監控和安防管理模塊組成。當前,江蘇聯通共有5 000多個機房,可以通過統一的多媒體平臺為各個地點設置固定的TCP/IP地址,使其接收到所需要的信號和資源。各個站點的機房控制系統都配備有紅外、燈光或煙霧等前段感知設備,可用于收集匯總相關數據信息,并對其進行智能分析、搜索和數據挖掘等復雜計算。以上功能的實現都離不開云計算和云管理的支撐。通過云技術,信息能夠得到循環處理、輸送和互動反饋。在中心機房下達指令后,各站點可以通過光電信號和智能設備接收指令,進而執行相應的指示。此外,中心平臺能夠突破時間和空間的限制,實現對數據信息的實時跟蹤、監控以及處理。

圖3 機房監控系統模塊
云計算借助數字技術、智能技術和互聯網技術,以手機和電腦等移動終端為載體,通過微博、微信和郵件等媒介進行虛擬化運作。無論在精細化分工、分布式監控和網格化管理還是智能化報警方面,都體現出云計算架構的靈活性和豐富性。這種新技術不僅能夠帶動信息產業健康有序的發展,也能憑借“三跨”優勢擴大數據服務的范圍,保證信息輸送的穩定性和安全性[8]。
云計算架構的系統優勢是能夠監督和管理各個環節或各類設備提供的各種服務,如UPS電源和IT服務器。當信息層或平臺層出現異常情況時,平臺可以借助多個接口和內部關聯信息網自動發布預警通知,整合AD與權限管理,提升系統運作的工作效率。具體優勢如表1所示。
江蘇聯通運用基于云架構的動環監控系統,集成溫度、濕度、紅外線和煙感等各類傳感器,實現對機房各個供電設備和光電設備的實時監控與管理,在發生危險狀況時可以發出警報,并定位故障點。此外,憑借數字采集和視頻監控技術,系統具備遠程監控功能,可以采用異常短信報警和遠程管理等各種控制手段,管理變得更加便利[9]。云計算構架以高收益、低成本的技術優勢實現技術上的發展和對系統的有效管理,具體改造情況成果及后續持續發展方向如下。

表1 云計算架構下的環境監控的優勢
(1)集成化。憑借統一的云平臺,可以實現全省動環監控系統、視頻安防系統乃至運維管理系統的高度集成。一般情況下,數據中心設備運行維護班組的例行工作是保養和維修,面對需要巡檢的設備卻沒有明確的規則,無法及時管理緊急維護任務。而作業管理會提供統一直觀的總覽展板,便于操作管理,不會遺漏重要工作內容。作業管理也擁有主動運維能力,可以自動生成保養檢修作業計劃,并結合手機派單形成閉環電子流,管理整個工作流程。提供數據中心維護制度自動設置功能,由軟件自動提醒相關人員進行設備維護及保養管理,并跟蹤進行手機派單和流程閉環;通過統一展板可看到總體維護工作情況,了解設備故障具體信息以及維護任務安排和執行情況,并可手工查看各細節,快速完成維護工作。
(2)流程化。即可在高度集成平臺的基礎上以流程化的方案展現全省機房運行情況。通常,值班員需要手工記錄各種事項,在進行交接班時需要雙方逐條說明情況并簽字。如果記錄的信息不完整或字跡潦草,那么交接效率將非常低。此外,忘記交接賬戶、值班人被騷擾和當班人收不到緊急信息通知等情況也時有發生。如果系統本身能內置交接班的管理規范,在交接班過程中自動進行數據的統計和確認并給出建議,將大大提高交接班的效率。應用云平臺的自動化交接班,在快下班時可以得到自動提醒,系統也可以幫助人員進行數據統計,形成翔實且易讀的交接班報表,交接班流程順暢不容易出現差錯。
(3)智能化。重點在于逐步提供精細化運維水平與智能運維程度。云平臺能夠利用全省運維數據分析運營風險(災害或主設備故障)并進行建模。其中,風險預案以AI方式納入系統管理,在發生風險時,系統會為值班員指示具體的風險等級和應對措施,顯示受風險影響的客戶和位置,并積極幫助聯系相關人。在應急方案執行過程中,系統能為工程人員及時顯示故障信息、維修設備資料和攜帶工具信息,為主管提供故障預計恢復時長和客戶影響信息,便于聯系客戶澄清問題。而在風險處理完后,自動實施閉環并進行經驗管理,為以后的運營提供數據支撐。
當前,物聯網與云計算是省級動環監控系統的技術演進方向。面對海量的監測局站、設備、監測點和告警信息,為提升動環設備的智能化程度,實現由動環設備自身完成監測數據生成、告警判斷與標準化處理操作,構建基于物聯網模式的網絡架構是目前最合理的解決方案。鑒于省級動環監控系統的檢測范圍廣,用戶需求多,物聯網與云計算的合理運用是其當前乃至未來很長一段時間的新方向和新目標[10]。
筆者結合通信信息產業發展的時代背景,對學界動力環境監控系統的相關研究分類匯總,并以江蘇聯通運營商為研究對象,對動力環境系統展開研究,深入分析系統架構、工作機制、設備維護等方面信息,指出工作中出現的問題與設備本身存在的故障,為動力環境監控系統今后的發展提出參考意見。與傳統監控系統相比,動環監控系統充分運用云技術、云管理和云架構虛擬技術,實時監控儀器設備,大大降低了人力物力,實現了系統智能化運行。各大生產商應積極響應通信行業的發展要求,在集中監控、維護和管理等方面投入更多資源,促進新技術的全面推廣和使用。動環監控系統能夠將各單項檢查項目通過監控中心平臺整合在一起,實時檢測設備運行參數,及時排查安全隱患,提高了系統的準確性和安全性。此外,系統的維修手段也從單一的設備檢查轉變為智能化手段,即利用數據庫的信息反饋對存在的問題進行專業判斷并制定針對性強的維修方案。語音、視頻和聲光報警方式的采用也有助于實現巡邏方式的線上化和虛擬化,減輕工作量,提高系統的工作效率。