劉化召 ,陳學鋒 ,俞 前
(1.中通服軟件科技有限公司 廣州 510610;2.中國電信股份有限公司廣東分公司 廣州 510620)
互聯網和3G的蓬勃發展對互聯網數據中心(internet data center,IDC)提出了新的要求和挑戰,當前“光進銅退”戰略快速推進,普及應用的PON、3G網絡所建設的高速通信帶寬,能夠支撐越來越多的互聯網應用,建立了穩定、快捷的智能信息管道,促使計算和存儲向IDC的服務器端遷移,龐大的互聯網用戶數對IDC的存儲量和訪問量的需求也越來越大,需要IDC提供商提供更大更優的存儲和服務器資源滿足用戶需求;手機電視、手機證券、手機資料備份等手機互聯網應用已經成為運營商的重點業務,大量的視頻、圖像、文檔資料存儲在數據中心,供用戶隨時下載、查看,并實現交互。IDC作為互聯網的應用和數據引擎,有力支撐了各類互聯網應用,利用有限的資源實現存儲的最大化,在用戶需要的時候,通過搜索及時提供給用戶,用戶通過輕量級終端、瀏覽器與互聯網高速連接,即可享受所需要的各種數據和計算服務。
目前全球IDC市場保持高速增長的趨勢,2011年整體市場規模達到222.6億美元,增速為21.5%。在云計算、虛擬化以及新型節能技術的推動下,各國IDC的發展呈現出虛擬化、智能化、綠色化的特征。隨著國家對戰略性新興產業的重視,對云計算、下一代網絡的積極推進,IDC市場迎來了前所未有的發展機遇。一方面,基于云計算的數據中心建設進一步推進,并成為不少政府園區關注引進的重點;另一方面,基于移動互聯網的應用發展迅速,SNS、電子商務、視頻等業務的大規模增加給IDC市場帶來了持續的需求。IDC行業經歷了轉型、整合、多元化發展階段后,逐漸變得規范、有序。目前全國最活躍、最體系化的IDC公司和運營商主要集中在北京、上海、廣東3地。2011年我國IDC市場規模達到170.8億元,同比增長67.1%,增長率持續上升的原因主要來自于增值業務的快速增長。
隨著IDC規模的快速擴張,機房服務器數量近幾年的增長速度維持在40%左右,主要來自于增值業務的推動,機房服務器數量為1 000~3 000臺的IDC所占比例最高,達到38%。近年來,隨著綠色機房觀念的倡導,設備投入所占比例已經在慢慢降低,相反人力資源的投入和培訓成為主要IDC企業成本投入增長最快的部分,如部分綠色工程的開發可以極大地減少維護這些技術環境所需要的空間和所消耗的能源,使用這些鞏固措施,減少了服務器、網絡設備、路由器、PBX設備、單獨的存儲設備以及CSU/DSU的需求。我國IDC圈公布的調研數據顯示,我國IDC公司的成本最高的內容情況:22%的被調查IDC服務商認為是人員投入成本,40%的被調查IDC服務商認為是設備投入,19%的被調查IDC服務商認為是維護成本。
為了提高運營效率、服務質量,推動IDC業務快速發展,同時降低成本,集約化運營已經成為IDC運營企業普遍的共識。集約化運營旨在合理利用資源,集中規劃調配,降低人力物力投入和提高生產效能,資源的集中和高效精細的管理是IDC集約化的核心。在集中統一調配生產資源的過程中,實現精細化管理,以節儉、約束、高效為價值取向,從而達到降低成本、高效管理,進而使企業集中核心力量,獲得可持續競爭的優勢。建立IDC全網集中融合運營支撐平臺是集約化運營的基礎和保障,能夠支撐集團級集約化運營體系,突出服務能力標準化,實現業務一點接入、全網服務。
系統融合架構主要體現在4個方面,包括流程融合、數據融合、操作融合、服務融合。通過合理設計構建出一個標準、松耦合的系統融合架構,基于此架構可靈活擴充業務,實現公共組件及技術復用。系統建設目標主要包括以下幾點。
(1)規范管理、統一調度
統一IDC業務的開通、保障、運維操作業務流程,實現IDC業務從售前、售中到售后的端到端服務,設備告警采集、故障分析及預警,提供機房、設備、網絡的維護操作平臺。
(2)面向業務運營、優化資源配置
建立客戶、IDC資源、業務的關聯關系,統一視圖,強化資源管理,建立IDC業務資源從新裝到退網的全生命周期管理,精細化資源管理,有效降低資源的浪費。
(3)快速響應需求提升客戶感知
基于統一的數據視圖及一體化的IDC業務流程平臺,提高IDC業務的響應速度;統一IDC業務管理部門、人員的IT支撐系統,提高運維工作效率,降低成本,滿足復雜的計費起租規則。
(4)建立網絡端口精細化管理手段
實現網絡資源與網管雙向自動同步管道,定時掃描網絡端口,確保客戶、產品準確占用資源,自動比較IDC出口、接入用戶流量數據一致性,提高業務健康水平。
從融合IDC運營支撐目標出發,滿足全程、全網跨域資源管控和服務調度要求,設計上重點考慮大規模、高可擴展性、高可靠性等技術指標。采用基于J2EE的B/S/S軟件架構,通過RIA技術實現面向全瀏覽器的豐富的客戶端操作體驗。
融合IDC運營支撐系統架構如圖1所示。系統縱向分為設施設備交互、業務處理和應用整合3個大的層次,橫向分為數據模型、公共構件、業務邏輯、MVC等多個層次。
設施設備交互層主要實現與IDC機房設備以及外圍設備的交互,包括數據采集、網絡激活、設備自動發現等,是運營自動化的主要基礎之一。第一類是網絡設備交互,匯聚和接入層直接面向NMS,一方面采集各層交換機、路由器、防火墻等網絡設備的物理和邏輯端口流量數據、性能和告警數據等,另一方面下發激活指令,自動開通業務工單;骨干層通過與核心數據網絡的EMS交互,同步出口設備、網絡的流量和障礙等數據,分析服務器對采集和同步的數據進行綜合加工,為上層業務邏輯提供各類自動化支持。第二類代理面向物理主機、云平臺等服務器、存儲等IT設備,實現對設備硬件(包括主板、內存、CPU、網卡等基礎設施)、基礎軟件(包括操作系統、虛擬化平臺、Oracle等數據庫軟件、中間件等)、應用軟件等各層次的數據采集、分析和運營工具化支持。第三類代理面向IDC安全和節能減排,與動力&環境監控系統、視頻監控、門禁、消防等系統交互,采集相關數據、集成運營管理界面,為集約化運營管理提供基礎數據。
圖1 融合IDC運營支撐系統架構
業務處理層是系統核心,支撐9大業務功能。數據模型層通過對IDC的資源、流程、業務和產品、客戶數據統一建模,實現圍繞IDC的全程、全網、全專業數據集中管理,減少數據冗余,對于流量、告警、視頻、圖片等非關系型數據,通過文件數據庫建模管理,提高系統性能和管理海量數據的能力;業務邏輯層采用分層法,分為ORM層、技術組件層、業務構件層、服務提供層、接口交互等多個層次,通過各層次復用,提高系統的快速需求響應能力;UI層采用MVC框架,根據不同的業務場景,支持基于瀏覽器展現復雜業務的RIA技術和較簡單的瘦客戶端展現。
應用整合層明確IDC運營部門與市場等相關部門的界面,實現業務自動化流轉,提高企業整體效率。通過標準接口發布服務,供客戶關系管理系統、進銷存、計費等系統調用,支持IDC的群新裝、擴容、減容、拆除、機架變更、端口升速等各類開通和資源查勘、割接影響分析等服務。
系統部署總體采用分布式架構,數據庫服務器采用雙機熱備,數據存放在磁盤陣列中,通過RAID5確保數據可靠性;應用服務器根據業務發展需要,利用云的彈性計算能力,部署于多臺VM上;采集機采用分布方式,按照機房設備容量,采用單一機房或多機房覆蓋方式部署,文件數據庫根據IDC空間分布情況部署。
系統主要包括9大業務功能,融合了IDC運營業務的業務管理、資源管理、網絡管理、服務開通、服務保障等各個領域。各功能詳述如下。
(1)業務管理
參照NGOSS企業信息核心數據模型,實現客戶、產品、業務流程的自定義和可視化配置。支持IDC空間產品(機柜、VIP 機房、U 位等),互聯網接入產品(IP、帶寬等),增值產品(安全專家、災備服務、座席等)和云計算產品(云主機、云存儲、云桌面等)的群子產品、組合產品管理,產品開戶、新裝、變更和拆除等業務,提供可視化業務流程監控和訂單管理。
(2)服務開通與激活
實現全網范圍內集團、省、IDC資源調度和統一施工管控,根據業務實際要求,提供定單和工單多級流程協調;系統提供流程圖形化監控,方便掌控各流程的日志以及所處環節的異常變更情況;支持的主要施工類型包括:新裝、擴容、減容、更改端口速率、入機、出機、批量入機、批量出機、按機架入機、停機、復機、換機、增值業務等正常和異常施工流程;支持跨域定單在集團、省、市IDC之間的協同調度。
(3)資源管理與配置
采用集中部署、分布應用,按照權限滿足集團、省、市、IDC資源管理的要求,基于Web的可視化資源管理方式,以機房平面圖為基礎,管理VIP空間、機柜、線架、連纜和電量等資源,各類設備資源實現架、框、板、槽、端口的面板展開圖;纜箱資源實現從列頭柜端子、多級線架到二/三層交換機用戶端口的工程關聯和業務跳線,形成完整的機房內IDC接入電路;支持IP地址段的自動分段、合并,由IP地址可追溯到托管服務器、機房位置、網絡端口、電路等信息,同時可直接展現出IDC客戶、業務數據。支持物理、邏輯等各類IDC資源的獨立和組合配置,組合配置依據資源連接關系,自動建立關聯;資源配置采用方便靈活的可視化配置方式,支持自動配置能力;提供完備的關聯校驗和方便的配置查詢能力,與云OS平臺對接,實現云虛擬資源同步,管理虛擬資源開通、漂移后與物理資源的實時映射。
(4)故障管理
系統具備對全網IDC機房的接入層、匯聚層交換機、路由器端口(含邏輯端口)運行狀態進行監控,實時接收各省級服務中斷的重大故障,并同步提供重大故障的告警能力,告警信息與客戶信息相關聯,在通過短信、郵件等方式向維護管理人員告警時,直接顯示IDC中心、客戶名稱、業務類型等主要的客戶業務信息。提供面向客戶的故障告警能力,面向集團的故障監控與檢查、故障處理流程管控等服務能力。在故障發生時,系統根據收到的故障報告,根據網絡拓撲結構,隔離根源故障點,關聯由此引發的相關故障信息,快速對故障定位。
(5)流量管理
采集出口、匯聚、接入以及客戶的出入流速,進行流量分析,從端口、設備、機房、VIP客戶等維度進行流量數據拓撲監控、歷史流量數據分析。根據配置好的分析任務,系統在后臺對相關任務涉及的流量數據進行統計分析,以供頁面展現分析結果;以圖形方式實時監控端口、出口、匯聚、接入電路、客戶綜合電路的流量;支持流量告警配置,系統在后臺做歷史流量分析時,如果滿足告警配置則產生告警。靈活定義基于AS號、協議、端口、地址等的組合流量過濾,并基于此實現TOPN、流量矩陣等分析報表、圖表。
(6)拓撲管理與自動發現
支持對IDC機房IP網絡設備的準確3層拓撲自動發現,在對全網絡進行拓撲管理的基礎上,建立業務和服務視圖;拓撲發現的網絡變化情況實時同步到資源數據中。根據網絡資源信息自動展現IDC機房網絡的拓撲視圖,顯示網絡的資源、流量、性能、告警信息。將系統配置的資源信息進行分層拓撲展現,采用不同顏色顯示網絡的不同狀態。支持用戶自定義網絡視圖,實現任意的定制資源、故障的拓撲展現視圖,滿足客戶需要。實現對拓撲展現風格的定制功能;根據業務或維護的需要,具備手工編輯IDC網絡拓撲視圖功能,包括手工添加、修改、刪除拓撲視圖中的網元或連接關系。
(7)性能與作業計劃
實現對IDC網絡設備、電路、客戶主機等的性能管理,可靈活實現對監控對象性能指標數據的采集定義配置;支持對采集到的原始性能數據進行格式轉換處理,轉換成系統定義的標準類型的性能數據,提供有效靈活的轉換處理手段來適應原始性能數據格式變化帶來的影響;提供方便、易配置的性能數據采集活動定義策略,支持周期性和非周期性以及即時的采集活動定義、采集周期(頻率)的設置靈活定義。
(8)配置管理
通過編輯配置文件實現對告警和性能數據的分析、建模及入庫等工作;支持對告警標準模型的定義、修改,并可根據需要針對不同的應用增加新的模型;資源配置管理實現對IDC的各種設備,如主機、電路、IP地址等的配置功能;根據用戶配置IDC機房設備訪問信息 (如IP地址、SNMP、Community等),按定義的采集周期,以SNMP polling等多種方式自動獲取網絡上不同廠商、不同類型設備(如路由器、交換機、主機等)的詳細配置信息;對各功能模塊及菜單進行定義和分類,實現合理布局,每個登錄用戶根據分配的模塊操作權限不同,所展現的功能也是不同的;根據業務的需求定義不同的數據字典,如客戶類別、客戶等級、行業性質等,數據字典主要包括條目名稱、條目代號、條目說明等信息;通過配置參數,決定系統運行的特殊行為,如登錄系統的首頁連接、附件上傳服務器后的存儲位置等。
(9)決策支持
面向IDC網絡、客戶,集中展現IDC客戶占用的IDC各類資源數據、當前在途業務開放情況,施工歷史記錄、用戶設備維護變更狀況等;實時生成IDC大客戶的設備網絡拓撲,根據權限級別,展現跨省、省內和本地網的IDC客戶設備拓撲;按照集團、省、本地網不同級別制定的報表模板,系統自動生成月、季、年統計報表,支持任意字段、任意字段組合和模糊查詢,支持統一查詢功能的多入口,基本報表功能能夠快速定制。
融合IDC運營支撐系統為IDC集約化運營提供了強有力的信息化支撐,建立了開放的服務能力體系,實現了能力封裝以及便捷的服務訪問手段,提升了業務運營效率、面向客戶的支撐能力,快速高效地支持跨域綜合應用支撐能力需求。建立策略統一展示、統一管理和統一調度的機制,采用靈活、高效的數據驅動生成策略,與網絡側的智能策略互動,使系統具有智慧的大腦,適應網絡和客戶快速變化的業務需求。以系統的方式共享操作方法,共享被確認的流程,智能生成新流程,實現高度的人機互動,支持業務的高度靈活性和多樣性。融合IDC運營支撐系統應用體系如圖2所示。具體應用體現在以下幾個方面。
(1)聚焦客戶、提升客戶體驗
聚焦客戶,強化客戶品牌的實施策略,優化開通激活的效率,提升客戶體驗;重點發展高價值客戶,提供差異化服務;建立客戶為中心的服務保障體系,提供客戶服務的便捷性;以市場為驅動,建立產品設計和網絡規劃建設的流程支撐體系。全面開放面向客戶的服務能力,提供方便、快捷、自助、主動、精確、有質量的客戶服務,為客戶提供快速、方便、主動的服務,滿足省心、開心、放心、舒心等“五心”服務的要求。
(2)全程全網、實現一體化管理
全面提供全程全網業務開通和服務保障能力,加強異地業務處理以及協同支撐能力,加強前后端的協作,建立靈活的第三方合作模式,建設全網流程貫通、服務能力共享、業務術語統一的網絡化運營體系。實現VIP客戶業務故障的一點申告、全網保障,業務開通的一點開通、全程管控以及業務的全程全網服務質量監控與分析管理。加強集團/省/IDC業務全網協同、快速開通和保障,集團和海外客戶的故障在線處理。
(3)精確智能、實現運營優異
實施集約化創新,實現流程自動化和辦公移動化,加強數據標準化建設,在開通、保障、調度等各方面強化對運營數據質量管控,在人財物運行維護實施精確化管理。整合IDC內部的各類空間信息,統一空間數據標準,消除信息“孤島”,節省企業投資成本,提高企業工作效率,為企業創造更大的經濟效益和社會效益。
本系統2009年已在中國電信股份有限公司廣東分公司投產,集中建設、分權分域應用,支撐20多個地市、近百互聯網數據中心的裝、拆、移、改類開通流程和客戶服務、保障流程,管理數10萬托管設備,支持思科、華為、中興通訊等10多家主流廠商的交換機、路由器等網絡設備的性能采集、告警監控、流量管理和自動激活等自動化管控能力。目前系統已支持數百并發訪問,不限制同時在線用戶數;系統已經成為用戶生產、運維的日常使用平臺,運營效率提高達30%,服務質量提高達25%,月度運營分析效率由原來的一周提高到1 h左右。本系統2012年已經開始向中國電信集團公司各省市公司推廣應用,并獲得多個省市公司的建設權。
圖2 融合IDC運營支撐系統應用體系
本文提出的融合IDC運營支撐系統將資源和網絡無縫融合,減少了網元數據冗余,最大限度實現流程數據驅動。通過統一的任務派發視圖,施工維護人員無需面對多個系統;管理人員通過一個統一的監控臺能夠對所有任務進行管控,全程體現每個任務對后端SLA(service level agreement,服務等級協議)時限的分解要求,實現對全業務開通、保障流程閉環管理,提高自動化處理能力,提升生產效率;加強服務質量管控,提高精細化的管理水平,提高客戶感知;通過提升IT能力促進管理,快速支撐IDC生產流程持續優化,統一了業務流程平臺,建立了統一服務標準,系統服務易開發、易維護、可復用;融合系統數據模型、統一業務數據的來源,確保了業務數據的一致性和完整性,方便數據提取和展示。
基于本系統架構和模型的IDCIMS平臺實現、跨域50多個IDC應用的實踐,證明了該體系結構的可實施性和可部署性,能夠滿足集團級IDC集中統一集約化運營的跨域開通和資源管控。
1 康楠.互聯網數據中心轉型服務全業務運營研究.信息通信技術,2010(12):10~13
2 王征,劉峰.云計算在IDC中的應用研究和實踐.數據通信,2011(7):65~69
3 侯繼江,張鑒,陳軍.電信運營商云計算數據中心安全防護體系研究.電信網技術,2012(3):23~29
4 徐玉.云計算對數據中心市場的影響分析.計算機工程,2006,32(13):30~35
5 牛勇.停開機業務工單處理調優分析.電信技術,2012(2):13~15
6 雷鳴,劉玲.云計算數據中心組網技術.電信工程技術與標準化,2012(4):26~30
7 劉蓬,王元,武潔夫.通信設備智能巡檢系統分析與設計.電信技術,2012(1):34~37
8 趙雷霆.運營商級云計算數據中心發展研究.信息安全技術,2011(8):36~39
9 劉高俊.應用ITIL體系提升IT運維服務水平.中國金融電腦,2012(5):56~58
10 劉佳,杜雪濤,朱文濤等.互聯網數據中心安全解決方案.電信工程技術與標準化,2010(2):25~29