陳寶光
【摘 要】政務云運維涉及多個部門,客戶需求多種多樣,具有較強的時效性,應及時做好應急預案,出現故障需立即響應,為部門服務好,以免造成不好的影響。論文從實際應用出發,對政務云運維當中發現的問題和產生問題的原因等內容進行了研究與闡述,根據客戶回訪的一些建議,提出了一些解決辦法。
【Abstract】The operation and maintenance of government affairs cloud involves many departments, the customer needs are various, and have strong timeliness, so we should make the emergency plan in time, respond to the failure immediately, and serve the departments well, so as to avoid bad effects. Starting from the practical application, the paper studies and expounds the problems found in the operation and maintenance of government affairs cloud, and the causes of the problems. And according to the suggestions of customer return visit, some solutions are put forward.
【關鍵詞】政務云運維;客戶回訪;故障響應
【Keywords】 operation and maintenance of government affairs cloud ; customer return visit; fault response
【中圖分類號】TP393 【文獻標志碼】A 【文章編號】1673-1069(2018)09-0132-02
1 引言
隨著云計算的快速發展,國家各項云計算相關標準和要求的出臺,各個省市的政務云相繼建設完成,政務云的運維也越來越重要。政務云運維涉及多個部門,客戶需求多種多樣,具有較強的時效性,應及時做好應急預案,出現故障需立即響應。因此,政務云的服務商應保證政務云的穩定運行,保證在出現故障和缺陷后按照事件等級在相應時間內做出響應和解決問題。
2 政務云服務商日常運營維護的主要工作內容
①對政務云平臺持續建設更新,依據政務云業務發展,在資源使用量達到一定比例的情況下對資源池進行擴容建設。②設備日常監控,包括機房的溫度、濕度和設備的運行狀況。③業務受理,開通相應賬號及資源,并向部門系統負責人提供業務系統部署到政務云的技術支持。④遷移服務,提供現場支撐或設計方案支撐,尤其對傳統網絡架構向云計算平臺遷移提供轉化方案。⑤異常或突發事件處置,包括主動發現或客戶反映故障、平臺運行中存在問題等,排查問題原因,解決存在障礙。⑥政務云整體安全管理,配置安全設備的策略、制訂安全應急方案。⑦政務云門戶網站的管理,做好部門在線申請資源的技術支持,政務云服務過程制度化、流程化。⑧做好政務云日常業務運營統計,產生各種報表,支持領導的決策分析。
3 政務云運維當中存在的問題和原因分析
第一,出現一對多和多對多的情況,問題處理不連貫,客戶滿意度差。①政務云目前運維人員實行輪值制度,存在較多客戶與不同技術人員對接的問題,處理問題沒有連續性,容易造成客戶混亂,事件處理規范性存在問題。②涉及的客戶層面人員復雜,客戶不同由不同層級主管負責,加之應用廠家多人參與其中,部門和云服務商之間易形成多對多局面。③管控平臺缺少相應工具系統,各事項及運行情況透明度差,導致管理單位獲取信息不全面、不完整。④云計算業務的責任邊界較傳統模式模糊,容易產生責任不清問題;事件后續跟蹤不到位,未能及時了解各廳局存在問題,客戶滿意度低。
第二,系統上線時間長,申請到業務正式上線至少20天。原因分析:業務開通資源開通較快。但涉及互聯網IP提供由于受備案管理影響,至少20日才可開通http端口,針對客戶的宣傳解釋不到位,容易造成客戶的誤解。
第三,事件處理周期長,回訪不及時,部分業務需求不能滿足。①部分運維人員技術能力有所欠缺,好多問題解決不了,需要其他公司技術支撐人員解決,一般會在1到2天內排除,尤其是涉及存儲性能、安全設備等問題未能有效解決。②運維人數不夠,尤其是缺少硬件維護人員,造成一定程度延時。
第四,云服務體系不完善,缺少災備服務、多樣化存儲、個性化安全配置能力;①目前政務云上安全設備存在故障率較高的問題,多次發生安全設備故障,解決辦法都是返廠維修,極大地影響了部門在政務云上的業務系統。②網絡故障多,因涉及和運營商進行溝通,造成客戶斷網時間稍長,用戶體驗較差。
4 解決辦法
4.1 規范服務途徑,統一服務入口
運營維護組為政務云平臺提供7*24小時服務支撐,對外提供統一的服務窗口:服務官網,統一的工單郵箱和報修郵箱,統一的運維電話(24小時在線)三個主途徑。后續所有服務均通過上述入口啟動支撐流程,三個入口與運維服務流程直接對接,通過系統實現規范統一的管理[1]。
4.2 充實人員,新設崗位
第一,設置負責業務或事件統一受理的服務受理崗位,事件進行內部分發,集中跟蹤統一回復口徑,統一政務云對外服務形象。由服務受理臺集中值守受理電話及郵箱,并監督業務受理和事件處置按流程要求落實。
根據新的崗位設置,結合目前整個運維團隊人數和運維能力,運維團隊需充實3名安全運維人員和2名VIP客戶經理[2]。
第二,優化備案管理相關流程。加強工信部、通管局對備案相關要求的宣傳力度,避免造成服務錯覺。建立健全回訪制度,提高客戶滿意率。
①日常業務受理回訪:涉及客戶新開戶、增刪改等日常服務,操作完成后第一時間與所屬客戶聯系人溝通確認,客戶試用無誤后閉環。建立規范的回訪話術,健全回訪記錄。②客戶故障回訪:對于客戶申告故障,經排查無論是平臺引起還是其他公司其他業務引起,在公司可解決范圍內,由故障處理人協助通知其他維護單位排查,處理完成后反饋客戶;經排查屬于客戶系統等其他原因引起的,與客戶詳細解釋,避免出現推諉問題;以上各類故障確難解決且歷時較長的,由故障處理人每20~30分鐘與客戶通報一次進展。障礙處理后,業務受理人員或VIP客戶經理對客戶進行回訪,健全回訪記錄。③新客戶回訪:對于第一次開通政務云資源的客戶,在反饋資源開通當時,要向客戶介紹政務云遷移部署注意事項,同時在第3、8、15天分三次回訪客戶部署情況,有問題客戶保持隨時溝通,期間客戶正常遷移部署完畢可結束該回訪。④VIP客戶回訪:對于使用云主機數量超過4臺的業務系統或者客戶或者需要重點保障的業務系統和客戶定義為VIP客戶,針對VIP客戶需要回訪到客戶主聯系人或信息中心負責人,每月回訪一次,每季度走訪一次,了解客戶使用情況,并做好回訪和走訪記錄[3]。
4.3 提升政務云平臺服務能力
①容災備份中心建設:盡快完成并確定實施方案,完成容災備份中心建設。②存儲多樣化:為滿足部門多種需求,增加磁盤陣列存儲方式。③加快相關監管、工單系統開發速度,提升服務能力,增加服務透明度,可視化。④進一步優化監控功能,有效使用監控工具定位問題,分清問題責任,提高工作效率。⑤不斷派技術人員去學習,提升自己的業務能力。
5 結語
政務云是目前的發展趨勢,也是一個新興的事物,政務云運維的好壞直接決定了政務云建設的成敗。政務云運維是在不斷摸索中進行的,并沒有形成成熟的體系,分享在實際工作中政務云運維的一些經驗并總結提升變得非常必要。
【參考文獻】
【1】湯兵勇,李瑞杰. 中國云計算應用叢書:云計算概論[M].北京:化學工業出版社,2014.
【2】董蕙亞,薄劍勇.政務云計算中心運維管理系統的架構研究[J].寧波大學學報(理工版),2012,25(03):53-57.
【3】田偉,林海鵬.電子政務云計算中心建設淺析[J].農學學報,2016,6(06):45-50.