程聰 周品秀
摘要:本論文針對傳統的人工運維方式的不足,提出依據現有的專家經驗和以往積累的已有經結合,實現自動化運維的方式。本文首先介紹自動化運維的整體架構,通過zookeeper消息發送實現指標采集入庫,發現指標異常進行告警分析,通過任務調度平臺調用executor執行器進行對應的python腳本自動化運維診斷,提升運維效率,降低成本。
關鍵詞:oracle;運維自動化;python;zookeeper
中圖分類號:TP319 文獻標識碼:A 文章編號:1007-9416(2018)07-0190-02
1 引言
隨著互聯網行業的迅速發展,信息系統變得越來越復雜,設備數量急劇增長,相對應的系統運維難度也逐漸增加。依靠人工分析采集的指標進行系統診斷的傳統診斷方式占用的成本越來越高。
運維自動化具有一下優點:(1)專業性:行業具有20年工作經驗的專家提供的知識整合,分析流程,通過編碼方式實現存放在系統中,具有極強的專業指導。(2)自成長:運維人員在掌握python編程的基礎上,學習腳本定義結構,可將運維經驗積累到系統中,形成豐富的知識庫,在以后的自動化運維中發揮作用,同時降低對現有人員依賴。(3)自動化:根據采集的指標發現異常,結合現有的專家經驗和積累的已有經驗,不需要手工干預,系統自動運行分析診斷發現可能存在的問題,給出結論。
2 可行性分析
在Oracle數據庫日常維護的大部分工作是由檢查數據庫警告日志, 檢查數據運行狀態、 表空間使用情況,處理數據庫無效對象和會話,檢查操作系統進程等組成[1],通過腳本可實現大部分運維工作,Python語言具有簡單,明確,入門快,可移植性和豐富的第三方庫等優點,因此腳本選用python語言。……