張琦
摘要:隨著我國經濟的不斷發展,企業科學管理水平的提高,企業管理信息化越來越受到企業的重視。企業信息系統投運后就進入系統運行維護階段,保障企業計算機信息系統安全、可靠、高效運行是系統維護的首要任務和目標,同時還需優化信息系統,使系統能夠不斷改善和提高,以便充分發揮企業信息系統的作用,更好的為企業提供務,提升企業科學管理水平,提高工作效率。本文主要在平時運維過程的經驗基礎上分析企業信息系統運行維護管理的方法。
關鍵詞:信息系統;運行維護;故障;管理
企業信息化建設涉及到整個企業的經營管理系統,企業ERP(企業資源計劃)系統、OA辦公自動化系統等先進的管理系統都進入企業并成為企業重要的綜合管理系統。在企業信息系統投入正常運行之后,做好企業信息系統的日常維護和管理工作,確保企業的信息系統正常運行,是為企業帶來更多經濟效益的重要舉措。企業信息系統運行維護管理主要體現在日常運行維護和故障管理兩方面。
1 系統日常運行維護管理
企業信息系統投入使用以后,日常運行的維護工作是非常重要的,確保企業計算機信息系統正常安全運行是系統維護的首要任務和目標。
1.1 巡檢與監控管理
制定信息系統巡檢計劃,定期對服務器、數據庫、中間件、應用系統等進行巡檢,及時發現存在的各種安全隱患;通過監控系統,實時監測服務器、數據庫、中間件、會話數等,及時了解系統當前運行狀態。其主要包括:監控系統的安全狀況,發現不良侵入立即采取措施予以制止;檢查系統日志和各種告警信息,根據分析結果提出解決方案;監控各應用系統間接口運行情況,對發現的異常數據要及時處理;對數據庫中垃圾數據的定時清理,及對歷史數據的及時遷移,優化系統性能;檢查系統進程是否正常;檢查磁盤的空間占用率;檢查CPU、內存的使用情況;檢查群集軟件運行情況等。
1.2 軟硬件啟停作業
信息系統啟停操作是為了使信息系統適應環境和各種其他因素的變化,及時地進行重啟、升級、更新補丁,保證系統正常的工作,滿足系統用戶對系統的要求。首先必須了解系統環境搭建過程,整理軟硬件清單、相關作業指導書,這能更好地指導系統的維護過程。在系統部署階段,能更好地規劃系統軟硬件配置,如搭建集群、主備等雙機模式,避免信息系統于單機環境運行;在停機前必須保護好現有數據,做好備份;在升級更新前還需做好舊應用軟件備份,如出現新版本不能穩定運行時能第一時間恢復系統。
1.3 權限管理與數據處理
用戶變更應用系統權限、處理業務數據時,需用戶所在部門審查和業務管理部門審批后交由系統管理員確認,進行增刪改操作。用戶權限分配須遵循最小權限原則,用戶口令長度應滿足密碼復雜性要求,用戶賬號的命名規則應規范管理;進行業務數據的變更操作前需做好備份工作,并在有人監護的情況下嚴格按照作業指導書開展工作。
2 系統故障管理
故障管理是計算機信息系統維護當中的復雜過程,應當將故障維護作為出發點,積極采取綜合性措施,確保計算進信息系統得以正常運行,發揮其應有作用。信息系統發生故障后,信息系統管理員應組織相關人員對故障進行處理,需從網絡、服務器、接口、數據庫、應用等多方面定位問題。一般結合監控分析系統的實時告警信息,可以很快地分析出故障的影響范圍和問題原因。無論大小的故障,都應該及時地記錄故障的發生時間、故障的現象、故障發生時的工作環境、處理的方法、處理的結果、處理人員、善后措施、原因分析等,形成故障處理分析報告,這對于信息系統的運維具有重要的意義。
2.1 數據庫故障
表空間不足、歸檔日志空間占滿是一般常見的故障,數據庫備份恢復操作是極少出現,所以這里重點介紹常見的故障處理方法。表空間不足也就是指在非自動擴展設備上建立的表空間的使用率接近或等于100%,數據自身已經不能再處理任何增加空間的SQL語句。當表空間不足出現時,我們一般可以通過ORACLE自身的日志或者前端提示的錯誤信息進行快速定位,通過擴充表空間的設備文件進行故障的排除。歸檔日志空間占滿大多是由于大批量數據變動引起歸檔日志空間被占滿而造成數據庫沒有響應,登錄對應的實例數據庫時會報無法登陸,等待日志空間回收;解決此類問題的辦法就是備份歸檔日志,然后刪除歸檔日志空間的歸檔日志文件。
2.2 應用服務器故障
當出現服務器不響應新的請求、請求超時、請求處理的時間長等,這可能是應用服務器掛起故障。例如內存溢出,即當JVM最大的內存數無法滿足應用邏輯處理的需求,系統就會報內存溢出(OutOfMemoryError)錯誤,從而掛起應用服務,這一般需直接重啟應用服務來解決問題。一般來說,服務器掛起之后可能會崩潰,這需馬上進行線程監控,查看每個線程在特定時刻正在執行什么操作的信息,是否存在死鎖或大量請求等,通過kill -3那些影響性能的進程。對于應用服務器故障,我們平時應注重對SQL語句優化、weblogic配置調整、JVM配置優化、擴充應用服務器內存和CPU等系統性能優化,能有效降低故障發生次數。
3 結束語
針對企業信息系統所開展的運行維護管理的工作核心在于:依托于網絡、服務器、軟硬件平臺、應用軟件等相關技術支持,確保系統安全、可靠運行。在運維過程中,需注重日常的巡檢和監控,規范信息系統運行維護的流程,及時定位故障源并解決,提高系統可用性。
參考文獻
[1]葛世倫.信息系統運行與維護[M].北京:電子工業出版社,2012.
(作者單位:黑龍江煙草工業有限責任公司綏化卷煙廠)