錢軍 刁志堅
摘 要:隨著國家中小企業信息化產業建設不斷的飛速發展,隨之帶來的就是中小企業用戶信息化建設的發展,用戶的網絡規模日益增長,網絡結構日益復雜。因此,IT運維對于用戶尤為重要。到了今天,單一的網絡管理維護已經無法滿足用戶對于信息化穩定性的需要,整體的IT運維已經取代了過去單一的網絡維護,網管員的工作已經升級到了IT管理者的層次。
關鍵詞:信息化建;中小企業;網絡管理;IT運維
1 企業運維的主要難題
1.1 IDC服務商的選擇
服務器增多,就要找好的IDC運營商;不然會出現服務器裝錯、域名白名單取消、機柜的帶寬流量無法實時監控、CDN效果不佳等問題。
1.2 服務器提供商和型號的選擇
例如出現DELL R410固件問題,每當服務器高流量的時候,服務器網卡會自動斷流,需要手動重啟網卡,到最后也未能完全解決;之前還遇到過內存,主板故障等問題,服務器的硬件一旦出現問題,就意味著停機檢修,服務自然要中斷。所以在服務器的選擇上也要慎重,而不是只考慮價格問題。
1.3 負載均衡和故障轉移
流量大了,或者業務重要性高,就要求最大可能提供服務器的高可用性和數據容災,自然要部署負載均衡和故障轉移;是采用硬件F5,cisco還是軟件lvs,keepalvie,heartbeat,nginx方式實現,效果如何?都需要去考量。
1.4 運維團隊和人才的培養
對于中小企業來講,IT運維人才的流失是比較可惜的,如何去留住一批優秀的運維人才也是企業需要考慮的問題。其實不只運維,企業要想有長遠的發展都應當想方設法留住人才,控制公司的人員流失率,要讓員工有歸屬感和榮譽感,而不是只有赤裸裸的雇傭關系;企業應該著重培養一支高素質,高凝聚力的運維團隊,而不是只當運維是業務部門和程序部門間的夾心餅,里外不是人,這樣的環境和團隊是留不住人才的。
2 企業運維人員的工作職責
2.1 保證服務器上正常的運行
怎么樣才能算正常的運行呢?論壇卡,服務器慢,網站打不開之類的問題,出問題的有可能是服務器,也可能是用戶端或者就是中間的網絡傳輸問題,在中國最典型的就是南北互通的問題,因為這種問題很難判斷,所以一般管理者會要求運維每年的故障時間不能超過一定的值,說7*24*365服務不間斷運行,但是總會有各種各樣的問題,無論你用了什么負載均衡,故障轉移技術,服務臨時中斷也是避免不了的,運維的價值在于在縮短服務中斷后的MTTR時間,可見運維的壓力是很大的。
2.2 備份關鍵數據,及時處理各種故障,保證服務器安全
備份是為了恢復,一般想到或者用到備份的時候,都是出現麻煩的時候,所以平常工作中對備份一定要足夠的重視,尤其是數據庫,在某些時候,看起來多年前的備份可能會給你的恢復工作帶來意想不到的作用;服務器的安全部分又是復雜的概念,因為安全本身就是相對的,而且安全和性能,用戶體驗之間是成反比的,運維在很多時候都是犧牲安全來換取性能和更好的用戶體驗,等將來安全上出現問題的時候再調整。
2.3 及時調整服務器各項設定滿足業務需要
框架定了,服務器選了,一般是不會輕易改動的,但設置服務器的工作卻是每天都有的。程序有時需要部署個memcache,有時需要個中文分詞系統,有時需要加個虛擬主機。運維人員在做這類工作的時候不能像應付任務那樣,但求過關即可,否則日積月累下來,服務器會出現意想不到的情況。在處理這類工作上運維人員應當做到規范和文檔記錄,長期做下來,不但自己的運維專業水平會提高,對于后期的維護也會起到良性循環作用。
2.4 記錄服務器維護日志和技術文檔
這點都是在處理完問題后記錄下,方便加快日后處理同類問題的速度和效率;至于技術文檔,身為運維人員一定要認真編寫,寫的很糟糕的文檔會給人誤導作用,internet上這類文章不在少數,本身IT這個行業就是很浮躁的,如果不能靜下心來好好整理知識,總有一天會被淘汰的;對于過去整理的文檔要定期的去溫習,有錯的要及時更正。
3 企業運維工具的選擇
隨著企業的業務對IT的依賴越來越多,企業的服務器的架構規模不斷擴展,為了更有效率的執行任務,為了我們運維人員不再像流水線上的一名工人一樣不斷重復的做著同樣的工作,我們將會用一類工具,這類工具是可編程的,我們只是需要寫上一些代碼就可以幫我們自動完成所有的工作。很公司用的是瑞寧CAM,集中審計管控系統,除了能完成自動化運維的工作,比如系統安裝、系統升級、批量修改密碼、主機名規范、終端資源監控、批量配置管理、終端批量實時操控等等,還有事后審計回放的功能,對于事后總結自己的工作,查找錯誤點非常有幫助。此外常見的運維工具還有:ickstart、Chef、Nagios、Cobbler、ControlTier、OpenNMS、OpenQRM、Func、Zabbix、Spacewalk、Puppet、Cacti等。
[參考文獻]
[1]付資亮.K公司IT運維管理研究[D].華南理工大學.2011年.
[2]王艷君.淺析IT運維的現狀與對策[J].中小企業管理與科技(下旬刊).2011年03期.
[3]唐琳,李偉.基于用戶體驗的“主動式”信息運維管理實踐[J].電力信息化.2013年03期.
[4]丁云成,王必榮,孫靜.基于ITIL的IT服務管理系統的應用[J].電腦知識與技術.2008年07期.