彭麗恩+鄧雄雷+何少萍
【摘要】 愛立信OSS系統當前一般采用冷備份的容災方式,主備用服務器上無數據同步功能,應急操作依賴于管理員手工切換,容災效果大打折扣。作為移動通信網中專用的設備操作管理系統,OSS系統的可用性至關重要,直接影響了對網絡的操作維護。因此,本論文提出一種有效的解決方案,實現冷備份系統“準熱備份”的容災效果。該解決方案也可用于其它冷備份系統,提升容災效果。
【關鍵詞】 冷備份 數據同步 一鍵切換 軟切換
一、背景情況
OSS系統是移動通信網中專用的愛立信設備操作管理系統,提供集中式的無線網絡和核心網絡的操作維護功能,主要提供故障管理、配置管理、性能管理、鑒權管理四大功能,包含OSS主服務器、備用服務器、COMINF服務器、UAS接口機、OMBS服務器、ENIQ服務器、交換機等設備,這些設備各施其能、各管其職,協同工作,為用戶提供愛立信網元的網管服務。OSS系統采用冷備份的容災方式,當該服務器的軟件或硬件出現故障的時候,需要切換到備用服務器上,由系統管理員前往機房操作,同時需要重啟備用服務器上的進程,更新備用服務器上的數據。當前OSS的容災方式和應急操作手段的不足,直接影響了OSS的冷備份容災效果。
1、主備機間無數據同步機制,數據不同步直接影響了切換后OSS用戶的某些維護操作。OSS系統上精確地配置了每個用戶的權限,存儲了每一個網絡設備的配置信息,包括IP地址、帳號權限、網絡配置等,以及用戶自己的文件。如果主備機切換前用戶的權限、網元的配置或者網絡參數修發生了變化,而備機沒有及時更新,切換后用戶就會因權限問題無法進行某些操作,網元出現斷連、參數不對無法進行網絡優化等問題。雖然切換到了備用服務器,但對于用戶來說,OSS的網管服務還是不可用的。
2、人工切換耗時長,需要OSS系統管理員前往機房進行操作,容災效果不明顯。若故障發生在非工作時間,OSS系統管理員趕到機房所耗費的時間,可能比起系統管理員直接修復主機故障所用的時間還長,備機的冷備份容災方式便形同虛設。
從上面的兩點可以看出,當前OSS系統采用的冷備份容災方式的效果受限于當前容災操作的數據維護方式和切換方式。而廠家也沒有任何解決辦法。為此,如何解決當前OSS系統冷容災方式的不足成為亟待解決的技術難題。
二、技術解決方案
1、備用服務器數據同步解決方案。
在備用服務器上開發數據準實時同步工具,實現備用服務器主動更新TSS、ARNE、HOME三大數據庫的數據,保持與主用服務器一致。
(1)增設主備用服務器間數據同步的專用網絡。
OSS系統內部原有3個獨立隔離的網絡:業務網絡、管理網絡和備份網絡,分別負責系統內部的業務通信、系統管理和系統備份。為避免相互干擾,提供安全可靠的傳輸通道,增設一個專用的數據同步網絡,使用C類IP地址,使用主備服務器上的備用網卡和冗余網口。考慮成本問題,采用在交換機上劃分VLAN的方式而非增加一臺交換機來實現。
(2)主用服務器自動備份相關數據。
從效率、資源成本的角度從發,選用Shell腳本與CRONTAB定時任務結合實現數據備份的功能。SHELL腳本實現的功能是檢測數據的變化和將相關數據備份到指定目錄。與現網關聯的數據主要是網元的連接數據,存儲在ARNE數據庫里,與用戶操作權限相關的數據存儲在TSS數據庫里,其他還需要實時更新的數據也包括用戶自己的數據,存儲在/ossrc/home/路徑下,還有一些定時任務CRONTAB的數據。這些數據是備機需要與主機同步的,因為他們直接影響OSS的服務。Shell腳本的功能就是定期備份這些數據到指定目錄,對于數據量大的用戶數據,采用增量備份方式,即只備份在上一次備份之后有變化的新數據。由于TSS是Sybase數據庫,和ARNE的Versant數據庫類型和架構不一樣,而HOME下的數據采用增量備份方式,所以主用服務器上需要配置多個SHELL腳本,實現不同的功能:TSS數據庫備份腳本實現賬號權限全量數據備份;ARNE數據備份腳本實現網元配置數據全量備份;HOME文件變更檢測腳本通過對文件的名字、大小、變更時間的比對發現文件的變更信息,檢測出所有用戶的文件變更情況和用戶CRONTAB任務表變更情況;HOME數據備份腳本將檢測到的變更文件備份到指定目錄。
綜合考慮服務器性能、數據變更頻率、數據重要性和對用戶的影響程度,并錯開網絡工程時間,在CRONTAB設置各個腳本的執行頻率與時間:
在主用服務器上上配置了這些Shell腳本后,主用服務器便可自動備份指定的數據,并存儲到專用的特定目錄下。備份周期可根據實際情況調整。例如,用戶變更的數據量不大但對用戶的操作影響大,每天早上上班前備份一次,而網元連接數據、用戶權限等變化少但數據量大的,則每周備份一次。為了使備份數據的工作對OSS主服務器的負荷影響降到最低,可將備份時間設為OSS業務量少,網絡工程已結束但日常維護還未開始的早上。同時,若系統管理員進行了大量的數據修改,可在數據修改后手動啟動以上各個腳本備份好數據。
(3)備用服務器自動獲取主用服務器上的備份數據并更新自身數據。
在備用服務器上布置定時Shell腳本,在主用服務器開始備份數據的30分鐘后,采用FTP技術通過專用數據同步網絡獲取主用服務器上備份好的數據,然后導入到本機上相應的數據庫和文件目錄下,進行數據更新。
2、主備服務器一鍵切換解決方案。
將主備用服務器同時接入OSS系統的業務網絡,劃分在同一個VLAN上面。平時,交換機上備用服務器的業務端口處于down的狀態,主用服務器的業務端口處于up狀態,對外提供服務。當啟動一鍵切換功能,通過交換機上的管理網絡,將OSS的主用服務器的業務端口狀態改為down狀態,將備用服務器的業務端口狀態改為up,由備用服務器對外提供網管服務。
一鍵切換功能部署在管理主機上。該功能由系統管理員啟動,通過Shell腳本實現。Shell腳本登陸到交換機上利用管理網絡進行操作,改變業務網絡的端口狀態實現主備用服務器間的切換。切換后,腳本將檢查備用服務器上的數據是否最新,若否則啟動數據同步功能,更新備用服務器上的數據,然后啟動備用服務器上的ldap-client和cron的守護進程,最后重啟所有UAS 接口機。
三、總結
實踐證明本文提出的方案有效解決了冷備容災方式數據不同步的問題,實現了硬切換到軟切換的轉變,達到了快速切換的目標。該解決方案適合于有數據同步需求或需要在服務器間進行切換的系統引入,尤其適合于想將冷備份容災方式轉化成“準熱備份”容災方式的系統。
【摘要】 愛立信OSS系統當前一般采用冷備份的容災方式,主備用服務器上無數據同步功能,應急操作依賴于管理員手工切換,容災效果大打折扣。作為移動通信網中專用的設備操作管理系統,OSS系統的可用性至關重要,直接影響了對網絡的操作維護。因此,本論文提出一種有效的解決方案,實現冷備份系統“準熱備份”的容災效果。該解決方案也可用于其它冷備份系統,提升容災效果。
【關鍵詞】 冷備份 數據同步 一鍵切換 軟切換
一、背景情況
OSS系統是移動通信網中專用的愛立信設備操作管理系統,提供集中式的無線網絡和核心網絡的操作維護功能,主要提供故障管理、配置管理、性能管理、鑒權管理四大功能,包含OSS主服務器、備用服務器、COMINF服務器、UAS接口機、OMBS服務器、ENIQ服務器、交換機等設備,這些設備各施其能、各管其職,協同工作,為用戶提供愛立信網元的網管服務。OSS系統采用冷備份的容災方式,當該服務器的軟件或硬件出現故障的時候,需要切換到備用服務器上,由系統管理員前往機房操作,同時需要重啟備用服務器上的進程,更新備用服務器上的數據。當前OSS的容災方式和應急操作手段的不足,直接影響了OSS的冷備份容災效果。
1、主備機間無數據同步機制,數據不同步直接影響了切換后OSS用戶的某些維護操作。OSS系統上精確地配置了每個用戶的權限,存儲了每一個網絡設備的配置信息,包括IP地址、帳號權限、網絡配置等,以及用戶自己的文件。如果主備機切換前用戶的權限、網元的配置或者網絡參數修發生了變化,而備機沒有及時更新,切換后用戶就會因權限問題無法進行某些操作,網元出現斷連、參數不對無法進行網絡優化等問題。雖然切換到了備用服務器,但對于用戶來說,OSS的網管服務還是不可用的。
2、人工切換耗時長,需要OSS系統管理員前往機房進行操作,容災效果不明顯。若故障發生在非工作時間,OSS系統管理員趕到機房所耗費的時間,可能比起系統管理員直接修復主機故障所用的時間還長,備機的冷備份容災方式便形同虛設。
從上面的兩點可以看出,當前OSS系統采用的冷備份容災方式的效果受限于當前容災操作的數據維護方式和切換方式。而廠家也沒有任何解決辦法。為此,如何解決當前OSS系統冷容災方式的不足成為亟待解決的技術難題。
二、技術解決方案
1、備用服務器數據同步解決方案。
在備用服務器上開發數據準實時同步工具,實現備用服務器主動更新TSS、ARNE、HOME三大數據庫的數據,保持與主用服務器一致。
(1)增設主備用服務器間數據同步的專用網絡。
OSS系統內部原有3個獨立隔離的網絡:業務網絡、管理網絡和備份網絡,分別負責系統內部的業務通信、系統管理和系統備份。為避免相互干擾,提供安全可靠的傳輸通道,增設一個專用的數據同步網絡,使用C類IP地址,使用主備服務器上的備用網卡和冗余網口。考慮成本問題,采用在交換機上劃分VLAN的方式而非增加一臺交換機來實現。
(2)主用服務器自動備份相關數據。
從效率、資源成本的角度從發,選用Shell腳本與CRONTAB定時任務結合實現數據備份的功能。SHELL腳本實現的功能是檢測數據的變化和將相關數據備份到指定目錄。與現網關聯的數據主要是網元的連接數據,存儲在ARNE數據庫里,與用戶操作權限相關的數據存儲在TSS數據庫里,其他還需要實時更新的數據也包括用戶自己的數據,存儲在/ossrc/home/路徑下,還有一些定時任務CRONTAB的數據。這些數據是備機需要與主機同步的,因為他們直接影響OSS的服務。Shell腳本的功能就是定期備份這些數據到指定目錄,對于數據量大的用戶數據,采用增量備份方式,即只備份在上一次備份之后有變化的新數據。由于TSS是Sybase數據庫,和ARNE的Versant數據庫類型和架構不一樣,而HOME下的數據采用增量備份方式,所以主用服務器上需要配置多個SHELL腳本,實現不同的功能:TSS數據庫備份腳本實現賬號權限全量數據備份;ARNE數據備份腳本實現網元配置數據全量備份;HOME文件變更檢測腳本通過對文件的名字、大小、變更時間的比對發現文件的變更信息,檢測出所有用戶的文件變更情況和用戶CRONTAB任務表變更情況;HOME數據備份腳本將檢測到的變更文件備份到指定目錄。
綜合考慮服務器性能、數據變更頻率、數據重要性和對用戶的影響程度,并錯開網絡工程時間,在CRONTAB設置各個腳本的執行頻率與時間:
在主用服務器上上配置了這些Shell腳本后,主用服務器便可自動備份指定的數據,并存儲到專用的特定目錄下。備份周期可根據實際情況調整。例如,用戶變更的數據量不大但對用戶的操作影響大,每天早上上班前備份一次,而網元連接數據、用戶權限等變化少但數據量大的,則每周備份一次。為了使備份數據的工作對OSS主服務器的負荷影響降到最低,可將備份時間設為OSS業務量少,網絡工程已結束但日常維護還未開始的早上。同時,若系統管理員進行了大量的數據修改,可在數據修改后手動啟動以上各個腳本備份好數據。
(3)備用服務器自動獲取主用服務器上的備份數據并更新自身數據。
在備用服務器上布置定時Shell腳本,在主用服務器開始備份數據的30分鐘后,采用FTP技術通過專用數據同步網絡獲取主用服務器上備份好的數據,然后導入到本機上相應的數據庫和文件目錄下,進行數據更新。
2、主備服務器一鍵切換解決方案。
將主備用服務器同時接入OSS系統的業務網絡,劃分在同一個VLAN上面。平時,交換機上備用服務器的業務端口處于down的狀態,主用服務器的業務端口處于up狀態,對外提供服務。當啟動一鍵切換功能,通過交換機上的管理網絡,將OSS的主用服務器的業務端口狀態改為down狀態,將備用服務器的業務端口狀態改為up,由備用服務器對外提供網管服務。
一鍵切換功能部署在管理主機上。該功能由系統管理員啟動,通過Shell腳本實現。Shell腳本登陸到交換機上利用管理網絡進行操作,改變業務網絡的端口狀態實現主備用服務器間的切換。切換后,腳本將檢查備用服務器上的數據是否最新,若否則啟動數據同步功能,更新備用服務器上的數據,然后啟動備用服務器上的ldap-client和cron的守護進程,最后重啟所有UAS 接口機。
三、總結
實踐證明本文提出的方案有效解決了冷備容災方式數據不同步的問題,實現了硬切換到軟切換的轉變,達到了快速切換的目標。該解決方案適合于有數據同步需求或需要在服務器間進行切換的系統引入,尤其適合于想將冷備份容災方式轉化成“準熱備份”容災方式的系統。
【摘要】 愛立信OSS系統當前一般采用冷備份的容災方式,主備用服務器上無數據同步功能,應急操作依賴于管理員手工切換,容災效果大打折扣。作為移動通信網中專用的設備操作管理系統,OSS系統的可用性至關重要,直接影響了對網絡的操作維護。因此,本論文提出一種有效的解決方案,實現冷備份系統“準熱備份”的容災效果。該解決方案也可用于其它冷備份系統,提升容災效果。
【關鍵詞】 冷備份 數據同步 一鍵切換 軟切換
一、背景情況
OSS系統是移動通信網中專用的愛立信設備操作管理系統,提供集中式的無線網絡和核心網絡的操作維護功能,主要提供故障管理、配置管理、性能管理、鑒權管理四大功能,包含OSS主服務器、備用服務器、COMINF服務器、UAS接口機、OMBS服務器、ENIQ服務器、交換機等設備,這些設備各施其能、各管其職,協同工作,為用戶提供愛立信網元的網管服務。OSS系統采用冷備份的容災方式,當該服務器的軟件或硬件出現故障的時候,需要切換到備用服務器上,由系統管理員前往機房操作,同時需要重啟備用服務器上的進程,更新備用服務器上的數據。當前OSS的容災方式和應急操作手段的不足,直接影響了OSS的冷備份容災效果。
1、主備機間無數據同步機制,數據不同步直接影響了切換后OSS用戶的某些維護操作。OSS系統上精確地配置了每個用戶的權限,存儲了每一個網絡設備的配置信息,包括IP地址、帳號權限、網絡配置等,以及用戶自己的文件。如果主備機切換前用戶的權限、網元的配置或者網絡參數修發生了變化,而備機沒有及時更新,切換后用戶就會因權限問題無法進行某些操作,網元出現斷連、參數不對無法進行網絡優化等問題。雖然切換到了備用服務器,但對于用戶來說,OSS的網管服務還是不可用的。
2、人工切換耗時長,需要OSS系統管理員前往機房進行操作,容災效果不明顯。若故障發生在非工作時間,OSS系統管理員趕到機房所耗費的時間,可能比起系統管理員直接修復主機故障所用的時間還長,備機的冷備份容災方式便形同虛設。
從上面的兩點可以看出,當前OSS系統采用的冷備份容災方式的效果受限于當前容災操作的數據維護方式和切換方式。而廠家也沒有任何解決辦法。為此,如何解決當前OSS系統冷容災方式的不足成為亟待解決的技術難題。
二、技術解決方案
1、備用服務器數據同步解決方案。
在備用服務器上開發數據準實時同步工具,實現備用服務器主動更新TSS、ARNE、HOME三大數據庫的數據,保持與主用服務器一致。
(1)增設主備用服務器間數據同步的專用網絡。
OSS系統內部原有3個獨立隔離的網絡:業務網絡、管理網絡和備份網絡,分別負責系統內部的業務通信、系統管理和系統備份。為避免相互干擾,提供安全可靠的傳輸通道,增設一個專用的數據同步網絡,使用C類IP地址,使用主備服務器上的備用網卡和冗余網口。考慮成本問題,采用在交換機上劃分VLAN的方式而非增加一臺交換機來實現。
(2)主用服務器自動備份相關數據。
從效率、資源成本的角度從發,選用Shell腳本與CRONTAB定時任務結合實現數據備份的功能。SHELL腳本實現的功能是檢測數據的變化和將相關數據備份到指定目錄。與現網關聯的數據主要是網元的連接數據,存儲在ARNE數據庫里,與用戶操作權限相關的數據存儲在TSS數據庫里,其他還需要實時更新的數據也包括用戶自己的數據,存儲在/ossrc/home/路徑下,還有一些定時任務CRONTAB的數據。這些數據是備機需要與主機同步的,因為他們直接影響OSS的服務。Shell腳本的功能就是定期備份這些數據到指定目錄,對于數據量大的用戶數據,采用增量備份方式,即只備份在上一次備份之后有變化的新數據。由于TSS是Sybase數據庫,和ARNE的Versant數據庫類型和架構不一樣,而HOME下的數據采用增量備份方式,所以主用服務器上需要配置多個SHELL腳本,實現不同的功能:TSS數據庫備份腳本實現賬號權限全量數據備份;ARNE數據備份腳本實現網元配置數據全量備份;HOME文件變更檢測腳本通過對文件的名字、大小、變更時間的比對發現文件的變更信息,檢測出所有用戶的文件變更情況和用戶CRONTAB任務表變更情況;HOME數據備份腳本將檢測到的變更文件備份到指定目錄。
綜合考慮服務器性能、數據變更頻率、數據重要性和對用戶的影響程度,并錯開網絡工程時間,在CRONTAB設置各個腳本的執行頻率與時間:
在主用服務器上上配置了這些Shell腳本后,主用服務器便可自動備份指定的數據,并存儲到專用的特定目錄下。備份周期可根據實際情況調整。例如,用戶變更的數據量不大但對用戶的操作影響大,每天早上上班前備份一次,而網元連接數據、用戶權限等變化少但數據量大的,則每周備份一次。為了使備份數據的工作對OSS主服務器的負荷影響降到最低,可將備份時間設為OSS業務量少,網絡工程已結束但日常維護還未開始的早上。同時,若系統管理員進行了大量的數據修改,可在數據修改后手動啟動以上各個腳本備份好數據。
(3)備用服務器自動獲取主用服務器上的備份數據并更新自身數據。
在備用服務器上布置定時Shell腳本,在主用服務器開始備份數據的30分鐘后,采用FTP技術通過專用數據同步網絡獲取主用服務器上備份好的數據,然后導入到本機上相應的數據庫和文件目錄下,進行數據更新。
2、主備服務器一鍵切換解決方案。
將主備用服務器同時接入OSS系統的業務網絡,劃分在同一個VLAN上面。平時,交換機上備用服務器的業務端口處于down的狀態,主用服務器的業務端口處于up狀態,對外提供服務。當啟動一鍵切換功能,通過交換機上的管理網絡,將OSS的主用服務器的業務端口狀態改為down狀態,將備用服務器的業務端口狀態改為up,由備用服務器對外提供網管服務。
一鍵切換功能部署在管理主機上。該功能由系統管理員啟動,通過Shell腳本實現。Shell腳本登陸到交換機上利用管理網絡進行操作,改變業務網絡的端口狀態實現主備用服務器間的切換。切換后,腳本將檢查備用服務器上的數據是否最新,若否則啟動數據同步功能,更新備用服務器上的數據,然后啟動備用服務器上的ldap-client和cron的守護進程,最后重啟所有UAS 接口機。
三、總結
實踐證明本文提出的方案有效解決了冷備容災方式數據不同步的問題,實現了硬切換到軟切換的轉變,達到了快速切換的目標。該解決方案適合于有數據同步需求或需要在服務器間進行切換的系統引入,尤其適合于想將冷備份容災方式轉化成“準熱備份”容災方式的系統。