鄧?yán)颉》兜萝姟O胤航
[摘 要] 隨著協(xié)同研究云建設(shè)與應(yīng)用,各類大型專業(yè)軟件實(shí)現(xiàn)了集中部署,傳統(tǒng)簡單的浮動許可管理模式已不能滿足全面管控的要求。本文通過對石油行業(yè)勘探開發(fā)大型專業(yè)軟件集中管控技術(shù)的研究與探索,部署協(xié)同研究云石油軟件管控工具,實(shí)現(xiàn)了對大港油田協(xié)同研究云大型專業(yè)軟件的監(jiān)控管理與高效利用,提高了軟件利用率,推動了協(xié)同研究云管控水平的提升。
[關(guān)鍵詞] 研究云;專業(yè)軟件;集中管控;許可管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 22. 060
[中圖分類號] TP309.2 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2014)22- 0093- 02
1 問題的提出
2012年,大港油田協(xié)同研究云正式開始建設(shè),同年12月28日,協(xié)同研究云正式上線運(yùn)行。目前,已經(jīng)建立了含64節(jié)點(diǎn)刀片服務(wù)器、130TB存儲的硬件環(huán)境,集中部署了地震解釋、測井評價、地質(zhì)建模、數(shù)值模擬、各類制圖等軟件總計16種,涵蓋了大港油田勘探開發(fā)研究主要的大型專業(yè)軟件工具。
協(xié)同研究云的建立、大型專業(yè)軟件的集中部署,將科研人員從大型專業(yè)軟件管理、Linux系統(tǒng)硬件維護(hù)管理、工區(qū)數(shù)據(jù)準(zhǔn)備等繁重工作解脫出來,全新投入科研生產(chǎn)工作。但是,傳統(tǒng)單一軟件的浮動許可管理模式,只能管理單一軟件的許可浮動調(diào)用,個別用戶多搶多占許可模塊、長時間占用等浪費(fèi)專業(yè)軟件有限資源的情況無法杜絕。大型專業(yè)軟件全部實(shí)現(xiàn)集中部署,為協(xié)同研究云IT管理人員同樣帶來了新的管理壓力。如何全面管理所有軟件的許可,如何監(jiān)控所有軟件、所有模塊的使用情況,如何對有限的許可進(jìn)行有效的利用和管控,如何在研究云環(huán)境中對專業(yè)軟件資源實(shí)現(xiàn)全面管控,實(shí)現(xiàn)有限的軟件資源實(shí)時監(jiān)控管理、分配回收、軟件資源在集群中使用情況及分析,這些現(xiàn)實(shí)問題擺在了我們面前。
2 集中管控技術(shù)架構(gòu)設(shè)計
為了實(shí)現(xiàn)協(xié)同研究云專業(yè)軟件集中管控,及時掌握集群環(huán)境軟件許可使用情況,通過全面分析,整體架構(gòu)分兩個部分:一是專業(yè)軟件許可資源管理;二是集群環(huán)境用戶信息監(jiān)控管理。
2.1 大型專業(yè)軟件許可資源管理
大型專業(yè)軟件許可資源管理,主要是在Flexlm浮動許可管理的基礎(chǔ)上,著重對專業(yè)軟件許可數(shù)量等資源管理。研究云主要的大型專業(yè)軟件,如OpenWorks、Petrel等,軟件許可管理模式都是采用FlexLM管理工具進(jìn)行浮動許可管理,已經(jīng)具備了專業(yè)軟件資源的基本管理功能。在此基礎(chǔ)上通過功能開發(fā),可以實(shí)現(xiàn)對專業(yè)軟件許可使用信息的管理。由于每個科室所有科研人員使用同一賬號,要能夠區(qū)分出當(dāng)前軟件調(diào)用集群的具體終端信息,并且具備簡單的統(tǒng)計功能。如軟件許可使用的峰值、使用率、軟件數(shù)量需求預(yù)測、識別閑置許可及回收等功能。
2.2 集群環(huán)境用戶信息監(jiān)控管理
該部分功能設(shè)計,主要從科研人員使用研究云環(huán)境軟件信息的角度,對所有賬號使用軟件情況進(jìn)行全面監(jiān)控管理,由于協(xié)同研究云整體采用集群架構(gòu),實(shí)現(xiàn)在集群架構(gòu)軟件使用情況監(jiān)控管理十分必要,重點(diǎn)是監(jiān)控科研用戶使用軟件情況,尤其是監(jiān)控各模塊在集群各節(jié)點(diǎn)使用的實(shí)時信息,賬號使用軟件情況分析等。
3 技術(shù)實(shí)現(xiàn)與主要功能
3.1 專業(yè)軟件許可證集中監(jiān)控系統(tǒng)
在刀片集群環(huán)境開發(fā)的專業(yè)軟件許可證集中監(jiān)控系統(tǒng),可以實(shí)現(xiàn)對集群軟件使用情況的有效監(jiān)控,包括軟件的不通模塊。
許可證集中報告,主要包括監(jiān)控預(yù)警、實(shí)時信息、歷史分析統(tǒng)計、系統(tǒng)設(shè)置等功能。監(jiān)控預(yù)警功能可以實(shí)時監(jiān)控軟件許可服務(wù)器運(yùn)行狀態(tài)、定時監(jiān)控軟件功能模塊到期情況、狀態(tài)異常頁面提醒就電子郵件報警。實(shí)時信息功能可以查看當(dāng)前功能模塊使用情況、實(shí)時用戶/節(jié)點(diǎn)在線使用記錄、查看用戶超時使用情況、監(jiān)控許可獲取失敗情況。歷史分析統(tǒng)計功能支持按照服務(wù)器、軟件進(jìn)行統(tǒng)計,多個軟件分布部署時可以合并分析統(tǒng)計,按照功能模塊分析當(dāng)前使用情況,按照年度、季度、月度及用戶自定義時間統(tǒng)計分析功能模塊使用情況、峰值、使用效率,按照用戶組/機(jī)器組分析統(tǒng)計多個功能模塊使用情況,功能模塊需求預(yù)測。系統(tǒng)設(shè)置功能包括可視化添加許可服務(wù)器并掃描監(jiān)控、自定義監(jiān)控許可升級更新情況。
軟件模塊動態(tài)釋放功能,主要包括策略配置、限制識別。策略配置定義需要監(jiān)控的軟件及閑置時間等參數(shù),并支持對特定機(jī)器使用不同策略。閑置識別可以自動監(jiān)控需要監(jiān)控的軟件、識別終端閑置情況、動態(tài)釋放激活軟件許可、動態(tài)回收模塊等功能。
專業(yè)軟件許可調(diào)度管理,主要包括許可預(yù)留、手動釋放等功能,軟件模塊許可預(yù)留主要是為特定用戶、重要匯報按照預(yù)定時間、預(yù)定模塊提前預(yù)留許可,并可以自定義預(yù)留策略,設(shè)置預(yù)留時間段,時間過后自動取消等。手動釋放軟件模塊可以實(shí)時查看使用軟件功能模塊的用戶信息,支持釋放具體功能模塊等功能。
許可證授權(quán)控制,管理員可以授權(quán)特定用戶使用,只能打開只能數(shù)量、只能模塊,杜絕浪費(fèi)、占用許可,非授權(quán)用戶無法獲得許可。
3.2 RTM集群監(jiān)控系統(tǒng)
研究云大型專業(yè)軟件環(huán)境是高性能計算 (HPC) 環(huán)境,維護(hù)這么復(fù)雜的 結(jié)構(gòu)挑戰(zhàn)巨大,由于整個集群采用platform云管理平臺軟件實(shí)現(xiàn)云模式管理的復(fù)雜環(huán)境,而許多現(xiàn)有的監(jiān)控工具只監(jiān)控基礎(chǔ)架構(gòu),而不提供完整的集群可視化監(jiān)控,尤其是不能對用戶作業(yè)和軟件模塊事情情況進(jìn)行有效的監(jiān)控,而RTM是 IBM Platform LSF 環(huán)境的操作儀表板,可提供綜合的工作負(fù)載監(jiān)控、報告和管理。Platform RTM 提供完整的集成監(jiān)控工具,通過部署Platform RTM,能夠有效監(jiān)控集群日常信息,并且提供改善集群效率所需的信息和工具,對研究云集群軟硬件環(huán)境進(jìn)行監(jiān)控管理,RTM集群監(jiān)控系統(tǒng)實(shí)時監(jiān)控服務(wù)、實(shí)時監(jiān)控集群所有節(jié)點(diǎn)狀態(tài),以及所有用戶、作業(yè)的信息,同時可以實(shí)時生成數(shù)據(jù)報表。
RTM集群監(jiān)控系統(tǒng)主要由集群監(jiān)控和控制、用戶作業(yè)概要分析、監(jiān)控資源使用和分配的功能、自動警報和異常處理、靈活的報表展現(xiàn)。直觀的操作儀表板可以幫助用戶快速識別并糾正問題,并通過尋找空閑容量和消除性能瓶頸來提高效率。用戶作業(yè)概要分析是基于用戶、組或項(xiàng)目密切監(jiān)控資源,以提高集群使用率、獲得更好的作業(yè)吞吐量并縮短用戶等待時間。并支持多個集群監(jiān)控,通過在集群間切換工作負(fù)載來提高效率,可以快速執(zhí)行軟件管理任務(wù)。
4 應(yīng)用效果
通過部署專業(yè)軟件許可證集中監(jiān)控系統(tǒng)和RTM集群監(jiān)控系統(tǒng),實(shí)現(xiàn)了對研究云環(huán)境的全面監(jiān)控管理,尤其是實(shí)現(xiàn)了對大型專業(yè)軟件的全面管控。
(1)全面監(jiān)控大型專業(yè)軟件的作業(yè)情況。對用戶使用軟件信息全面掌握,甚至每個用戶所有工作時間、什么時候調(diào)用什么軟件模塊等信息一目了然,便于公司領(lǐng)導(dǎo)掌握科研單位使用軟件情況和科研人員工作情況。
(2)全面管理了大型專業(yè)軟件資產(chǎn)信息。通過軟件許可監(jiān)控管理,實(shí)時掌握了價值昂貴的大型專業(yè)軟件資產(chǎn)情況,研究云環(huán)境有多少軟件資源、有多少許可數(shù)量、有多少模塊功能可用,這些信息做到了全面掌握。
(3)大型軟件資源實(shí)現(xiàn)了優(yōu)化配置、發(fā)揮了最大效益。通過兩套系統(tǒng)的部署,可以根據(jù)工作需要動態(tài)調(diào)整軟件功能模塊的分配與使用,可以為重點(diǎn)工作、重點(diǎn)項(xiàng)目,如井位討論會,及時提供許可模塊,保障其正常開展;同時,通過閑置識別與回收等功能,保障了大型專業(yè)軟件資源的動態(tài)配置、合理利用。
(4)實(shí)現(xiàn)了對集群環(huán)境作業(yè)信息的有效監(jiān)控管理。監(jiān)控每個科室、每個用戶使用軟件模塊情況,集群環(huán)境硬件資源與軟件作業(yè)之間的管理,硬件資源、軟件資源在調(diào)用軟件模塊的作業(yè)過程中的詳細(xì)信息,并能夠?yàn)轭I(lǐng)導(dǎo)提供詳細(xì)的報表分析,從而為購買軟件提供詳細(xì)的依據(jù)。
5 結(jié) 語
大港油田大型專業(yè)軟件集中管控技術(shù),是在協(xié)同研究云建設(shè)與應(yīng)用效果明顯、作用日趨重大的時刻產(chǎn)生的管理需求,通過對軟件管控技術(shù)的研究,并實(shí)現(xiàn)全面監(jiān)控管理,有效提升了協(xié)同研究云整體管理水平,為公司領(lǐng)導(dǎo)決策提供了強(qiáng)大的決策依據(jù),盤活了軟件資產(chǎn)、提高了軟件利用率,保障協(xié)同研究云軟件資源的有效管理,推動了協(xié)同研究云的應(yīng)用,為油田公司勘探開發(fā)科研生產(chǎn)工作提供了有力的技術(shù)保障,是石油行業(yè)大型專業(yè)軟件管理與應(yīng)用的有效手段,有很大的推廣和應(yīng)用價值。
主要參考文獻(xiàn)
[1]陳哲,范德軍.大港油田基于瘦客戶端技術(shù)的項(xiàng)目研究環(huán)境建設(shè)[J].管理觀察,2009(31).