付喜春,鐘吉太,李家俊
(大慶鉆探工程公司物探研究院 黑龍江 大慶 163357)
基于地震資料解釋IT資源分配和管理系統的開發
付喜春,鐘吉太,李家俊
(大慶鉆探工程公司物探研究院 黑龍江 大慶 163357)
隨著地震資料解釋工作站系統和應用軟件等資源規模不斷擴大,解釋IT資源運維管理難度越來越大,傳統的人工分配IT資源,常使多個生產項目相互擠占資源,導致資源失衡和生產效率降低。通過技術研究及程序開發,對解釋資源實現自動分配、統一監控,并實時跟蹤解釋項目的進展情況,大大提高了設備利用率和生產效率。
地震資料解釋; IT運維管理 ;工作站系統;資源自動分配; 監控軟件
大慶物探研究院現有地震資料解釋工作站、存儲系統等設備95臺套,解釋軟件21套,應用軟件模塊160多個。目前的解釋生產工作量和數據量很大,形成的地質成果類別和種類也很多,每年通常有30多個二維和三維解釋區塊。解釋生產區塊多、來源雜,需要對生產信息進行實時自動跟蹤。而且,每年還有很多科研項目同時進行,都需要占用大量的IT資源,經常出現搶占資源現象,導致有的資源閑置,有的資源超負荷,大大降低了生產、科研效率。當多個解釋項目組在業務流程和資源利用上有重合時,就難免發生不同部門之間推卸責任、糾纏不清的推諉事件。諸如幾個項目組搶占計算機資源等問題,很可能會牽涉到幾個部門之間的配合。導致生產、科研問題復雜化,無法統一協調,問題不能及時解決,影響解釋項目的進展。另外,解釋資源完全靠人工分配,資源不能得到最大效率的利用,時常延遲解釋生產周期,影響生產任務的順利完成。
因此,開發一個針對解釋IT資源分配和項目管理的軟件系統,幫助解決解釋資源生產應用過程中的各種技術難題,實現解釋項目運維管理的規范化、流程化、自動化和簡約化,使有限的IT資源得到合理、高效的應用,提高生產和科研效率。
資源分配功能模塊的設計研發,需要綜合考慮計算機硬件資源的整體情況,針對不同的解釋項目,當項目長提交了資源申請后,生成資源使用申請單,經過室、院領導審批后,由系統按照項目的需求,從資源池中分配計算機硬件資源,實現資源的合理分配。
1.1 資源分配流程
解釋項目的資源分配過程,主要是針對計算資源。系統中存在的角色分為管理員、解釋項目長、解釋室領導和研究院領導。物探研究院IT資源分配工作流程,如圖1所示。

圖1 資源分配工作流程
資源分配功能模塊的基本工作流程為:
計算機系統管理員創建項目;解釋項目長創建申請單;相關解釋室領導二級審批申請單;研究院主管領導三級審批申請單;系統從資源池自動分配IT資源。
1.2 資源分配規則
對于解釋項目長提交的項目申請單,在解釋室領導和院領導完成審批后,自動提交由系統進行資源分配。為了提高工作站資源的利用率,減少運算資源的浪費和擁塞,研發了工作站硬件、軟件資源自動分配模塊[1]。
1.2.1 軟件資源自動分配
解釋用戶在填寫申請單中,項目長首先選擇應用軟件(LandMark、Jason等),選定提交完成后,系統自動分配應用軟件,無需系統管理員再進行操作;系統根據選定的軟件,去匹配相應的服務器和工作站,哪臺機器安裝什么軟件是數據搜集階段在數據庫里定義好的。
1.2.2 硬件資源自動分配
綜合分析以往解釋生產區塊使用硬件資源情況,設計并實現了解釋服務器/工作站資源自動分配技術。
1)根據以往解釋生產區塊使用工作站的情況,綜合考慮二維、三維等不同解釋項目,生成工作站資源分配模板,見表1。
2)全部解釋工作站系統分成兩組,在數據庫中進行定義。含有應用軟件(如Landmark、Jason)的一組定義為主服務器組,不含應用軟件的為一組定義為終端組。

表1 解釋項目工作站資源分配模板
3)應用軟件定義、工區定義完成后,工作站數量也就根據表1的分配規則進行選擇。這時系統會根據這些數據,首先從服務器組選一臺工作站(含有應用軟件),另外的工作站從終端組選擇。這些是基于工作站監控系統來操作,選CPU利用率低的相對空閑的工作站。
4)選出的工作站在數據庫里做標識,避免下一個工區再重復操作和選用。
針對現有90多套不同種類的工作站系統,實現在統一窗口,實時、完整的監控這些龐大、繁雜設備的運行狀態的前提,必須要準確的收集到各解釋工作站組的各個關鍵部件的運行性能指標數據。
2.1 監控數據匯集技術
監控數據的匯集技術,包括數據收集、數據存儲和數據傳輸等。針對多套不同類型的服務器、工作站,要監控全部工作站的運行狀態,首先需要準確的收集到全部工作站關鍵部件(包括CPU、內存、磁盤、網絡等)的運行性能指標數據,然后通過后臺系統客戶端(即需要監控的全部工作站)守護進程pcnt整理成XML的數據形式進行存儲,最后通過網絡實現傳輸匯總,最終到前臺系統動態顯示[2]。數據采集分別來自表2中所列的文件。
2.2 解釋項目監控設計
解釋項目監控子模塊可以完整地展示解釋生產項目的進展情況,包括每個項目的項目名稱、項目類型、負責人、執行環節、使用工作站數量、存儲量、名稱解析、開始時間、結束時間、項目進度等[2]。

表2 CPU類資源、內存類資源、磁盤類資源和網絡類資源數據采集來源
解釋項目監控中的一些信息,如項目名稱、類型等,可以從項目申請單中提取,但是,項目進度的監控,需要從地震資料解釋應用軟件的作業運行信息中收集。應用軟件作業運行信息采集、數據庫匯聚并在同一系統平臺進行綜合展現是開發本系統的一大難點和創新點。
地震資料解釋應用軟件作業信息采集需要對關鍵階段模塊進行采集和統計,采集的模塊見表3。

表3 Landmark解釋軟件項目采集進程對應表
Landmark、Jason等軟件運行中包括數百個進程模塊,使用者調用某一模塊時,該模塊在軟件系統內的名稱會顯示到系統進程中,通過編寫進程采集程序子模塊get_proc_info,即可收集到軟件運行過程中調用的模塊進程。
各個工作站通過此程序模塊采集本機Landmark解釋軟件和Jason反演軟件的進程,與主服務器端做時間同步,將信息發送到主服務器進行存儲,并進行信息匯總。
2.3 主機監控設計
主機監控主要是指解釋工作站系統監控。采集的信息包括CPU、內存、SWAP和網絡等關鍵部件的實時信息,如主機的CPU利用率、內存利用率、SWAP利用率網絡發送速率和網絡接收速率等運行數據。這些信息可以真實的反應當前工作站系統整體的利用率和的負載等[3]。如圖2所示。
頁面中每一個單體窗口對應一臺工作站,這些單體窗口的界面,均顯示對應工作站的CPU使用率、內存使用率、swap使用率等系統級數據信息。

圖2 解釋工作站監控表格方式展示圖
目前地震資料解釋系統中涉及的資源,可以簡單地歸為以下幾類:用戶、應用軟件、硬件和軟件許可證。
3.1 用戶信息管理
用戶信息管理采用系統分級權限管理的設計方案,這是保障系統安全運行的基礎。用戶信息管理包含以下功能:用戶管理、角色管理、功能管理、部門管理、組別管理。
3.2 應用軟件資源管理
軟件資源管理包括解釋系統各應用軟件資源管理。軟件資源管理中展示了軟件名稱、軟件類型、安裝服務器、軟件功能、軟件廠家、許可證類別等信息。
3.3 硬件資源管理
硬件資源管理主要是管理工作站資源。包括全部解釋工作站系統的名稱、品牌、操作系統、內存數量、CPU個數、網絡IP地址等基本配置信息[4]。
3.4 許可證資源管理
許可證是地震資料解釋應用軟件系統中非常關鍵的資源,對許可證的有效管理非常關鍵。系統設計的許可證管理模塊展示了許可證名稱、工作站名稱、IP地址、MAC地址、許可證目錄、許可證到期日、許可證數量等信息。
資源統計模塊為用戶提供對資源使用情況的查詢功能,分為2個子模塊:工作站統計和解釋項目統計。
4.1 工作站運行信息和利用率統計
工作站統計可以通過查詢條件,對各個工作站組的任意工作站的運行信息進行統計,包括:CPU利用率、內存/SWAP使用率、網絡收發速率、本地磁盤讀寫速率、內存帶寬讀寫速率和NFS讀寫速率[5]。如圖3所示。

圖3 解釋工作站資源利用率統計
4.2 解釋項目統計
解釋項目統計模塊,可以統計一段時間內全部解釋生產項目的各種信息,包括:項目名稱、項目類型、項目負責人、運行階段、使用工作站、使用存儲、項目名稱解析、項目開始時間、項目結束時間、項目進度等。可以依據起始時間、項目類型、項目負責人等條件進行查詢,也可以柱狀圖和餅狀圖的方式顯現項目統計情況。
通過地震資料解釋資源分配和管理系統的開發,可自動分配地震資料解釋IT資源,并能實時監控、管理和統計各類資源,有效地解決了地震資料解釋科研和生產應用中的資源失衡、系統資源競爭、系統安全和管理手段落后等生產技術難題,從而實現了降低生產和管理成本,達到提高生產效率的目的。
[1] 全 民, 張 倪. 工作站系統結構軟件開發及應用[M].北京:國防工業出版社,1993:476-501.
[2] 付喜春. 基于多架構PC集群監控系統結構設計[J].信息技術,2013,(9):96-99.
[3] 孫玉芳. UNIX SHELL程序設計[M].北京:清華大學出版社, 1992:75-90.
[4] 王勁松, 蔣麗萍. 網絡互連技術基礎教程[M].北京:學苑出版社,1994:130-140.
[5] 胡道元. 計算機局域網[M].北京:清華大學出版社,1990:164-183.
Developing of IT Resource Allocation and Management System Based on Interpretation Seismic Data
FU Xichun, ZHONG Jitai, LI Jiajun
(GeophysiealExplorationResearchInstitute,DaqingDrillingandEngineeringCompany,Daqing,Heilongjiang163357,China)
As the scale of the workstation system and its applications growing fast, the interpretation of IT resources is becoming more and more difficult, the traditional way of IT resource allocation always makes the different projects compete with each other and preempt resources, which may leads to an imbalance in the resource distribution and low efficiency. By developing a resource allocation and management system, the resources can be allocated automatically and efficiently. The real-time monitoring of the workstation system and the interpretation progress can be achieved, which can increase the efficiency and raises resource utilization.
seismic data interpretation; IT operation and maintenance; workstation system; resource automatically allocation; monitor software
付喜春,男,1964年生,高級工程師,1988年畢業于江漢石油學院電子儀器專業,目前從事集群計算機、解釋工作站系統技術管理和軟件開發。E-mail:fuxichun@sina.com
TP274
A
2096-0077(2017)04-0014-04
10.19459/j.cnki.61-1500/te.2017.04.004
2016-10-07 編輯:韓德林)