閆燕 張洪濤 李偉波 丁建群 劉書艷
(中國(guó)石油集團(tuán)東方地球物理公司 河北省涿州市 072751)
近年來(lái),隨著超高效地震勘探混疊采集技術(shù)的發(fā)展,野外采集的日產(chǎn)量從原來(lái)的一萬(wàn)多炮增加到現(xiàn)在的三萬(wàn)多炮,單日及總體采集數(shù)據(jù)量成倍增加,其對(duì)地震數(shù)據(jù)的存儲(chǔ)及質(zhì)控等提出了更高的要求和挑戰(zhàn)。采集地震數(shù)據(jù)在海量數(shù)據(jù)條件下面臨的主要問題:
(1)傳統(tǒng)的磁帶存儲(chǔ)數(shù)據(jù)的方式,使得數(shù)據(jù)的查找費(fèi)時(shí)費(fèi)力。
(2)對(duì)海量數(shù)據(jù)進(jìn)行質(zhì)控,單純依靠?jī)x器或者操作員自己編寫的一些針對(duì)某個(gè)功能的小程序等不能及時(shí)進(jìn)行系統(tǒng)高效的統(tǒng)計(jì)并查找問題。
(3)對(duì)海量數(shù)據(jù)的分析,不具有針對(duì)性和全面性,沒有全面深入進(jìn)行數(shù)據(jù)挖掘的軟件。
基于網(wǎng)絡(luò)的B/S 架構(gòu)的軟件開發(fā)技術(shù)已經(jīng)在各個(gè)行業(yè)得到迅速推廣應(yīng)用,東方公司的生產(chǎn)指揮系統(tǒng)做了對(duì)生產(chǎn)過程的實(shí)時(shí)監(jiān)控,得到很好的應(yīng)用效果,但對(duì)于小隊(duì)內(nèi)部的質(zhì)控和生產(chǎn)數(shù)據(jù)分析等方面的內(nèi)容沒有涉及。
本文主要針對(duì)野外返回的生產(chǎn)數(shù)據(jù)管理、質(zhì)控及數(shù)據(jù)分析方面,結(jié)合小隊(duì)的生產(chǎn)實(shí)際,有針對(duì)性的進(jìn)行了相關(guān)研究,總結(jié)出了一套適用于混采的室內(nèi)質(zhì)控流程并結(jié)合信息化手段,實(shí)現(xiàn)了海量數(shù)據(jù)的智能化管理,減少了人工處理帶來(lái)的風(fēng)險(xiǎn)。本系統(tǒng)在實(shí)際生產(chǎn)數(shù)據(jù)的管理、分析的應(yīng)用,初步取得了較好的效果。
如圖1 所示,本系統(tǒng)由數(shù)據(jù)層、業(yè)務(wù)層和應(yīng)用層三部分組成。
數(shù)據(jù)層:數(shù)據(jù)庫(kù)的訪問即對(duì)非原始數(shù)據(jù)的操作,為業(yè)務(wù)層和應(yīng)用層提供數(shù)據(jù)服務(wù)。資源訪問控制實(shí)現(xiàn)對(duì)具體原始數(shù)據(jù)的分類管理與調(diào)用。
業(yè)務(wù)層:包括系統(tǒng)的主要功能模塊,實(shí)現(xiàn)系統(tǒng)的統(tǒng)計(jì)、計(jì)算、分析等邏輯處理。
應(yīng)用層:通過Web 界面,跟用戶進(jìn)行交互,實(shí)現(xiàn)質(zhì)量分析與監(jiān)控的可視化。通過Web API 接口,可接外部應(yīng)用程序,實(shí)現(xiàn)數(shù)據(jù)的傳輸與相關(guān)應(yīng)用。
性能監(jiān)控、日志:對(duì)系統(tǒng)運(yùn)行情況進(jìn)行整體監(jiān)視,并進(jìn)行匯總,實(shí)時(shí)生成結(jié)果報(bào)表,供系統(tǒng)管理人員進(jìn)行參考、分析。
本系統(tǒng)采用了Pivotal 團(tuán)隊(duì)的Spring Boot。該框架使用了特定的方式來(lái)進(jìn)行配置,從而使開發(fā)人員不再需要定義樣板化的配置,能夠大幅度提高Spring 應(yīng)用的開發(fā)效率。
持久化層采用了一個(gè)半自動(dòng)化的持久層框架MyBatis,它通過直接將SQL 語(yǔ)句寫在映射配置文件中來(lái)操作數(shù)據(jù)并支持動(dòng)態(tài)SQL,更加靈活可控,簡(jiǎn)單易用,SQL 調(diào)優(yōu)也更加容易。
關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)MySQL 所使用的SQL 語(yǔ)言是用于訪問數(shù)據(jù)庫(kù)的常用標(biāo)準(zhǔn)化語(yǔ)言,體積小、速度快,開源成本低,雖然與其他大型數(shù)據(jù)庫(kù)如Oracle、SQL Server 等相比,有其不足之處,但考慮到目前的業(yè)務(wù)需求已經(jīng)能得到滿足,因此本系統(tǒng)采用了MySQL 作為本地?cái)?shù)據(jù)庫(kù)。

圖1:系統(tǒng)架構(gòu)

圖2:系統(tǒng)功能圖

圖3:數(shù)據(jù)表
針對(duì)數(shù)據(jù)存儲(chǔ)的問題,本文設(shè)計(jì)了數(shù)據(jù)自動(dòng)讀取功能和數(shù)據(jù)整理上交功能,針對(duì)海量數(shù)據(jù)存取速度和安全性的考慮,本系統(tǒng)采用了redis 集群部署的分布式數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn);針對(duì)海量數(shù)據(jù)質(zhì)控高效、全面的問題,本系統(tǒng)將數(shù)據(jù)智能分析功能、數(shù)據(jù)動(dòng)態(tài)管理和節(jié)點(diǎn)工作狀態(tài)功能,整合到一個(gè)系統(tǒng),將需要進(jìn)行監(jiān)控的參數(shù)以及對(duì)比結(jié)果進(jìn)行了統(tǒng)計(jì)并輸出。如圖2 所示。
本系統(tǒng)設(shè)計(jì)了以下幾個(gè)功能模塊:
2.3.1 數(shù)據(jù)自動(dòng)讀取

圖4:節(jié)點(diǎn)電量展示
數(shù)據(jù)自動(dòng)讀取功能包含:
數(shù)據(jù)上傳:通過網(wǎng)絡(luò)將生產(chǎn)數(shù)據(jù)文件傳輸?shù)奖P陣指定目錄;
數(shù)據(jù)入庫(kù):系統(tǒng)按數(shù)據(jù)類型分別自動(dòng)讀取指定目錄采集數(shù)據(jù)文件,對(duì)異常文件進(jìn)行識(shí)別與過濾,實(shí)時(shí)顯示數(shù)據(jù)上傳進(jìn)度,剔除重復(fù)數(shù)據(jù)信息,建立生產(chǎn)管理數(shù)據(jù)庫(kù);
數(shù)據(jù)查看:查看存儲(chǔ)目錄下的數(shù)據(jù)文件,提供界面讓用戶存儲(chǔ)目錄中根據(jù)文件內(nèi)部時(shí)間查找對(duì)應(yīng)的存儲(chǔ)文件夾;
信息提取:用戶可以自定義選擇提取顯示和導(dǎo)出數(shù)據(jù)庫(kù)中的信息。
2.3.2 數(shù)據(jù)動(dòng)態(tài)管理
數(shù)據(jù)動(dòng)態(tài)管理的功能包括:
文件檢查:
(1)匹配力文件和擴(kuò)展QC 文件的數(shù)量,做出丟失統(tǒng)計(jì)并圖形化展示;
(2)匹配力文件和VP Report 文件,做出丟失統(tǒng)計(jì)并圖形化展示;
(3)檢查力信號(hào)文件和擴(kuò)展QC 文件的返回率,以及最大連續(xù)丟失的個(gè)數(shù)。
震源狀態(tài)監(jiān)控包括:震源屬性分析(平均相位、峰值相位、平均畸變、峰值畸變、平均出力、峰值出力)、剛性和粘度、震源狀態(tài)碼、過載、警告信息、HDOP、其它信息檢查、力信號(hào)檢查。
采集進(jìn)度監(jiān)控:監(jiān)控炮點(diǎn)的施工順序和施工位置,動(dòng)態(tài)回放震源施工路線;線束完整性檢查:應(yīng)用配置文件,將當(dāng)天的炮點(diǎn)按照線束號(hào)進(jìn)行劃分,統(tǒng)計(jì)產(chǎn)量與重復(fù)的炮點(diǎn),計(jì)算出實(shí)際產(chǎn)量。
炮點(diǎn)偏移距質(zhì)控:統(tǒng)計(jì)分析炮點(diǎn)的偏移情況。
TD 規(guī)則檢查:統(tǒng)計(jì)不符合設(shè)置中設(shè)定的TD 規(guī)則的炮點(diǎn)。
空點(diǎn)檢查:檢查所有線束中的炮點(diǎn)是否放完。
2.3.3 節(jié)點(diǎn)工作狀態(tài)
展示節(jié)點(diǎn)最近的一次狀態(tài)信息,根據(jù)不同的狀態(tài),使用不同的顏色在圖上給出不同的標(biāo)識(shí),狀態(tài)有:傾斜度、噪音、阻值、GPS狀態(tài)、電量、剩余存儲(chǔ)空間、24 小時(shí)未返回、節(jié)點(diǎn)收放圖、節(jié)點(diǎn)收放列表。
2.3.4 數(shù)據(jù)智能分析
數(shù)據(jù)智能分析包括:風(fēng)速和溫度統(tǒng)計(jì)、停炮時(shí)間統(tǒng)計(jì)、震源工作效率統(tǒng)計(jì)、施工地形統(tǒng)計(jì)、廢文件統(tǒng)計(jì)、震源施工臺(tái)數(shù)統(tǒng)計(jì)、震源搬點(diǎn)時(shí)間統(tǒng)計(jì)、Pad Down 時(shí)間統(tǒng)計(jì)、Wait to shoot 時(shí)間統(tǒng)計(jì)等功能。智能分析功能主要是將儀器返回的數(shù)據(jù)和班報(bào)數(shù)據(jù)等經(jīng)過一系列的統(tǒng)計(jì)分析,用圖表或表格的形式更清晰明了的展示出來(lái),利于發(fā)現(xiàn)施工中存在的問題以及時(shí)調(diào)整施工。
2.3.5 數(shù)據(jù)整理上交
讀取數(shù)據(jù)庫(kù)內(nèi)部的信息,系統(tǒng)根據(jù)甲方給定的格式自動(dòng)整理出SPS 文件。
歸檔上交資料:將GF、ExtendQC、Windlog、SPS 等文件提交保存。
根據(jù)功能模塊設(shè)計(jì)對(duì)應(yīng)需求的數(shù)據(jù)表,設(shè)計(jì)了如圖3 的數(shù)據(jù)庫(kù)表。
為了驗(yàn)證本系統(tǒng)的有效性,本文采用了阿曼的地震施工數(shù)據(jù)作為測(cè)試數(shù)據(jù),包括groundforce、vpreport、fleetreport、windLog、timeLog、地形文件、節(jié)點(diǎn)野外狀態(tài)、spsConfig、RlineCofig、日?qǐng)?bào)等數(shù)據(jù)文件。
通過散點(diǎn)圖,很清楚的能看到具體某臺(tái)震源的異常值的范圍。
圖4 展示了節(jié)點(diǎn)的電量情況,綠色為電量充足,藍(lán)色為電量為50%-79%;黃色電量為20%-49%;紅色為電量小于20%報(bào)警。
通過折線圖的形式將2020-04-24 00:00:00 到2020-04-24 23:59:59 時(shí)間段的風(fēng)速和溫度展示出來(lái),能夠直觀的判斷風(fēng)速和溫度的值是否異常。
以柱狀圖的形式展示了2020-04-24 每小時(shí)每臺(tái)震源的總炮數(shù),同時(shí)可以選擇要查看的震源。
以柱狀圖的形式展示了2020-04-24 每臺(tái)震源每種地形的施工總炮數(shù),可以選擇要查看的震源,同時(shí)以表格的形式統(tǒng)計(jì)出了每種地形的總炮數(shù)。
實(shí)際數(shù)據(jù)的測(cè)試顯示,文中根據(jù)混采的室內(nèi)質(zhì)控流程實(shí)現(xiàn)的生產(chǎn)數(shù)據(jù)管理系統(tǒng),能夠滿足野外生產(chǎn)對(duì)數(shù)據(jù)管理的需要,方便了數(shù)據(jù)管理,提高了質(zhì)控的精度和效率,減少了人為的干預(yù)和主觀因素的影響,非常適合海量數(shù)據(jù)下的生產(chǎn)數(shù)據(jù)管理。該系統(tǒng)充分利用了物探生產(chǎn)與信息化手段的緊密結(jié)合,為大規(guī)模的應(yīng)用到生產(chǎn)數(shù)據(jù)管理中提供了可能性。目前該系統(tǒng)的功能尚不完善,需要結(jié)合野外生產(chǎn)需要,進(jìn)一步完善并開發(fā)新的應(yīng)用,另外正在轉(zhuǎn)型采用微服務(wù)的形式來(lái)繼續(xù)后續(xù)的開發(fā)工作。