胡 斌,楊 敏,徐 棟,周 寅
(國家海洋局北海海洋技術保障中心,山東 青島 266034)
隨著國家對海洋油氣的需求越來越大,海洋油氣勘探開發活動越來越多,與此對應的海洋石油平臺排污及溢油的風險也在相應增加[1]。因此對海洋石油平臺日常運行產生的生產和生活污水進行實時監控非常必要,這樣便于及時掌握海洋石油平臺的排污情況[2]。但現實情況卻是海洋石油平臺的排污監測自動化程度較低,實時性較差[3]。平臺的排污監測基本依靠平臺上的人員對排污口進行樣本采集,再進行實驗室化驗,最后將化驗結果傳回陸地。這種工作模式的弊端就是工作效率較為低下,且實時性較差[4]。所以開發一套能實時在線自動監控石油平臺排污的系統有很大的必要性[5]。本文通過前期對石油平臺的調研和對比,基本選定在線監測生產和生活污水的兩個主要監測要素:一個是水中油濃度的監測,其主要針對生產污水;另一個是COD的監測,其主要針對生活污水[6]。同時兼顧溫度和流量的監控。通過對這些要素的監測,實現對石油平臺的生產和生活污水的排放監控[7]。
本系統在現有的石油鉆井平臺污染物排放監測數據采集系統的基礎上,以先進的數據流加工、科學存儲、大數據分析及可視化等技術為基礎構建。本系統平臺的總體技術架構可以分為硬件和軟件兩個部分[8]。
本系統的硬件及網絡結構設計如圖1所示。經公網以WebService的形式從阿里云服務器中定時抓取最新一次的監測數據,并按照既定規則計算、處理后存儲至本地服務器的數據倉庫中。基于本地數據倉庫中的數據開發出的分析報表發布在本地Web服務器上,內網用戶通過瀏覽器可以直接訪問查看本系統。同時需要時可以透過內網防火墻,外網其他相關的業務用戶也可以通過瀏覽器實現跨平臺訪問[9]。

圖1 硬件及網絡結構設計
本系統可對監測到的溢油數據進行高效的采集、聚合、加工、存儲、分析、可視化展示等。軟件的功能架構設計如圖2所示。根據數據流程分為數據接收處理、數據存儲、數據可視化展示三部分。
(1)數據處理:將海洋石油勘探開發污染物排放監測數據按照定制的規則和邏輯進行自動清洗、加工,最終形成標準化的數據形式。
(2)數據存儲:海洋石油鉆井平臺污染物排放監測數據倉庫平臺的設計與搭建基于實際業務分析需求,結合數據規模,設計海洋石油勘探開發污染物排放檢測數據倉庫系統平臺,將標準化的監測數據進行存儲和讀取。
(3)數據可視化展示:將海洋石油鉆井平臺污染物排放監測數據在用戶端進行可視化顯示,提高用戶體驗。
針對水中油濃度和COD數據特點,本文對這兩類數據主要進行了三類分析處理,分別是曲線擬合、異常值判斷和數據校正。通過這三類分析基本上能將數據進行清洗和分類,達到數據預處理的效果[10]。
測得的油濃度和COD數據是一個隨時間變化的變量,在一定時間內,通過曲線擬合的方式,選擇適當的曲線類型來擬合觀測數據,從而對數據和時間建立線性的對應關系。
本文采用的是最小二乘法多項式曲線擬合。最小二乘法多項式曲線擬合的基本定義是:根據給定的一段時間內的n個離散的觀測點數據P(Sn,Tn),求得擬合多項式曲線y=F(Sn,Tn),所得多項式曲線與數據給定點的平方和最小(式(1)),即認為是最接近觀測數據的曲線。
(1)
通過曲線擬合的方式,不僅僅能描述觀測數據和時間的關系,并且還能將離散點(每隔半小時觀測一次)的數據連續化,提高數據質量。圖3即為擬合后的數據曲線。
不管是傳感器本身出現問題還是數據在通信的過程中出現問題,系統都有可能會出現數據異常的情況,這就需要對異常數據進行判斷和剔除,并報知系統管理者,對異常情況進行具體分析。由于數據量測量次數較多,故而對異常值的判定選用比較通用的拉依達準則(3δ),該準則的標準就是認定數據整體是符合正態分布的(基本符合此規律),因而在監測的數據值中出現大于或者小于3倍均值方差的數據概率極小,所以認為大于或者小于3倍均值方差的數據即為異常值[11]。

圖2 軟件功能架構

圖3 數據擬合曲線
當然這個算法是基于統計學概念的算法,有一定局限性,在本系統的應用中,會對原始數據進行存儲,并不直接剔除,同時對判定的異常數據進行報警提示,故而可以通過監測人員來具體分析判斷是否為異常值[12]。
由于COD傳感器是采用進口的傳感器,在國內應用此傳感器并沒有相應的國家標準來標定,因此COD傳感器采集的數據需要一種手段來校正,以確保數據的真實性和可靠性。本系統是通過實驗室比對方式計算出相應的經驗公式,再通過數據接口操作對數據進行校正[13]。
COD的經驗校正公式為:
COD=K×SAC+d
(2)
SAC=UV/L
(3)
其中SAC為紫外光吸收系數,可由傳感器UV值和L(液層厚度)計算得出;K為比例系數,d為補償系數,通過傳感器與實驗室實驗的多組比對測試,可以計算得出K和d的經驗期望值。將經驗系數帶入式(2)即可求出COD的校正后數值。
每個傳感器的經驗系數都不同,需要每次對新的傳感器設備進行實驗室測試得出,故而在本系統的管理模塊增加了可設置的變量,使得系統可以對每個傳感器設備分別進行相應的系數設置,保證校正數據的真實性和可靠性。
本系統除了對本身監測數據進行分析和處理,還在此基礎上對監測數據進行了一定程度的挖掘,現階段系統主要是對監測到的數據進行置信度的分析和污染物貢獻值分析。
置信度分析主要是針對監測到的數據在一段時間內的一個樣本統計分析,展現監測數據以“一定概率”出現在一個測量結果范圍的程度,即出現在置信區間內的概率是多少。
在本系統的設定中,首先固定置信率,然后求得置信區間的范圍。分別設置置信率為90%、95%、99%,計算出相應的監測值會出現的區間范圍。
置信區間為:上限A=M+n×ST;下限B=M-n×ST。其中M為平均值,ST為標準差,當置信率為90%時n=1.645;當置信率為95%時n=1.96;當置信率為99%時,n=2.576。分別根據這三個置信率計算置信區間Confidence interval=[B,A]。
系統采集的監測數據都是排污水中含油或者有機物的濃度數據,對管理者來說直接觀測這些數據并不能直觀地認識平臺排污的量級,并進而分析對環境的影響,故而需要對數據進行再加工,計算平臺一段時間內排污的總量,即污染物貢獻值。污染物貢獻值=監測濃度數據×流量。本系統通過此公式將一定時間內排海總量進行統計,計算出在此段時間內的平臺污染物貢獻值,為管理者更好地分析和研判平臺對周邊環境的影響提供支持[14]。
本文從石油平臺排污實時在線監測需求出發,以數據處理為導向,開發研制了海洋石油平臺污染物排放在線監測系統。系統除了具備數據接收和處理的基本功能,在此基礎上還拓展了數據挖掘及展示功能,能更加飽滿地展示整個系統的運行情況。本系統現階段已經接入部署在岐口18-1油田的在線監測設備,運行效果良好,并且系統也預留了相應的接口,可以在后期加入更多的石油平臺監測設備,擴展性及兼容性良好。