劉重陽
(遼寧省地震局,遼寧 沈陽 110034)
地下流體觀測井井體內部監測得到的溫度數據通常會在一個預設范圍內上下波動,溫度允許波動范圍被稱之為公差,而當監測結果數據大于波動范圍時,可以認為此時井內溫度存在超差現象[1]。當發現溫度發生急劇變化時,可以預測地區存在短期或鄰近階段的地震災害。但由于部分地區的氣象臺的監測能力較差,無法及時感知地震前區域的異常變化,容易導致地區經濟遭受了大量損失、地區居民出現人身安全威脅的情況發生[2]。因此我國在各地建立了多個地下流體觀測井,通過對井內溫度的及時監測,發現自然災害前的異常現象。為了全面落實并推進此項工作,本文引進數據挖掘技術,以地下流體觀測井為例,設計一種針對井內溫度數據超差異常現象的全新監測方法,通過對溫度異常現象的及時感知,發揮地下流體觀測井在地區更高的作用與效能。
為了精準監測的需求,應明確井內溫度超差的判定依據[3]。定義地下流體觀測井溫度數據集合表示為D,獲取溫度數據的數量表示為q(樣本數據集合表示為q),設定q 在D 中是以多概率ξ 值存在的。此時,q 的表示方式為q^,q 的取值范圍為σ,當q^∈D 時,此時井內的溫度數據為超差異常數據[4]。在此基礎上,設定采集溫度數據樣本的所有數值滿足σ 在空間內的高斯分布特征,則q 的正常溫度值概率的95.0%應滿足±2σ 的均值相差要求,而不滿足上述要求的溫度數據便屬于超差異常數據。
給定地下流體觀測井溫度數據流為s,在對井內溫度進行采樣內,假定兩次連續采樣的溫度數值均不滿足±2σ 的均值相差要求,即兩個連續采樣數據均為溫度數據超差異常數據,進行超差異常判定依據的描述[5]。表達式如下:

公式(1)中:r 表示為溫度超差判定依據;i 表示為溫度數據采集樣本中的遺忘因子。為了確保設定依據的準確性,設定r 的取值范圍在0~1 之間。
采用建立井內反饋溫度數據倉庫的方式,對不同測點的溫度進行反饋[6]。在此過程中,設定地下流體觀測井參數信息、溫控參數,設定>10.0 個光纖溫度測點,建立多個基于Access 的關系數據庫。采用集成數據庫Visual C++技術,對溫度監控過程進行可視化處理,確保編程技術可以集成或應用在溫度監控過程中時,插入溫度數據倉庫信息表,建立全過程可視化的數據倉庫技術框架[7]。
數據倉庫共由源端數據、ETL 技術建庫、數據倉庫核心存儲和處理工具四個部分組成。通過直接監測的方式進行溫度信號的反饋,部分數據具有冗余、隨機等特點[8]。在數據樣本集合中進行主題數據的抽取,對采樣數據進行格式的統一化處理。對反饋的此部分數據進行清洗處理,清除數據集合中的冗余數據、重復數據、錯誤數據、亂碼數據等,將剩余數據按照元數據的標準描述方式導入數據倉庫層[9]。通過對大量數據的統計處理與分析后,根據數據的類別進行統一化處理,為終端監控與預警提供決策。
引進數據挖掘技術,通過對倉庫中歷史溫度數據的選擇、溫度數據的處理與數據格式的標準化轉換,實現對數據集合的高效率、頻繁檢索,從而獲得更加高質量的溫度數據集合[10]。數據挖掘過程的本質是對溫度數據的降噪、轉換、增添等過程,通過對大量異常數據的提取,挖掘溫度數據的變化規律。
利用數據挖掘技術中的關聯規則,對建成的數據倉庫集合進行反復迭代處理分析,找出不同溫度指標之間的內在聯系,通過對指標的調整實現對溫度數據的頻繁檢測。使用SQL 軟件,建立一個針對數據倉庫的關聯規則挖掘模型,根據不同數據集合的強關聯,進行溫度數據最大閾值與最小閾值的設定,將規則數據中置信度大于閾值的規則數據作為此次挖掘的關聯規則[11]。根據數據挖掘規則,建立一個溫度數據頻繁項數,對其進行描述,如下計算公式所示:

公式(2)中:s(A)表示為溫度數據s 頻繁項數;t 表示為溫度數據事務元素;T 表示為溫度數據事務元素集合;P(A)表示為溫度數據頻繁項集。其中T=t1;t2;t3;…;tn。完成對頻繁檢索集合的描述后,找出數據集合中的非空子集,將其表示為B,按照頻繁項數的導出規律,進行溫度數據集合的頻繁檢索,將此過程用下述計算公式表示:

公式(3)中:Bc表示為溫度數據頻繁檢索過程;C 表示為溫度數據集合中的非空真子集。
引進模糊ARHMM 算法,對處理后的數據超差異常現象進行監控與預警。建立溫度數據馬爾科夫鏈,通過溫度數據集合之間的聯系,對溫度狀態進行轉移,將溫度轉移的狀態與情況用初始化概率參數表示,將參數表示為π,利用π建立一個溫度狀態數據轉移矩陣,將矩陣表示為R,對R 的描述可用下述計算公式表示:

公式(4)中:aij表示為溫度狀態數據轉移矩陣中的狀態量;N 表示為矩陣行數與列數。為了確保對溫度數據的高精度監控,對上述計算公式中的aij進行描述,aij計算公式如下:

公式(5)中:P 表示為地下流體觀測井溫度數據發生轉移現象的概率;St表示為溫度超差數據的狀態描述方式;sj表示為預測溫度數據值;sk表示為觀測溫度數據值。將計算得到的溫度數據進行串聯處理,即可得到一個針對地下流體觀測井的溫度超差馬爾科夫鏈。完成處理后,將溫度數據鏈導入AR 數據觀測模型,對溫度數據的超差現象進行描述,將描述后超出預設范圍的溫度數據作為超差數據,通過此種方式,實現對井內超差溫度的監控,將此過程表示下述計算公式:

為了滿足此次實驗的真實性需求,選擇青海玉樹中心區域外圍700.0km 位置的地下流體觀測井為實驗對象。獲取與此井孔相關的數據信息,具體內容如表1 所示。
產婦在順產時,胎兒的娩出會使得陰道極度擴張,雖說產后會自動復原,但依然會有不同程度的變化,對于有些陰道重度撕裂的女性來說,甚至會影響性生活。別擔心,產后這些盆底康復訓練助你和陰道松弛say byebye!

表1 地下流體觀測井構造描述
為了確保地下流體觀測井可以在該地區發揮應有的效果,在對其進行設計時,在所有井孔內布設HYJH1-A1100型號的電子式溫度計,用于井內溫度測量與反饋。
此次實驗以已知的青海玉樹地震信息作為研究對象,將井內溫度數據庫中2009 年10 月~2011 年5 月水溫觀測分鐘值數據作為樣本數據。設定此地下流體觀測井在投入使用后的公差,明確井內溫度數據的上限值。通過對數據的處理,統計井孔月超差溫度數據(當月超出3.0 倍公差的溫度數據個數)、每月導入的數據量。數據完整度為98.54%,月導入數據量為92215bit,月超差溫度數據均方差為0.0023。
完成對本次實驗的部署與樣本數據的采集后,將本文設計的方法集成在地下流體觀測井計算機監測終端,建立HYJH1-A1100 型號的電子式溫度計與計算機監測終端之間的通信連接。
在監測終端上設定一個地下流體觀測井溫度數據公差(將公差值表示為A),即溫度界限值,以此種方式,實現對監測終端相關參數的設計。
在此基礎上,設定地下流體觀測井溫度數據超差判定依據,收集并獲取地下流體觀測歷史數據,按照標準進行歷史數據的處理,建立一個針對地下流體觀測井反饋溫度的數據倉庫,將相關數據參照標準導入數據倉庫中。引進數據挖掘技術,對不同溫度數據進行深度分析,掌握數據之間的關聯性與規則,實現對前端HYJH1-A1100 電子式溫度計反饋數據的多次迭代與頻繁檢索。引進模糊ARHMM 算法,對比反饋的溫度數據與公差值,實現對地下流體觀測井溫度數據超差異常的監測。根據終端監測的結果,對超差溫度數據進行預警。
將樣本數據按照月份順序導入計算機監測終端,將監測結果繪制成平滑的曲線以便于后續分析。地下流體觀測井溫度超差異常監測結果如圖1 所示。

圖1 地下流體觀測井溫度超差異常監測結果
上述圖1 中,A 表示為地下流體觀測井溫度數據公差。根據圖中曲線的變化趨勢可以看出,井內溫度共發生過4.0次突跳,分別發生在2 月~3 月、4 月初、5 月初、6 月~7 月,在7 月~12 月,井內溫度監測結果未超過公差值,即沒有發生溫度超差異常現象。根據監測終端技術人員反饋,從開始監測到完成監測,終端共觸發四次預警,與前端井內溫度共發生過4.0 次突跳對應,由此可以證明,本文此次設計的監測方法,可以實現對地下流體觀測井溫度超差異常的有效監測,即本文方法在實際應用中具有一定可行性。
完成對本文設計方法可行性的檢驗后,為了進一步證明本文方法在使用中的優勢,選擇基于BIM 及SQL-SERVER的監測方法(方法1)與基于WeMos D1 物聯網的監測方法(方法2)作為傳統方法,進行本文方法與傳統方法監測效果的對比。
實驗中,隨機抽取一段時間的地下流體觀測井溫度數據,在已知井內真實溫度數值的基礎上,分別使用上述提出的傳統方法1 與傳統方法2,進行區段溫度的監測。為了更加直觀地評價監測方法對溫度的監測效果,將監測結果繪制成折線圖,如圖2 所示。

圖2 傳統監測方法與本文監測方法監測效果對比
從上述圖2 中可以看出,本文方法監測溫度數值與地下流體觀測井真實溫度數值幾乎一致;傳統方法1 監測溫度數值與地下流體觀測井真實溫度數值變化趨勢一致,但部分監測結果數據與實測數據存在誤差;傳統方法2 不僅存在監測溫度數值與地下流體觀測井真實溫度數值差異較大的問題,還存在部分溫度數據監測結果缺失的現象。
在此基礎上,獲取實驗結果,對三種溫度數據超過異常監測方法的監測精度進行比較。通過測試可知,傳統方法1的最大相對誤差為3.61,均方差根誤差為4.05,平均相對誤差為4.77;傳統方法2 的最大相對誤差為3.28,均方差根誤差為2.17,平均相對誤差為3.09;而本文方法的最大相對誤差為0.56,均方差根誤差為0.38,平均相對誤差為1.24;由此看出本文方法監測結果的最大相對誤差、均方差根誤差、平均相對誤差,均小于傳統方法,可以實現對溫度的高精度監測,從而提高監測結果與真實結果的一致性。
本文從設定地下流體觀測井溫度數據超差判定依據、建立地下流體觀測井反饋溫度數據倉庫、溫度數據頻繁檢索、基于模糊ARHMM 算法的數據超差異常監測與預警四個方面,完成了基于數據挖掘的地下流體觀測井溫度數據超差異常監測方法設計。并在完成此方面內容的設計后,通過對比實驗證明了本文設計的方法,可以實現對溫度的高精度監測,從而提高監測結果與真實結果的一致性。因此,可在后續對地下流體觀測井的監測中,使用本文方法代替傳統方法使用,以此種方式,獲取精度更高的溫度數據監測值,為地區地震等自然災害的發生給予正確預警與判斷。