唐莉
(大慶師范學院數學科學學院,黑龍江 大慶 163712)
氣相色譜法是利用氣體作流動相的色層分離分析方法。汽化的試樣被載氣(流動相)帶入色譜柱中,柱中的固定相與試樣中各組份分子作用力不同,各組份從色譜柱中流出時間不同,組份彼此分離。采用適當的鑒別和記錄系統,制作標出各組份流出色譜柱的時間和濃度的色譜圖。根據圖中表明的出峰時間和順序,可對化合物進行定性分析;根據峰的高低和面積大小,可對化合物進行定量分析。具有效能高、靈敏度高、選擇性強、分析速度快、應用廣泛、操作簡便等特點。適用于易揮發有機化合物的定性、定量分析。對非揮發性的液體和固體物質,可通過高溫裂解,氣化后進行分析[7]。氣相色譜分析常被用在地化分析技術當中,在漫長的地質歷史過程中,水中的細菌就與部分烴類發生菌解和氧化作用,使正構烷烴減少,異構烴類與雜原子化合物增加,導致色譜峰較油層低,輕組分相對減少,主峰碳明顯,碳數范圍變窄等。經過對樣品分析結合試油資料,就可以總結油層、油水同層、水層的典型譜圖特征[10]。
在應用過程中總結了不同油質類型的譜圖特征基本上響應值是以正態分布為主,峰形為三角形(包括前三角形、后三角形)、馬鞍型等。用這些特征來判斷油水層基本上是以圖形來定義油水層特征,屬于定性判斷,且圖形的微觀變化無法表示出來,并且受人為因素影響太大,因此如何將圖形數字化,用數字描述圖形,建立氣相色譜譜圖解釋模型;從氣相色譜譜圖解釋模型入手,尋找敏感參數,建立定量解釋標準是急需解決的難題[11]。
氣相色譜分析技術可以檢測儲層中可流動部分的烴類,從氣相色譜譜圖解釋模型入手,尋找敏感參數,為定量解釋標準的建立奠定基礎[9]。
氣相色譜圖目前可以由保留時間-響應值的坐標系、碳數-峰高坐標系、碳數-飽和烴面積坐標系及碳數-質量分數坐標系四種形式顯示[12]。無論以哪一種形式顯示的譜圖,其大致形狀是一致的。下面以碳數-質量分數坐標系的形式來對譜圖的形態進行分析。從碳數-質量分數坐標系下的氣相色譜圖的形態可以聯想到正態函數該函數取不同的σ值和不同的μ值時的圖形如下。

圖1 正態函數圖像
為了很好地對氣相色譜圖進行表征,首先需要確定要表征的圖形對象。原始譜圖的橫坐標是保留時間,縱坐標是響應值[8]。由于各種組分的保留時間不一致,因此本文將碳數作為橫坐標,分別將峰高、峰面積、質量分數作為縱坐標,再對離散數據點進行擬合。當峰高、峰面積為縱坐標時,氣相色譜擬合圖數值差別較大,不容易進行對比,但取質量分數為縱坐標時的擬合卻很好,一方面保留了圖形的信息,另一方面不同井、層位和深度的差異相對很小,只是形狀有些差異,比較便于進行表征。因此表征的對象定為將碳數作為橫坐標、將質量分數作為縱坐標的氣相色譜圖[14]。
在后面的分析中會看到,氣相色譜圖表征的出發點是分段表征,因此要求在分段表征前先對所有離散數據點合理地分成幾段[15]。離散點的分布從整體上看具有明顯的變化趨勢,但是離散點有時高、有時低,因此要對所有離散點進行整體擬合,以確定色譜圖是單峰還是雙峰。作整體擬合的另外一個原因是要用整體擬合函數的峰值點將所有離散數據點進行分段并參與分段后的擬合[16]。
函數擬合最常用的方法是最小二乘法,該法選取的基函數是{1,x,x2, …,xn},其最后一步要解一個線性代數方程組,而此方程組的系數矩陣是Hilbert矩陣,這就不易得到準確的擬合函數,出現這個問題的原因是基函數選擇不恰當。所以,我們構造正交多項式族作為基函數,這時再求擬合函數的系數時,不用解方程組,不僅克服了系數矩陣病態的問題,同時也大大減少了計算量[17]。方法的原理如下:
假設給定m+1個數據點(xi,yi),i=0, 1, …,m其中x0<x1<…<xm。求n次(n<m)多項式使得在m+1個給定點上的偏差平方和最小。先約定關于點集{x0,x1, …,xm}的內積定義為
(1)正交函數族的構造
首先從線性無關的函數族{1,x,x2, …,xn}出發,利用施密特正交化方法構造出如下的函數族

其中

下面證明這樣構造的函數族確實是關于點集{x0,x1, …,xm}正交的。
由上述的表達式有

現假定(Pl,Ps)=0(l≠s)對s=0,1,…,l-1及l=0,1,…,k;k<n均成立。要證(Pk+1,Ps)=0,s=0,1,…,k,
由于(Pk+1,Ps)=((x-γk+1)Pk,Ps)-βk(Pk-1,Ps)=(xPk-Ps)-γk+1(Pk,Ps)-βk(Pk-1,Ps)
由歸納法假定,當0≤s≤k-2時(Pk,Ps)=0,(Pk-1,Ps)=0
另外,xPx(x)是首項系數為1的s+1次多項式,它可由P0,P1,…,Ps+1的線性組合表示,而s+1≤k-1,固由歸納法假定又有(xPx,Ps)≡(Pk,xPs)=0,所以當0≤s≤k-2時,(Pk+1,Ps)=0。
由(Pk+1,Pk-1)=(xPx,Pk-1)-γk+1(Pk,Pk-1)-βk(Pk-1,Pk-1)及假定有(Px,Pk-1)=0得

由上式和βk的表達式得(Pk+1,Pk-1)=(xPx,Pk-1)-βk(Pk-1,Pk-1)= (Pk,Pk)-(Pk,Pk)=0
最后

至此就證明了多項式{Pk(x)}(k=0,1,…,n,n<m)組成一個關于點集{xi}正交系[19]。
(2)擬合函數的求取
令S(x)=a0P0(x)+a1P1(x)+…+anPn(x)

由P0(x),P1(x),…,Pn(x)關于點集{x0,x1,…,xm}正交,即(Pi,Pj)=0,i≠j,方程組變為

所以方程組的解為

ak求出后,擬合函數就為S(x)=a0P0(x)+a1P1(x)+…+anPn(x)。
由于利用了正交多項式擬合,減少了工作量,也避免解方程組時出現的病態性。關于n的值不宜取得過大,否則會出現震蕩現象,一般取n=5時擬合效果就很好了。由前面的分析看到圖形的寬窄由于函數中標準差σ的改變而發生變化,最高點的縱坐標也發生了改變,這對圖形表征不利[20]。因此我們選擇概率函數 來取代正態函數,k值的大小可以反映概率函數圖形的主要形態,參數個數變少了,還有明確的幾何意義,這兩類函數很適合作為表征函數[21]。
(1) 確定概率函數和二次函數的表征參數的數學方法研究
設此段離散數據點為(x0,y0), (x1,y1), (x2,y2),…,(xm,ym),其中整體擬合函數的頂點坐標為(x0,y0)[1]
兩邊取對數得:lny=lny0+k(x-x0)2
所以

即

所以

(2) 圖形的分段表征函數的確定
由于已確定了所有的離散數據點的分段,并且研究了對每一段離散數據點用概率函數進行表征時表征參數k的求取公式和用二次函數進行表征時表征參數a的求取公式[3]。接下來就是對每段數據點進行表征擬合,通過比較來確定哪一類函數表征擬合的效果好就作為該離散數據段的表征函數。可以發現有單峰有雙峰,經統一辨別,將所有譜圖定義為四段,當擬合的曲線為單峰時,僅有第一段、第四段函數的參數信息;為雙峰時,第一、二、三、四段函數的參數信息都存在[22]。
下邊首先對飽和烴氣相色譜表征過程進行完整的說明,接著給出表征結果的效果檢驗,最后給出表征參數的統一定義[4]。 飽和烴氣相色譜表征分以下四步進行:(1)選取數據庫中要表征的氣相色譜圖;(2)擬合,確定峰形和頂點坐標;(3)利用擬合頂點將數據點進行分段;(4)對每一段確定表征函數及相應的參數值。為了說明圖形表征及所求特征參數的有效性,需要定量分析利用特征參數恢復的圖形和原始圖形的近似程度[23]。
假設在原始離散點的坐標為(x0,y0), (x1,y1), (x2,y2),…,(xm,ym),每一段所選的特征函數及相應的特征參數其實就是得到了在區間[x0,xm]上的分段函數,求該分段函數在x0,x1, …,xm上的函數值,記為y0′,y0′,…,ym′。
(1) 圖2是得到的表征函數及其參數進行圖形恢復的效果圖,圖3是用擬合函數作為表征函數進行圖形恢復的效果圖[24]。

圖2 圖形恢復效果圖

圖3 圖形恢復效果圖
觀察圖形可知利用所研究的方法恢復效果的近似度大,且表征參數個數少,因此表征效果優于直接利用整體擬合函數作為表征函數進行表征的效果[6]。
(2) 圖4是利用研究所得到的表征函數及其參數進行圖形恢復的效果圖,圖5是用一個概率函數作為表征函數進行圖形恢復的效果圖[25]。

圖4 圖形恢復效果圖

圖5 圖形恢復效果圖
從恢復圖形的效果及近似度可以看出,利用所研究的方法恢復效果優于后者。同時也說明了研究中所提出的分段表征的科學性和正確性[26]。
觀察氣象色譜如圖6、圖7所示。

圖6 單峰

圖7 雙峰
從選取的函數來看,是二次函數及概率函數,因此,將分段函數做如下定義:第一段二次函數的特征參數用a1表示,第一段概率函數的特征參數用k1表示;第二段二次函數的特征參數用a2表示,第二段概率函數的特征參數用k2表示;第三段二次函數的特征參數用a3表示,第三段概率函數的特征參數用k3表示;第四段二次函數的特征參數用a4表示,第四段概率函數的特征參數用k4表示。
文章通過地化分析參數進行量化表征處理方法的研究,對氣相色譜資料進行數學表征,求取有效的評價參數,所建立的地化分析單項資料的處理方法,有效地提高了算法的全面性,并通過對實例計算驗證了算法的可行性及可用性,對地化分析參數進行量化表征處理方法的研究達到了預期的目的,為實際生產提供了很強的實際指導意義。本文的圖形表征時主要考慮飽和烴面積的質量分數,這為下一步將未分辨面積作表征奠定了基礎,接下來將進一步做探究。