尹維翰 齊衍萍 樊曉杰
(1.國家海洋局北海環境監測中心 山東 青島 266033;2.國家海洋局海洋溢油鑒別與損害評估技術重點實驗室 山東 青島 266033;3.中國海洋大學海洋地球科學學院 山東 青島 266100)
空間插值作為一項基本的空間分析技術,已開始應用于海洋環境評價領域,從基礎的海洋環境因子等值線和等值面圖的繪制,到建立在插值平面基礎上的環境因子時空變化分析[1]、環境綜合評級[2]、海洋系統動力學模型等等。目前已成為海洋海洋環境評價不可或缺的工具之一,但它也是海洋環境評價中的薄弱環節。在多數的研究中,也并不重視進行插值方法的篩選和差值參數的優化。使用不合適的方法或參數,會造成嚴重的插值噪音,使變化趨勢難以辨識,甚至會產生扭曲的變化趨勢,誤導推理和判斷,產生錯誤的決策結果[3]。
插值方法的篩選、條件的優化已經成為空間差值技術在各領域應用研究的熱點,在氣象、土壤、遙感等領域都有廣泛報道,但在海洋環境評價領域研究甚少。李峋曾利用高維空間插值在海洋環境數據預處理中的應用進行了研究,而針對海洋環境污染面積評估研究還未見有報道。因此,本文利用渤海海洋環境監測資料,在探索性空間數據分析和數據轉化的基礎上,分別使用3種方法對渤海各類水質面積進行插值,最后對各項優化措施效果進行驗證,為海區海水污染面積評估提供了理論依據,為海洋行政主管部門提供了有力的技術支撐。
國家海洋局北海分局 2010 年在渤海區(〈121.1630E,38.7370N〉和〈120.8690E,37.8240N〉兩點連線以西的渤海海域)監測任務。

圖1 渤海海域監測站位分布
監測站位如圖1所示。監測采樣和樣品分析均按照《海洋監測規范GB 17378-1998》來進行。
檢驗數據的正態分布性是使用空問統計學變異函數計算和克立格法進行土壤質量空間分析的前提,只有當數據服從正念分布時,空間插值才有效。對不符合正念分布的變量數據進行對數轉換后再進行檢驗。目前,國內常用的方法有單樣本K-S檢驗和多樣本的Q-Q圖檢驗和直方圖檢驗。K-S檢驗是利用樣本數據推斷總體是否服從某一理論分布,因其主要用來做單樣本數據探討,本文不做進一步討論。
Q-Q圖和直方圖均是通過觀察數據的效果圖來判斷數據是否服從正態分布。Q-Q圖是其橫坐標為改變量的觀測值,縱坐標為位數。若該組數據服從正態分布,則圖中的點應該形成近似y=x直線。非標準正態分布的斜率為樣本標準差,截距為樣本均值。直方圖又稱質量分布圖、柱狀圖,它是表示資料變化情況的一種主要工具。用直方圖可以解析出資料的規則性,比較直觀地看出產品質量特性的分布狀態,對于資料分布狀況一目了然,便于判斷其總體質量分布情況。不難看出,此兩種方法均依靠主觀觀察來鑒別樣品數據是否符合正態分布,人為因素往往會導致錯誤的判斷,如圖2所示,直方圖直接觀測數據應該符合正態分布,但經檢驗AD=1.1>1,實為非正態分布。

圖2 直方圖正態分布檢驗
基于此,本文推薦采用Anderson-Daeling檢驗,該檢驗是Anderson-Daeling1954年提出的檢驗統計量A*,以此來度量經驗分布函數與總體分布函數的偏離程度:

若A*<1,則樣本數據符合正態分布。該方法功效隨樣本容量的增大而增大,隨顯著性水平的提高而增大[4]。
根據海洋環境因子的空間變異性對環境因子的空間插值技術進行了分析比較,以選出一種適合的插值算法處理評價結果,使輸出面的灰度數值分布的失真度為最小,確定擬合較優的插值方法。
反距離加權法是一個加權平均插值法,可以進行確切的或者圓滑的方式插值。方次參數控制著權系數如何隨著離開一個格網結點距離的增加而下降。對于一個較大的方次,較近的數據點被給定一個較高的權重份額,對于一個較小的方次,權重比較均勻地分配給各數據點。計算一個格網結點時給予一個特定數據點的權值與指定方次的從結點到觀測點的該結點被賦予距離倒數成比例。
樣條函數是使用函數逼近曲面的一種方法。樣條內插的本質是利用數學方法產生一組已知采樣點的平滑曲線,并依據這條曲線來估計每個點的屬性數據值,在計算過程中要求通過已知樣本點的曲面的曲率最小。理論上采用高階多項式進行插值估計可以得到高階平滑結果,但實際研究中較多采用二階多項式估值。
克里金插值法以空間自相關為基礎,利用區域化的變量的原始數據和變異函數的結構特點,對未知點的區域化的變量進行線性無偏最優估計的一種插值。具體地說克里格插值要求所有點屬性值服從正態分布。更詳細的講,克里金法是根據未知點有限鄰域內的若干已知點的測量值關系,與未知樣本點相互空間位置關系,以及變異函數提供結構信息之后,對未知點值進行的一種線性無偏最優估計。
樣條函數不需要對空間結構進行預先估計和作統計假設,只進行局部區塊的擬合,但作為一種函數方法,難以滿足對于利用有限的觀測數據進行缺值預測和內插格網的精度要求,也難以對誤差進行估計,樣本點稀疏時插值效果不好。
反距離加權法計算開銷少,具有普適性,不需要根據數據的特點對方法加以調整。但其作為一種幾何方法,插值結果受r值的影響很大,根據不同r值估算的同一未知點的值會有很大的差別。當任何一個曲卸(1≤i≤n,1≤r≤n)時,該點權值為無窮大,導致該點的輸出數據不連續,計算時會得到其實際測量值,在進行外插值時,反距離加權法會不恰當地將這些估計直回歸為觀測數據的平均值。
克里金插值法以空間統計學作為理論基礎,可以克服內插中誤差難以分析的問題,能夠對誤差作為這逐點的理論估計,不會產生回歸分析的邊界效應,插值精度較高,唯一性很強,外推能力較強。克里金插值的不足時做為一種地統計學方法,復雜,計算量大,運算速度慢,需要較高配置的高性能計算機,但其已經作為最重要的插值方法在GIS領域中得到應用。
對3種插值方法的插值中誤差進行比較,存在較大差異,在進行不均勻分布數據中,克里金插值法可以得到了較好的精度結果,因此本文推薦選用克里金插值法作為渤海海水污染面積評估的插值方法[5]。
對單樣本K-S檢驗和多樣本的Q-Q圖檢驗和直方圖檢驗以及Anderson-Daeling檢驗研究表明,Anderson-Daeling檢驗更適合海洋環境監測領域中的多樣本數據空間轉化分析和正態分布檢驗,且該方法能夠較客觀的反應數據本質,受人為主觀影響較小。
對三種插值方法的研究表明,克里金插值法更適合渤海海域污染面積評估中應用。從海洋環境研究角度講,它根據已知監測站位點上環境要素變量,如某種污染物濃度的實測數據,對環境要素變量進行結構性(變差函數模型的確定)分析之后,為了對待估點做出一種線性、無偏、最小方差的估計,而對周圍已知站位點的測量值賦予一定權系數,進行加權平均來估計待估點環境要素變量的方法。
因海洋的流動性、邊界的不確定性,生物地球化學循環等復雜性等,空間插值分析如何在海洋環境監測領域應用需進一步研究。
[1]蔡文貴,賈曉平,李純厚.基于GIS的粵西海域浮游植物的時空變化分析[J].生態學報,2004,24(100):2143-2148
[2]蔡文貴,李純厚,林欽,等.粵西海域餌料生物水平及多樣性研究[J].中國水產科學,2004,11(5):440-446.
[3]Mitas L,Mitasova H.Spatial interpolation methods in GIS.In:Longley P A ed.Geographical information system.Volume 1,principles and technical issues,second edition[J].New York:Join Wiley&Sons,1999:452-461.
[4]章剛勇,阮陸寧.基于Monte Carlo隨機模擬的幾種正態性檢驗方法的比較[J].統計與決策,2011,4(7):17-20.
[5]劉光孟,汪云甲,張海,等.空間分析中幾種插值方法的比較研究[J].地理信息世界,2011,8(3):41-45.