文 兵
(成都理工大學,四川 成都 610000)
土壤重金屬反演的基本數據包括土壤的光譜數據和地球化學分析數據。地球化學分析數據一般是采集地面樣本點的表層土壤,然后對土壤樣本的化學成分進行檢測,進而得到土壤各元素含量數據。光譜數據來源主要可分為兩方面,地面波譜測試儀和機載、星載遙感測量波譜儀。目前地面波譜儀最常用的儀器是美國 ASD公司(Analytic Spectra Devices)的系列產品。而機載、星載傳感器是各國發射的一些列高空間和高分辨率衛星傳感器。
在建模之前我們一般會對光譜數據預處理,進行一些變換,如對數、倒數對數、一階微分、二階微分、連續統去除、連續小波變換等方法。用這些方法對光譜數據進行預處理是為了光譜平滑、消除了噪聲和基線漂移,并且還突出了光譜特征波段的位置。
在建模之前,首先必須選擇最佳波段進行反演。最佳波段的選擇問題一般采用診斷指數法,就是判斷光譜反射率與重金屬元素或者間接物質的相關性,在這其中最常見的就是皮爾遜相關系數法。
當前,運用土壤反射和輻射光譜來預測重金屬含量,通常采用經驗模型的方法。經驗模型的常用建模方法包括單變量回歸,主成分回歸,多元逐步線性回歸,偏最小二乘回歸,人工神經網絡回歸等。
單變量統計分析主要選擇土壤重金屬含量與光譜反射率之間相關性最大的譜帶,以建立預測模型。有2種方法:一種是直接單波段分析方法;另一種是直接單頻帶分析方法。
主成分回歸是一種分析多元共線性問題的方法。將光譜數據轉換為主要成分負荷矩陣和得分矩陣,提取獨立變量以建立回歸方程,模型的準確性取決于均方根誤差大小。
多元逐步回歸方法是通過雙向過濾引入了有意義的變量,并刪除了無意義的變量。它通常用于識別某些物質敏感的波段,然后通過物質的含量與其反射率之間的相關性估算出研究區該物質的含量分布。
偏最小二乘回歸集成了多元線性回歸分析、典型相關分析和主因子分析的特點,因此廣泛用于光譜數據處理。偏最小二乘回歸方法克服了多元線性回歸分析面臨的多重共線性問題,可以更有效地提取光譜信息,因而用它得到的反演模型更加準確。
人工神經網絡可以學習要表達的任何內容。它具有一定的自學習、自組織和自適應能力,強大的容錯能力,信息的分布式存儲和并行處理以及強大的非線性逼近能力。
由于高光譜數據具有內部相關性較高的海量光譜數據,因此多元線性回歸和主成分回歸方法在重金屬含量反演建模中并不適用。偏最小二乘回歸方法可以在海量波段和自相關嚴重的情況下進行回歸建模,較好地解決了多重共線性問題,更適合重金屬含量反演。另外,神經網絡技術、遺傳算法和支持向量機等方法的發展,將促進重金屬含量反演技術的發展。
目前,在土壤重金屬反演研究中,線性偏最小二乘回歸是應用最廣泛的方法。各種非線性機器語言反轉方法如神經網絡等方法仍在探索中。目前土壤重金屬建模方向存在的問題如下。
(1)建模方法相對單一,通常是單個線性或非線性模型,亦或是它們的組合,這些數學模型不具有通用性。今后的發展可以考慮將環境因素融入模型使它具有通用性。
(2)土壤重金屬污染元素類型很多,單獨研究這些元素與光譜關系通常得不到較好結果。如果將土壤的成分與光譜進行分析將有更好的反演模型。
(3)目前對光譜中有效信息提取的方法不夠成熟,在建模過程中模型很容易被光譜噪聲干擾。
(4)土壤重金屬反演的基本機理條件尚未明確。今后土壤重金屬反演的發展方向,多開發利用一些非線性數學分析方法,如支持向量機;將線性和非線性方法相結合,將提升對土壤中金屬含量的預測精度。利用AI人工智能和大數據算法對高光譜影像提出新的更有效的反演方法,研究重金屬定量反演的物理機理也是一個熱點方向。