李怡春 潘 愷 王昌昆 劉 婭 吳士文 劉 杰徐愛愛 潘賢章?
(1土壤與農業可持續發展國家重點實驗室(南京土壤研究所),南京 210008)
(2 中國科學院大學,北京 100049)
土壤顏色是土壤的一種重要屬性,能反映土壤組成和肥力狀況,甚至能指示土壤年齡,并表征某些土壤過程。不同類型土壤常具有不同的顏色,因而土壤顏色能輔助野外識別土壤類型[1]。土壤顏色與其他土壤屬性關系密切。當有機質含量較高時,土壤通常呈現暗棕色或黑色[2]。當赤鐵礦的含量較高時土壤呈現紅色,而針鐵礦含量較高時土壤呈現黃色[3]。土壤顏色受水分影響很大,通常濕態較風干態顏色更暗[4],這個特性經常用于定性描述土壤含水率。土壤顏色信息也可用于土壤質量評估,研究認為,土壤色調、明度和彩度等顏色信息是石灰性土壤分布區森林立地評估的最佳指標之一[5]。
人眼依靠視網膜上的視錐細胞和視桿細胞來感知不同的顏色,根據細胞敏感光波的波長分為紅錐、綠錐和藍錐,通過三種錐細胞的組合可實現顏色的分辨[6]。工業界常用紅(R)、綠(G)、藍(B)3個顏色通道的變化以及它們相互之間的疊加來描述顏色,由于RGB色彩可以通過電子設備直接獲取,比較方便。而描述土壤顏色最常用的色系是蒙塞爾色系[7],其與RGB顏色系統之間差異很大,因此,實際使用過程中往往需要進行色系之間的轉換。色系轉換法的基本思路是首先將RGB反射率值轉換到CIE XYZ坐標系下,分別得到XYZ三刺激值,然后再轉換為蒙塞爾色系HV/C值[8]。該方法的優點是,可以將蒙塞爾比色卡的顏色引入計算機自動配色測色,實現不同色度系統之間的快速轉換和色域匹配[9],但缺點在于土壤顏色受多方面因素的影響,用色系轉換法來預測土壤顏色時,忽略了土壤屬性和土壤表面狀態對土壤顏色測量的影響。此外,由于需經過多次轉換獲得蒙塞爾顏色值,各個轉換環節均會帶來一些誤差。因此,運用色系轉換法預測土壤顏色存在一些不可避免的問題,有必要探索一些新的預測方法。
近年來廣泛用于土壤屬性光譜預測建模的偏最小二乘回歸(Partial Least Squares Regression,PLSR)方法取得了很好的預測效果。劉婭等[10]研究表明,PLSR方法可以比較準確地預測土壤電導率和濱海鹽土地區土壤鹽分含量。在應用PLSR預測游離鐵含量大于20 g kg-1的土壤樣品時,該模型可以較好地預測游離鐵的含量[11]。PLSR方法對野外實測光譜處理也有較好的效果,郭燕等[12]利用野外實測光譜分別進行全波段、歸一化光譜指數和特征波段的PLSR建模,均可以準確預測有機質含量。劉秀英等[13]研究表明PLSR模型是估測黃綿土鉀含量的最佳模型。然而將PLSR方法應用于土壤顏色預測是否可行仍需探索。由于土壤有機質的敏感波段大部分集中在波長為400~1 000 nm的光譜范圍內,并且主要集中于640~790 nm[14-15],氧化鐵的光譜響應波段為550~650 nm和750~950 nm[16]。而人眼識別紅、綠、藍三色分別對應于620~750 nm、495~570 nm、450~495 nm[17],這些波段與土壤有機質、氧化鐵等的光譜敏感波段重疊。由此可見,利用可見光-近紅外的不同波段對土壤顏色進行預測具有較大的可行性。
因此,本研究主要探索基于PLSR方法預測土壤蒙賽爾顏色的建模預測效果,并與色系轉換法進行比較,以期為土壤蒙塞爾顏色的獲取提供一種更加快速和準確的方法。
研究區位于皖南山區和豫章平原地區,主要位于安徽省的宿松縣、望江縣、東至縣和祁門縣,以及江西省的鄱陽縣和景德鎮郊區(圖1),經緯度范圍在116°8′~117°15′E,29°17′~30°12′N之間。該地區年平均氣溫16℃~17℃,年降水量1 350~1 400 mm,屬于典型的亞熱帶季風性濕潤氣候。采樣區地形多樣,包括山地、丘陵和平原,山地土地利用以林地為主,丘陵以林灌草利用為主,平原多為耕地。

圖1 采樣點分布圖Fig. 1 Distribution map of soil sampling points
為了盡可能增加土壤顏色的多樣性,采樣設計既考慮了主要的土壤類型,又考慮了不同的利用方式。采樣點土壤類型包含紅壤、水稻土、黃棕壤、潮土、紫色土和黃壤(對應的中國土壤系統分類分別是黏化濕潤富鐵土、鐵聚水耕人為土、鐵質濕潤淋溶土、淺色潮濕雛形土、酸性紫色濕潤雛形土和鐵質常濕淋溶土)[18]。土地利用類型包括裸地、稀疏幼林地、灌叢草地、水田和旱地等。土壤樣品采用五點法采集,取樣深度為0~15 cm,共采集樣品76個。樣品風干后去除植物殘體后,分別過10目和100目篩。本實驗中,pH、有機質、全氮、全磷和全鉀測定方法參照《土壤農業化學分析方法》[19]。土壤顆粒組成使用激光粒度分析儀測定。
將過2 mm篩的土壤樣品放入直徑為7 cm、厚度為1 cm的涂黑的圓形鋁盒中,表面刮平后進行高光譜測試。高光譜采集采用美國ASD FieldSpec4 Hi-Res 地物光譜儀,此光譜儀的波段范圍為350~2 500 nm。土壤樣品測定過程中使用兩個50W的鹵素燈,分別放置于與垂直方向成45°角的斜上方,ASD探頭視場角為8°,探頭放置于樣品上方40 cm處。每次進行光譜測量之前,要對實驗儀器進行暗電流校正和白板校正,白板校正使用的是25 cm×25 cm的漫反射標準參考板。為保證測量結果不受土壤表面狀態的干擾,每次測量旋轉樣品臺90°,每個方向測量五條光譜曲線,共20條光譜曲線,以這20條光譜曲線的平均值作為樣品的測試值[20]。ASD測量首先獲得的土壤表面每個波段的亮度值,通過拼接校正后獲得土壤表面在不同波段的光譜反射率值。在進行波段范圍選擇時人眼對顏色的感知主要與波長1 000 nm之前的波段有關,在色系轉換算法中亦只用到紅、綠、藍三種波段,因此,本研究選取的波段范圍為400~1 000 nm。為減少噪聲誤差,對該波段范圍內的光譜進行平滑處理,平滑處理的方式為Savitzky-Golay多項式法(二次多項式,9點平滑)。
采用中國科學院南京土壤研究所1989年編制的中國標準土壤色卡在自然光下(光線強度4 300~4 500 Lux時)對土壤樣品進行比色,土壤顏色的記錄方式為HV/C。光強測試計選用SMART SENSOR數字光照度計。為了方便計算,利用色系轉換與PLSR法預測蒙塞爾顏色值時,通常將蒙塞爾H值用數值表達,在蒙塞爾色度系統中,H代表色調值,依次參照文獻[21]中的方法將H值轉換為數字形式,2.5YR=12.50、5YR=15.00、7.5YR=17.50、10YR=20.00、2.5Y=22.50、5Y=25.00。V和C的值可以直接用于計算和預測,不需要做轉換。
(1)RGB值的計算 RGB值采用紅、綠和藍三種顏色對應波段范圍(620~750 nm、495~570 nm、450~495 nm)內的反射率均值(式(1)~式(3)),用于估算HV/C值。

式中,i 表示對應的波段,λi表示 i 波段對應的反射率值,R、G、B分別表示紅、綠、藍三波段的反射率值。
(2)色系轉換 將計算得到的R、G、B值采用式(4),首先轉化為國際標準色系坐標CIE XYZ下的XYZ值[22]:

然后,根據Miyahara和Yoshida[23]提出的轉換公式完成從CIE XYZ到蒙塞爾顏色的轉換(式(5)~式(14))

式中,Xc=1.020X、Zc=0.487Z、

令θ =cot(H2/ H1),

H、V和C的表達式為:

色系轉換法中評價模型精度時使用的參數為均方根誤差(Root mean square error,RMSE)[24]、平均值和ΔE,ΔE參照文獻[21]中提出HV/C顏色精度評價參數,該參數由式(15)針對每個樣品計算得到,再計算所有樣品的均值。

式中,C1和C2表示預測和實測的彩度值,ΔH表示預測和實測的色調值之差,ΔV表示預測和實測的明度值之差,ΔC表示預測和實測的彩度值之差。RMSE和ΔE均值越小,表示模型精度越高。
PLSR是基于因子提取的多元回歸數學優化模型。首先對光譜矩陣與顏色屬性進行雙線性分解,之后在變量系統中提取一系列對因變量有最佳解釋能力的新綜合變量(即因子提取),因子確定時要求光譜矩陣分解得到的因子與含量矩陣分解得到的因子相關性最大,最后利用提取的因子進行回歸分析[25]。建模過程采用交叉驗證的驗證方法,即給定一個含有i 個樣品的矩陣X,將其中某個樣品暫時剔除在PLSR建模計算范圍之外,用保留下來的i-1個樣品計算模型參數向量,最后用這i-1個樣品計算模型參數向量并預測被剔除的樣品的顏色坐標值。重復該運算流程直至所有樣品均被剔除和預測過一次[26]。在本研究中使用該方法分別建立土壤實測H、V和C值與波長為400~1 000 nm的反射率值之間的PLSR模型。
PLSR中評價建模精度時使用建模集交叉驗證決定系數(Determination coefficient of cross validation,)、交叉驗證均方根誤差(Root mean square error,RMSEcv),測定值標準偏差與標準預測誤差的比值(Ratio of standard deviation to standard prediction error,RPD)[27],式(16)和ΔE。

式中,SD表示數據集實測值標準差。
計算中涉及的色系轉換在MATLAB R2012a中完成,PLSR的建模及驗證在The Unscrambler 10.1中完成,圖表制作由OriginPro 9.0、ArcGIS 10.2完成。
土壤樣品基本屬性的統計特征如表1所示。土壤pH介于3.96 ~7.60,平均值為4.84,表明大部分土壤為酸性土壤。有機質平均值為20.57 g·kg-1,土壤肥力總體較高。在土壤顆粒組成中,粉粒含量較高,土壤質地主要是壤質砂土、粉(砂)壤土、壤土等。表2為不同土壤類型全鐵和有機質含量的統計值,有機質含量由高到低依次為黃棕壤、水稻土、黃壤、紫色土、潮土和紅壤。全鐵含量由高到低依次為黃壤、紅壤、潮土、黃棕壤、水稻土和紫色土。
研究區內的76個風干樣本的實測土壤顏色(Munsell HV/C)如下表3所示,色調主要集中在12.50到20.00之間的黃紅色調中,明度范圍在4.00至8.00之間,彩度值的變化范圍在1.00至8.00之間。由于比色時土壤呈風干態,所以樣品偏亮、明度值偏高。土壤彩度值變化范圍較大,樣品的色彩濃度差異較大。

表1 采樣點土壤基本屬性Table 1 Basic properties of the sampling soils

表2 顏色相關的不同類型土壤屬性信息Table 2 Color-dependent properties of soils different in type

表3 實測HV/C值基本信息Table 3 Statistics of the measured HV/C values
土壤樣本在400~1 000 nm波長內原始光譜反射率總體呈現上升的趨勢,本研究區土壤中均含有一定量的氧化鐵,在850~950 nm處存在不同程度的氧化鐵吸收峰,黃壤和紅壤氧化鐵含量較高,在光譜曲線中存在較為明顯的吸收峰。
本研究中,以色系轉換方法計算的H、V、C值為預測值的平均值與范圍,以人眼觀察值為實測值計算RMSE,結果如表4所示:

圖2 不同土壤樣品原始光譜Fig. 2 Original spectra of soil samples

表4 色系轉換預測土壤蒙塞爾顏色結果Table 4 Statistics of soil Munsell colors predicted with the color space conversion method
其中色調H的范圍介于13.95~23.57,而實測H值范圍介于12.50~20.00,二者之間有一定差距,從均值來看,預測平均值為19.25,其實測值為18.16,本研究中的土壤主要集中在黃紅色調中,因此,預測結果大約偏黃一個色調。明度V的預測范圍介于3.69~6.00,而實測值范圍介于4.00~8.00,預測平均值為4.99,實測值為6.68,可見,預測值較實測值偏暗。彩度值C的預測范圍介于4.24~8.30,實測值的范圍介于1.00~8.00,色系轉換法預測彩度值C存在一定的偏差;C預測均值為5.79,而實測均值為4.45,C均值偏低約1.34個單元。因此,預測值不足以表達土壤顏色的豐富程度。
從轉換結果(圖3)來看,色調H的預測值與實測值的回歸系數R2僅為0.30,預測結果較差。明度V回歸系數R2達到0.67,雖然預測值與實測值存在顯著正相關的關系,但預測V值明顯低于1∶1線,說明預測出的明度偏暗。彩度C預測值與實測值的回歸系數R2達到0.61,但C值的預測范圍較窄。從預測結果中可以得出,色系轉換法預測的顏色與真實值有較大差異。
基于色系轉換的方法預測土壤顏色時,土壤色調普遍偏黃,明度偏暗,彩度值的預測范圍較窄,該結論與Rossel等[29]2009年的研究結果相同。因此,色系轉換法雖然可以預測土壤顏色的實測值,但整體效果并不理想。
從模型預測結果來看(表5),預測范圍與實測范圍非常接近,H預測值的范圍介于14.42~21.96,預測范圍偏高,但在中國標準土壤色卡的劃分中該誤差不足一個色調。V的預測值范圍介于5.12~8.21,范圍下限較實測值高約一個單元,上限與實測值上限大致相同;彩度值C的預測范圍介于0.40~8.70,與實測值的彩度范圍十分接近。PLSR方法預測的H、V、C的平均值與實測平均值一致。可見,PLSR預測值的平均值與實測值的平均值基本相同。

圖3 色系轉換與實測值對比圖Fig. 3 Measured HV/C versus predicted HV/C using color space conversion method

表5 PLSR預測土壤蒙塞爾顏色結果Table 5 Statistics of soil Munsell colors predicted with PLSR
利用PLSR法分別建立土壤色調、明度、彩度值與反射率回歸模型,PLSR模型在預測土壤蒙塞爾顏色的H、V、C值中,交叉驗證決定系數分別達到0.62、0.61和0.75,RPD分別達到1.94、1.67、2.15,說明PLSR方法可以很好地預測土壤的彩度值,可以較好地預測土壤色調值,可以近似地預測土壤明度值。

表6 不同預測方法ΔE統計結果Table 6 Statistics of ΔEs predicted with different methods
色系轉換法預測的蒙賽爾顏色的RMSE達到2.26、1.79和1.92個誤差單元,而PLSR法預測蒙塞爾顏色H、V和C值的RMSEcv僅為1.32、0.55和0.97個誤差單元,PLSR法的誤差與色系轉換法相比明顯偏低。表6中所示,利用ΔE對H、V、C三個因數進行綜合分析可得,平均值和預測范圍顯著下降,PLSR預測誤差明顯小于色系轉換法。因此,PLSR方法更適合預測土壤的蒙塞爾顏色。
從回歸分析結果(圖4)可知,PLSR預測H與實測H的決定系數R2為0.69,相比于色系轉換法變異明顯減小,說明色調H的預測精度有較大幅度的提升。明度值V與色系轉換法對明度值的預測結果相似,但回歸線與1∶1線更接近,明度值的預測范圍較色系轉換法更大。彩度值C的預測值與實測值R2達到0.78,回歸方程與1∶1線非常接近,說明預測值與真實值很接近,基于PLSR方法預測C值的效果明顯優于色系轉換法。

圖4 PLSR預測值與實測值對比圖Fig. 4 Measured HV/C versus predicted HV/C using PLSR
本研究用色系轉換與PLSR法預測土壤顏色,結果表明,PLSR法預測土壤的H、V、C值的效果較好,該方法估測的土壤蒙塞爾顏色值較為可靠,整體預測精度高于色系轉換方法,預測結果與真實值差異小于色系轉換方法。由于PLSR法與色系轉換法存在較大的不同,所以預測效果存在一些差異,從土壤光譜、影響因素、計算過程和測量誤差四個方面分析差異產生的原因。
從土壤光譜來看,由于色系轉換法僅采用了肉眼能夠感知的RGB三個波段范圍光譜信息,數據處理中由于無法獲取肉眼的光譜響應函數,故僅對各個波段反射率做了簡單平均,使其損失了較多有效信息。同時由于色系轉換采用的波段僅有紅、綠、藍3個波段,相對于原始光譜來說,存在信息過度壓縮的問題。而PLSR方法運用了400~1 000 nm的全部波段反射率信息,對于光譜信息的利用更為全面。因此,PLSR方法可以更好地進行土壤顏色預測。
從土壤顏色的影響因素來看,一般認為土壤有機質含量、土壤針鐵礦、赤鐵礦含量,以及顆粒組成和研磨程度對顏色的判定和光譜反射率有較大的影響[30]。從有機質含量來看,于士凱等[31]認為647 nm、750 nm、876 nm均是土壤有機質的敏感波段。從鐵氧化物來看,依據Schwertmann的研究[32],土壤中的某些礦物,例如針鐵礦、赤鐵礦也與土壤顏色息息相關,Brown 等[33]提出由于針鐵礦與赤鐵礦的原子構型不同,導致在430 nm和550 nm處的敏感波段的反射率曲線形態存在一定差異,赤鐵礦是一段“平緩曲線”,而針鐵礦則出現“反射峰”。PLSR法將這些細微差異完全保留,并運用于顏色預測的建模過程中,而色系轉換法則忽略了土壤顏色產生的機理,僅從色系坐標和色彩表達的角度進行推算,雖然這對色彩學研究有較大幫助,但由于土壤顏色的表達是一個復雜的過程,簡單的方法并不一定完全適用于土壤顏色研究。
從計算過程來看,色系轉換方法只選取紅、綠、藍三波段范圍內的反射率信息,轉化步驟繁雜,每一步轉換均會存在一些不可避免的誤差;而PLSR法預測土壤顏色較為直接,該方法以誤差最小和決定系數最高為目標進行建模,從而可以獲得能夠充分揭示數據內涵的模型。此外,蒙塞爾比色卡比色時對土壤顆粒研磨的粗細程度和樣品表面狀態沒有過多的要求,而不同土壤樣品表面粗糙度和土壤質地存在差異,反射率受到一定的影響,這些因素也會導致土壤預測時的誤差。因此,相比之下色系轉換計算土壤蒙塞爾顏色的誤差來源更多。本研究中提出的PLSR預測土壤顏色有一定的優勢和較為廣闊的應用前景,對快速獲取土壤顏色提供了一種新的方法。
本研究僅限于安徽南部、江西北部和湖北東部地區的土壤,樣本的顏色主要集中在黃紅色調,未來將擴大土壤類型,提高本研究方法的適應性。從研究方法上而言,研究中僅使用了PLSR方法和色系轉換方法,關于其他色調土壤的研究和其他預測方法的探索將在后續展開。此外,在自然狀態下土壤顏色的判定還受到土壤水分含量等客觀因素的干擾。因此,后續研究將考慮土壤水分等因素對土壤顏色預測的影響。
本文探討了色系轉換法與PLSR方法對土壤蒙塞爾顏色的色調H、明度V和彩度C的預測效果,并進行了對比分析,PLSR的均方根誤差分別較色系轉換法低0.94、1.24 和0.95,其ΔE的平均值為1.91,色系轉換法的平均值為7.07,色系轉換法預測結果偏離實測值更遠,表明PLSR方法對土壤HV/C的預測效果優于色系轉換法。該方法可以應用于不同類型、質地的土壤顏色的預測,為土壤顏色的獲取提供了一條新的途徑。