儲陽
關鍵詞:近紅外反射光譜;標準歸一化;隨機森林;最小均方根誤差;巖石礦物
隨著社會經濟的不斷發展,我國各個領域的建設對各種礦物資源的需求量也在不斷提升。礦物資源的利用涉及開采、儲存、使用等過程,各種巖石礦物成分、含量的準確測定對實現礦物資源的合理利用有著極為重要的現實意義。實際上,礦物中各種組分與含量的測定均于實驗室中采用專業的化學方法進行。但是,實驗檢測過程涉及較多實驗操作步驟,對人力、物力的需求量較大,且對各種檢測設備儀器的精確度有較高的要求,即使如此,也要采用破壞分解的方式對樣本進行檢測[1]。隨著礦物檢測技術的發展,實驗室檢測范圍的局限性越來越弱。各種較為先進的測定技術,如近紅外漫反射光譜分析技術等的應用,在計算機精密計算的輔助下,大大提高了檢測結果的準確性,并且不會對實驗樣本造成破壞。
1 天然巖石礦物成分分析
巖石的主要成分是礦物,但風化后的巖石內不僅有礦物,還存在諸多鹽類等其他物質,且巖石內的礦物成分直接決定抗風化能力。通常,礦物由巖漿內結晶出來的順序影響硅酸鹽礦物的風化順序,因此,可以根據晶系劃分礦物。晶系主要是根據礦物晶體對稱情況進行分類的一種級別,根據具體對稱點的差別能劃分為3個晶族。在地表中,最快分解的是地下深處巖漿內最早結晶的礦物,在巖漿內最后結晶的礦物具有最強的抗風化能力。因此,含有較多硅鋁礦物的中性巖、酸性巖比含有較多鐵鎂礦物的基性巖與超基性巖更容易風化[2]。
變質巖的礦物成分主要包括兩種:(1)和沉積巖或巖漿巖共有的礦物,包括云母、長石、石英;(2)變質巖中存在的獨特礦物,包括蛇紋石、綠泥石以及滑石等。幾乎所有的單礦巖均由一類礦物構成,體脹系數、導熱率以及顏色都相同,而且不會因為受到物理風化影響而發生破碎。但是復礦巖不同,其中存在穩定性較差的元素,會與晶格相脫離而移走,影響巖石的完整性。
2 近紅外光譜概述
近紅外光譜屬于一類分子吸收光譜,因為原子在物質內始終處于振動的狀態,一旦用紅外光照射物質,分子吸收、分子振動以及轉動頻率相同的紅外光會出現分子振動能級的躍遷,從基態躍遷至較高能量能級,因為具體化學鍵均有不一樣的吸收頻率,在紅外光譜中會呈現不同的吸收峰,所以化學鍵吸收頻率不同時,實際所得的紅外光譜也會呈現一定差別[3]。近紅外光譜主要指位于4000~12000cm﹣1的紅外光譜,能將水分子,NH、OH、CH等含氫基團、羥基和金屬離子的結合方式以及合頻、倍頻吸收峰的振動特征反映出來。一般外界與內部環境不會過多地影響該類基團的近紅外光譜特征,差異較為明顯,所以有一定的鑒別特征。
3 近紅外光譜在天然巖石礦物成分測定中的應用
近紅外光譜技術在天然巖石礦物成分測定中的實際檢測效果需要通過正態性檢驗確定。實驗采用的樣本由白云母、高嶺土、蒙脫石3種成分組成。完成礦物質配合后,采用近紅外光譜進行礦物樣本成分檢測,對收集的光譜進行分析與研究。在這一過程中,主要采用標準歸一化法分析收集到的相關數據,通過人工神經網絡、主成分回歸、隨機森林、偏最小二乘法等模型處理相關數據[4]。在實驗中,通過分析、預測樣本中的3種成分得到的預測值和真實值之間的最小方根差對檢測結果進行評價。
4 采用近紅外光譜進行天然巖石礦物成分含量測定實驗
4.1 樣本獲取
在工業生產過程中,白云母、高嶺土、蒙脫石是3種使用量相對較大的礦物資源,因此,實驗采用這3種巖石制作實驗樣本更具代表性。
4.2 礦物光譜采集系統配置
完成樣本制作后,需采用礦物光譜采集樣本成分及其組成信息。天然巖石成分測定分析系統主要包括計算機顯示控制系統、采集控制模塊、近紅外光譜采集模塊。其中,近紅外光譜采集模塊主要包括線陣探測器、近紅外光譜儀、光纖、參考白板等;采集控制模塊主要由可平移、可升降、可旋轉的控制平臺組成[5]。
4.3 對光譜數據進行預處理
近紅外光譜是一種較為常見的光譜類型,光譜區間介于中紅外區和可見光區之間,波長范圍為780~2 526 nm。在實驗中,巖石樣本的近紅外光譜波長區間為900~2 500 nm。實驗采用AvaSpec-NIR256-2.5光譜儀,剛好能實現波長為900~2 500 nm的光譜波長檢測。不同的巖石成分都有相應的近紅外光譜放射信息,在實驗中可以實現清晰檢測,進而分析光譜信息,得到對應的巖石成分信息。
在處理數據前,采用預處理的方式避免不必要因素影響實驗結果的準確性。較為常用的方法包括標準歸一化法、一階導數法、平滑法、平滑濾波法等,光譜處理波長也集中在950~2 450 nm。完成預處理之后就可通過構建數學模型分析、預測礦物的未知組分。應用較為廣泛的數學模型有人工神經網絡、主成分回歸、隨機森林、最小二乘法等。標準歸一化法的應用可以在較大程度上排除散射、噪聲對實驗結果的干擾,適用性較為顯著。
5 近紅外光譜對天然巖石礦物成分含量測定實驗的預測原理
在天然巖石礦物成分含量測定分析中,近紅外光譜技術是一種間接的分析技術,正處于應用發展階段。這一技術的應用需要以一定實驗為基礎,采用數學模型,以定性或者定量的方式分析、預測樣本成分及含量,達到實驗目的。在實驗過程中,采用抽樣的方式進行天然樣本實驗,對樣本的成分情況建立不同的模型,如主成分回歸分析、人工神經網絡分析、偏最小二乘法分析等模型,實現對巖石礦物成分及含量的有效分析與預測。在充分實驗的基礎上,對未檢測的樣本礦物情況進行預測,驗證該檢測方法的準確性。
5.1 主成分回歸分析
主成分回歸分析主要是通過構建矩陣的方式分析未知成分。在具體操作中,應用內容與方法包括主成分矩陣、光譜數據點分析、多元性回歸模型、待測組成含量矩陣等。
5.2 偏最小二乘回歸分析
偏最小二乘回歸分析是另一種對未知組分進行預測的方法,是基于主成分回歸分析的一種方法。在實際操作中,需要結合光譜矩陣與組分含量矩陣的有效應用對實驗數據進行分析,得出兩者之間的相互關系,提升實驗結果的關聯性[6]。
5.3 人工神經網絡
人工神經網絡是一種主要由非變換神經元組成的前回饋神經網絡,網絡結構較為復雜,采用反向傳播的算法,在預測與逼近實際數據方面有較好的應用效果。
5.4 隨機森林
在處理實驗數據時,隨機森林也是較為常用的處理方法,這種方法的應用是以Bagging算法為前提構建的數學模型。相比于其他算法,隨機森林模型設計的參數相對較少,省略了對過多擬合問題的考慮、處理。所以隨機森林算法可以實現對數量較大樣本數據的處理,并且可以在較大程度上避免噪聲對實驗數據的干擾。隨機森林算法的應用原理是采用自助采樣的方式進行樣本處理,在實際應用過程中,要求以較快速度生成測試樣本和訓練樣本,并以此為依據形成隨機森林。實際實驗的預測結果可以結合具體分類樹分析得到具體情況。
6 采用近紅外光譜進行天然巖石礦物成分含量測定實驗結果與討論
完成實驗后,對獲得的各組實驗情況進行處理,將樣本數據平均分為兩組,一組用作測試樣本,另一組用作光譜訓練樣本。首先,采用一階導數、平滑、標準化歸一、五點平滑濾波等較為常用的方法對光譜信息進行科學處理,并以此為基礎建立數學模型進行數據處理。將這4種數據模型分為非線性建模、線性建模兩種類型和方式。其中,非線性建模主要是人工神經網絡模式與隨機森林模式,線性建模主要是主成分回歸模式與偏最小二乘法。其次,采用最小均方根誤差對判斷的準確性進行合理預測。
在實際操作中,采用隨機森林法分別對高嶺土、白云母、蒙脫石的預測結構進行制圖處理。其中,高嶺土預測值與真實值之間呈線性關系,白云母預測值與真實值之間呈線性關系,蒙脫石預測值與真實值之間呈相關性關系。
7 結語
隨著我國生產技術的不斷提升,各個領域的生產對各種礦物的需求量也在不斷提升,只有明確礦物組成成分,才能提高礦產資源開采的準確性,提高對礦產資源的開采與利用效益。采用高嶺土、白云母、蒙脫石3種具有代表性的礦物進行相關實驗,采用反射光譜信息測定的方式,結合各種預處理技術,構建數學模型,分析紅外光譜得到的成分檢測結果。研究發現,采用標準歸一化法進行建模處理最有利,采用非線性回歸模型比線性回歸模型得到的分析預測效果好。通過分析,希望能為相關礦物檢測人員與檢測工作提供有效借鑒。