
摘要:本文針對稀土元素檢測、國土資源等領域的高維光譜分析。基于人工智能技術,提出了高維寬譜系統總體結構、組成以及各個組成部分的內容、主要技術關鍵點、需要解決的技
術問題和實現的目標等。
關鍵詞:高維寬譜;人工智能;譜線輪廓;自適應;譜圖匹配;譜線識別;大數據
中圖分類號:TP183 ? 文獻標識碼:A ?文章編號:1007-9416(2020)06-0000-00
1系統目標
1.1 總體目標
系統是以原子物理學、量子力學、原子發射光譜理論、原子發射光譜干擾理論、化學計量學等理論等作指導;以計算機科學、統計學、儀器分析、化學分析、現代數字信號處理、工程數學、矩陣理論等為工具;以元素譜線基礎信息、譜線干擾信息庫為標準數據源;以高維譜線輪廓模型為擬合標準;以化學計量學各種算法、高維譜圖基線確定、高維譜圖平滑、高維去卷積分、高維二階差分尋峰、高維譜線擬合、譜圖匹配、譜線識別等做為關鍵技術;以CCD器件為數據采集器件;以稀土元素檢測、有色金屬、國土資源、地質勘探、農業遙感、科研院所、數字醫療、環境保護等領域為服務對象,構建在這些領域的大數據分析的戰略支撐。具體目標為:
(1)建立高維譜圖大數據的快速應急處理及高維譜圖的可視化體系;
(2)建立高維譜圖的專家系統應用體系;
(3)建立高維譜圖深度處理體系;
(4)建立標準譜線峰型輪廓的譜線標準體系;
(5)建立強大的痕量檢測體系;
(6)建立元素多線-多段-多時段分析體系;
(7)建立智能評價系統。
1.2 主要技術
(1)大數據高維譜的數據采集、數據傳輸、數據存儲及數據實時處理;
(2)高維譜圖的可視化及深度處理、圖像銳化、像元加強突出、邊緣檢測計算;
(3)高維譜的自適應基線確定、高維譜自適應去燥平滑、高維譜自適應尋峰、高維譜自適應譜峰擬合;
(4)高維譜圖匹配和譜線識別。
2系統構架
高維寬譜檢測分析應用系統的系統框架如圖1所示:
本系統包括四大部分:
2.1使用對象
包括光譜領域專家、技術工程師、元素分析用戶,通過系統接口來使用。
2.2系統接口
系統接口就是系統的一些為光譜領域專家、技術工程師、分析用戶使用的應用程序界面。其包括:高維譜圖可視化(1D/2D/3D)顯示、樣品分析、系統測試和其他工具。
2.3智能庫及核心技術庫
這是系統的核心,包括兩大部分人工智能庫和核心技術庫。
2.3.1智能庫
人工智能庫包括光譜分析領域的知識庫、知識獲取機構、推理機、解釋機構和深度學習機構五大部分[1]。
2.3.2核心技術庫
核心技術庫包括化學計量學算法庫和數字信號處理核心庫二部分。
化學計量學算法庫主要有:回歸分析、多元校正、主成分分析、方差分析、人工神經網絡等。
數字信號處理主要包括:高維譜圖的平滑與濾波、高維譜圖的基線確定、高維譜圖的峰位識別及峰區確定、高維譜圖的擬合等。
2.3.3人工智能技術庫
包括譜圖識別、譜線識別和系統智能評價等。
2.4綜合數據庫
綜合數據庫它是分析元素過程中符號或數據的集合,用于存儲光譜分析的原始事實、推導過程中得到的中間信息(數據)、推理的中間假設、中間結論、目標結果、推理過程的信息。
數據庫管理系統負責對數據庫中的數據進行增、刪、改以及維護工作,以保證數據表示方法與知識表示方法的一致性。
3需要解決的技術問題
本系統需要解決以下技術問題[2]:
3.1 實時大數據處理問題
分析設備提供高維的譜數據,數據量大(650/s~1.0G),分析設備的大數據包含多維背景、噪音以及有用的譜峰,特別是在低統計值的高維譜數據中提取有用信息,而且是實時的提取是本系統要面對的大問題。
3.2 系統1D/2D/3D可視化問題
對從分析設備大數據中提取的有用信息,要實時的2D,3D顯示、渲染,給予分析人員交互、對譜圖進行更進一步的深度分析如:譜圖圖像圖像銳化、邊緣檢測、浮雕處理、運動模糊、譜圖像元加強突出等的分析。
3.3 病態系統求解問題
由于在解析儀器大數據分析模型中,公式(4.65)、(4.66)是個超定方程組,這個方程沒有唯一解,只有最優解。為了得到更優的解,需要正則化方法來求解。
3.4 包含極小噪聲而引起的大的測量結果誤差問題
通過正則化,可以得到最優解。但正則化有很多種方法,為了減少由于噪聲而引起的大的測量結果誤差問題,采取正定矩陣,這樣保證測量結果誤差更小。除此之外,噪聲引起的誤差不能引起系統的穩健性。也就是說保證系統的收斂。
3.5 由于計算精度產生的截斷誤差引起的測量結果誤差問題
我們知道,在求解正則化的求解過程中,都是一些浮點數的計算,計算機的位數限制肯定在浮點數的加減乘除運算肯定會引起四舍五入和截斷計算誤差,特別是積累的誤差會對最終結果產生很大的影響。
3.6 譜圖高分辨率問題
高維譜圖的正確的分辨率是重要的問題。譜圖的尋峰過程中,特別是對低統計譜數據及高維譜來說更重要。不能因為漏峰而影響譜圖的最終結果的解析。
3.7 迭代的收斂速度
收斂速度是決定系統的重要指標,在分析設備的大數據處理過程中要求快速的得到分析結果。由于在計算過程中系統采取迭代方法,迭代算法的優劣決定收斂的迭代次數,迭代次數決定算法的優劣。
4系統社會經濟效益
4.1提升國防保障能力
在稀土元素檢測領域,稀土元素是工業的味精,少量的稀土元素對材料的性能有重大的影響。特別是對航空、航天發動機來說,加入微量的稀土元素,提高發動機熔點,大大改善提高發動機的性能,對國防工業有著重要的意義。
4.2提高行業分析水平
在國土資源領域,原《國土資源部十三五國土資源普查規劃》中指出,在國家地質化學填圖1:20萬、1:25萬的基礎上,即將開展1:1萬、新1:5萬全國性的地球資源普查系統,為國家的大政方針提供戰略數據支撐。
4.3具有環保作用
對有色領域來說,由于分析精度高,尤其是對貴金屬金、銀、鎳、鉻以及高純氧化物來說,精度增加一位,則經濟效益呈幾何級數增長。二是再加上分析時間短,使合格產品冶煉時間大大縮短。對冶煉來說,時間就意味著能量的消耗和污染物的排放,縮短時間就意味著節能和減排。
對生產企業來說,分析精度高、數據準確性提高意味著提高勞動生產率,減少員工勞動強度,減少分析樣品的能耗,可以更好的保護環境,減少環境污染。
4.4促進行業技術進步
目前,國內還沒有成熟的基于人工智能的高維光譜譜圖應用分析系統,該系統必將促進國內的光譜儀器行業的發展,核心技術勢必促進國內該行業的技術進步。
參考文獻
[1]俞汝勤,梁逸曾,吳海龍.分析化學手冊第三版(化學計量學分冊)[M].化學工業出版社, 2016.
[2]Sophisticated algorithms of analysis of spectroscopic data 2008 Miroslav Morhá?.
收稿日期:2020-05-08
作者簡介:馬增(1966—),男,天津人,本科,工程師,研究方向:基于人工智能的高維寬譜分析檢測。