彭良剛
(畢節醫學高等專科學校,貴州畢節,551700)
SOM神經網絡是一種有效的無導師監督的分類識別器,具有很大的應用前景[1-2],不同中藥材表現的光譜特征差異較大,即使來自不同產地的同一藥材,因其無機元素的化學成分、有機物等存在的差異性,在近紅外、中紅外光譜的照射下也會表現出不同的光譜特征,因此可以利用這些特征來鑒別中藥材的種類及產地。中藥材的種類鑒別相對比較容易,不同種類的中藥材呈現的光譜的區別比較明顯。本研究針對2021年全國大學生數學建模競賽E題的中紅外光譜的數據,分析研究中藥材的特征,并以該特征研究不同中藥材的分類識別研究。
基于SOM神經網絡的中藥材分類識別系統,設計流程如圖1所示。

圖1 SOM神經網絡中藥材分類識別系統流程
建立SOM神經網絡中藥材分類識別,有效的特征是識別的關鍵。首先要對不同中藥材的波數的吸光度作對比分析,經過大量的實驗,得到425種編號的中藥材波數吸光度對比圖,這里給出部分編號的波數吸光度對比圖,如圖2~圖4所示。

圖2 編號1-5;51-55;101-105;151-155波數吸光度分布

圖3 編號201-205;251-255;301-305;351-355波數吸光度分布

圖4 編號401-405;421-425波數吸光度分布
從圖2~圖4的不同中藥材編號的波數吸光度分布特點,發現所有的中藥材在中波數段的吸光度分布幾乎是接近而無差異,而在低波數段和高波數段的吸光度具有明顯的差異,因此可以用低波數段和高波數段的吸光度來區分中藥材的特征。這里我們分別選取了低波數段:652-1653和高波數段:2652-3988來進行特征提取,以每一編號的中藥材的吸光度平均數作為特征提取。
篩選低波數段的計算每一編號中藥材的平均值。首先,把篩選的低波數段652-1653的425種編號的1002個波數的吸光度作為一個新的矩陣A。

式中Ai,1,Ai,1002分別表示編號為i(i= 1 , 2,… ,4 2 5)的波數為652和波數為1653的吸光度,其余表示一樣。其次,計算每一個編號的低波數段的所有吸光度的平均值,計算公式為:


表1 編號1-10的低波數段的吸光度平均值

表2 編號101-110的低波數段的吸光度平均值

把篩選的高波數段:2652-3988的425種編號的1347個波數的吸光度作為矩陣B,表達式為:

公式中Bi,1,Bi,1347分別表示編號為i(i= 1 , 2,… ,4 2 5) 的波數為2652和波數為3988的吸光度,其余表示類似。計算每一個編號的高波數段的吸光度的平均值,公式為:


表3 編號1-10的高波數段的吸光度平均值

表4 編號101-110的高波數段的吸光度平均值

表5 編號401-410的高波數段的吸光度平均值


圖5 低波數段分類器

圖6 高波數段分類器
結果顯示425種編號的中藥材可以分為兩種藥材,對應的權值矩陣為:

通過對比低波數段和高波數段的分類器,低波數段的分類器能夠有效地把425種編號的中藥材分成兩類藥材,而高波數段的分類器的分類識別結果不明顯。