王小亮,黃萍
佐匹克隆片常規(guī)劑量具有鎮(zhèn)靜催眠和肌肉松弛作用,作用于苯二氮卓受體,可用于各種失眠癥。作為一種安全性較高的速效催眠藥,佐匹克隆能延長睡眠時間,提高睡眠質量,減少夜間覺醒和早醒次數,臨床應用廣泛[1]。
近紅外光譜檢測(Near Infrared Spectrum,NIR)技術作為一種快速、簡便、無損檢測方法,極大簡化了樣本測試環(huán)節(jié),可以用于石化、農業(yè)、食品和藥品領域[2]。近年來已廣泛用于藥品快速檢驗及過程分析領域,但其建模方法多基于偏最小二乘算法[3-6]。
人工神經網絡(Artificial Neural Networks,ANN)是一種模擬大腦神經突觸聯(lián)接結構實現信息處理的數學運算模型,由大量進行并行計算的基本單元(神經元)相互連接組成。神經網絡的功能與信息處理能力全部由神經元之間的相互連接(權值)來體現,神經元之間的互連體現了信息的分布式存儲,各神經元連接權值的動態(tài)修正體現了網絡的學習進化過程,神經網絡通過計算得到的輸出體現了網絡的聯(lián)想記憶功能[7-10]。主要分為兩個步驟:第一步為正向傳播階段,對于給定的網絡輸入,通過正向傳播得出各個單元的實際輸出;第二步為誤差反向傳播階段,計算輸出層各單元的輸出誤差項,根據這些誤差逐層向輸入層方向逆向傳播,調整各個連接權值。通過兩個步驟的反復迭代,直到輸出層的誤差項最小。見圖1。

圖1 神經網絡功能示意圖
本文將近紅外檢測與人工神經網絡建模相結合,通過近紅外在線檢測獲得樣本的光譜數據,然后通過神經網絡快速建模,可以將近紅外檢測的高效性與神經網絡的高準確性、高魯棒性相結合,實現對樣本的快速定量檢測[11-12]。
本研究起止時間2016年6月至2017年3月。
1.1儀器Matrix-F近紅外光譜儀(德國Bruker公司,配有1.5 m長固體光纖探頭);銦鎵砷(InGaAs)檢測器;OPUS 5.5光譜分析軟件(德國Bruker公司);UV-2600紫外可見分光光度計(日本島津公司);BP211D電子分析天平(德國賽多利斯公司);MATLAB R2010a商業(yè)數學軟件(美國MathWorks公司)。
1.2樣品5個廠家生產的84批佐匹克隆片,均為陜西省食品藥品檢驗所抽驗樣品;佐匹克隆對照品(中國食品藥品檢定研究院,生產批號100872~200801,規(guī)格:50 mg)。
1.3方法
1.3.1含量測定 依據《中國藥典2015年版二部》,采用紫外分光光度法測定佐匹克隆的含量[13]。84批樣品含量測定結果均以%表示。見表1。

表1 建模選用的樣本數據
1.3.2NIR光譜測定及預處理 以漫反射方式采集樣品的NIR光譜。以固體光纖探頭抵住片劑采集樣品的NIR漫反射光譜。選擇未帶刻痕、一面作為光譜采集部位。光譜采集條件:掃描范圍為(12 000~4 000)/cm,分辨率8/cm,室溫,掃描次數64次,每批樣品測定6片作為原始光譜,再求平均光譜作為建模光譜。如圖2所示。

圖2 經平均后的近紅外建模光譜
一階求導及矢量歸一化的光譜預處理方法可有效地校正光源強度波動及人為因素的影響,消除光程或樣品厚度帶來的影響,更能真實細致地反映與活性成分含量相關的光譜信息。同時,通過與原始光譜、一階求導預處理、二階求導預處理所建立的模型相比,采用一階求導及矢量歸一化預處理光譜建立的神經網絡模型具有相對更高的預測精度,因此選用一階求導及矢量歸一化方法對光譜進行預處理,處理后的光譜如圖3所示。由于光譜在前端很平,基本上沒有峰值出現,進行建模時無法提供有效的樣本信息,而光譜在后端存在較大的系統(tǒng)噪聲。為了保證光譜包含足夠豐富的樣本信息,同時又盡可能減小系統(tǒng)誤差對建模精度的影響,建模時選取(10 000~4 200)/cm譜段,每組樣本包含778個數據點。

圖3 經一階求導及矢量歸一化后的近紅外建模光譜
1.4統(tǒng)計學方法利用MATLAB R2010a商業(yè)數學軟件(美國MathWorks公司)進行紅外圖譜的數據信息處理。主要方法是:以一階求導對紅外光譜做矢量歸一化的光譜預處理,而后對數據進行主成分分析。
2.1主成分分析結果經過預處理后的光譜數據每個樣本包含778個數據點,直接進行神經網絡建模會導致模型輸入層節(jié)點過多,因此,為了數據降維和消除重復的光譜信息,首先對84組樣本光譜數據進行主成分分析[14-16]。經主成分分析得出的前20個主成分對應的特征值和貢獻率、累計貢獻率見表2。

表2 前20個主成分對應的特征值和貢獻率、累計貢獻率
由主成分分析結果可知,第一個主成分的特征值為494.96,其貢獻率為63.62%,即其對總體信息的解釋程度為63.32%;第二個主成分的特征值為150.57,其貢獻率為19.35%,即其對總體信息的解釋程度為19.35%。按照主成分確定的一般原則,當其特征值大于1或累計貢獻率達到85%以上時即可,綜合考慮確定建模選取的主成分為10個,其對總體信息的累計代表程度為99.07%。

圖4 選用的神經網絡模型構型
2.2人工神經網絡建模與分析圖4給出了建模選用的神經網絡模型示意圖,模型為10(輸入節(jié)點)-6(隱含層節(jié)點)-1(輸出節(jié)點)三層神經網絡,輸入樣本集包括三部分:訓練集、驗證集和測試集。訓練集用于網絡訓練,驗證集用于在網絡訓練過程中防止訓練過擬合,即當訓練集誤差繼續(xù)下降,但驗證集誤差還是上升時停止網絡訓練,而測試集用于對訓練好的網絡進行測試,以檢驗網絡的推廣能力,樣本的劃分采用隨機取樣方法。
進行神經網絡建模時,選取所有84組樣本數據進行網絡建模,建模所采用的參數見表3。

表3 神經網絡建模模型參數
在進行神經網絡建模前,首先對樣本進行了歸一化處理,將樣本數據轉換到[-1,+1]區(qū)間內,轉換方法如下:
y=2×(x-xmin)/(xmax-xmin)-1
式中,x表示單個樣本值,xmax和xmin分別為樣本數據列的最大值和最小值。
圖5給出了神經網絡訓練次數與誤差均方值MSE的關系曲線,隨著訓練次數的增加,訓練集、驗證集和測試集的誤差均方值均有所下降,當訓練次數達到12次時,訓練集的誤差均方值減小到2.75e-7,小于設定的訓練目標誤差值1e-5,神經網絡停止訓練,建模完成。訓練結束時,對于驗證集的誤差均方值為1.02e-1,測試集的誤差均方值為5.71e-2。

圖6 樣本實測值與模型輸出值相關性:A為訓練集;B為驗證集;C為測試集;D為全樣本
圖6給出了樣本實測值與模型預測值相關性曲線,所建立的神經網絡模型對訓練集、驗證集和測試集的回歸系數分別為1.000、0.992和0.973,而神經網絡模型對整個樣本集的回歸系數則達到了0.994,說明依據神經網絡模型所預測出的模型預測值與樣本實測值之間存在極高的相關性,模型預測結果具有極高的可信度。
從84組樣本中選取10組樣本,代入神經網絡模型,進行了模型預測值與樣本實測值對比如表4所示,模型預測值與樣本實測值的最大偏差為2.85%,最小偏差為0.02%,平均偏差為0.70%,具有相當高的預測精度。

表4 模型預測值與樣本實測值的對比
將近紅外光譜測量方法與人工神經網絡建模方法相結合建立了佐匹克隆片的定量分析模型。在主成分分析的基礎上,利用84組樣本對神經網絡模型進行了訓練,并對模型進行了預測驗證。模型預測值與樣本實測值的對比結果顯示,模型預測結果與實測結果很好吻合,其最大偏差為2.85%,最小偏差為0.02%,平均偏差為0.70%。經訓練的網絡模型可以用于對佐匹克隆片含量的快速準確預測。
(本文圖5見插圖1-2)