李佳瑞,王繼芬,劉津彤
(中國人民公安大學 偵查學院,北京 100038)
目前我國公共安全問題突出,針對公共安全的重要組成部分食品藥品的安全問題,公安部部署全國公安機關集中開展了“昆侖2020”專項行動,依法對食藥環領域的違法犯罪活動進行嚴厲打擊。在藥品行業快速發展的背景之下,足不出戶就可以通過互聯網買到世界各地的藥品,導致假藥銷售及管制類藥物走私情況日趨嚴峻,嚴重危害了人們的身體健康。因此迫切需要建立對藥品的準確、快速檢驗方法。
非巴比妥類鎮靜安眠藥為新型中樞神經抑制藥,包括強安定藥和弱安定藥兩類。前者為抗精神病藥,其中吩噻嗪類為首選藥物。后者為抗焦慮性鎮靜藥,常用的主要為苯二氮類[1]。目前此類藥物的臨床應用廣泛,有的甚至可在醫藥商店購買到。吩噻嗪類藥物濫用中毒多為錐體外系反應[2];苯二氮類藥物的危害也被廣泛報道,濫用易產生依賴性,且會對人的認知功能產生負面影響[3]。近年來,管制類藥物走私不斷出現新特點,不法分子常通過郵寄渠道,如通過快件、空運貨物渠道由拉美地區走私入境,或通過行李物品夾藏等方式從空港旅檢渠道走私進境,且相關案件呈增長趨勢。對此類藥物的快速準確檢驗在犯罪嫌疑人的確定、案件偵破以及定罪量刑等方面都具有重要意義。因此必須完善技術打造利器,精準打擊違法犯罪。
光譜技術提供了一種快速靈敏且無損的有效檢測方法,成為法庭科學領域的有利分析工具[4-8],適用于藥物成分的檢驗分析。已有的相關研究主要進行簡單的藥物定性檢測,缺乏對光譜數據的深入挖掘與分析[9-10]。在實際檢驗中,存在多種藥物混雜的情況,而對于多種成分共存的藥物進行檢驗在分離和分析方法上尚存在一定的局限性。目前使用高效液相色譜、氣相色譜與質譜聯用等技術對鎮靜安眠藥進行檢測的檢材主要為生物樣品[11-12],對繳獲藥物的研究相對較少,且此類檢測方法成本較高,操作也較為復雜,無法滿足基層公安工作的需要。
紅外光譜具有特征性強、測定快速、不破壞樣品、試樣用量少、操作簡便等優勢,在物質鑒定方面得到了廣泛應用。本研究采集了苯二氮類(艾司唑侖、阿普唑侖、地西泮、硝西泮)和吩噻嗪類(奮乃靜、氯丙嗪、異丙嗪)藥物的紅外光譜數據,通過主成分分析(Principal component analysis,PCA)提取不同波段光譜數據特征后進行降維,并借助貝葉斯判別分析(Bayes discriminant analysis,BDA)和多層感知神經網絡(MLP)構建了單一和融合模型進行對比。結果顯示,融合模型由于在數據預處理階段將提取的光譜數據特征值重新串聯,從而可獲得更豐富的譜圖信息。本實驗借助數據模型對不同類型樣品及同一類型不同種類的樣本進行識別與分類,以期為相關案件的檢驗鑒定提供參考,為相關物證的檢驗鑒定提供幫助。
Nicolet 5700 型傅里葉變換紅外光譜儀(Thermo Fisher Scientific 公司),ATR 樣品槽使用金剛石晶體,KBr分束器(Thermo Fisher Scientific 公司),使用OMNIC 光譜數據處理軟件。掃描次數為64 次,分辨率為2 cm-1,光譜采集范圍為4 000~400 cm-1(4 000~3 700 cm-1主要為設備噪聲,1 300~400 cm-1為紅外光譜指紋區),每個樣本采集4次光譜曲線,取均值作為實驗樣本光譜數據[13-16]。
借助傅里葉變換紅外光譜儀獲取樣本譜圖,采用峰面積歸一化、自動基線校正和多元散射校正等對譜圖進行處理[17-19],將光譜數據集標準化并進行一階與二階求導,經PCA 降維后以70%的樣本作為訓練集,30%的樣本作為測試集構建分類模型[20]。
圖1為各樣本的紅外光譜圖,在波數3 700~3 000 cm-1和2 500~2 000 cm-1范圍內,各樣本之間的峰形有所差異。2 750~3 000 cm-1波數范圍內有尖峰,各類樣本部分波段出峰位置相似,具有相似的振動基團,總體峰形較為混雜,難以依靠圖譜進行直觀區分。

圖1 苯二氮類(A)和吩噻嗪類(B)樣本的紅外光譜圖Fig.1 Infrared spectra of benzodiazepine(A)and phenothiazine(B)samples
分別構建基于全波段光譜和指紋區光譜數據集的原始、一階和二階導數的單一模型,比較其BDA和MLP 的分類準確率。由表1可知,單一模型中BDA 訓練集和測試集的總體分類準確率較為穩定。這是由于MLP 分類識別率使用的是各數據集重復6 次測試的平均值,且采用隨機取樣的方式對數據變量進行分析,導致分類識別率在一定區間內變化。而BDA 是按判別函數值最大或后驗概率最大進行判別,因此分類識別率保持相對穩定。

表1 不同方法下的分類識別率Table 1 Classification recognition rates under different methods
圖2 為全波段和指紋區數據集原始、一階導數和二階導數模型的受試者工作特征曲線(Receiver operator characteristic curve,ROC 曲線),縱坐標為感光度,橫坐標為特異性,圖2A 中的紅色和藍色兩條ROC曲線相較于圖2B均較為靠近左上角。ROC曲線越靠近左上角或ROC曲線下的面積(AUC)越大,模型越理想。反復進行多次數據分析后發現,相較于指紋區光譜,全波段光譜的分類識別率更高。

圖2 不同單一模型的ROC曲線Fig.2 ROC curves of different single models
綜合表1、圖2 可知,借助BDA 的分類模型中,基于全波段光譜數據集的二階導數單一模型分類效果最優,總體分類準確率達92.7%。進一步考慮對光譜數據進行融合,以期使用更豐富的數據信息構建分類模型,實現對樣本更準確的分類。
如圖3 所示,通過PCA 對全波段和指紋區數據集二階導數模型進行特征變量的提取,全波段和指紋區數據集分別提取到20個和18個特征值。圖中縱坐標代表提取的特征值,橫坐標的特征值重要性反映了此特征值對應的特征向量對整個數據集的代表程度。特征值重要性的百分比越大,此特征值對應的特征向量對整個數據集的代表程度越好。由此可見,基于全波段和指紋區數據集二階導數模型提取的大部分特征變量對數據集有較好的代表性。

圖3 全波段光譜(A)和指紋區光譜(B)二階導數模型特征值的重要性Fig.3 Eigenvalue importance of the second derivative model of the full spectra(A)and the fingerprint spectra(B)
在單一模型的基礎上,將經過PCA 降維后提取到的特征值串聯后建立模型,對分類準確率最高的全波段和指紋區數據集二階導數進行融合,得到36 個特征值。如圖4 所示,相比單一模型,特征值數量得到明顯提高,其重要性有所提升。說明融合模型特征值能更好地反映整體數據集的情況。

圖4 全波段與指紋區光譜二階導數融合模型特征值的重要性Fig.4 Eigenvalue importance of a fusion model of the second derivative spectrum of the full spectra and fingerprint spectra
分別使用BDA 和MLP對全波段和指紋區數據集的二階導數融合模型進行分析,對比不同模型對兩類安眠藥的分類預測準確率,結果如表2 所示。由表可見,融合模型的效果優于單一模型,借助BDA的二階導數融合模型分類效果好且穩定。圖5為此融合模型的ROC 曲線,ROC 曲線下面積AUC 更直觀地體現了模型的分類效果。融合模型結合了單一模型的優勢,對數據特征進行了統計分析,使相似成分能夠有效區分,為模型的構建提供了更全面的信息。

表2 不同方法下二階導數模型的分類識別率Table 2 Classification and recognition rates of the second derivative model under different methods

圖5 融合模型的ROC曲線Fig.5 ROC curve of the fusion model
吩噻嗪類:Y2=-33.111+2.582X1+9.682X2+10.469X3-23.157X4-4.367X5+11.491X6-4.610X7-3.893X8+ 3.607X9+ 10.743X10+ 2.101X11-4.845X12-3.784X13-8.514X14+ 3.233X15+ 0.720X16+ 4.382X17+0.596X18-3.116X19+ 2.126X20+ 1.897X21+ 2.401X22-0.081X23-1.298X24+ 8.182X25+ 1.575X26+ 1.254X27+3.817X28+4.638X29-6.281X30+3.626X31+3.297X32+5.108X33-2.739X34-11.766X35-8.238X36。
運用貝葉斯判別公式可以計算出兩類鎮靜安眠藥的分類識別率,結果表明兩類藥物均可實現100%的準確區分,分類結果理想。以上實驗表明,借助貝葉斯判別分析的基于全波段和指紋區融合數據集的二階導數模型為最佳分類模型。
采用借助貝葉斯判別分析的全波段和指紋區融合數據集的二階導數模型對4種苯二氮類和3種吩噻嗪類鎮靜安眠藥進行分類識別,分別得到兩類鎮靜安眠藥的空間分布圖。如圖6A所示,不同種類樣品在不同判別軸上的分布差異性大,其中藍色與綠色較為集中,結合BDA1、BDA2 與BDA3 判別軸,該模型對所有苯二氮類樣品的分類正確率達96.7%。如圖6B 所示,在BDA4 判別軸上,綠色與紅色分離較好;在BDA5判別軸上,藍色與紅色分離較好,結合BDA4 與BDA5 判別軸可實現對所有吩噻嗪類樣品100%的準確分類。結果證明該分類模型對同一類型不同種類的安眠藥同樣適用。

圖6 苯二氮類(A)和吩噻嗪類(B)藥物的空間分布圖Fig.6 The spatial classification details of benzodiazepine(A)and phenothiazine(B)samples
本文將不同波段紅外光譜數據融合,借助貝葉斯判別分析和多層感知器構建分類模型,實現了不同類型鎮靜安眠藥的快速、無損有效區分。基于二階導數構建了全波段與指紋區光譜的融合模型,并與單一模型進行比較,發現融合模型對苯二氮類和吩噻嗪類兩個不同類型精神藥物的分類準確率可達到100%;對苯二氮類精神藥物中艾司唑侖、阿普唑侖、地西泮和硝西泮的分類準確率達到96.7%;對吩噻嗪類精神藥物中奮乃靜、氯丙嗪、異丙嗪的分類準確率達到100%。不同類型藥物的光譜數據不同,可以此為依據對海關現場繳獲的精神藥物進行分類鑒別,提升公安機關維護社會公共安全的能力。光譜融合技術為管制類藥物的研究提供了一種快速且無損的有效方法,有望成為法庭科學領域的有利分析工具。