(公安部第一研究所,北京 102200)
當今世界,在海洛因、大麻等第一代傳統毒品和以冰毒、搖頭丸等第二代傳統合成毒品仍舊泛濫的情況下,第三代毒品即新精神活性物質已凸顯且異常活躍。近年來,新精神活性物質對社會的危害呈上升趨勢愈演愈烈,面對新精神活性物質新產品變化多樣層出不窮、以及美國內芬太尼類物質濫用等各國存在的問題,全面開展新形勢下的禁毒之戰是全世界全社會共同面對的重大課題,現代快速檢測識別技術對新精神活性物質濫用擴散的遏制無疑將發揮積極作用。
拉曼光譜分析技術因其無需制樣、無損、快速、信息豐富、水干擾小、可重復、靈敏度高、強穩定性及高分辨率等眾多優點,已成為分析化學及工業、安檢及反恐等領域物質結構信息測定與快速識別鑒定的有效技術[1-6]。本研究借助現代拉曼檢測技術,針對新精神活性物質拉曼譜圖信號其普遍存在的強熒光背景問題,充分挖掘解析原始信號曲線的統計特性,通過線性回歸分析創新引進“廣義信噪比”,提出了一種快速去除強熒光背景的基線校正方法,該方法的應用在實際中將為拉曼光譜特征峰的準確提取及其后續的定性定量分析提供正確可靠的過程數據,有效去除強熒光背景是新精神活性物質拉曼譜圖信號數據處理的關鍵環節[7-10]。
一般而言,隨著激光激發波長的漸增,新精神活性物質拉曼譜圖信號漂移變化總趨勢呈現了從平緩、突增、上升、下降、緩降直至平緩,而所檢測物質的真實拉曼光譜特征峰疊加在強熒光背景信號之上,新精神活性物質受激光激發產生的熒光光譜等背景信號卻遠強于物質拉曼特征峰的真實信號,圖1為典型示例圖。

圖1 1-(4-氯苯基)-2-乙氨基-1-戊酮拉曼譜圖原始信號
由此可見,新精神活性物質拉曼譜圖原始信號其特有的強熒光背景將嚴重影響待測物質拉曼光譜特征峰的準確提取及其后續的定性定量分析,有效去除強熒光背景是新精神活性物質拉曼譜圖信號數據處理的重中之重。
為敘述方便起見,現引進“廣義信噪比”如下:
首先,基于線性回歸刻畫新精神活性物質拉曼譜圖信號曲線漂移變化,即對原始信號進行信號數據窗移動和局部窗口線性擬合,從而得到各數據窗口的線性回歸擬合線、信號線性漂移下行線、信號線性漂移上行線。其中,線性漂移下行線、線性漂移上行線為與線性回歸線平行的、并分別通過下方和上方最大偏差信號點的兩條平行線,見圖2

圖2 “廣義信噪比”定義理解輔助圖
通過觀察分析發現:(1)兩條平行線之間的距離d(X)反映了該信號數據窗口去除基線后真實信號的變化幅度,拉曼信號曲線與線性漂移下行線的交點為準基線點;(2)通過計算得到的準基線點集合包含了全部的真實基線點,還需進一步對準基線點進行判斷并從中提取真實基線點(詳見下文);(3)當d(X)比較大時,對應的數據窗口蘊含了拉曼特征峰信號,反映了拉曼譜峰峰位及峰幅度等特征值;當d(X)很小時,對應的數據窗口蘊含了噪聲信號,反映了噪聲信號的隨機偏差。于是,通過對強熒光背景新精神活性物質拉曼譜圖原始信號從左到右逐點進行窗移動和局部窗口線性擬合及系列計算,得到了各點對應其局部數據窗口沿信號漂移線性上下方浮動的變化幅度值d(X)。因此,現定義廣義信噪比如下:
GSNR(X)=d(X)/RDV
(1)
其中
RDV= min(d(X))
(2)
事實上,原始信號的廣義信噪比值在譜峰信號與噪聲信號處表現特性不同,在信號譜峰處附近其廣義信噪比值保持較大,而在其它處的廣義信噪比值較小,廣義信噪比值較小的所對應的準基線點為真實基線點。見圖3、圖4。

圖3 廣義信噪比仿真結果示例圖

圖4 廣義信噪比歸一化仿真結果示例圖
鑒于原始信號的廣義信噪比在譜峰信號與噪聲信號等其它處的特性不同,根據廣義信噪比歸一化閾值可提取真實基線點,再線性連接相鄰基線點,從而最終實現基線校正的目標。
本研究所設計的基線校正方法,首先設置信號數據窗口尺寸WindowSize和廣義信噪比歸一化閾值GsnrNormThreshold,采用從左到右逐點移動信號窗口,對各窗口的數據進行線性回歸與計算獲得信號線性漂移上下方浮動的變化幅度值d(X)、廣義信噪比GSNR(X)和準基線點,然后由廣義信噪比歸一化閾值判斷提取真實基線點,再對相鄰基線點采用線性連接形成一條完整的基線。
該算法共有兩個參數即數據窗口的寬度WindowSize和廣義信噪比歸一化閾值GsnrNormThreshold,基線校正參數選項見表1。

表1 基線校正算法參數選項表
關于該基線校正算法的實現,如流程圖5所示。

圖5 基于隨機信號處理的基線校正算法程序流程圖
備注:
(1)在實用中亦可結合儀器信號系統實際情況完善配套軟件算法庫并優化相應算法具體細節,如添加拉曼光譜spike峰剔除功能等[11];
(2)該數據處理流程實際包含了刪除首尾無用信號段,因這不是本文的主題對此不再贅述其具體體現,該項工作亦可在儀器信號采集與數據前處理系統中完成;
(3)本算法亦適用于其它化學譜圖信號的基線校正處理。
根據上述新精神活性物質拉曼譜圖信號強熒光背景去除方法和程序流程圖,筆者用Matlab編程實現了該算法,為限于篇幅具體程序省略。本示例對一幅3,4-亞甲二氧基丙卡西酮拉曼譜圖原始信號采用所編寫的程序進行數據處理,仿真結果如圖6、圖7所示。
通過以上及多組仿真實驗結果分析可得:(1)采用本研究設計的算法進行數據處理,根據廣義信噪比歸一化閾值判斷能有效提取真實基線點;(2)基于多參數選項的算法更加靈活實用,可通過選擇適當的參數值優化應用效果:算法參數WindowSize的選取通常以峰寬值為參考值、一般選取約半峰寬至約全峰寬即可;算法參數GsnrNormThreshold的選取應比較適中,當GsnrNormThreshold太小(與0值靠近)、或太大(與1值靠近),基線范圍將會減小、或擴大,從而導致基線貫穿、或基線過校正;當GsnrNormThreshold適當大時,對譜峰兼有一定的去卷積作用(如圖7所示);(3)在實際應用中可結合儀器信號系統實際情況確定參數值適合范圍。

圖6 仿真結果顯示圖WindowSize=21;GsnrNormThreshold=0.2

圖7 仿真結果顯示圖WindowSize=21;GsnrNormThreshold=0.3
本研究科學合理引進“廣義信噪比”,創新提出了一種有效去除強熒光背景的基線校正方法,利用原始信號的廣義信噪比在譜峰信號與噪聲信號處的特性不同,通過廣義信噪比歸一化閾值判斷獲取基線點,再通過相鄰基線點線性連接從而得到最終的基線。該算法具備如下幾個特點:(1)算法直觀簡捷、易于實現,無需平滑去噪等前處理,直接對時間域信號提取能反映原始信號曲線隨機特性的廣義信噪比,從而快速獲取真實基線點;(2)算法含有兩個參數選項,靈活易用、穩健高效,根據算法參數值選擇準則和經驗,通過設置適當的算法參數值(數據窗口寬度WindowSize和廣義信噪比歸一化閾值GsnrNormThreshold)可優化應用效果;(3)為準確獲取待測物質拉曼光譜特征、后續譜圖數據處理峰識別提供可靠的自適應閾值判別依據;
通過以上理論分析和眾多仿真實驗反復驗證,該算法是一種靈活實用、快速簡易的高效算法。