丁尚文,王純賢
(1.合肥工業大學基礎部,安徽 宣城 242000; 2.合肥工業大學機械工程系,安徽 宣城 242000)
飲酒作為一種社會習俗和文化已經流傳了幾千年。酒文化的巨大作用和影響推動了社會的發展,同時也給社會帶來了巨大損失。長期過量飲酒會產生高血壓、糖尿病及心腦血管等疾病。高劑量攝入酒精會引發腦細胞毒性水腫,并且長期酗酒會導致腦部形態在額葉、胼胝體等部位發生特異性損傷[1]。
對于過量飲酒危害是否對腦認知功能產生損傷,國內外學者開展了相關研究工作。Michael等采用威斯康星卡片分類對急性飲酒志愿者進行測驗,結果表明急性酒精中毒可導致大腦執行控制能力下降,其相應的持續語言功能由于受到酒精抑制而導致語言表達不連貫[2]。謝成娟等對酒精依賴患者進行愛荷華博弈測試(Iowa gambling test,IGT)。試驗結果表明,對照組的IGT凈得分顯著高于酒精依賴組,并推測認為患者的IGT表現受損,可能與眶額葉皮質、杏仁核受損等有關[3]。Ehler等采用腦電(electroencephalogram,EEG)技術研究發現酒精依賴患者在靜息態下額葉部位β功率明顯高于對照組[4]。劉桂青等[5]對酗酒者腦皮層EEG信號的同步性開展研究,結果發現酗酒者大腦不同區域間的功能連接強度受到一定程度的損傷。Korucuoglu等采用EEG方法研究急性飲酒對腦認知功能的影響,結果發現與安慰劑組相比急性飲酒志愿組的額葉處EEG信號α功率有明顯的增強[6]。文獻[7]采用的Flanker范式考察被試者在清醒狀態和飲酒狀態下的事件相關電位(event-related potentials,ERP)的差異性,研究結果發現飲酒會導致前扣帶回處的神經活動興奮,進而使得覺察、認知功能和控制能力下降。
綜上分析可以發現,國內外研究人員采用認知量表、EEG技術等研究了酗酒成癮者腦認知功能損傷問題,研究結果給出了飲酒對腦認知功能產生影響的定性結論。進一步研究期望獲得研究個體EEG信號評估特征參數;利用已經獲得的評估參數對酗酒者EEG信號識別與分類。
支持向量機(support vector machine,SVM)是以統計學理論為基礎的一種模式分類識別技術[8]。為了對訓練數據進行分類,SVM的基本原理就是要尋找一個最優分類面,盡可能使得訓練數據中樣本間距最大,從而將訓練數據分類。最優分類面如圖1所示。圖1中的虛線表示分類的邊界線,在邊界線上的向量稱之為支持向量。邊界線之間的距離稱之為分類間隔。

圖1 最優分類面示意圖
wx+b=0為分類線方程。該方程滿足條件:
yi[(wxi)+b]-1≥0

(1)
采用Lagrange求極值方法,利用對偶理論將式(1)中目標函數最值求解問題轉化為求下列目標函數最值問題[8]:
(2)
求解式(2)中對偶問題,得到最優分類面的權系數向量以及分類域值為:
(3)
x(1)為式(3)中的訓練數據中第一類樣本點,x(-1)為第二類樣本點。式(4)中的最優分類函數稱之為支持向量機,又稱之為最優分類函數。
(4)
(xi·x)在式(4)中表示為內積,且(xix)可選用核函數K(xix)替換,核函數的選取滿足Merce條件即可,但核函數表達式的不同對SVM分類結果有不同影響。另外,對于訓練樣本不可分情況,SVM借助松弛變量ξ以判斷對訓練數據xi的分類程度,懲罰因子C用來判斷最小錯分樣本點個數和分類間隔,最終獲得最優分類面。式(4)中的(x1,y1),(x2,y2),…,(xn,yn)為已知訓練樣本。其中,xi∈Rl,yi∈{+1,-1},i=1,2,…,n。支持向量算法優化的目標函數為:
(5)
s.t.yi(w·xi+b)≥1-ξi,ξi≥0
常用的核函數形式主要有線性核函數、內積核函數、徑向基核函數等[8]。
本文分析采用的數據均來自于紐約大學HenriB教授在互聯網上公開的EEG數據庫。該數據主要涉及的是酒精中毒病人的相關腦電信號數據。試驗記錄了兩組試驗對象,即酗酒者和對照組在3種視覺刺激條件下的EEG信號。試驗時,按照國際標準在受試者頭部放置64導電極,設備采樣頻率為256 Hz,每次試驗記錄1 s的數據。試驗過程施加單一刺激或者復合刺激。數據采集存放在兩個數據集SMNI_CMI_TRAIN和SMNI_CMI_TEST。數據選擇:本文數據選擇來源于該試驗的大數據集(The Large Data Set),受試者包括酗酒者和正常人。各選擇10例受試者數據用來測試。從酗酒者和對照組的EEG數據中分別隨機選擇6段數據作為分析樣本,每組試驗數據作為訓練樣本或者測試樣本,共計三組數據,分別簡稱數據1、數據2和數據3。
本文將酗酒者和健康者EEG信號相關參數作為標準,采用SVM方法期望借助評估參數對酗酒者和健康者EEG信號進行分類識別,同時優選出用于識別兩類不同EEG信號的最佳評估因子。
能量參數:在EEG節律特征研究中,大多選擇特征波的能量這一特征值對信號進行特征識別。EEG信號的低頻率節律相關能量E可用式(6)計算得到:
(6)
式中:x(n)為EEG信號的幅值;N為采集到數據點個數。
通過式(6),能夠計算出低頻率節律波EEG中相關的α、β和θ節律波段的能量[9]。
EEG信號功率譜AR參數:在信號頻譜分析方法中,AR譜估計(簡稱AR模型)由于可用較短時長數據獲得較高頻率分辨的優點而被研究者廣泛使用。AR算法詳見文獻[10]。該算法是建立在數據基礎上的基于自回歸系數求解的有效算法。
EEG信號近似熵:Pincus等在研究混沌現象課題時發現熵可以用來描述混沌現象[11],他們利用信號的時間序列復雜度提出了近似熵模型。通過近似熵判斷時間序列中新信息發生的可能性,以此判斷混沌現象中產生新模式的可能性。近似熵具體算法詳見文獻[11-12]。
將酗酒者和健康者的EEG信號的特征參數集合{‘EEG信號能量參數’,‘EEG信號功率譜AR參數’,‘EEG信號近似熵’}中任意元素作為EEG信號評估參數,將該參數對應的信號數據作為支持向量的訓練樣本。例如將EEG信號能量值作為訓練樣本(x1,y1),(x2,y2),…,(xn,yn),xi∈R2,yi∈{+1,-1},i=1,2,…,n。酗酒者的EEG信號能量值標簽對應設定為1,健康者的EEG信號能量值標簽對應設定為-1。將10例酗酒者和10例健康者的EEG信號能量值數據作為訓練樣本,對SVM模型參數進行訓練和估計。將對應的兩類EEG信號能量值各10例為測試樣本,分別對應的標簽設置為1和-1,具體流程見圖2。根據圖2算法流程,對EEG數據采用SVM方法(使用libsvm軟件包)進行訓練和測試。本文選擇線性核函數作為SVM的核函數,借助EEG信號不同頻率段對應的能量值,將酗酒者和健康者EEG信號分類。

圖2 基于SVM的酗酒者和健康者的EEG信號分類流程圖
基于不同數據組的測試效果對比如表1所示。

表1 基于不同數據組的測試效果對比
從表1可以發現,采用近似熵、AR參數作為訓練樣本,能夠對酗酒者EEG信號和健康者EEG信號分類識別,測試誤差率最小值分別為22.5%和25%。采用α、β和θ能量值作為訓練樣本,能夠對酗酒者EEG信號和健康者EEG信號分類識別,測試誤差率最小值分別為25%、35%和10%。對應的基于θ能量評估參數的酗酒者和健康者EEG信號分類結果見圖3。通過以上的分類結果比較,可以發現最佳的評估因子為θ能量評估參數,且使用θ能量評估參數采用SVM方法能夠對兩類不同EEG信號分類識別,識別精度最高達到90%。

圖3 第十通道EEG信號θ能量評估參數分類結果圖(分類誤差10%)
酗酒會對腦認知功能產生嚴重損傷,國內外研究者采用認知量表、EEG等技術已進行大量的研究,并給出較為可靠的腦認知損傷報告。本文提出基于支持SVM方法的EEG信號自動分類檢測技術。本文的工作能夠為當前國內外研究機構對酗酒成癮者評估檢測提供技術參考,能夠對健康飲酒者是否有酗酒傾向提供輔助檢測。