祝青芳


摘 要:本文介紹了一種基于隱馬爾科夫模型(HMM)的分析核磁共振圖像(fMRI)數據的無監督學習模型,與一般線性模型(GLM)方法不同,GLM的主要針對體素的血氧水平(BOLD)反應大腦活動的時間序列響應進行建模,而HMM方法主要針對體素在第一個時間序列的演化過程進行建模。因此,HMM方法可以在BOLD信號上發現更多的信息。本文介紹了兩種不同的腦激活檢測方法,第一種方法基于似然估計和似然估計比檢驗,其中高斯模型被用來增加HMM似然映射的對比度。第二種方法是基于兩個狀態的分布之間的定距,其中,對HMM狀態序列進行最有效的估計的是Viterbi算法。通過T檢驗或使用K- L距離(KLD)來測量激兩種狀態之間是分布距離。
關鍵詞:腦激活檢測 功能磁共振成像 隱馬爾科夫模型 似然比
中圖分類號:TP393.0 文獻標識碼:A 文章編號:1672-3791(2018)05(a)-0094-02
功能磁共振成像(fMRI)技術是一個在認知神經科學領域的檢測大腦活動的技術。每個功能磁共振成像體素的響應表示氧合血紅蛋白和脫氧血紅蛋白濃度的在時間序列上的變化,因為神經激活可能增加血流腦的某些區域。BOLD信號通常被認為是腦活動的間接信息。
1 基于fMRI序列的隱馬爾科夫模型
隱馬爾科夫模型是一個含有隱含位置參數的馬爾科夫過程的統計模型,描述了一種不同狀態集組成的一個序列集合。隱馬爾科夫模型包含有限個狀態。在傳統的馬爾可夫鏈中,狀態是直接可見的,并且狀態轉移概率是確定的。然而在HMM中,只有在隱馬爾可夫模型中,狀態是不直接可見的,但輸出依賴于該狀態。每個狀態通過可能的輸出記號有了可能的概率分布。因此,通過一個隱馬爾科夫模型產生標記序列提供了有關狀態的一些序列的信息。一個隱馬爾科夫模型可由以下描述:
因此一個隱馬爾科夫模型可以表示成為,我們假設每個狀態的分布服從高斯分布:
給定隱馬爾科夫模型和狀態O,通過Viterbi算法[36]計算的最大似然,估計可以得到最可能的序列,Viterbi的權值函數如下:
表示狀態i在時間t最可能的分布,可以整理如下:
在隱馬爾科夫模型的應用中,多個隱馬爾可夫模型被不同組標記的數據訓練。隱馬爾科夫模型的參數通過訓練集進行估計,通過最大似然估計進行分配。
1.1 HMM似然估計
在無監督的學習方法中,HMM參數通過給定給定模式和體素的時間序列訓練得來。這與傳統的隱馬爾科夫模型直接從訓練集上訓練得到參數不同,因為這些腦激活過程會在不同的體素和患者之間不同,因此避免直接訓練參數,不使用固定的體素特征。
因為腦活動只有兩種狀態,on和off狀態在此工作中,另狀態數N=2,on狀態S1和off狀態S0
基于給定給定模式,我們令on狀態的序列為Lon,off狀態的序列為Loff,狀態轉移矩陣A可以表示為, a01=1-a00,,a10=1-a11。
腦激活檢驗的參數可以通過體素的時間序列O表示,假設采樣服從高斯分布,另pon表示on狀態分布,Poff表示off狀態分布,off狀態So高斯分布的參數為:
由給定模式可知,序列總是從off狀態開始,因此我們令,π0=1,π1=0,給定一個二值狀態的隱馬爾科夫模型,如果這個觀察序列有兩個很明顯區分的狀態,那么會與顯著不同,那么這個模型針對這個序列的似然估計會比較高。如果觀察順序沒有這樣明顯分布不同或者有兩個相似的狀態,那么這個狀態轉移就會顯現隨機性,因此不會與狀態轉移矩陣A有很好的擬合,在這樣的的情況下,該序列的最大似然估計將就會比較低。
為了增強似然映射的正確率,我們為Poff采樣引入高斯分布,與二值隱馬爾科夫模型的So狀態分布一致,以下的對整個序列的似然估計都將基于高斯假設。
1.2 狀態分配距離
給定高斯分布的參數和通過t檢驗計算不同分布之間的距離為:
對fMRI每個序列的體素進行計算t值,t值高的點對應于激活的體素KL距離通常被用來衡量兩個概率分布密度之間的距離。因為KL距離不對稱,因此理論上來說并不是真正的距離,KL距離通常用來表示相對熵;
2 結語
本文提出一個假設,令所有給定給定模式為off狀態的作為off狀態采樣,所有給定給定模式是on狀態的作為on狀態采樣,我們把這種方法稱為“模式狀態”方法。通過將序列與HRF卷積波形而得到μ0和μ1,將體素序列與加權模式波形的殘差作為σ0和σ1。我們通過不同的方法來計算體素序列的兩種不同隱馬爾科夫狀態,并且通過Viterbi算法計算最可能的狀態序列,這種方法是Viterbi路徑方法,然后通過優化每個序列的狀態分配得到on狀態和off狀態的取樣概率分布,通過off狀態的分布得到,通過on狀態的分布得到。
參考文獻
[1] 林亞平,劉云中,周順先,等.基于最大熵的隱馬爾可夫模型文本信息抽取[J].電子學報,2005,33(2):236-240.