徐浩東 王建鋒
(西京學院,陜西 西安 710000)
高血壓是指以體循環動脈血壓增高為主要特征,是常見的慢性病。除評估診室血壓外,患者還應注意家庭清晨血壓的監測和管理,所以可穿戴設備可以提供持續的動態監測對控制血壓、降低心腦血管事件的發生率帶來了巨大的幫助。目前,可穿戴設備通常利用單模態數據進行血壓預測[2],例如心電信號、加速度信號等,其預測效果尚未達到臨床診斷的預期。本文提出了基于注意力機制和圖循環神經網絡的高血壓預測系統,該系統將患者的多模態生理信號以圖(Graph)的形式表征,已有的高血壓檢測研究表明,多種臨床器械聯合應用能夠明顯提高臨床時間的檢出準確率。同時,注意力機制的引入將會考慮患者間的個體差異性,當可穿戴設備佩戴在用戶手腕時,傳感器設備將持續動態地上傳各項生理參數數據,云端服務器根據個體的差異調整模型,提高模型的病理分析能力。
系統的整體工作流程分為:線下模型預訓練過程和在線模型訓練測試過程。其中線下預訓練過程步驟包括:a.搭建基于可穿戴設備、智能手機和云平臺服務器的數據平臺。包括存儲層和數據處理層。b.采集可穿戴設備及其傳感器測量的數據。數據包括PPG 數據,三軸加速度數據,心率、血氧飽和度、血壓和體溫。c.用戶填寫基本信息。數據包括姓名、性別、年齡等。d.由專業醫護人員報告監護高血壓事件發作的事件和表現。e.根據采集的傳感器信息、靜態信息和高血壓發作事件報告建立基于圖長短時記憶單元和注意力機制的深度神經網絡,并將訓練好的模型部署至云服務器。系統線下實施流程圖如圖1 所示。
在線訓練測試步驟包括:a.采集可穿戴設備及其傳感器測量的數據。數據包括PPG 數據、三軸加速度數據、心率、血氧飽和度、血壓和體溫。b.通過更新的數據和已填寫的用戶基本信息進行模型的測試,分析臨床事件發作的風險。c.根據用戶的報告,在已有模型上分別對用戶報告的結果進行訓練,建立針對各個用戶獨立的模型。系統在線實施的流程圖如圖2 所示。

圖2 系統在線實施流程
醫學臨床的時序數據包括多種數據源,一般可表示為X={Xbase,Xwave}。其中,Xbase=[x1,x2, ...,xn],n∈N+表示臨床靜態數據,如性別、年齡等。Xwave為多通道時序波形或生理參數數據,可以表示為:

這里的m 表示通道個數,n 表示在時間t 內采樣序列的長度。從不同通道采集到的序列代表著不同的物理意義。臨床診斷任務表明將患者的多模態數據聯合使用在預測準確率上比使用單一模態數據有明顯提高。同時不同模態數據之間存在一定的關聯關系,為了表征數據間的相互關系并提取深層的語義信息,本文引入圖的概念。圖是由頂點(Vertex)集合及連接頂點間的邊(Edges)組成的一種數據結構。其定義為:
G=(V,E)
其中V={vi|i=1,2,...N} 表示所有頂點的集合,表示頂點的個數。E={eij|vi,vj∈V},|E|≤N2表示頂點與頂點之間所連接的邊。圖的表示形式有三種,分別為鄰接矩陣、度矩陣和鄰域。當頂點個數較為稠密時,鄰接矩陣是比較合適的表達方式,本文也將利用鄰接矩陣的形式表征多模態數據。鄰接矩陣是一個元素為bool 值或權值的N×N矩陣,若圖中存在一條連接頂點vi和vj的邊eij,則aij≠0,否則為0,該矩陣的定義如下:

可穿戴設備及其傳感器所采集的數據包括PPG 信號、三軸加速度數據、心率、血氧飽和度、血壓、體溫。臨床醫學診斷過程中發現多模態數據PPG 信號會受到運動偽軌跡的影響,因此它與三軸加速度信號直接相關,同時PPG 信號與心率和血氧飽和度也存在一定的關聯關系,而與體溫數據沒有關聯。本文利用無向圖表示多模態數據,因此構造的鄰接矩陣Aij是一個對稱方陣,且主對角線元素均為0,橫縱坐標表示的通道信號分別為PPG、加速度x 軸、加速度y 軸、加速度z 軸、血氧飽和度、血壓、溫度以及心率。若通道之間存在相互關系則權值表示為1,否則為0。鄰接矩陣將和多模態數據一同作為參數送入Graph LSTM 網絡中,網絡將提取各數據間的語義信息。

公式中xt為t 時刻的輸入通道向量,ht為當前時刻的


圖3 Graph LSTM 內部結構
神經網絡模型主要包括Graph LSTM、位置編碼器、多頭自注意力模塊以及預測模塊,整體框架如圖4 所示。

圖4 神經網絡模型框架
2.4.1 位置編碼器
為了整合關于序列順序的信息,模型將經過Graph LSTM 得到的隱狀態向量加入位置編碼[5]為時間戳提供相對位置信息,這樣做的好處在于既符合臨床診斷的一般規律也提高了模型的可解釋性。通過位置編碼器部分,將位置向量pt加到隱狀態矩陣上,輸出向量Pn的維度與Hwave保持一致:
靜態信息Xbase經過嵌入后表示為Pbase,與多通道時序數據處于同一維度空間,因此在傳入注意力機制之前所有數據可以使用矩陣P 來表示:P=(Pn,Pbase)。
2.4.2 多頭注意力機制

這里的Wq、Wk和Wv為投影矩陣,不同多頭注意力子層之間不共享投影矩陣參數,因此可以在不同空間中捕獲輸入向量之間的相互關系,自注意力層的輸出通過拼接和經過全連接層的操作后將包括全局的向量特征,實現信息融合。經過多頭注意力機制高血壓患者的靜態信息以及多模態動態數據可以用P*來表示:P*=(P*n,P*base)。為了預測高血壓在某時間窗口病發與否,我們將經過多頭注意力機制的輸出張量P*轉換為一個二維向量完成二分類任務。在這里,本文引入了個性化特征注意力整合方法,具體來說查詢向量Query 由靜態信息P*base得到,而鍵向量Key 則通過P*n得到。計算公式如所示:


本文提出的基于注意力機制及圖循環神經網絡的高血壓預測系統將多模態數據利用圖的形式表示并轉換成結構化數據,利用Graph LSTM 作為淺層網絡提取多模態數據,提高了模型在預測高血壓任務上的準確率和魯棒性。其次,注意力機制的引入在原有模型的基礎上進一步對特征向量進行融合,利用訓練得到的注意力權重合理的分配計算資源,提高模型運行時的效率。靜態信息和動態序列數據的共同作用,使得該預測方法可以根據高血壓患者的特點做個性化診斷。