楊中方 金依霖 何加敏 朱政,2,3 胡天天 余駿雯
(1.復旦大學護理學院,上海 200032;2.上海市循證護理中心,上海 200032;3.紐約大學護理學院, 紐約 10010)
隨著信息技術的快速發展和大數據時代的到來,癥狀網絡的應用逐漸受到廣泛關注。癥狀管理會隨著個人結果以及人、健康/疾病或護理環境的變化而發生改變,是一個從多維角度開展護理研究的過程[1]。癥狀管理可幫助理解癥狀(群)間的作用機制、制定及檢驗健康管理策略以及評估干預效果,是一種指導選擇健康管理策略的概念,具有很強的普適性[2]。癥狀網絡區別于傳統的醫學研究,能夠將癥狀和疾病之間的關系加以整合,通過分析癥狀網絡的拓撲結構和網絡特性,從更全面的視角發現疾病或癥狀之間潛在的病理機制和關聯模式。癥狀網絡通過分析癥狀與癥狀間的交互關系,有助于了解不同癥狀之間的關聯程度、相互作用以及可能的因果鏈條,從而為個體化的精準診療和照護提供支持,促進臨床決策的制定。同時通過分析癥狀網絡中的癥狀變化和網絡演化,可以追蹤疾病或癥狀的發展路徑和風險因素,預測疾病的預后。鑒于癥狀網絡的重要研究意義,本文旨在介紹基于數據類型分類的3種主要癥狀網絡類型:同期網絡、動態網絡和時序/個體化網絡。對于每種類型,本文將詳細闡述其數據基礎、網絡模型、分析方法及在健康管理相關研究中的應用案例,以便幫助讀者更好地理解癥狀網絡在解決現實問題中的潛力和優勢。
基于癥狀的數據類型,癥狀網絡可分為同期癥狀網絡、動態癥狀網絡和時序/個體化癥狀網絡。在所有類型的癥狀網絡中,每個節點代表一個癥狀。網絡中的邊代表2個節點之間的條件獨立關系,邊越粗,2個節點之間的關聯性越強[3]。構建癥狀網絡最常用的統計分析軟件為R語言,通過R語言的qgraph軟件包可實現網絡結構的可視化。不同類型的癥狀網絡具有不同的數據特點、網絡模型和分析方法,具體如下。
1.1同期網絡 同期網絡是指在特定時間點或時間段內收集的數據所構成的網絡,用于理解疾病或癥狀間的關聯性[4]。見圖1。

圖1 同期癥狀網絡示例
1.1.1同期網絡概述 同期網絡是一種偏相關網絡,常用于分析橫截面橫斷面數據[4],但目前也出現了采用時間序列數據來構建同期網絡的研究。在Curtiss等[5]的研究中,研究者使用了時間序列網絡模型來評估34例焦慮癥和抑郁癥患者積極和消極情緒的同期網絡結構,以識別積極情緒和消極情緒節點在時間序列數據構建的同期網絡中是否表現出更強的中心性,以厘清積極情緒、消極情緒與基于智能手機的體育鍛煉估計值之間的動態關系。在同期網絡中,同價節點表現出正關聯(如悲傷和焦慮之間等),相反價的節點表現出負關聯(如悲傷和快樂之間等)。這一結果證明在橫斷面和時間序列水平上,同價情感狀態之間存在穩健的正相關關系,而相反價情感狀態之間存在負相關關系。
同期網絡往往為無向關聯網絡,常通過彈簧布局算法來生成[6]。該算法可將具有較強關聯的節點放置在網絡的中心位置,相互之間比較接近。同期網絡分析中還可識別出與總體嚴重程度明顯相關的協變量,以厘清在控制了混雜因素后癥狀之間的真正關系。同期網絡的準確性和穩定性采用Bootstrapping方法來評估,可使用R軟件的bootnet包實現。通過計算邊緣權重值的95%置信區間(CIs)來評估準確性,CIs通常使用非參數引導法來構建。通過計算節點預期影響的相關穩定性系數來評估穩定性,通常采用個案剔除自舉法實現。相關穩定系數最好是>0.5,至少要>0.25[6]。
同期網絡可通過節點的中心性指標從機制角度識別核心癥狀。用以下3種中心性指標進行中心性分析:強度中心性、中介中心性和緊密中心性[3]。從機制的角度來看,強度中心性、中介中心性和緊密中心性越高的癥狀,被認為越重要。較高的強度中心性意味著該癥狀更有可能與其他癥狀一起出現。中介中心性是由1個節點作為2個節點之間最短路徑上橋梁的次數來衡量的。中介中心度較高的節點具有更大的網絡影響力。緊密中心性是由1個癥狀節點和所有其他節點之間的平均距離(逆向距離)表示。路徑越短,緊密中心度值越大。∑s(2個節點之間所有Spearman系數的絕對值)被用作表示網絡密度的指標。
同期網絡使用mgm(mgm是R中的軟件包,被用于存儲“混合”數據,如順序等級變量和連續變量,并利用這些數據構建網絡模型。這個軟件包的全稱就是“mgm”)來確定每個節點的可預測性[7]。節點可預測性是評估網絡中所有其他節點對給定節點的預測程度的指標[8]。具有較高可預測性的癥狀表明可以通過其鄰近節點來控制該癥狀。相反,如果可預測性較低,需要直接對癥狀進行干預或尋找網絡外的標記。同期網絡往往需要進行差異測試,來確定不同變量間的網絡連接和中心性的估計是否不同。Zhu等[6]的研究在基于多態相關矩陣的最小絕對收縮和選擇算子正則化的部分相關網絡中,對邊緣權重和中心性指數進行了自舉式差異檢驗。
1.1.2同期癥狀網絡的應用領域 Bringmann等[9]采用同期網絡構建抑郁癥癥狀的網絡結構模型,發現失重癥(即“喪失快樂”)是最中心的節點,與其他癥狀表現出高度的連接性。此外,網絡結構呈現2個節點群落,這與抑郁癥的憂郁型和非典型亞型的表現一致。Fisher等[10]在情緒和焦慮癥患者的異質樣本中進行了一項時間序列研究,發現消極情緒和積極情緒在同期網絡結構中高度集中,但抑郁和焦慮2個主要癥狀卻不在同期網絡中。積極的情緒節點表現出最大的出強度中心性,預測了下一個時間點的其他幾個節點。Curtiss等[11]研究了雙相情感障礙患者和健康者的情感與體動儀記錄的身體活動的同期網絡結構。結果顯示,2組患者的積極情感和消極情感節點的中心性沒有明顯差異。此外,健康組人群的身體活動在同期網絡中表現出比雙相情感障礙人群更多的連通性,這表明身體活動在情緒心理病理學中對情感的影響起著突出作用。目前,國內研究者較少發表同期癥狀網絡分析的文章,有研究[12]在對2 927例HIV陽性患者構建同期網絡發現,隨著患者HIV陽性年限的增加,16個HIV相關的心理癥狀發生率及其嚴重程度下降,但網絡的總連接密度上升,提示HIV陽性年限越長,患者的心理變得更加脆弱,更容易通過一個心理癥狀快速激活其他癥狀。
1.2動態癥狀網絡 動態癥狀網絡是描述在不同時間點或時間段內,癥狀之間交互關系動態變化的網絡[13]。與同期網絡不同,動態網絡關注的是癥狀隨時間推移而發生的變化。見圖2。

圖2 動態癥狀網絡示意圖
1.2.1動態癥狀網絡概述 當癥狀在幾個時間點測量時,就可以估計橫斷面(同期)的癥狀間聯系(在同一時間點t;a)和縱向(時滯或時間)的癥狀間聯系(從t~t+1;b),其節點間的聯系具有方向性,所構建網絡為有向網絡。另外,節點之間的所有時間性連接都互為等效,而且相互之間的聯系可能強度不等。值得注意的是,動態網絡分析并不局限于具有離散和等距測量時間點的研究。此外,盡管通常真實世界中只能測量相對較少的離散時間點的結果,但原則上這些結果可以代表連續的時間過程。
動態癥狀網絡通常采用多級向量自回歸(vector autoregression, VAR)方法的修改版本分析多個時間窗口間(即面板數據)多種癥狀的短期動態變化。多種癥狀從一個時刻到另一個時刻之間的時間動態由VAR模型表示[14]。在VAR模型中,時間點t的因變量(如癥狀“悲傷”)在自變量的滯后t-1面板上進行回歸。通常為了考慮個體之間的差異,假設所有回歸系數在人群水平上呈正態分布,可獲得由固定(平均)和隨機(個體)效應組成的多級模型。
1.2.2動態癥狀網絡的應用領域 因其關注短期癥狀動態變化,動態癥狀網絡常被應用于心理精神疾病領域的機制研究。正如相關的認知理論[15-16]認為,認知過程的變化(例如消極思維)會導致情感等癥狀的短期動態變化,動態癥狀網絡的研究目的正在于此。在臨床實踐中通常可以觀察到,當患者的一種癥狀(例如睡眠問題)得到緩解,其他癥狀(如頭疼)也會逐漸減弱,這預示著康復的開始。相關研究[17-18]通過對抑郁癥和壓力性生活事件等因素構建動態癥狀網絡發現,抑郁癥危險因素和壓力性生活事件對抑郁癥狀有不同的影響。癥狀之間的相關性直接受到生活壓力事件的影響,并且不能用潛在常見原因的變化來解釋,這進一步支持了癥狀之間具有自主相互影響的觀點。動態癥狀網絡能夠客觀地描述癥狀之間的相互作用,可以為臨床研究和實踐提供重要線索。梁一鳴等[19]使用動態網絡模型分析了197名地震兒童幸存者4年的創傷后應激綜合征首次出現癥狀縱向數據,結果發現,閃回的中心性居高不下,侵入性想法和創傷線索引發生理性反應的中心性隨時間推移而增強,而創傷線索引發情感反應和未來無望的中心性呈弱化趨勢,這為建立災后階段性干預模型提供了見解。
1.3個體化癥狀網絡 個體化癥狀網絡是指基于個體的特定特征、行為或癥狀組數據構建的網絡[4]。個體化網絡描述了不同個體癥狀之間的關系和相互作用,突出了個體之間的差異性和個體特征在網絡中的重要性。通過建立個體的癥狀網絡,結合個體的人口學資料、社會經濟學資料和疾病資料等多維數據,可實現精準的癥狀風險評估、個體化的預防、治療和護理,提高個體健康結果的預測準確性和健康管理效果。
1.3.1個體化癥狀網絡概述 單個個體的癥狀會隨著時間推移發生動態變化,所以個體化癥狀網絡包含同期網絡和動態網絡。單個個體的密集時間序列數據可構建個體化癥狀網絡,作為理解該動態變化的有效途徑[4]。這些密集的時間序列數據可以通過生態瞬間評估(ecological instantaneous assessment, EMA)收集[20],也稱為經驗抽樣法(experience sampling method, ESM)。EMA是一種在個體的自然狀態下實時收集數據的方法,用以評估個體在日常生活中的行為、情緒、感受和環境,有助于減少回憶偏倚,獲得更真實和準確的信息。個體化癥狀網絡通常采用VAR的統計方法來估計,該方法多用于大型數據集的分析[21]。值得注意的是,VAR分析本身側重于對時間關系(不同測量窗口之間發生的關系)的估計,即動態網絡。然而,VAR模型的殘差則可以進一步用于估計同期關系(發生在同一測量窗口的關系),即同期網絡。
VAR方法的主要局限性在于,即使用于估計同期網絡,其結果也取決于所使用的滯后間隔。如果滯后間隔短于動態的時間范圍,則可能無法發現有意義的關系(例如食欲不振導致的體重減輕可能在幾天或幾周內發生,而不是幾小時內)。相反,如果關系發生或變化過快,它也可能無法被檢測(例如關系的影響若在幾分鐘后消散,則可能無法在每小時或更長時間間隔測量個體化數據的設計中捕獲它)。最佳滯后間隔通常是未知的,不同變量的最佳滯后間隔不同,甚至同一變量可能因個體而異。滯后間隔時間的選擇通常依賴研究者的臨床和科研經驗及研究的可行性。
1.3.2個體化癥狀網絡的應用領域 個體化網絡常用于研究個體隨著時間推移可能出現的心理動態變化。如Kroeze等[22]將1例患有焦慮和抑郁癥狀的67歲女性患者作為個體化網絡分析對象,對其情緒和情境相關變量進行2周的密集監測并進行EMA,結果發現感覺放松會增加體力活動,從而在接下來的幾個小時內引起身體不適。身體不適會因為其癥狀與其擔心的軀體(焦慮)癥狀相似而產生壓力。這讓個體更加深刻地認識到,以軀體癥狀表現出來的壓力在她的焦慮癥中起著核心作用,這對關于如何應對由軀體(焦慮)癥狀引起的壓力具有啟示作用。個體化癥狀網絡的局限性在于監測到的癥狀動態可能無法推廣到任何其他時態,這值得進一步探索。此外,個體化網絡還被用于研究日常生活中物質使用的預測因素和后果,不同時間間隔的渴望和使用之間的關系[23],以及物質使用動機[24]。
癥狀網絡是描述和分析疾病的癥狀之間相互關系的網絡模型。根據數據類型的不同,將癥狀網絡分為同期網絡、動態網絡和時序/個體網絡3種類型。盡管3種癥狀網絡在不同領域的應用前景廣闊,但仍存在潛在挑戰。首先,癥狀網絡的構建需要大量的數據,并且對數據的質量和準確性有較高的要求,因此,研究人員需要開發更精確和可靠的算法和代碼來篩選和處理數據,以提高癥狀網絡分析結果的準確性和可靠性。其次,癥狀網絡的分析和結果解釋需要結合專業領域知識和專家經驗,以確保對網絡結果的正確解讀和有效應用。此外,隱私和倫理問題也需要充分考慮,特別是在個體化醫療和健康數據共享的場景中,應確保在使用癥狀網絡時保護用戶的隱私和數據安全。盡管如此,癥狀網絡研究在健康管理中的作用和意義仍不容忽視。首要作用在于發現癥狀關聯,能夠揭示不同癥狀之間的關聯模式,幫助我們了解某些癥狀可能與其他癥狀共同出現、相互影響的規律,這有助于早期發現和診斷復雜的疾病,提高對疾病的認知水平。預測疾病風險也可通過癥狀網絡分析實現,這有助于實施精準的健康干預措施,降低疾病風險,提高患者的整體健康水平。癥狀網絡還可通過對不同患者癥狀網絡的比較,更好地理解個體之間的差異,從而制定出更適合個體需求的醫療方案,為個性化醫療奠定了基礎。隨著健康大數據的不斷積累,癥狀網絡研究將有更豐富的數據可供分析,從而更全面地認識不同癥狀之間的關聯。同時,數據處理技術的不斷提升也將使得癥狀網絡的構建和分析更加高效和準確,從而實現更加精準的預防和早期干預,這將對提高整體健康水平和降低醫療成本產生積極影響。未來研究可探索將癥狀網絡與其他數據源和模型進行整合,以獲得更全面和深入的研究結果。此外,研究人員應進一步拓展癥狀網絡的應用領域,包括健康政策制定和醫療資源分配等方面,以提升癥狀網絡在更廣泛范圍內的價值和影響力。