余駿雯 朱政,2,3 胡天天 金依霖 何加敏 楊中方
(1.復旦大學護理學院,上海 200032;2.上海市循證護理中心,上海 200032;3.紐約大學護理學院,紐約 10010)
癥狀網絡是一種分析多種癥狀之間復雜聯系和推定因果關系的網絡模型[1]。通過分析癥狀間的相互作用,可以揭示疾病的復雜性和多樣性。傳統的癥狀管理常常將每一個癥狀視為一個孤立的個體,主要從癥狀的發生率和嚴重程度等方面評估,而忽視了各復雜癥狀之間的相互關系。然而,在真實的臨床情景中,患者往往同時存在多種癥狀,且并非每個癥狀都同等重要,多種癥狀的復合影響往往大于單個癥狀的總和[2-4]。癥狀網絡的特異性指標是評估癥狀網絡性質和特征的重要指標,在癥狀管理研究和臨床實踐中具有重要意義[1];有助于揭示疾病進展和癥狀出現的機制,識別出對疾病的發展和傳播具有重要影響的關鍵癥狀,可為疾病的早期診斷、療效評估和進展預測提供依據,為癥狀管理指示有效干預靶點。本文從癥狀網絡的基本元素、節點指標、網絡指標、網絡擬合指標和差異性檢驗指標等方面進行介紹,結合各特異性指標的臨床意義,以期為構建癥狀網絡、促進臨床醫療人員實施精準干預提供參考。
癥狀網絡中癥狀間的關系可以通過繪制的網絡結構圖直觀地觀察到,其中最關鍵的2個元素是節點(node)和邊緣(edge)。
1.1節點 表示所觀測的變量或癥狀,可為二分類變量或連續性變量,二者的選擇取決于研究問題;根據數據類型的不同,網絡估計方法將有所差異,二分類變量常采用依辛模型(ising model)進行估計,而連續性變量常采用高斯圖模型(glasso)進行估計[5]。節點的增刪選擇和數據類型都會影響最終的網絡構建結果,選擇和數據處理時需謹慎考慮。
1.2邊緣 2個節點間由邊緣相連[6]。邊緣表示在控制其他節點的影響后,連接的2個節點之間的偏相關關系。邊緣可以分為有向和無向2種類型。有向網絡的邊緣可以指明因果結構,例如“A→B”表示A對B有影響,有向網絡常見于縱向研究。而無向網絡的邊緣只能表示相互關系,無法指示方向和因果,常見于橫斷面研究。
1.3邊緣權重 癥狀間聯系的緊密程度可以通過邊緣的連接強度即邊緣權重(edge weight)表示。邊緣權重的符號表示交互作用的類型,“+”代表正相關,在可視化的網絡結構中,正相關的邊緣一般以綠色呈現;“-”代表負相關,一般以紅色呈現。邊緣權重的絕對值表示交互作用的強度,絕對值越大,網絡結構圖中的邊緣越粗,代表2個節點間的關系越緊密,二者更容易相互影響,反之亦然。邊緣權重的方向和強度有助于臨床醫療人員了解不同癥狀間的相互作用和影響關系,這有助于揭示疾病的病理生理過程,可能發現潛在的疾病機制和新的治療靶點。此外,不同患者具有不同的網絡結構,這可為個體化醫療提供支持,幫助醫療人員制定個體化治療方案和癥狀管理策略。
2.1中心性(centrality) 節點的中心性是一種客觀量化單個節點重要性的指標,主要包括強度中心性(strength)、緊密度中心性(closeness)和中介中心性(betweenness)[7]。上述指標可從機制的角度衡量節點的影響力和重要性,數值越大代表節點在整個網絡中的重要性越高。在R語言中網絡的中心性指標可通過mgm包計算。(1)強度中心性:指一個節點和與其直接相連的所有節點間的邊緣權重絕對值之和,強度中心性越高表明該癥狀越有可能與其他癥狀同時發生,其在整個網絡中的影響力越強。對于縱向研究中的動態網絡,強度中心性可細分為出度中心性(out-strength)和入度中心性(in-strength)2項指標,前者代表該節點對其他節點的影響強度,而后者代表該節點被其他節點影響的強度。(2)緊密中心性:指節點與其它直接相連節點之間的平均距離的倒數。(3)中介中心性:指節點在整個網絡中作為中介的次數,即節點在網絡中連接其它節點的最短路徑上的數量。(4)橋梁癥狀:廣義上指連接不同癥狀群、不同疾病或同一疾病不同亞組的癥狀,橋梁癥狀的中心性指標分類和定義同上所述,橋梁強度中心性數值最大的癥狀即為橋梁癥狀。形成中心性指標結果示例,見圖1。在癥狀網絡中,中心性指標數值最大的節點可被視為網絡中具有最大影響力的核心癥狀,可以幫助醫療人員識別關鍵的干預靶點。其中,強度中心性是最關鍵的指標,當3項指標的數值排序不一致時,一般以強度中心性的排序結果為準[8-9]。當核心癥狀出現或加劇時,更容易進一步影響其他癥狀,進而激活整個網絡,產生一系列相互關聯的多種癥狀。這為臨床工作者提供了除癥狀發生率和嚴重程度之外的評價指標,幫助醫療人員更準確、有效地識別能預測其他癥狀產生或加重的前哨癥狀[10]。因此,核心癥狀在疾病的診斷、預后評估和治療選擇中具有重要作用,可作為有效的干預目標。醫療人員可優先關注核心癥狀,及早采取具有針對性的干預措施,以改善患者預后。

圖1 癥狀網絡分析中心性指標結果示例
2.2預期影響系數(expected influence) 中心性指標可以提供有關網絡中各節點對其他節點的影響力的信息,高中心性的節點可能在疾病的發展、持續或緩解過程中發揮著重要作用。然而,由于上述中心性指標不區分邊緣的正相關和負相關,簡單地將負相關邊的權重取絕對值進行計算,因此中心性指數在兼具正負相關邊的網絡中存在一定的局限性。為了更全面地評估節點的影響力,則需要考慮節點的預期影響系數。預期影響系數同時考慮了網絡中邊緣的性質和強度,可評估其累積影響。預期影響系數的計算分為“1步法”和“2步法”。1步法用于評估某節點對與其直接相連的節點的影響,然而這種方法不考慮其相鄰節點的預期影響系數,這可能導致對該節點對整體網絡的影響能力的評估有所偏差。如當節點A只與節點B相連,如果節點B的預期影響系數較低,則節點A的變化對網絡其余部分的影響很小;但如果節點B與多條邊緣權重較高的邊相連,則節點A的變化可能通過對節點B的高影響而對整個網絡產生較大影響。“2步法”彌補了“1步法”的局限,其考慮了節點通過其相鄰節點對網絡產生的二次影響,在計算時需對相鄰節點的二次影響進行加權。因此,在計算節點的預期影響系數時推薦采用“2步法”[11]。有研究[9]表明,在完全正相關邊的網絡中,中心性指標和預期影響系數間存在密切關系(rs≥0.78),但當網絡中負相關邊的數量增加時,二者的相關性則會隨負邊比例增加而下降,在負相關邊比例較高的網絡中,中心性指數可能無法很好地反映哪些節點最為重要。因此,在分析兼具有正相關和負相關邊緣的網絡時,預期影響指標可以提供更準確的節點重要性評估,應結合中心性指標加以解讀。
2.3可預測性(predictability) 中心性指標反映了節點間聯系的相對緊密程度,從而可以得出某節點受其他節點影響大小的排序,但無法得出節點所受影響的絕對程度大小。節點的可預測性則可以解決這一問題,它指該節點的決定性或可控性的絕對程度,這一指標有助于指導干預靶點的選擇和干預措施的制定[12]。某節點的可預測性越接近1,則其越可以被網絡中其他所有節點預測或決定,說明對其周圍節點的干預可能會對該節點產生較大的影響。動態網絡中,可預測性分為出可預測性和入可預測性,出可預測性代表該節點對其他節點的預測價值,而入可預測性則代表其他節點對該節點的預測價值。同期網絡和動態網絡的可預測性結果示例,見圖2和圖3。節點的可預測性取決于節點所連接邊的數量和邊緣權重,一般而言,連接到節點的邊越多,強度中心性越高,其可預測性就越高。既往研究[12]發現,某些疾病的平均可預測性高于其他疾病,這表明前者的癥狀網絡更具有自我決定性,而后者的癥狀網絡中的節點更易受未包含在網絡中的其他因素的影響,其他因素可能包括其他癥狀、生物和環境變量。可預測性高的網絡表明可以通過網絡中的相鄰癥狀來控制目標癥狀,而對于可預測性低的網絡,則需尋找其他重要影響因素或選擇直接干預目標癥狀。

圖2 癥狀網絡分析同期網絡的可預測結果示例

圖3 癥狀網絡分析動態網絡的可預測性結果示例
3.1網絡密度(density)和連通性(connectivity) 網絡的全局特性可以用網絡密度和網絡連通性來衡量,二者意義相近而略有不同。網絡連通性描述網絡中節點的連接數量和質量,可通過絕對連接的加權和計算,網絡連通性也稱為全局強度(global strength)[13-14]。網絡密度指實際存在的邊緣數與可能存在的邊緣數之間的比值,部分研究也用邊緣權重的絕對值之和(∑s)來表示網絡密度[15-16]。研究[16]發現,網絡密度和癥狀的嚴重程度并不成正相關,即網絡密度大不意味著癥狀更嚴重。網絡的連接緊密程度可能與治療反應有關[13]。癥狀網絡密度或連通性較大的疾病,其短期療效可能更差,這主要是由于癥狀間容易相互影響激活,某一癥狀的惡化可引起其他多種癥狀的惡化,甚至形成惡性循環,導致治療效果不佳[13]。因此,網絡密度和連通性常常被視為疾病長期預后的預測因子之一,但這一預測作用的有效性仍有待驗證[15]。
3.2模塊度(modularity) 模塊度是衡量網絡結構中模塊或群組聚類結果優劣的一種量化方法[17]。在模塊度較高的網絡中,同一模塊或群組內的節點連接密集,而在不同模塊或群組間節點的連接較稀疏。當邊緣滿足隨機分布時,模塊度的值等于落在給定模塊或群組內的邊緣數減去在隨機連接的等價網絡中的期望數,取值范圍為-1~1。模塊度為正且數值較大,說明網絡具有較明顯的模塊化結構,可能存在明顯的癥狀群,有助于指導醫療人員識別和理解疾病的癥狀組合,從而提供個體化的干預策略。模塊度為負說明網絡的連接相對較均勻或隨機,癥狀節點間的連接在不同群組中差異較小。需要注意的是,模塊度并非確定網絡是否適合劃分癥狀群的唯一指標,負值并不意味著無法通過其他方式識別癥狀群,還需綜合其他網絡特異性指標和方法加以判斷。
4.1邊緣權重的精確性檢驗 邊緣權重代表了癥狀間的聯系緊密程度,其估計的精確程度至關重要;為評估邊緣權重的精確性,可采用自舉法(bootstrapping)來計算邊緣權重的95%置信區間,見圖4[18]。自舉法可分為非參數自舉法和參數自舉法。非參數自舉法通過從原始數據中進行有放回地重復采樣,生成與原始數據集類似的新數據集,這意味著每個觀測值都有可能在新數據集中多次出現或完全不出現。而參數自舉法則是從已通過原始數據集估計得到的參數模型中抽取新的觀測值,從而生成新的數據集,即新的數據集是從參數模型產生而非從原始數據中采樣得到,這種方法需要假設數據符合某個特定的參數模型。非參數自舉法是完全數據驅動的,不需要理論依據,而參數自舉法更加依賴理論。非參數自舉法幾乎可應用于任何情況,在處理有序數據時,建議使用非參數自舉法[9],使用高斯圖模型時可選擇R包mvtnorm實現[19],而使用依辛模型時可選擇R包IsingSampler實現[20]。當沒有使用正則化、非參數自舉結果不穩定、或者為了檢查2種方法的置信區間是否一致時可考慮使用參數自舉法。需要注意的是,自舉法生成的邊緣權重置信區間僅用于顯示邊緣權重的精確性,而不應解釋為對零的顯著性檢驗,即不應根據置信區間是否包含零來判斷邊緣權重的準確性。邊緣權重估計的精確性可通過置信區間的寬度來衡量,所得置信區間越窄,代表邊緣權重的估計越精確。相反,當置信區間較寬時,表示對邊緣權重的估計相對不精確,邊緣權重的真實值存在較大的不確定性,這可能是由于樣本數據的噪聲、樣本量不足或者模型的復雜性等因素所致。對于精確性不佳的網絡結果應謹慎解釋和推廣,可考慮增加樣本量、優化數據收集方法以提高數據質量或根據研究問題和數據特點選擇合適的模型或簡化模型等提高網絡的精確性。

圖4 癥狀網絡分析的邊緣權重精確性檢驗示意圖
4.2中心性的穩定性檢驗 通過在不斷減少樣本或節點的數據子集中重新估計網絡,根據中心性指標排序與原網絡中排序的相關性可檢驗中心性指標的穩定性。根據數據子集的抽樣方法可分為剔除案例自舉法(case-dropping subset bootstrap)和剔除節點自舉法(node-dropping subset bootstrap)。剔除案例自舉法通過剔除一定比例的樣本形成新的數據集,而剔除節點自舉法則通過剔除網絡中一定比例的節點來研究穩定性,但這種方法解釋較為困難,剔除50%的節點會導致完全不同的網絡結構,因此通常建議選擇剔除案例自舉法,剔除案例自舉法的結果示例,見圖5。中心性指標的穩定性可通過相關穩定性系數(correlation stability coefficient,CS-coefficient,簡稱CS系數)來量化。CS系數(cor=0.7)表示在95%的概率下,使得基于新數據集估計的中心性指數與基于原始數據集估計的中心性指數間的相關性保持在≥0.7的前提下,所能剔除樣本的最大比例。此處的cor=0.7是默認設置,指相關性要求至少為0.7,研究人員可根據對穩定性的興趣設置不同的閾值。CS系數越大,說明剔除越多樣本依然能得出相似的節點中心性,中心性指標的穩定性越強。一般認為,CS系數>0.5代表穩定性較好[9],但目前對CS系數的分層或閾值尚無統一標準。

圖5 癥狀網絡分析中心性的穩定性檢驗示意圖
5.1節點和邊緣的差異性檢驗 自舉法差異檢驗除了可用于檢驗邊緣權重的精確性和中心性的穩定性,還可用于檢驗不同節點的中心性或不同邊的邊緣權重是否顯著不同,這種方法可計算節點中心性或邊緣權重的差值并構建其重復抽樣所得的置信區間,見圖6和圖7。根據零假設檢驗,如果零位于置信區間內則代表節點中心性或邊緣權重的差異不顯著。

圖6 癥狀網絡分析中邊緣的差異性檢驗示意圖

圖7 癥狀網絡分析中節點的差異性檢驗示意圖
5.2網絡差異性檢驗 當需要比較不同亞組的癥狀網絡是否有差異時,可采用R包NetworkComparison Test (NCT)實現[21]。NCT是一種基于排列的假設檢驗,適用于高斯分布數據和二進制數據。它基于幾種不變性假設(網絡結構不變性、全局強度不變性和邊緣不變性)來評估2個網絡之間的差異。P<0.05為差異有統計學意義。
6.1癥狀網絡在臨床干預中的應用價值 在臨床資源較緊張的現實情況下,精準干預對節約時間和人力,提高醫療資源的有效利用率至關重要。作為一種新的研究范式,癥狀網絡不僅具有類似于癥狀群的降維功能,而且有助于確定核心癥狀并探索癥狀機制,從而指導臨床工作者制定行之有效的精準干預策略。臨床工作者可根據目標疾病或癥狀的特征、可干預性及干預措施的可行性靈活選擇干預方式。值得注意的是,網絡分析可從機制上為癥狀間的相互關系提供參考,實際臨床干預策略的制定需結合臨床經驗加以判斷和考慮。
6.2癥狀網絡的穩定性檢驗 癥狀網絡的穩定性是結果的可推廣性和臨床應用性的重要考慮因素。在臨床實踐中,癥狀網絡的穩定性檢驗為醫療人員和研究人員提供了重要的指導。通過了解網絡結構的穩定性,可確定可靠的關鍵節點和潛在的影響因素,從而更好地理解疾病的發展機制和設計個體化的治療策略。此外,穩定性檢驗還為癥狀網絡的構建和分析方法提供了評估和改進的依據,以確保研究結果的可靠性和可重復性。如果樣本量不足,所構建的網絡結果穩定性或精確性不足,則說明所得出的癥狀間可能存在虛假關聯,需進一步擴大樣本量或減少發生率低的癥狀節點加以驗證。然而,目前對于中心性指標的穩定性檢驗等的閾值仍無統一定論,研究者需結合研究目的和穩定性要求加以界定。
6.3癥狀網絡的特異性 同一疾病的癥狀網絡并非一成不變的,具有不同特征的人群可能呈現不同的癥狀網絡特征;因此,研究人員可結合健康的社會決定因素(social determinants of health)進行深入的亞組分析,結合因果關聯、網絡中心性和網絡密度等指標,更全面地理解不同特征人群中疾病的癥狀機制和發生模式。健康的社會決定因素指個體健康和疾病風險的社會和環境因素,包括但不限于個人的社會經濟地位、教育水平、居住環境、就業狀況和社交支持等[22],這些因素亦可對癥狀網絡的形成和發展產生重要影響。通過深入分析不同特征人群中的癥狀網絡,可識別出不同影響因素對癥狀網絡的作用程度和方式,這有助于進一步理解社會因素與疾病間的關系,并為個體化的干預和預防策略提供依據。