韓奕,張斌龍,李建軍,高穎
1北京中醫藥大學第一臨床醫學院,北京100700;2北京中醫藥大學;3中國中醫科學院廣安門醫院;4河北以嶺醫院
運動神經元病(MND)是一種神經退行性疾病,只有在多個區域出現上、下運動神經元受損體征,且通過神經影像學、神經系統檢查及血液檢查排除其他相關疾病后[1],才可作出MND診斷,其臨床表現存在著極大異質性,診斷十分困難。迄今為止尚未有確診MND的方法,且近半個世紀以來約有50項MND相關隨機對照研究,其中僅有利魯唑及依達拉奉兩種藥物是被認可及廣泛使用的,提示我們對MND疾病進展的準確評價仍然是促進其研究和設計發展的重要步驟之一[2]。基于患者報告的結局評價量表[3]重視患者自我評價,評價內容包括患者滿意度在內的生理及心理方面多個領域,多應用于評價慢性疾病患者的結局。傳統中醫在MND治療中具有獨特的系統診療思路,本研究將中醫整體觀與現代醫學對MND的認識與評價相結合[4],研制了基于患者報告的MND結局評價量表,并進行第一輪科學性考評。現報告如下。
1.1 臨床資料 選擇2017年2~5月北京中醫藥大學第一臨床醫學院腦病科專家門診、病房、運動神經元病專科及河北以嶺醫院肌萎縮科收治的MND患者20例,其中男15例、女5例,年齡(53.8±9.9)歲,受教育情況:文盲1例、初中8例、高中或中專4例、大學及以上6例、不詳1例。本研究通過醫院倫理委員會批準,患者及家屬均簽署知情同意書。
1.2 基于患者報告的MND結局評價量表研制
1.2.1 基本框架建立 在前期研究工作中,研究小組通過文獻及臨床病例分析獲得MND的癥狀性指標,綜合主成分分析、聚類分析、關聯規則等分析方法,形成基于患者報告的MND結局評價量表的基本框架,基于此框架指導條目池建立及量表初稿形成。提取各領域貢獻度高的癥狀條目,對語義相近的條目描述進行合并;按照患者的理解,校正條目問題的表達方式,形成量表條目池。征求神經內科專家及相關領域心理學專家對量表條目池條目的重要性、描述準確性、語義表達等方面的評價及建議,對條目池中的條目進行修正與刪減。選取不同文化程度的5例MND患者進行患者訪談及條目描述測試,根據患者反饋,對條目提問方式進行調整,使其符合我國的文化及語言環境,形成條目池專家意見問卷。
1.2.2 條目篩選及量表初稿建立 采用Delphi法[5]。選擇5所中醫醫院或綜合性醫院,遴選其腦病科或神經內科對于MND有研究基礎的副高及以上職稱專家25人,以現場發放或郵件回收等方式對量表初稿進行問卷調查[6],基于專家意見問卷進行條目篩選。將專家意見問卷中的條目按照重要程度分為3個等級,并賦值為1~3分(1分為不重要、2分為次重要、3分為重要),由專家依據自身臨癥經驗對問卷中所設條目的重要性作出評價。
基于專家意見問卷調查結果,從4個方面進行條目篩選[6]:①專家積極系數。即量表總體的回收率,代表該領域專家對量表總體可行性的認可度。②條目可操作性。使用滿分頻率(K)表示,Kj=mj/Mj,Mj表示參加第j個條目評價的專家數,mj表示給滿分的專家數;K越大說明該條目越重要,一般認為K以85%為界值,得分≥85%的條目入選。③波動性及協調程度。以變異系數(V)表示,Vj=δj/Xj,δj表示第j個條目的標準差,Xj表示第j個條目的均數,Vj表示專家對第j個條目相對重要性的波動程度;V越高說明波動程度越高,相對應的協調程度越低;采用界值法篩選條目,界值=均數+標準差,得分低于該界值的條目入選。④意見匯總。由于使用呼吸機及胃造瘺術會對患者的心理精神造成一定的影響,故針對是否將此項目列入量表評價進行專家建議調查。搜集專家調查問卷中的建議,經過研究小組論證,對量表條目池進行刪減;并對部分條目的描述經討論后予以更改。結合MND患者逐漸喪失運動功能、部分患者喪失語言功能的疾病特點,盡量保證量表測評時間在15 min以內。
根據國際量表研制說明,將初稿中的條目選項按照Likert-5級評分進行描述;編寫明確且簡明的卷首語,使被試者了解研究目的、研究背景及需要考察的時間維度,形成基于患者報告的MND結局評價量表初稿。
1.3 第一輪科學性考評
1.3.1 可行性分析 對納入的20例MND患者進行量表測評,記錄回收率、有效率及測評完成時間[7]。
1.3.2 項目區分度分析 項目區分度為條目的鑒別能力,即是否可以對目標人群的能力進行區分。本研究采用各條目與量表總分的Spearman相關系數法計算項目區分度,并與Spearman相關系數界值表進行對比,若大于相對樣本量界值則表示該條目與量表目標相關性高,具有良好的項目區分度[8]。
1.3.3 信度分析 信度指量表是否能在受試人群中得到穩定且可重復的結果,本研究采用折半信度、克朗巴哈α系數作為量表信度的檢驗指標。折半信度[9]把量表按照奇偶數目分為兩個量表,通過檢驗兩個量表之間的相關性,反映量表是否能穩定地衡量目標人群的潛在特征。克朗巴哈α系數[10]通過計算條目的相關系數矩陣,分析每個條目之間的相關性即一致性,考量量表是否能同時反映被試者潛在的特定特點,在此處即為MND的疾病嚴重程度。克朗巴哈α系數≥0.8時,表示量表內部一致性良好。
1.3.4 效度分析 效度主要評價量表與預想的模型框架的擬合度,即量表是否可以測量目標人群的目標特征,本研究主要從內容效度和結構效度兩方面對量表的效度進行檢驗[9]。內容效度[11]是指對多數的測定對象來說,其對量表條目及其選項的理解是否與研究者預設的量表框架一致,使用條目與所屬領域之間的Spearman相關系數進行計算,Spearman相關系數越高說明條目與該領域擬合度越高,即內容效度越高。結構效度即構想效度[12],為量表所測屬性暫不存在確定的衡量標準時使用的間接測量法,也是驗證假設成立的主要方法。繪制量表因子結構圖,使用擬合優度指數(GFI)評價模型擬合,GFI>0.8提示模型擬合良好。
1.4 質量控制 在量表初稿的科學性評價調查前,參與調查的人員需經過篩選及統一培訓,保證在現場發放問卷時能解答患者的疑惑,并確保不會干預其選擇。
1.5 分析方法 采用SPSS23.0統計軟件進行K、V、信度、內容效度分析,采用AMOS20.0統計軟件進行結構效度分析。
2.1 基于患者報告的MND結局評價量表建立結果 經過專家論證及患者語言測評規范后,得到癥狀指標58個,構成條目池。專家意見問卷共由40個條目組成,量表分為四個維度,核心癥狀維度包含21個條目、全身癥狀維度包含8個條目、心理精神維度包含7個條目,社會關系維度包含4個條目。專家問卷發放回收問卷比例為23∶25,專家積極系數(回收率)為92%。各條目V均小于界值,說明上述條目的專家意見波動程度均較低,協調度均良好。根據專家建議,決定納入呼吸機及胃造瘺術的應用,但不做等級評分。篩選出專家認為可操作性高的條目(K≥85%)共16個(表1),按照Liker-5級評分規則進行選項描述及賦值,編寫卷首語,形成基于患者報告的MND結局評價量表初稿。

表1 專家認為可操作性高的16個條目
2.2 第一輪科學性考評結果
2.2.1 可行性分析結果 20例MND患者發放與回收量表比為20∶20,回收率100%,有效率100%,測評完成時間(5.7±2.3)min。
2.2.2 項目區分度分析結果 Spearman相關系數界值表中樣本量為20例時,界值為0.447。在2.1納入的可操作性高的16個條目中,站立、行走、拿取物品、翻身、穿衣、夜間呼吸、肌肉跳動、飲水嗆咳、言語、抬頭、睡眠、疲勞、治療渴望、急躁、對家人態度、人際交往與量表總分的Spearman相關系數分別為0.619、0.507、0.620、0.430、0.825、0.722、0.589、0.681、0.637、0.498、0.219、0.217、0、0.602、0.606、0.606,其中翻身、治療渴望、睡眠、疲勞4個條目的Spearman相關系數低于0.447,區分度較低。
2.2.3 信度分析結果 ①折半信度:折半量表間相關系數為0.58,經校正后折半信度即斯皮爾曼布朗折半系數為0.73,基本說明量表的跨條目一致性在可接受范圍。②克朗巴哈α系數:校正后的克朗巴哈α系數為0.81;提示本量表各個條目與所要測量的終點即MND的疾病嚴重程度相關性強,具有良好的內部一致性。
2.2.4 效度分析結果 ①內容效度:量表中各條目得分與各維度得分的Spearman相關系數見表2,其中核心癥狀維度中的肌肉跳動條目與本領域的相關性較低(Spearman相關系數為0.46),心理精神維度中的治療渴望條目與本領域的相關性較低(Spearman相關系數為0.33)。②結構效度:本研究GFI指數為0.567(圖1)。GFI<0.8,提示條目之間存在測量領域的交叉,即可能某幾個條目存在于多個領域之中,與原量表框架的構建之間有一定的差距。

表2 量表中各條目得分與各維度得分的Spearman相關系數
在量表研制過程中,條目篩選是關鍵步驟、難點與重點。醫學是在臨床經驗的積累中不斷發展與升華的,專家經驗是醫學進步中的重要環節,而專家意見問卷為量化專家經驗的一種方式,結果具有更高的代表性和可靠性。因此,本研究主要運用Delphi法,以專家意見問卷的形式,通過專家重要性評分,對量表條目進行篩選。結果顯示,專家問卷回收率>92%,說明專家對該項研究的支持與重視程度較高;專家對條目重要性評分的V值均未超過界值,說明專家意見協調程度較高。故本研究按照條目可操作性(K)進行篩選,并在此基礎上綜合專家建議,對條目進行優化,對表達不清的條目進行完善,形成了16個條目組成的MND量表初稿。

圖1 量表因子結構圖(GFI=0.567)
MND量表能否客觀、全面、真實地評價所要測評的內容,需要通過臨床數據對量表的性能進行考評。本研究量表的回收率為100%,測評的平均完成時間為5.7 min,表示受試者既可以在理解量表條目的基礎上完成作答,又不會因長時間作答而產生厭煩及消極情緒。本研究項目區分度結果顯示,翻身、治療渴望、睡眠、疲勞4個條目的Spearman相關系數低于0.447,區分度較低,但其他條目的區分度均良好,故總體來說該量表具有較好的項目區分度。部分條目區分度低的原因可能是:①項目區分度很大程度上依賴于樣本量,而MND為罕少見病,發病率低,病例收集困難,可能導致部分條目區分度低。②可能與條目的描述不清,易造成意義混淆,或描述過于復雜,對某些患者來說難度過大有關。因此,需要在以后的研究中針對項目區分度較低的條目進行優化或刪減。本研究量表折半信度及克朗巴哈α系數均提示量表信度基本良好,具有測量穩定性、可靠性;但量表的效度與模型框架之間存在一定的差距,表現在某些條目與領域的相關性較低,以及GFI未達到國際統一標準。雖然可能與樣本的局限性有關,但在今后量表條目的改良及驗證中,仍應擴大樣本量,并針對GFI<0.8的條目進行刪減、條目描述優化等調整。
MND的臨床特征是在幾周或幾個月內出現的進行性運動缺陷,基本上任何隨意肌都會受累,造成多樣的臨床表現(從構音障礙到足下垂均可出現)[13],導致MND診斷有難度。隨訪也是診斷中極為重要的環節。基于患者報告的結局評價量表以心理學測評理論為基礎,以臨床經驗為支撐,是評估臨床患者疾病變化的科學性手段。對于MND患者來說,在欠缺特效治療的現狀下,全方位評價疾病進展及盡早進行對癥治療是MND領域研究的重點及難點[14]。現代臨床研究中多使用ALSFRS-R量表[15],但該量表僅關注于MND的核心癥狀;而相關生活質量量表因條目繁多,MND晚期患者完成相對困難,并且在實施過程中,因條目問題描述過于直接,可能造成部分患者拒絕回答。以上均提示我們應根據MND的疾病特點,結合患者的生存狀態進行綜合評價。MND患者一般終身患病,逐漸喪失運動能力,部分患者出現構音障礙,喪失語言交流及進食能力,依賴于護理者生存,嚴重影響患者的生活質量、心理情緒、功能狀態等諸多方面[16]。故本研究認為,MND的評價中不僅僅需要關注MND核心癥狀的評價(如肌肉萎縮、肌肉無力等),也需要關注患者與疾病的伴隨癥狀(如失眠、疲勞等)、患者心理情緒變化(如暴躁、低沉等)、患者與家人的關系(如拒絕交流)、社會關系(如拒絕探視)等。需將多領域多維度結合起來,綜合評價MND的整體疾病狀態。
綜上所述,本研究成功研制了基于患者報告的MND結局評價量表初稿,并經科學性考評驗證該量表可行性、信度、效度均良好,可較好反映MND患者自覺癥狀的變化,為臨床評價MND提供了新的方法。但在今后的研究及工作中,應在本研究的基礎上擴大量表條目池,對量表條目及選項進行增改,擴大樣本量,增加樣本的豐富性,并進行第二輪科學性考評。