史釗 ,李順平 *,吳小燕 ,劉嘉琪 ,杜慧敏
不孕癥是指1對配偶未采取避孕措施,有規律性生活至少12個月未能獲得臨床妊娠[1-2]。由于環境污染問題嚴峻,以及受睡眠不足、生活節奏加快等因素的影響,我國育齡夫婦的不孕不育率從20年前的2.5%~3%攀升至近年的15%左右[3-5]。不孕不育嚴重影響著個人健康和家庭幸福,已經成為重要的公共衛生問題,同時隨著我國人口老齡化趨勢加劇,不孕不育也已成為日益突出的社會性問題。健康相關生命質量(HRQoL)是患者基于自身健康狀況和治療對其日常生活影響做出的自我評價,是從生理、心理和社會適應方面綜合評價健康的一種模式,能比較全面地反映患者的主觀與客觀健康狀況[6]。同時,HRQoL是患者報告結局(PRO)測量的核心內容之一。目前在不孕不育患者臨床效果評估中多將受精率、胚胎著床率、妊娠率等臨床客觀指標作為健康結局指標[7-9],但不孕不育的治療過程復雜、周期較長,可導致患者出現疼痛、失眠、焦慮等癥狀,尤其是在“不孝有三,無后為大”的觀念和“傳宗接代”的思想影響下,不孕不育患者更是承受著較大的社會、心理壓力[10]。因此,臨床客觀指標并不能全面反映患者的健康狀況。
目前,已有研究者對國內外不孕不育患者HRQoL量表進行了詳細介紹[11-12]和系統綜述[13-17],并且不孕不育患者HRQoL量表已在臨床上得到了廣泛的應用,但尚不確定這些量表應用于臨床時是否具有良好的測量性能,缺乏對量表的質量評價。健康測量工具遴選標準(COSMIN)是用于評價患者報告結局測量量表(PROMs)的測量性能及研究方法學質量的工具,適用于PROMs的系統評價,可用于形成PROMs開發與利用相關推薦意見[18]。本研究通過全面梳理國內外不孕不育患者HRQoL量表相關研究,采用COSMIN對不孕不育患者HRQoL特異性量表進行系統評價,旨在為健康結局測量工具的合理選擇提供參考,也為中國不孕不育患者健康結局測量工具的研制提供借鑒。
1.1 文獻的納入與排除標準
1.1.1 納入標準 (1)研究對象:臨床診斷患有不孕不育者。(2)研究工具:采用經過信效度檢驗的普適性量表〔如健康調查簡表(SF-36)等〕或疾病特異性量表〔如生育生活質量量表(FertiQoL)等〕對不孕不育患者的HRQoL進行評估。(3)研究類型:研究類型不限,如橫斷面研究、隨訪研究等。(4)研究內容:使用HRQoL量表測量不孕不育患者生命質量、健康效用值等,包括量表開發、測量性能驗證研究,以及運用量表評估不孕不育患者HRQoL的實證研究等。
1.1.2 排除標準 (1)評價內容聚焦不孕不育患者婚姻質量、心理健康;(2)未明確說明量表使用情況的研究;(3)綜述、系統綜述及其他二次研究;(4)重復發表文獻;(5)非中、英文文獻;(6)無法獲取全文的文獻;(7)會議論文。
1.2 文獻檢索策略 于2020年10月,計算機檢索PubMed、Web of Science、the Cochrane Library、EmBase、中國知網、萬方數據知識服務平臺、維普中文科技期刊全文數據庫和中國生物醫學文獻數據庫,獲取國內外公開發表的有關不孕不育患者HRQoL的研究,檢索時限均為建庫至2020-10-05。檢索策略采用主題詞與自由詞相結合的方式。中文檢索詞包括不孕不育、生命質量、生活質量、生存質量、健康效用值、健康偏好、健康結果測量、量表等;英文檢索詞包括 infertility、quality of life、health related quality of life、health state preference、PRO等。以PubMed為例,具體檢索策略請掃描本文二維碼獲取。
1.3 文獻篩選與資料提取 由兩名研究者獨立篩選文獻和提取資料,并交叉核對,如遇分歧則通過小組討論解決。篩選文獻時首先閱讀文章題目、摘要,在排除明顯不相關文獻后,進一步閱讀可能符合納入標準文獻的全文,以確定最終是否納入。提取納入研究所采用的HRQoL量表的基本特征,內容包括:研制者(第一作者)、量表(全)簡稱、研制時間、適用對象、研制國家/地區(組織)、量表維度與條目數、是否有中文版等。
1.4 評價方法 由兩名研究者分別采用COSMIN偏倚風險評價清單[18]、更新版良好測量學屬性標準[19]對不孕不育患者HRQoL特異性量表開發研究、量表的測量性能進行獨立評價,并交叉核對結果。如遇分歧,則通過小組討論解決。COSMIN偏倚風險評價清單由10個模塊組成,采用4點評分法(“非常好”“合格”“有問題的”“不合格”)對每項量表開發研究的偏倚風險進行評價。某一模塊的整體偏倚風險評分由模塊內所有條目的最低評分決定,即最低計分原則。更新版良好測量學屬性標準主要用于評價量表的8種測量性能,并將評價等級設置為3個級別,即“足夠”“不足”“不確定”。
1.5 統計學方法 采用描述分析法對不孕不育患者HRQoL量表的應用現狀,以及不孕不育患者HRQoL特異性量表的測量性能及量表開發研究的方法學質量進行分析。
2.1 文獻篩選流程及結果 初檢共獲得文獻2 608篇,剔重后獲得文獻1 805篇,經閱讀題目和摘要排除1 439篇,閱讀全文后,排除不符合納入標準的文獻137篇,最終共納入229篇文獻,文獻篩選流程見圖1。

圖1 文獻篩選流程Figure 1 Literature screening flowchart
2.2 納入不孕不育患者HRQoL量表的基本信息 納入的229篇文獻共涉及19個[20-39]不孕不育患者HRQoL量表,其中4個[20-24]為不孕不育患者HRQoL特異性量表〔TLMK(Tübinger Lebensqualit?tsfragebogen für M?nner mit Kinderwunsch)、FertiQoL、QOLICQ(Quality of Life in Infertile Couple Questionnaire)及中醫肝郁型不孕癥生命質量量表〕,4個[25-28]為用于測評癌癥及其他疾病患者HRQoL的特異性量表,11個[29-39]為普適性HRQoL量表。2005年,德國學者研制了第一個用于測量男性不育患者HRQoL的量表——TLMK[20]。FertiQoL是由歐洲人類生殖和胚胎學協會與美國生殖醫學會專家于2011年采取國際合作方式、跨學科方法研制而成的且經過國際多中心臨床驗證的第一個不孕不育患者HRQoL特異性量表[21-22],現已被翻譯和修訂成中文版且通過了心理測量學性能檢驗[40-42]。2017年王英[24]研制了中國首個針對女性肝郁型不孕癥患者的HRQoL特異性量表。在11個普適性HRQoL量表中,2個量表的研制基于中國人群數據,分別為生活質量評定問卷(GQOLI-74)[38]和中華生存質量量表(ChQOL)[39]。19個不孕不育患者HRQoL量表的基本信息見表1。
2.3 不孕不育患者HRQoL測量的相關量表應用現狀 納入的229篇文獻中,19個量表共計被使用233次,其中FertiQoL量表在現有研究中被使用的頻率最高〔39.1%(91/233)〕,其次為SF-36〔33.9%(79/233)〕、世界衛生組織生存質量測定量表簡表(WHOQOL-BREF)〔9.9%(23/233)〕、生活質量綜合評定問卷(GQOLI-74)〔6.9%(16/233)〕、健康調查12條簡表(SF-12)〔2.1%(5/233)〕、世界衛生組織生存質量測定量表(WHOQOL-100)〔1.3%(3/233)〕等普適性HRQoL量表,見圖2。在不孕不育患者HRQoL特異性量表中,王英[24]編制的中醫肝郁型不孕癥生命質量量表在開發后尚未得到應用。

圖2 不孕不育患者HRQoL量表的應用頻次(截至2020-10-05)Figure 2 The application frequency of HRQoL instruments in infertility patients as of October 5,2020
2.4 不孕不育患者HRQoL特異性量表開發質量評價 基于COSMIN偏倚風險評價清單中的PROMs開發模塊對TLMK[20]、FertiQoL[21-22]、QOLICQ[23]及中醫肝郁型不孕癥生命質量量表[24]的開發質量進行評價(表2),并且對各個量表條目的形成與篩選過程進行梳理(表3)。4個不孕不育患者HRQoL特異性量表開發研究均描述了量表針對的目標人群和使用背景,且研究人群的選擇具有代表性,其在上述三方面的方法學質量為“非常好”。除中醫肝郁型不孕癥生命質量量表的開發者外,TLMK、FertiQoL、QOLICQ量表的開發者在構建量表條目的過程中均對患者進行了定性訪談。應用認知性訪談法評估目標人群對不孕不育患者HRQoL特異性量表條目的理解及對量表內容全面性的看法時:FertiQoL量表的開發者并未提及認知性訪談是否由經驗豐富的訪談員組織實施、訪談過程是否全程錄音、轉錄的細節及是否由兩名研究者參與資料分析等內容,故FertiQoL量表開發研究認知性訪談部分的方法學質量為“有問題的”;而TLMK、QOLICQ量表的開發者則未闡述是否評估了目標人群對量表條目的理解程度,故TLMK、QOLICQ量表開發研究認知性訪談部分的方法學質量為“不合格”。此外,上述3個量表開發研究對訪談提綱、轉錄/編碼過程、資料飽和判定標準及資料分析方法等方面的信息披露不足。FertiQoL量表開發的總體質量為“有問題的”,TLMK、QOLICQ、中醫肝郁型不孕癥生命質量量表開發的總體質量均為“不合格”。

表2 不孕不育患者HRQoL特異性量表開發質量評價Table 2 Evaluation of the development quality of infertility-specific HRQoL instruments

表3 不孕不育患者HRQoL特異性量表條目的形成與篩選Table 3 Item generation and screening toward developing infertilityspecific HRQoL instruments
2.5 不孕不育患者HRQoL特異性量表開發研究方法學質量評價及量表測量性能評價 4項量表開發研究均未對量表的跨文化效度/測量等同性、測量誤差進行評價。(1)內容效度方面:FertiQoL、QOLICQ量表開發研究的方法學質量分別為“非常好”“有問題的”;TLMK量表開發研究未采用專家評定法評價量表的內容效度,中醫肝郁型不孕癥生命質量量表開發者則未對患者進行調查,并且對定性和定量分析的方法描述不夠清晰,故TLMK、中醫肝郁型不孕癥生命質量量表開發研究的方法學質量均為“合格”。(2)結構效度方面:TLMK、FertiQoL及中醫肝郁型不孕癥生命質量量表開發研究均采用探索性因子分析法評價量表的結構效度,方法學質量均為“合格”;QOLICQ量表開發研究雖然進行了探索性因子分析,但是未明確闡明因子分析的樣本量及因子旋轉方法等,方法學質量為“有問題的”;4個量表開發研究均未進行驗證性因子分析,故4個量表的結構效度均為“不確定”。(3)內部一致性方面:4個量表開發研究均報告了量表的Cronbach'sα系數,方法學質量均為“非常好”;4個量表的Cronbach'sα系數均>0.7,內部一致性均為“足夠”。(4)重測信度方面,僅QOLICQ量表開發研究對量表的重測信度進行了評價,并報告了量表的重測信度相關系數,但由于其未明確報告測量方法、統計分析方法等方面的信息,其方法學質量為“有問題的”,量表的重測信度為“不確定”。(5)效標效度方面:中醫肝郁型不孕癥生命質量量表開發研究采用Pearson相關檢驗量表與FertiQoL量表間的效標效度,方法學質量為“非常好”;Pearson相關性系數為-0.792,量表的效標效度為“足夠”。(6)建構效度方面:僅TLMK量表開發研究進行了建構效度分析,方法學質量為“非常好”,量表的建構效度為“足夠”。(7)反應度/靈敏度方面:FertiQoL量表開發研究發現,不同性別不孕不育患者FertiQoL量表得分存在明顯差異;FertiQoL量表的方法學質量為“非常好”,量表的反應度/靈敏度為“足夠”,見表4、5。

表4 不孕不育患者HRQoL特異性量表開發研究的方法學質量評價Table 4 Methodological quality of research on the development of infertility-specific HRQoL instruments

表5 不孕不育患者HRQoL特異性量表測量性能評價Table 5 Quality of measurement properties of infertility-specific HRQoL instruments
本研究全面梳理了國內外不孕不育患者HRQoL量表相關研究,同時采用國際上應用廣泛的PROMs質量評價標準COSMIN對量表開發研究的方法學質量和量表的測量性能進行了評估。目前,國內外研究者主要運用FertiQoL等特異性量表,以及SF-36、WHOQOL-BREF等普適性量表測量不孕不育患者HRQoL,盡管普適性量表對不孕不育患者HRQoL評估的靈敏度不如特異性量表[44-45],但由于普適性量表能夠為不同疾病人群的健康測量提供統一工具[45],其應用仍較為廣泛。FertiQoL量表是目前國際上應用最為廣泛的不孕不育患者HRQoL量表[16],其為評估不孕不育患者HRQoL及HRQoL的跨文化比較提供了有效的工具支持。本研究基于COSMIN對不孕不育患者HRQoL特異性量表進行系統評價發現,FertiQoL量表與其他3個不孕不育患者HRQoL特異性量表相比,量表開發研究具有相對較好的方法學質量且量表的測量性能更佳,但中文版FertiQoL量表中的“伴侶承諾”“是否可以獲取想要的不孕不育癥醫療服務”等條目在我國文化背景及醫療衛生服務體系下的適用性略顯不足[40]。
目前,我國學者已研制出“中醫肝郁型女性不孕癥患者的生命質量量表”[24],但該量表僅適用于中醫肝郁型女性不孕癥患者,應用范圍較為局限。同時,該量表的開發者在研制量表的過程中未對患者進行訪談?!盎颊邊⑴c”是量表研制的關鍵環節,形成和篩選量表條目時,需要通過訪談法或焦點小組討論法等定性研究方法廣泛聽取患者及醫務人員的意見和建議[46-47],并且由于中西方之間對“健康”的理解存在較大差異,尤其是在生育文化方面存在著根本性差異[10],缺少“對患者進行訪談”這一關鍵步驟可能會導致關鍵測量條目的缺失,從而影響量表的靈敏度。
在測量內容上,幸福感等主觀感受越來越成為健康測量研究關注的焦點[48-50],尤其是在生殖健康領域,不孕不育不僅會影響患者的健康,還可能會影響婚姻質量和家庭幸福感[15,17]?,F存的不孕不育患者HRQoL特異性量表中,僅TLMK量表包含幸福感維度[20],其余3個量表的研發者均對不孕不育患者幸福感的關注度相對不足。在測量方法上,4個不孕不育患者HRQoL特異性量表均是基于經典測量理論研制的,其研制過程缺乏現代測量理論的指導。項目反應理論等現代測量理論能為量表條目篩選、測量學性能評價提供更多的方法學支持[51-52]。此外,現存不孕不育患者HRQoL特異性量表均未對回憶期做出限定,而回憶期限不明確可能會導致測量結果產生偏倚,也可能會影響縱向研究中研究者對重復測量時間點的選擇,從而不利于量表反應性的評價[16]。目前尚未有研究探討不孕不育患者HRQoL量表的最小臨床重要性差值(MCID)[16],這也給量表結果的解釋帶來一定的不利影響。
未來,在研制不孕不育患者HRQoL量表時,應著力提升量表研制的規范性,可按照標準化研制流程或COSMIN進行量表開發與測量性能驗證,構建量表條目時應將專家咨詢法與個人深度訪談法、焦點小組討論法等其他定性研究方法有機結合,基于多角度充分挖掘患者的感受和健康信息。在量表研制與測量性能評價方法方面,建議以項目反應理論、經典測量理論等多種理論為指導進行量表條目篩選與測量性能評價,量表研制時需要盡可能設置回憶期,以為量表反應性評估提供相關參照,保證測評的一致性與準確性。同時,也須注重對MCID的探討,旨在為量表結果的解釋提供相應參考。
本研究存在一定的局限性:首先,本研究采用了COSMIN作為不孕不育患者HRQoL特異性量表評價工具,COSMIN中部分評價標準主觀性較強,可能會導致評價結果的偏倚;其次本研究僅對不孕不育患者HRQoL特異性量表開發研究的方法學質量及原版量表的測量性能進行了評價,未來在進行量表的測量性能評價時可將不同語言版本的量表均納入研究,從而使評價結果更加全面、完善。也可運用COSMIN改良GRADE[53]綜合評定不孕不育患者HRQoL特異性量表各測量性能的證據等級,并形成對于量表的最終推薦意見。
作者貢獻:史釗、李順平進行文章的構思與設計,史釗、吳小燕、劉嘉琪、杜慧敏負責文獻篩選及質量控制與審校;史釗、吳小燕、劉嘉琪進行數據收集及整理;史釗、李順平負責結果的分析與解釋,撰寫論文;史釗、李順平、吳小燕、劉嘉琪、杜慧敏進行論文的修訂;李順平負責文章的可行性分析,對文章整體負責,監督管理。
本文無利益沖突。