小兒積滯病中醫(yī)證候療效評價量表的編制和北方地區(qū)檢驗*

2022-07-30 02:37:02李瑞本馬延寧胡思源吳力群張葆青薛征閆永彬郭素香劉虹胡淑萍魏小維成天萌陸艷泓吳鈺儀張依

天津中醫(yī)藥 2022年7期

關鍵詞：評價

李瑞本，馬延寧，胡思源，吳力群，張葆青，薛征，閆永彬，郭素香，劉虹，胡淑萍，魏小維，成天萌，陸艷泓，吳鈺儀，張依

（1.天津中醫(yī)藥大學第一附屬醫(yī)院兒科，天津 300381；2.國家中醫(yī)針灸臨床醫(yī)學研究中心，天津 300381；3.北京中醫(yī)藥大學東方醫(yī)院兒科，北京 100078；4.山東中醫(yī)藥大學附屬醫(yī)院兒科，濟南 250011；5.上海市中醫(yī)醫(yī)院兒科，上海 200071；6.河南中醫(yī)藥大學第一附屬醫(yī)院兒科，鄭州 451100；7.天津中醫(yī)藥大學第二附屬醫(yī)院兒科，天津 300250）

小兒積滯病是一種具有明顯中醫(yī)特色的兒科常見脾系疾病，臨床以不思乳食，食而不化，腹部脹滿，大便不調(diào)為特征[1]。本病中醫(yī)內(nèi)涵比較清晰，中醫(yī)診療過程以證候表現(xiàn)等軟指標作為主要證據(jù)，故中醫(yī)證候量表是評價療效最為恰當?shù)氖侄巍１菊n題組擬編制《小兒積滯病中醫(yī)證候療效評價量表》并主要在北方地區(qū)進行信度、效度及反應度檢驗，以期更好的為本病的臨床研究工作提供量表基礎。

1 資料及方法

1.1 量表編制

1.1.1 構建條目池成立課題小組和專家工作組，包括3名中醫(yī)兒科專家、1名中西醫(yī)消化內(nèi)科專家，2名方法學專家、2名臨床主治醫(yī)師和3名中醫(yī)兒科研究生。前者負責實施方案，后者負責指導決策。

以“積滯”“食積”“乳積”“傷食”等為檢索詞在中文數(shù)據(jù)庫、中醫(yī)兒科學教材/專著、行業(yè)標準和團體標準和中醫(yī)古籍中檢索關于小兒積滯病臨床癥狀和體征的描述。并由2名工作人員獨立進行數(shù)據(jù)提取。

由課題組專家對所提取條目進行審核，刪除與現(xiàn)代小兒積滯疾病認識不同、不適宜療效評價等條目，對“一詞多義”“一義多詞”的條目進行拆分與合并，參照《中醫(yī)臨床診療術語（疾病部分）》[2]《中醫(yī)臨床診療術語（證候部分）》[3]和《中醫(yī)診斷學》[4]等術語要求對條目進行規(guī)范化命名，最終形成條目池。

1.1.2 條目篩選采用德爾菲問卷的方法，計劃在全國范圍內(nèi)遴選40名長期從事中醫(yī)兒科臨床及科研專家，通過2～3輪專家問卷，對各條目的重要性達成共識。第一輪問卷中的條目信息根據(jù)條目池編制，后續(xù)問卷中條目信息根據(jù)上一輪問卷分析結果進行刪補。條目的重要程度評分設置為1～9分，分數(shù)越高則表示該條目對中醫(yī)證候療效評價的影響很大。

統(tǒng)計各條目的重要程度評分均數(shù)和變異系數(shù)（CV）。剔除條目重要程度評分≤4分和/或CV≥0.4的條目，剩余條目將納入第2～3輪調(diào)查問卷再次確認。

1.1.3 條目優(yōu)化將篩選后的條目分級量化，各條目按無（0分）、輕度（1分）、中度（2分）、重（3分）進行賦分，制定包括患兒基本信息和中醫(yī)癥狀評價量表兩部分的小兒積滯病初級臨床調(diào)查表。

在天津中醫(yī)藥大學第一附屬醫(yī)院兒科門診隨機選取積滯患兒，填寫初級臨床調(diào)查表，評價問卷填寫人對條目的理解程度，通過反饋結果對初級評價量表條目進行刪減、補充或修改。

1.2 信度、效度和反應度評價

1.2.1 倫理本研究經(jīng)天津中醫(yī)藥大學第一附屬醫(yī)院倫理委員會審查通過（批件號：SPHFJPK2019020-02）。

1.2.2 研究對象

1.2.2.1 診斷標準參照《中醫(yī)病證診斷療效標準》[5]制定。

1.2.2.2 納入標準 1）符合小兒積滯病診斷標準。2）年齡1～14歲。3）法定監(jiān)護人或與受試兒童（≥8歲）共同簽署知情同意書。

1.2.2.3 排除標準 1）診斷為其他疾病，伴有積滯癥狀者。2）合并心、腦、呼吸、肝、腎等系統(tǒng)疾病及精神疾病者。

1.2.2.4 病例來源所有病例由天津中醫(yī)藥大學第一附屬醫(yī)院、天津中醫(yī)藥大學第二附屬醫(yī)院、上海市中醫(yī)醫(yī)院、山東中醫(yī)藥大學附屬醫(yī)院、北京中醫(yī)藥大學東方醫(yī)院、河南中醫(yī)藥大學第一附屬醫(yī)院6家單位共同承擔，均來源于門診。

1.2.2.5 樣本量樣本量=量表條目數(shù)×（5～10）[6]。

1.2.3 調(diào)查方法臨床調(diào)查采用門診醫(yī)生主導、經(jīng)專業(yè)培訓的調(diào)查人員輔助醫(yī)生和患兒及其家屬的形式進行。納入的積滯患兒需首先填寫知情同意書，然后由調(diào)查員根據(jù)患兒具體情況填寫臨床調(diào)查表。臨床調(diào)查表包括基本信息和中醫(yī)癥狀量表兩部分，在填寫積滯中醫(yī)癥狀量表時，調(diào)查員需逐條目詢問積滯患兒的癥狀，并選定與其描述相符合的級別，填寫到指定位置。條目賦分：癥狀條目按無癥狀計0分、輕度計1分、中度計2分、重度計3分賦分；舌脈條目按照無計0分、有計1分賦分。

7～10d后隨訪，調(diào)查員需對積滯患兒進行中醫(yī)癥狀量表信息的二次采集。此外，調(diào)查員還需在門診采集30例非積滯患兒的量表信息，作為量表反應度測評的數(shù)據(jù)。

1.2.4 干預措施可選擇中藥湯劑、顆粒劑，或聯(lián)合針刺四縫等療法辨證施治。

1.2.5 統(tǒng)計方法采用Excel 2016建立數(shù)據(jù)庫，指定專人雙次錄入數(shù)據(jù)并核對保存；采用SPSS 26.0軟件進行分析。計量資料采用均數(shù)、標準差進行描述。結構效度采用探索性因子分析，內(nèi)容效度、重測信度和分半信度采用相關系數(shù)分析，內(nèi)部一致性采用克朗巴赫系數(shù)；反應度采用t檢驗或非參數(shù)檢驗。

2 結果

2.1 量表編制

2.1.1 條目池形成通過文獻檢索，共提取136個癥狀/體征條目、17個舌象條目、15個脈象條目、7個指紋條目。課題組專家對條目討論審核，刪除如“壅盛涎鳴、熱毒發(fā)瘡、四肢不舉、目腫、囟腫喉塞、毛發(fā)稀疏、咳喘、氣短”等與現(xiàn)代小兒積滯疾病認識不同的條目；“喜按、喜俯/伏臥、拒按、喜飲熱湯、體重不增”等更適合作為診斷條目，也予剔除；拆分和合并“一詞多義”和“一義多詞”的條目。舌象、脈象以及指紋條目僅保留“苔膩”。將剩余條目進行規(guī)范化，形成具有46個癥狀條目的評價量表條目池。

2.1.2 德爾菲法問卷

2.1.2.1 專家信息兩輪問卷調(diào)查分別發(fā)放40、40份問卷，回收38、33份有效問卷，回收率分別為95.0%和82.5%，專家積極程度較高。調(diào)查專家分別來自東北地區(qū)、華北地區(qū)、華東地區(qū)、中南地區(qū)、西南地區(qū)、西北地區(qū)中16個省市的29家三甲醫(yī)院，具有廣泛的地域代表性。專家均為高級職稱，平均年齡（52.0±7.0）歲，工作年限（28.0±9.2）年。見表1。

表1 專家基本信息Tab.1 Basic information of experts

2.1.2.2 第一輪專家問卷第一輪專家問卷條目均數(shù)為2.66～8.37，CV為0～0.51。按照條目篩選標準，經(jīng)專家工作組討論決定刪除“大便青綠、小便短黃、小便如米泔、口干渴、低熱、肚腹熱甚、時寒時熱、胸脅苦悶、口苦、流涎、夢囈、磨牙、面色潮紅、形體消瘦、神疲肢倦、精神萎靡、足冷、唇淡白”共18個條目。見表2。

表2 第一輪專家調(diào)查各條目的統(tǒng)計結果Tab.2 Statistical results of items in the first round of expert survey

2.1.2.3 第二輪專家問卷第二輪專家問卷，條目均數(shù)為 4.06～8.27，CV 為0.10～0.45，專家集中程度明顯提高。按照條目篩選標準，經(jīng)專家工作組討論決定刪除“大便黏稠、口中氣熱、自汗、盜汗”共4個條面目，最終保留24個條目。見表3。

表3 第二輪專家調(diào)查各條目的統(tǒng)計結果Tab.3 Statistical results of items in the second round of expert survey

2.1.3 條目優(yōu)化共選取了25名積滯患兒進行臨床調(diào)查問卷的小范圍測試[7]。歸納出兩點問題：1）條目“嘈雜”，患兒及其家長均難以理解。2）條目“大便時干時稀”，7位家長反映孩子的大便是“先干后稀”。經(jīng)課題組專家討論并決定：1）因條目“嘈雜”難以描述和理解，予以其刪除。2）因行業(yè)標準和中醫(yī)兒科教材中所描述的積滯證候分型與大便形態(tài)并無明確的對應關系，故將描述大便形態(tài)的條目“大便時干時稀、大便干、大便溏”合并為“大便不調(diào)”。經(jīng)測試后量表條目初步優(yōu)化為21個。

2.2 信度、效度和反應度檢驗

2.2.1 一般情況共對213名兒童進行調(diào)查研究，剔除信息不全病例18例，最終納入195例，包括積滯患兒165例，非積滯患兒30例。165例小兒積滯患兒中男 93例（56.36%），女 72例（43.64%）；年齡（5.36±2.60）歲。30例非積滯兒童中男18例，女12例；年齡（5.12±2.70）歲。兩組兒童一般信息比較差異均無統(tǒng)計學意義（P＞0.05），具有可比性。見表4。

表4 一般信息Tab.4 General information

2.2.2 效度分析

2.2.2.1 結構效度對量表的21個條目，利用主成分的方法進行因子分析，結果Kaiser-Meyer-Olkin（KMO）檢驗值為0.723，Bartlett’s球形檢驗近似卡方值為 1 317.537（P＜0.05），提示適合做因子分析。并進行方差正交旋轉后，結果條目“噯氣”小于0.4，條目“大便不調(diào)、夜寐不安”在2個因子上相近。課題小組及專家組參考既往研究集體討論決定以上3 個條目[8-10]。

對剩余18個條目再次進行因子分析，結果KMO值0.728，Bartlett’s球形檢驗近似卡方值為1 227.720（P＜0.05）。按照特征根大于1的標準提取出7個公因子，累積方差貢獻率為75.152%，各條目經(jīng)方差正交旋轉后各因子載荷結果見表5，碎石圖見圖1。7個公因子所包含的條目存在課題組所預想的連帶關系/邏輯關系。課題組專家建議，將因子3、因子4、因子7合并，最終確定為5個因子，即5個維度：維度1—共性癥狀[食欲不振、食量減少]，維度2—氣滯[脘腹脹滿、脘腹疼痛]，維度3—食積[口氣臭穢、苔膩、嘔吐、惡心、大便酸臭、大便夾有食物殘渣/乳片、矢氣惡臭]，維度4—化熱[手足心熱、大便臭穢、煩躁、唇紅]，維度5—脾虛[食則飽脹、稍食即飽（早飽）、面色萎黃]。

圖1 18條目碎石圖Fig.1 18 item gravel diagram

表5 18個條目經(jīng)方差正交旋轉后各因子載荷結果Tab.5 Load results of each factor after variance orthogonal rotation of 18 items

2.2.2.2 內(nèi)容效度量表中各條目與其所屬維度的相關性結果見表6，除“苔膩、嘔吐”較低外，其余各條目與其所屬維度的相關系數(shù)均＞0.4（P＜0.05）。

表6 量表各條目與其所屬維度的相關性Tab.6 The correlation between each item of the scale and its dimension

2.2.3 信度分析

2.2.3.1 重測信度邀請間隔在7～10 d來復診的30例積滯患兒再次填寫臨床調(diào)查表，計算兩次量表總分和各維度得分的相關系數(shù)。結果顯示，兩次測量總分和各維度關系數(shù)均＞0.7（P＜0.05）。見表7。

表7 量表重測信度各維度相關系數(shù)Tab.7 Correlation coefficients of test-retest reliability of the scale

2.2.3.2 分半信度將量表條目按奇數(shù)、偶數(shù)分為兩組，計算165例積滯患兒兩組得分的相關性。奇、偶數(shù)條目的 Cronbach’s α 系數(shù)分別為 0.368、0.376，兩者相關系數(shù)為 0.66（P＜0.05），Spearman-Brown 和Guttman Split-Half系數(shù)均為0.798。見表8。

表8 量表分半信度結果Tab.8 Split half reliability results of the scale

2.2.3.3 內(nèi)部一致性總量表及各維度的Cronbach’s α系數(shù)，均＞0.4。提示該量表及其各維度內(nèi)部一致性良好。見表9。

表9 量表總表以及各維度的Cronbach’s α系數(shù)Tab.9 Total scale and Cronbach’s of each dimension’s α coefficient

2.2.4 反應度

2.2.4.1 與非積滯兒童的比較比較30例非積滯兒童和165例積滯患兒5個維度得分和量表總分。通過Mann-Whitney U檢驗，均有統(tǒng)計學差異（P＜0.05）。見表10。

表10 積滯患兒與非積滯兒童中醫(yī)證候療效評價量表反應度分析Tab.10 Response score of traditional Chinese medicine syndrome efficacy evaluation scale for children with accumulation and stagnation and healthy children

2.2.4.2 積滯患兒治療前后的比較對30例積滯患兒治療前后的中醫(yī)證候總分和各維度得分進行比較，通過Wilcoxon秩和檢驗，均有統(tǒng)計學差異（P＜0.05）。見表11。

表11 積滯患兒治療前后中醫(yī)證候療效評價量表反應度分析Tab.11 Response analysis of traditional Chinese medicine syndrome efficacy evaluation scale children with accumulation and stagnation

3 討論

3.1 量表編制方法保證量表內(nèi)容的全面和完整是編制一個合格量表的前提[11]，條目池構建采用文獻研究法，保證了評價量表條目的全面性和完整性。在兩輪德爾菲問卷中，采用均值＞4和CV＜0.4的雙重標準進行篩選，其中重要性評分的均值大小反映了專家意見的集中程度，均值大則意見越集中；CV數(shù)的大小反映了專家意見的協(xié)調(diào)性，CV小則專家意見的協(xié)調(diào)程度高[12-13]。最終形成篩選出21條目，均具有較高的集中程度和協(xié)調(diào)度。德爾菲法最大限度保證了信息的真實性和廣泛性，同時在保證評價條目全面性的基礎上，融合了現(xiàn)代中醫(yī)兒科專家們的寶貴經(jīng)驗，使得評價量表條目更符合時代性和適宜性。最后進行了小范圍測試，保證了評價量表中的每個條目都能夠成功被表達和理解。

3.2 舌脈和指紋類條目處理因舌象、脈象等體征具有較為強烈的主觀評價特征，所以一直被認為是中醫(yī)證侯量表研制中的瓶頸[14]。有研究表明，由于醫(yī)生對患者舌脈的判斷主要依靠個人經(jīng)驗和感覺，同時受到視覺、空間、光線等因素的影響，極易出現(xiàn)判斷結果的不一致性，而且舌象、脈象的分類越多，越降低判斷結果的一致性[15]。近些年，醫(yī)療領域應用新技術建立了包括舌診、脈診在內(nèi)的臨床客觀療效評價體系，但其中舌象、脈象的客觀參數(shù)作為中醫(yī)臨床療效評價指標仍不成熟[16]。本研究最初構建評價量表條目池中舌象、脈象以及指紋條目分類過多，考慮評價不一致性對將最終結果造成影響，擬全部刪除。因“苔膩”為行業(yè)標準和團體標準中均提及的積滯病各證型均可具備的舌象，故在評價量表條目池中對其保留。

3.3 效度分析效度即用于反映測量結果與“真值”的接近程度[17]。結構效度研究中因子分析法可根據(jù)各條目在公因子上載荷系數(shù)的大小對條目進行取舍，一般情況下，刪除載荷系數(shù)小于<0.4的條目以及在2個或2個以上因子載荷系數(shù)相近而無特異性的條目。本研究中刪除“噯氣”“大便不調(diào)”和“夜寐不安”3個條目，對量表條目一步優(yōu)化。對再優(yōu)化后的量表進行因子分析，結果顯示，最終形成的5個公因子所包含的條目存在課題組所預想的連帶關系/邏輯關系，且每個因子各自代表一個維度，不同維度的組合能體現(xiàn)小兒積滯的不同證型，符合臨床實際。

內(nèi)容效度通常用專家評議來評價。本次量表的編制，先后經(jīng)歷了2輪德爾菲法專家問卷調(diào)查，可以保證本量表具有較好的內(nèi)容效度。此外，內(nèi)容效度與結構效度具有相關性，對結構效度的量化指標做出評價也能間接反映內(nèi)容效度[18-19]。本次研究結果顯示，除“苔膩、嘔吐”較低外，其余各條目與其所屬維度的相關系數(shù)均＞0.4，所有條目的P均＜0.05，說明相關性較好[9]。

3.4 信度分析重測信度用來考評量表跨時間的穩(wěn)定程度，多數(shù)學者認為時間跨度一般應為1～4周，用2次測評結果的相關系數(shù)來反映穩(wěn)定程度，一般認為重測信度系數(shù)＞0.7時較理想[8-9，20]。本次研究結果顯示，本量表兩次測量的總分和各維度得分的重測信度系數(shù)均＞0.7，說明本量表具有較好的穩(wěn)定性。分半信度又稱折半信度，常用來考察量表的跨條目一致性，一般采用Spearman-Brown系數(shù)和Guttman Split-Half系數(shù)表示分半信度系數(shù)，要求R＞0.7[21]。本次研究結果顯示，Spearman-Brown系數(shù)和Guttman Split-Half系數(shù)均為0.798，說明本量表的跨條目一致性較好。內(nèi)部一致性信度又稱同質(zhì)性信度，是信度測評時常用的指標，是指圍繞某一個特定方面展開的條目之間的相似程度。本次研究結果顯示，總量表及各維度的 Cronbach’s α系數(shù)處于0.488～0.924，說明此量表的內(nèi)部一致性較好[22]。

3.5 反應度分析反應度又被稱為敏感性、區(qū)分效度[23]，是指一個量表具有檢測被調(diào)查者細微特性變化的能力。目前對量表反應度的測評多從以下兩個方面：1）量表是否具備能夠區(qū)分不同人群生存質(zhì)量的能力。2）量表是否能夠區(qū)分一個體/群體的生存質(zhì)量隨時間變化情況。研究結果顯示，非積滯兒童與積滯患兒、積滯患兒自身治療前后，在中醫(yī)證候總分及各個維度得分方面的差異均具有顯著性意義。表明本量表具有較好的反應度。

3.6 不足與展望本項目信效度評價研究的受試者來自北京、天津、河南、山東、上海5個省市，以北方地區(qū)居多，一定程度上可能影響了本量表的輻射能力。量表的研制工作需要不斷探索、不斷完善，在今后的研究中應增加南方地區(qū)的兒童樣本量，驗證量表在南方地區(qū)的適用性，進一步對本量表進行優(yōu)化。