李瑞本,馬延寧,胡思源,吳力群,張葆青,薛征,閆永彬,郭素香,劉虹,胡淑萍,魏小維,成天萌,陸艷泓,吳鈺儀,張依
(1.天津中醫(yī)藥大學第一附屬醫(yī)院兒科,天津 300381;2.國家中醫(yī)針灸臨床醫(yī)學研究中心,天津 300381;3.北京中醫(yī)藥大學東方醫(yī)院兒科,北京 100078;4.山東中醫(yī)藥大學附屬醫(yī)院兒科,濟南 250011;5.上海市中醫(yī)醫(yī)院兒科,上海 200071;6.河南中醫(yī)藥大學第一附屬醫(yī)院兒科,鄭州 451100;7.天津中醫(yī)藥大學第二附屬醫(yī)院兒科,天津 300250)
小兒積滯病是一種具有明顯中醫(yī)特色的兒科常見脾系疾病,臨床以不思乳食,食而不化,腹部脹滿,大便不調(diào)為特征[1]。本病中醫(yī)內(nèi)涵比較清晰,中醫(yī)診療過程以證候表現(xiàn)等軟指標作為主要證據(jù),故中醫(yī)證候量表是評價療效最為恰當?shù)氖侄巍1菊n題組擬編制《小兒積滯病中醫(yī)證候療效評價量表》并主要在北方地區(qū)進行信度、效度及反應度檢驗,以期更好的為本病的臨床研究工作提供量表基礎。
1.1.1 構建條目池 成立課題小組和專家工作組,包括3名中醫(yī)兒科專家、1名中西醫(yī)消化內(nèi)科專家,2名方法學專家、2名臨床主治醫(yī)師和3名中醫(yī)兒科研究生。前者負責實施方案,后者負責指導決策。
以“積滯”“食積”“乳積”“傷食”等為檢索詞在中文數(shù)據(jù)庫、中醫(yī)兒科學教材/專著、行業(yè)標準和團體標準和中醫(yī)古籍中檢索關于小兒積滯病臨床癥狀和體征的描述。并由2名工作人員獨立進行數(shù)據(jù)提取。
由課題組專家對所提取條目進行審核,刪除與現(xiàn)代小兒積滯疾病認識不同、不適宜療效評價等條目,對“一詞多義”“一義多詞”的條目進行拆分與合并,參照《中醫(yī)臨床診療術語(疾病部分)》[2]《中醫(yī)臨床診療術語(證候部分)》[3]和《中醫(yī)診斷學》[4]等術語要求對條目進行規(guī)范化命名,最終形成條目池。
1.1.2 條目篩選 采用德爾菲問卷的方法,計劃在全國范圍內(nèi)遴選40名長期從事中醫(yī)兒科臨床及科研專家,通過2~3輪專家問卷,對各條目的重要性達成共識。第一輪問卷中的條目信息根據(jù)條目池編制,后續(xù)問卷中條目信息根據(jù)上一輪問卷分析結果進行刪補。條目的重要程度評分設置為1~9分,分數(shù)越高則表示該條目對中醫(yī)證候療效評價的影響很大。
統(tǒng)計各條目的重要程度評分均數(shù)和變異系數(shù)(CV)。剔除條目重要程度評分≤4分和/或CV≥0.4的條目,剩余條目將納入第2~3輪調(diào)查問卷再次確認。
1.1.3 條目優(yōu)化 將篩選后的條目分級量化,各條目按無(0分)、輕度(1分)、中度(2分)、重(3分)進行賦分,制定包括患兒基本信息和中醫(yī)癥狀評價量表兩部分的小兒積滯病初級臨床調(diào)查表。
在天津中醫(yī)藥大學第一附屬醫(yī)院兒科門診隨機選取積滯患兒,填寫初級臨床調(diào)查表,評價問卷填寫人對條目的理解程度,通過反饋結果對初級評價量表條目進行刪減、補充或修改。
1.2.1 倫理 本研究經(jīng)天津中醫(yī)藥大學第一附屬醫(yī)院倫理委員會審查通過(批件號:SPHFJPK2019020-02)。
1.2.2 研究對象
1.2.2.1 診斷標準 參照《中醫(yī)病證診斷療效標準》[5]制定。
1.2.2.2 納入標準 1)符合小兒積滯病診斷標準。2)年齡1~14歲。3)法定監(jiān)護人或與受試兒童(≥8歲)共同簽署知情同意書。
1.2.2.3 排除標準 1)診斷為其他疾病,伴有積滯癥狀者。2)合并心、腦、呼吸、肝、腎等系統(tǒng)疾病及精神疾病者。
1.2.2.4 病例來源 所有病例由天津中醫(yī)藥大學第一附屬醫(yī)院、天津中醫(yī)藥大學第二附屬醫(yī)院、上海市中醫(yī)醫(yī)院、山東中醫(yī)藥大學附屬醫(yī)院、北京中醫(yī)藥大學東方醫(yī)院、河南中醫(yī)藥大學第一附屬醫(yī)院6家單位共同承擔,均來源于門診。
1.2.2.5 樣本量 樣本量=量表條目數(shù)×(5~10)[6]。
1.2.3 調(diào)查方法 臨床調(diào)查采用門診醫(yī)生主導、經(jīng)專業(yè)培訓的調(diào)查人員輔助醫(yī)生和患兒及其家屬的形式進行。納入的積滯患兒需首先填寫知情同意書,然后由調(diào)查員根據(jù)患兒具體情況填寫臨床調(diào)查表。臨床調(diào)查表包括基本信息和中醫(yī)癥狀量表兩部分,在填寫積滯中醫(yī)癥狀量表時,調(diào)查員需逐條目詢問積滯患兒的癥狀,并選定與其描述相符合的級別,填寫到指定位置。條目賦分:癥狀條目按無癥狀計0分、輕度計1分、中度計2分、重度計3分賦分;舌脈條目按照無計0分、有計1分賦分。
7~10d后隨訪,調(diào)查員需對積滯患兒進行中醫(yī)癥狀量表信息的二次采集。此外,調(diào)查員還需在門診采集30例非積滯患兒的量表信息,作為量表反應度測評的數(shù)據(jù)。
1.2.4 干預措施 可選擇中藥湯劑、顆粒劑,或聯(lián)合針刺四縫等療法辨證施治。
1.2.5 統(tǒng)計方法 采用Excel 2016建立數(shù)據(jù)庫,指定專人雙次錄入數(shù)據(jù)并核對保存;采用SPSS 26.0軟件進行分析。計量資料采用均數(shù)、標準差進行描述。結構效度采用探索性因子分析,內(nèi)容效度、重測信度和分半信度采用相關系數(shù)分析,內(nèi)部一致性采用克朗巴赫系數(shù);反應度采用t檢驗或非參數(shù)檢驗。
2.1.1 條目池形成 通過文獻檢索,共提取136個癥狀/體征條目、17個舌象條目、15個脈象條目、7個指紋條目。課題組專家對條目討論審核,刪除如“壅盛涎鳴、熱毒發(fā)瘡、四肢不舉、目腫、囟腫喉塞、毛發(fā)稀疏、咳喘、氣短”等與現(xiàn)代小兒積滯疾病認識不同的條目;“喜按、喜俯/伏臥、拒按、喜飲熱湯、體重不增”等更適合作為診斷條目,也予剔除;拆分和合并“一詞多義”和“一義多詞”的條目。舌象、脈象以及指紋條目僅保留“苔膩”。將剩余條目進行規(guī)范化,形成具有46個癥狀條目的評價量表條目池。
2.1.2 德爾菲法問卷
2.1.2.1 專家信息 兩輪問卷調(diào)查分別發(fā)放40、40份問卷,回收38、33份有效問卷,回收率分別為95.0%和82.5%,專家積極程度較高。調(diào)查專家分別來自東北地區(qū)、華北地區(qū)、華東地區(qū)、中南地區(qū)、西南地區(qū)、西北地區(qū)中16個省市的29家三甲醫(yī)院,具有廣泛的地域代表性。專家均為高級職稱,平均年齡(52.0±7.0)歲,工作年限(28.0±9.2)年。見表1。

表1 專家基本信息Tab.1 Basic information of experts
2.1.2.2 第一輪專家問卷 第一輪專家問卷條目均數(shù)為2.66~8.37,CV為0~0.51。按照條目篩選標準,經(jīng)專家工作組討論決定刪除“大便青綠、小便短黃、小便如米泔、口干渴、低熱、肚腹熱甚、時寒時熱、胸脅苦悶、口苦、流涎、夢囈、磨牙、面色潮紅、形體消瘦、神疲肢倦、精神萎靡、足冷、唇淡白”共18個條目。見表2。

表2 第一輪專家調(diào)查各條目的統(tǒng)計結果Tab.2 Statistical results of items in the first round of expert survey
2.1.2.3 第二輪專家問卷 第二輪專家問卷,條目均數(shù)為 4.06~8.27,CV 為0.10~0.45,專家集中程度明顯提高。按照條目篩選標準,經(jīng)專家工作組討論決定刪除“大便黏稠、口中氣熱、自汗、盜汗”共4個條面目,最終保留24個條目。見表3。

表3 第二輪專家調(diào)查各條目的統(tǒng)計結果Tab.3 Statistical results of items in the second round of expert survey
2.1.3 條目優(yōu)化 共選取了25名積滯患兒進行臨床調(diào)查問卷的小范圍測試[7]。歸納出兩點問題:1)條目“嘈雜”,患兒及其家長均難以理解。2)條目“大便時干時稀”,7位家長反映孩子的大便是“先干后稀”。經(jīng)課題組專家討論并決定:1)因條目“嘈雜”難以描述和理解,予以其刪除。2)因行業(yè)標準和中醫(yī)兒科教材中所描述的積滯證候分型與大便形態(tài)并無明確的對應關系,故將描述大便形態(tài)的條目“大便時干時稀、大便干、大便溏”合并為“大便不調(diào)”。經(jīng)測試后量表條目初步優(yōu)化為21個。
2.2.1 一般情況 共對213名兒童進行調(diào)查研究,剔除信息不全病例18例,最終納入195例,包括積滯患兒165例,非積滯患兒30例。165例小兒積滯患兒中男 93例(56.36%),女 72例(43.64%);年齡(5.36±2.60)歲。30例非積滯兒童中男18例,女12例;年齡(5.12±2.70)歲。兩組兒童一般信息比較差異均無統(tǒng)計學意義(P>0.05),具有可比性。見表4。

表4 一般信息Tab.4 General information
2.2.2 效度分析
2.2.2.1 結構效度 對量表的21個條目,利用主成分的方法進行因子分析,結果Kaiser-Meyer-Olkin(KMO)檢驗值為0.723,Bartlett’s球形檢驗近似卡方值為 1 317.537(P<0.05),提示適合做因子分析。并進行方差正交旋轉后,結果條目“噯氣”小于0.4,條目“大便不調(diào)、夜寐不安”在2個因子上相近。課題小組及專家組參考既往研究集體討論決定以上3 個條目[8-10]。
對剩余18個條目再次進行因子分析,結果KMO值0.728,Bartlett’s球形檢驗近似卡方值為1 227.720(P<0.05)。按照特征根大于1的標準提取出7個公因子,累積方差貢獻率為75.152%,各條目經(jīng)方差正交旋轉后各因子載荷結果見表5,碎石圖見圖1。7個公因子所包含的條目存在課題組所預想的連帶關系/邏輯關系。課題組專家建議,將因子3、因子4、因子7合并,最終確定為5個因子,即5個維度:維度1—共性癥狀[食欲不振、食量減少],維度2—氣滯[脘腹脹滿、脘腹疼痛],維度3—食積[口氣臭穢、苔膩、嘔吐、惡心、大便酸臭、大便夾有食物殘渣/乳片、矢氣惡臭],維度4—化熱[手足心熱、大便臭穢、煩躁、唇紅],維度5—脾虛[食則飽脹、稍食即飽(早飽)、面色萎黃]。

圖1 18條目碎石圖Fig.1 18 item gravel diagram

表5 18個條目經(jīng)方差正交旋轉后各因子載荷結果Tab.5 Load results of each factor after variance orthogonal rotation of 18 items
2.2.2.2 內(nèi)容效度 量表中各條目與其所屬維度的相關性結果見表6,除“苔膩、嘔吐”較低外,其余各條目與其所屬維度的相關系數(shù)均>0.4(P<0.05)。

表6 量表各條目與其所屬維度的相關性Tab.6 The correlation between each item of the scale and its dimension
2.2.3 信度分析
2.2.3.1 重測信度 邀請間隔在7~10 d來復診的30例積滯患兒再次填寫臨床調(diào)查表,計算兩次量表總分和各維度得分的相關系數(shù)。結果顯示,兩次測量總分和各維度關系數(shù)均>0.7(P<0.05)。見表7。

表7 量表重測信度各維度相關系數(shù)Tab.7 Correlation coefficients of test-retest reliability of the scale
2.2.3.2 分半信度 將量表條目按奇數(shù)、偶數(shù)分為兩組,計算165例積滯患兒兩組得分的相關性。奇、偶數(shù)條目的 Cronbach’s α 系數(shù)分別為 0.368、0.376,兩者相關系數(shù)為 0.66(P<0.05),Spearman-Brown 和Guttman Split-Half系數(shù)均為0.798。見表8。

表8 量表分半信度結果Tab.8 Split half reliability results of the scale
2.2.3.3 內(nèi)部一致性 總量表及各維度的Cronbach’s α系數(shù),均>0.4。提示該量表及其各維度內(nèi)部一致性良好。見表9。

表9 量表總表以及各維度的Cronbach’s α系數(shù)Tab.9 Total scale and Cronbach’s of each dimension’s α coefficient
2.2.4 反應度
2.2.4.1 與非積滯兒童的比較 比較30例非積滯兒童和165例積滯患兒5個維度得分和量表總分。通過Mann-Whitney U檢驗,均有統(tǒng)計學差異(P<0.05)。見表10。

表10 積滯患兒與非積滯兒童中醫(yī)證候療效評價量表反應度分析Tab.10 Response score of traditional Chinese medicine syndrome efficacy evaluation scale for children with accumulation and stagnation and healthy children
2.2.4.2 積滯患兒治療前后的比較 對30例積滯患兒治療前后的中醫(yī)證候總分和各維度得分進行比較,通過Wilcoxon秩和檢驗,均有統(tǒng)計學差異(P<0.05)。見表11。

表11 積滯患兒治療前后中醫(yī)證候療效評價量表反應度分析Tab.11 Response analysis of traditional Chinese medicine syndrome efficacy evaluation scale children with accumulation and stagnation
3.1 量表編制方法 保證量表內(nèi)容的全面和完整是編制一個合格量表的前提[11],條目池構建采用文獻研究法,保證了評價量表條目的全面性和完整性。在兩輪德爾菲問卷中,采用均值>4和CV<0.4的雙重標準進行篩選,其中重要性評分的均值大小反映了專家意見的集中程度,均值大則意見越集中;CV數(shù)的大小反映了專家意見的協(xié)調(diào)性,CV小則專家意見的協(xié)調(diào)程度高[12-13]。最終形成篩選出21條目,均具有較高的集中程度和協(xié)調(diào)度。德爾菲法最大限度保證了信息的真實性和廣泛性,同時在保證評價條目全面性的基礎上,融合了現(xiàn)代中醫(yī)兒科專家們的寶貴經(jīng)驗,使得評價量表條目更符合時代性和適宜性。最后進行了小范圍測試,保證了評價量表中的每個條目都能夠成功被表達和理解。
3.2 舌脈和指紋類條目處理 因舌象、脈象等體征具有較為強烈的主觀評價特征,所以一直被認為是中醫(yī)證侯量表研制中的瓶頸[14]。有研究表明,由于醫(yī)生對患者舌脈的判斷主要依靠個人經(jīng)驗和感覺,同時受到視覺、空間、光線等因素的影響,極易出現(xiàn)判斷結果的不一致性,而且舌象、脈象的分類越多,越降低判斷結果的一致性[15]。近些年,醫(yī)療領域應用新技術建立了包括舌診、脈診在內(nèi)的臨床客觀療效評價體系,但其中舌象、脈象的客觀參數(shù)作為中醫(yī)臨床療效評價指標仍不成熟[16]。本研究最初構建評價量表條目池中舌象、脈象以及指紋條目分類過多,考慮評價不一致性對將最終結果造成影響,擬全部刪除。因“苔膩”為行業(yè)標準和團體標準中均提及的積滯病各證型均可具備的舌象,故在評價量表條目池中對其保留。
3.3 效度分析 效度即用于反映測量結果與“真值”的接近程度[17]。結構效度研究中因子分析法可根據(jù)各條目在公因子上載荷系數(shù)的大小對條目進行取舍,一般情況下,刪除載荷系數(shù)小于<0.4的條目以及在2個或2個以上因子載荷系數(shù)相近而無特異性的條目。本研究中刪除“噯氣”“大便不調(diào)”和“夜寐不安”3個條目,對量表條目一步優(yōu)化。對再優(yōu)化后的量表進行因子分析,結果顯示,最終形成的5個公因子所包含的條目存在課題組所預想的連帶關系/邏輯關系,且每個因子各自代表一個維度,不同維度的組合能體現(xiàn)小兒積滯的不同證型,符合臨床實際。
內(nèi)容效度通常用專家評議來評價。本次量表的編制,先后經(jīng)歷了2輪德爾菲法專家問卷調(diào)查,可以保證本量表具有較好的內(nèi)容效度。此外,內(nèi)容效度與結構效度具有相關性,對結構效度的量化指標做出評價也能間接反映內(nèi)容效度[18-19]。本次研究結果顯示,除“苔膩、嘔吐”較低外,其余各條目與其所屬維度的相關系數(shù)均>0.4,所有條目的P均<0.05,說明相關性較好[9]。
3.4 信度分析 重測信度用來考評量表跨時間的穩(wěn)定程度,多數(shù)學者認為時間跨度一般應為1~4周,用2次測評結果的相關系數(shù)來反映穩(wěn)定程度,一般認為重測信度系數(shù)>0.7時較理想[8-9,20]。本次研究結果顯示,本量表兩次測量的總分和各維度得分的重測信度系數(shù)均>0.7,說明本量表具有較好的穩(wěn)定性。分半信度又稱折半信度,常用來考察量表的跨條目一致性,一般采用Spearman-Brown系數(shù)和Guttman Split-Half系數(shù)表示分半信度系數(shù),要求R>0.7[21]。本次研究結果顯示,Spearman-Brown系數(shù)和Guttman Split-Half系數(shù)均為0.798,說明本量表的跨條目一致性較好。內(nèi)部一致性信度又稱同質(zhì)性信度,是信度測評時常用的指標,是指圍繞某一個特定方面展開的條目之間的相似程度。本次研究結果顯示,總量表及各維度的 Cronbach’s α系數(shù)處于0.488~0.924,說明此量表的內(nèi)部一致性較好[22]。
3.5 反應度分析 反應度又被稱為敏感性、區(qū)分效度[23],是指一個量表具有檢測被調(diào)查者細微特性變化的能力。目前對量表反應度的測評多從以下兩個方面:1)量表是否具備能夠區(qū)分不同人群生存質(zhì)量的能力。2)量表是否能夠區(qū)分一個體/群體的生存質(zhì)量隨時間變化情況。研究結果顯示,非積滯兒童與積滯患兒、積滯患兒自身治療前后,在中醫(yī)證候總分及各個維度得分方面的差異均具有顯著性意義。表明本量表具有較好的反應度。
3.6 不足與展望 本項目信效度評價研究的受試者來自北京、天津、河南、山東、上海5個省市,以北方地區(qū)居多,一定程度上可能影響了本量表的輻射能力。量表的研制工作需要不斷探索、不斷完善,在今后的研究中應增加南方地區(qū)的兒童樣本量,驗證量表在南方地區(qū)的適用性,進一步對本量表進行優(yōu)化。