章軼立 魏戌 聶佩蕓 申浩 虞鯤 康樹 謝雁鳴*
1. 中國中醫科學院中醫臨床基礎醫學研究所, 北京 100700 2. 中國中醫科學院望京醫院科研處, 北京 100102 3. 中國人民大學統計學院, 北京 100872 4. 上海大華醫院中醫科, 上海 200237 5. 北京中醫藥大學附屬東直門醫院放射科, 北京 100700
絕經后骨質疏松性骨折是絕經后骨質疏松癥的嚴重后果,可嚴重增加患者的致殘率和病死率,并帶來極大的家庭和社會經濟負擔[1-2]。流行病學調查顯示,截至2010年,全球范圍內約有21%的50~84歲婦女患有骨質疏松癥,歐洲約有2 200萬婦女受到影響[3];2014年美國國立骨質疏松癥基金會(NOF)估計,美國約有1020 萬骨質疏松癥患者,每年發生超過 200 萬例骨質疏松相關性骨折,其中女性占 70%[4];2015年文獻顯示,中國目前40歲以上的骨質疏松癥患者已有1.12億,其中女性發病尤其突出。
對該病危險人群進行早期風險評估,預測未來幾年內患病的危險程度、發展趨勢及相關的危險因素,是絕經后骨質疏松性骨折預防與診治的基礎和核心環節。目前國際較常用的骨質疏松性骨折風險評估工具主要包括骨折風險預測簡易工具(FRAX?)、Garvan nomogram評估工具、亞洲人骨質疏松自我篩選工具 (Osteoporosis Self-assessment Tool for Asians,OSTA)等,但適用于國人使用且專門針對絕經后骨質疏松性骨折的預測工具仍然缺乏?!吨嗅t藥健康服務發展規劃(2015-2020年)》[5]中指出:通過中醫健康風險評估、風險干預等方式,提供中醫特色健康管理服務,是國家的戰略需求與導向。故本研究在中醫學“治未病”理論指導下,利用課題組前期在北京市東城區及上海市徐匯區連續 3 年登記40~65歲女性骨質疏松癥高危人群的危險因素及中醫癥狀信息,嘗試建立絕經后骨質疏松性骨折風險評估工具。
本研究數據來自課題組2009-2011年在北京、上海兩地接受“社區40歲~65歲婦女骨質疏松危險因素及證候”課題調查患者,詳細介紹請參考有關文獻[6-7]。共計1498例患者組成本研究的3年縱向分析數據,遴選其中絕經后的1129例患者作為構建預測模型的3年研究數據。
以WHO推薦的T值參考范圍[8]作為骨質疏松癥診斷標準,即:BMD低于同性別、同種族健康成人<1 SD屬于骨量正常;T值處于1.0~2.5 SD之間為骨量減少;T≥2.5 SD為骨質疏松。骨質疏松性骨折診斷標準參考《骨質疏松性骨折診療指南》[9](2017版)定義:指在日常生活中未受到明顯外力或受到“通常不會引起骨折外力”而發生的骨折。“通常不會引起骨折外力”指人體從站立高度或低于站立高度跌倒產生的作用力。
基于SPSS 23.0軟件對患者一般情況進行描述分析,計量資料采用均值±標準差表示,計數資料采用率和構成比表示?;赗 3.3.3軟件的Grplasso包進行Group Lasso回歸分析,篩選現代醫學危險因素與中醫證候要素。再以篩選出的早期預警指標作為協變量,以骨折發生情況(是否骨折)作為結局變量,并基于Logistic模型構建絕經后骨質疏松性骨折的早期預警模型,受試者工作特征曲線判斷模型優劣。
很多分類問題都會面對樣本不均衡性的問題,很多算法在這種情況下分類效果都不甚理想?;诖?,一般有采樣和代價敏感學習兩種策略,具體又可分為over-sampling和under-sampling兩種。其中,SMOTE算法是over-sampling中比較常見的一種。Chawla 等[10]的研究表明,該算法生成新樣本的思想是對少數類樣本進行類內的插值。因此,不會改變少數類樣本集本身的空間邊界;而生成的新樣本是根據樣本點及其最近鄰樣本點間的屬性隨機插值獲得,從而保證算法信度。
Yuan等[11]提出的 Group Lasso 方法通過引入對罰函數的擴展很好地解決了Lasso直接應用于具有組結構模型中時,傾向于選擇出單個特征,因而破壞了特征的組結構的缺陷。因此,Group Lasso 是對 Lasso 的一種推廣,對組特征的選擇進行研究,從而改進了 Lasso 在組結構數據上的缺。其公式如下:
本研究截止到2011 年11 月底,共跟蹤到1129名與絕經后骨質疏松癥骨折相關的調查信息,應答率82.71%。其中,北京地區跟蹤到511例完整信息,應答率85.16%;上海地區跟蹤618例完整信息,應答率80.78%。
根據研究人群骨密度檢測結果和骨折發生原因分析, 1129名患者中共有49人發生骨質疏松性骨折,患病率約為4.34%。其中,扭傷 12 例,跌倒 37 例;骨折部位方面,橈骨遠端的骨折 14 例,股骨上端 7 例,胸腰椎椎體6 例,踝關節22 例。
可以看出,骨折人群與未骨折人群人數比例分布并不均衡(約1:22),依此數據建??赡茉斐蓪W習過程中不能正確識別骨折人群數據,導致其分類準確率不高[12]。故經SMOTE過抽樣算法對骨折人群樣本進行樣本插值,最終得到未骨折樣本2034例,骨折樣本392例,兩類樣本分布比約為1∶5。
在實際問題中,很多協變量之間會存在一些組結構,在進行變量選擇時應盡量減少組結構的破壞,而將相關協變量作為一個組同時選入或剔除[13]。本研究采用的問卷經克朗巴赫系數、折半信度及結構效度檢驗表明,條目間的內部一致性較高,具有良好的信度與效度[8,14]。問卷中包括一般信息、生活習慣、發病相關因素、軀體狀況、臨床體征五個領域的內容,共65個條目,且五個領域內部不同條目間又各有關聯,故將其再分為若干組(見表1)。其中,“軀體狀況”內部的各種癥狀,在參考《骨質疏松癥中醫臨床實踐指南》(2011)和《中醫藥防治原發性骨質疏松癥專家共識(2015)》的基礎上,又可分為腎陽虛、脾胃氣虛、肝腎陰虛、血瘀氣滯四個維度,即四種中醫證候要素,將其視為四個組作為待選變量。

表1 各組內部描述Table 1 Characteristics of each group
基于R 3.3.3軟件的gglasso包,在不同λ水平上,我們對絕經后骨質疏松性骨折的危險因素與中醫證候要素進行學習。最終結合數理與醫理,認為λ=47時遴選出的變量最佳,具體組變量包括:骨密度、年齡、食物類、身高、月經情況、孕產次數和肝腎陰虛。特征組內部各變量系數見表2,各變量賦值含義見表3。
將表2中的變量系數代入回歸公式,得到第i個患者發生絕經后骨質疏松性骨折的概率為:P=-1.88 + 0.437*BMD + 0.289*年齡 + 0.023*大米面條-0.007*奶制品-0.096*豆制品-0.128*肉類-0.084*魚類-0.007*新鮮蔬菜-0.018*蛋類 + 0.047*海藻類 + 0.048*身高-0.035*是否變矮-0.081*初潮年齡 + 0.171*是否絕經 + 0.121*絕經年限 + 0.039*懷孕次數 + 0.192*生產次數-0.056*子宮卵巢是否切除 + 0.05*手足煩熱-0.094*盜汗 + 0.008*腿軟 + 0.15*目眩-0.048*視物模糊-0.045*目睛干澀-0.089*惡熱 + 0.08*脫發 + 0.034*齒搖 -0.101*口苦 + 0.004*易怒 + 0.054*午后潮熱-0.056*失眠 + 0.019*多夢易驚-0.02*胸脅苦滿 + 0.137*下肢轉筋。
對Logistic回歸模型預測概率繪制受試者工作特征曲線(receiver operator characteristic curve,ROC),結果顯示曲線下面積為0.8775(95%CI=0.8412~0.9138),見圖1。

圖1 絕經后骨質疏松性骨折預測工具的ROC曲線Fig.1 Roc curve of the risk assessment tool for postmenopausal osteoporotic fractures
選擇在社區防治骨質疏松(osteoporosis,OP)的發展,必定是今后 OP 等慢性病防治工作的重點,而面對當前大部分社區基礎設施薄弱、專業人員不足的情況,研究應用經濟、實用、快速、準確、安全、無痛苦的篩檢方法,是識別OP 高危人群的重要手段,已成為 OP 預防與控制的關鍵。
本研究基于2009-2011年在北京、上海兩地社區接受“社區40歲~65歲婦女骨質疏松危險因素及證候”課題調查患者數據,以是否發生絕經后骨質疏松癥骨折為結局變量,通過Group lasso回歸算法和Logitic回歸模型,篩選出絕經后骨質疏松性骨折的六個常見危險因素,即:骨密度、年齡、食物種類、身高、月經情況、孕產次數和以肝腎為證候要素靶位,陰虛為主的中醫證候要素,初步構建出具有良好預測效能的絕經后骨質疏松性骨折初發風險評估工具。
年齡是骨質疏松性骨折影響因素中的不可控因素。日本的一項隨訪研究[15],納入64809名女性以調查五年內骨質疏松性骨折發生率。受試者平均年齡(56.9±9.9)歲,五年內骨折人數3421例(5.3%),Logistic回歸模型發現,骨質疏松性骨折發生與年齡有關(OR=1.05,95%CI1.02~1.09)。值得注意的是,骨密度的重要相關因素是年齡,進而影響骨質疏松性骨折的發生。人一生中的骨量變化,從嬰兒期的開始增加至少年時期的迅速增加,35歲左右可達峰值骨量水平,隨后開始逐漸降低并伴隨骨質疏松性骨折發生率的提高[16]。
骨密度值降低是骨質疏松性骨折的重要危險因素之一,其含量也被作為確診發生骨質疏松性骨折的“金指標”[17]。美國一項研究發現[18],患者BMD值下降1 SD,其骨質疏松性骨折風險即增加1.5~3倍。本研究中,Group lasso 算法得出的骨密度系數高達0.437,進一步證明了骨密度水平與骨質疏松性骨折具有很強的相關性。
飲食中Ca2+和Vit D是決定骨峰值的重要因素,對兒童、成人的相關調查均發現,牛奶對腰椎、股骨近端骨峰值有明顯影響,每天飲用牛奶者較不喝或偶爾喝者骨峰值高 6.6%[19]。本研究的問卷中涉及到日常生活中的主要食物種類,結果發現,富含蛋白質、鈣、磷等微量元素的蛋奶類、肉類等食物與骨質疏松性骨折發生率成反比關系,提示注重該類食物的攝入可有效降低骨質疏松性骨折的發生概率。
經帶胎產是女性特有的生理功能,同樣也是影響骨質疏松性骨折的重要因素。Cheung等[20]研究認為,女性在絕經年齡后,雌激素水平下降,通常會有一定程度的骨質流失。國內有學者闡明[21],絕經后女性性激素水平下降,其抑制破骨細胞活性、減少骨吸收、促進成骨細胞活性及骨質形成作用下降而逐漸發生骨質疏松。此外,隨著孕產次數增加,女性總哺乳時長增加,產后哺乳閉經導致雌激素水平低下和高泌乳素水平以及哺乳期間為了滿足幼兒對鈣的需要,在體內進行骨鈣動員,從而導致鈣質流失加大、產后鈣攝入量不足,均可導致女性骨質疏松。
2011年發布的《原發性骨質疏松癥中醫臨床實踐指南》中,把原發性骨質疏松癥分為了腎陽虛證、脾腎陽虛證、肝腎陰虛證和血瘀氣滯證四型?!夺t精經義》言:“腎藏精, 精生髓, 髓生骨, 故骨者腎之所合也;髓者, 精之所生也, 精足則髓足, 髓在骨內, 髓足則骨強?!闭f明骨之強勁與脆性是腎中精氣盛衰的重要標志,腎中精氣充盈,則骨髓生化有源骨才能得到骨髓的滋養, 則能強健有力。婦女到了絕經的年齡, “天癸”絕,腎精虛少,化源不足,不能營養骨骼而致骨髓空虛, 進而導致了絕經后婦女原發性骨質疏松癥的發生。
肝藏血主筋,腎藏精主骨,中醫素有“精血同源”、“肝腎同源”之說,藏血和藏精之間的關系實際上是精和血之間存在著相互滋生相互轉化的關系。 血的化生有賴于腎中精氣的氣化;腎中精氣的充盛有賴于血液的濡養。絕經期婦女多有情志不遂,肝郁諸證明顯, 肝氣郁結,可耗傷陰血,而致肝陰不足,導致腎精虧虛,使骨髓失養,髓枯筋燥,痿廢不起。腎虛日久,亦必損及肝,最終肝腎陰虛。
本研究表明,絕經后骨質疏松性骨折的中醫證候要素以陰虛為主,涉及臟腑主要包括肝腎,也進一步佐證了先賢醫籍中的理論。國內亦有學者[22]針對91例絕經后骨質疏松癥中醫證型分布規律研究發現,骨質疏松癥患者中肝腎陰虛型最多44例占48.35%,腎陰虛型19例占20.88%,腎陽虛型12例占13.19%,脾腎陽虛型10例占10.99%,脾胃虛弱型6例占6.59%,說明在絕經后骨質疏松癥的患者中,陰虛證仍是最主要的證型。
本研究形成的骨質疏松骨折早期預測模型具有良好的預測效能,是識別絕經后女性骨質疏松性骨折高危人群的簡易工具。在高危人群的預防和治療中,基于本研究篩選出的危險因素,應重點對骨密度進行定期監測。同時,日常生活中應注意膳食結構的調整,青少年時期多進食奶制品、豆制品、肉類、魚類、新鮮蔬菜、蛋類等富含鈣質、蛋白質類食物,以增加峰值骨量水平;絕經后中老年女性也應適當增加該類食物,減緩骨量流失。隨著年齡和絕經年限的增加,中醫學認為,絕經后骨質疏松癥患者趨于肝腎陰虛為主的體質類型,故在臨床治療該類患者時,遣方用藥應注意顧護患者肝腎之陰?;颊呷粘I钪?,可根據自身情況適量選取滋補肝腎之品代茶飲、煲湯等。當絕經后女性出現手足煩熱、盜汗、目眩、下肢轉筋等肝腎陰虛癥狀時,應警惕發生絕經后骨質疏松性骨折的可能性并盡早預防。
本研究為絕經后骨質疏松性骨折的預測提供了一定的參考,但限于實際條件限制,數據取樣不是很充足,發病患者樣本量及來源地太少,未必能反應總體的真實情況。此外,Logistic 回歸雖是數據處理中常用的統計方法,但對于變量共線性的問題又存在自身不足[23]。故在今后的研究中,可以通過相應統計算法,事先減少數據間的不平衡性,再基于其他數學模型構建預測工具,以對本研究的結果進行補充與完善。