揭芳芳,李 金,陳 濤*
(南昌大學a.理學院,江西 南昌 330031;b.第二附屬醫院,江西 南昌 330006)
華法林是目前世界上應用最廣泛的一線口服抗凝藥[1-2],據統計,在美國,每年有200萬左右人口開始使用華法林預防和治療血栓栓塞性疾病,華法林在臨床上可應用于靜脈血栓栓塞、房顫、肺栓塞、急性心肌梗死等疾病的預防和治療,但華法林在臨床應用中存在很多局限性[3],主要表現在藥物濃度太低無法產生治療效果,濃度太高容易引發副作用。患者對華法林劑量的個體差異較大,并且華法林治療效果受藥物相互作用影響嚴重,為加強華法林藥物利用效果,提高患者治療機率,減少不良事件的發生,故需對華法林穩定劑量進行研究。
目前國內對華法林的研究主要還是停留在醫學方面或不同基因型等對華法林劑量的影響,如劉艷麗等[4]在基因多態性的基礎上研究了腎功能不全患者對華法林劑量的需求情況;李曉琪[5]通過藥物基因組學劑量預測模型對華法林個體抗凝治療進行了臨床研究;P.S.Wells[6]主要研究了不同CYP2C9、CYP4F2和VKORC1基因對華法林藥物臨床劑量的需求。
本文創新之處在于,利用數理統計的方法,從數學角度出發,根據以往所收集的數據,分析數據[7-8],現擬結合相關基因(如VKORC1、CYP2C9、CYP4F2、GGCX等[9])多位點變異建立精準用藥數學模型,同時考慮同一位點不同基因型之間的相互聯系,建立華法林藥物劑量與所研究對象的關系。
數理統計學[10]是統計學分支學科。它是以概率論為理論基礎,對受隨機因素影響的不確定性現象進行大量的觀測或試驗,以有效的方法獲取樣本、提取信息,進而對隨機現象的統計規律(如參數、分布、相關性等)做出推斷。本文通過收集南昌市295名患者華法林臨床穩定劑量,運用統計學分析華法林穩定劑量與人體其他因素之間的關聯,從而建立華法林穩定劑量預測模型,并對模型的準確性進行驗證,更好地控制華法林臨床用藥劑量范圍,從而達到醫療效果。
通過收集南昌大學附屬醫院正在服用華法林藥物的患者信息,征求到295名患者相關醫療信息,為提高華法林穩定劑量預測模型的準確性,對295名患者進行等距抽樣將其中245名患者作為建模組,剩余50名患者作為驗證組,使我們模型是基于較多數據的前提下建立的,提高模型的準確性。

3.1.1 數據處理
對所收集的數據進行符號處理,處理結果如表1。

表1 符號說明
同時對所有臨床數據進行統計學描述,年齡、體重、身高表示為:mean±SD,描述結果如表2所示。

表2 所選患者臨床資料
由于存在兩個或兩個以上基因座位的等位基因同時出現在一條染色體上的情況,從而會導致重組后部分基因型概率高于隨機出現的概率,這種現象在基因學上稱為Linkage Disequilibrium(連鎖不平衡)[14-16],在本文研究的8個基因位點中rs1057910屬于CYP2C9基因,rs2069514屬于CYP1A1基因,rs887829屬于VGT1A1基因,rs699664屬于GGCX,而rs9923231、rs9934438、rs7196161、rs7294位點同屬于VKORC1基因,故需判斷以上4個位點是否存在LD現象,在本研究中所選患者人群的4個位點基因的分布情況如表3所示。

表3 患者VKORC1基因位點等位基因分布表
根據LD計算公式:
D=P(AB)-P(A)P(B)
注:假設基因A的等位為A,a;基因B的等位為B,b。則P(AB)表示單倍型AB出現的實際概率;P(A)P(B)表示單倍型AB出現的理論概率。
以rs9923231、rs9934438為例,將數據帶入上式得出r2>0.9,說明rs9923231與rs9934438之間存在強烈的連鎖不平衡現象,同理得出rs7196161、rs7294與rs9934438之間一樣存在強烈的連鎖不平衡。也故以下研究僅考慮VKORC1基因rs9923231位點對華法林劑量的影響。
3.1.2 各因素對華法林劑量的影響
利用Pearson及Spearman相關性及單因素線性回歸分析性別、年齡、體重等17個自變量與華法林劑量之間的關系,得出結果如表4所示。
由上述分析知:VKORC1(rs9923231)、CYP2C9(rs1057910)、GGCX(rs699664)、胺碘酮、年齡、體重、身高、BSA等因素對華法林劑量的穩定性的影響具有統計學意義,而血栓史、倍他樂克、ACEI等對華法林劑量穩定性的影響沒有統計學意義。
VKORC1(rs9923231)、CYP2C9(rs1057910)、GGCX(rs699664)各基因型間華法林穩定劑量如表5所示。
根據以上數據,可得出在不考慮其他因素的影響下,VKORC1(rs9923231)AA組華法林日穩定劑量為2.438±0.452 mg,明顯低于A/G組3.323±0.749和GG組5.163±0.477 mg;CYP2C9(rs1057910)GG組華法林日穩定劑量為0.750 mg,明顯低于A/G組2.076±0.391 mg和AA組2.658±0.634 mg,且每攜帶一個A等位基因,華法林劑量需求增加28%。此外,GGCX(rs699664)GG組華法林日穩定劑量2.671±0.640 mg也要高于AA組2.330±0.400 mg。
各基因型間華法林穩定劑量箱圖[17]如圖1~3所示。

表4 各變量與華法林穩定劑量之間關系

表5 患者3個基因型位點華法林穩定劑量表
3.1.3 華法林預測模型建立
為提高模型的準確性,將所收集數據的5/6作為建模組,另外的1/6作為驗證組去驗證模型的準確性,以使得我們的模型是基于較多數據而建立的,從而達到更好的預測效果,模型建立思路如圖4所示。
建模組及驗證組臨床信息如表6所示,通過單因素線性回歸得到可能影響到華法林穩定劑量的因素,對建模組中245名患者,使用逐步線性回歸[18],得到方程系數表如表7所示。

表6 建模組與驗證組患者基本信息

表7 多元線性回歸結果
據上述表格,得到華法林劑量預測模型為:
華法林穩定劑量(mg)=2.534-0.771×VKORC1(rs9923231)AA+0.024×體重-0.512×CYP2C9(rs1057910)GG+1.526×VKORC1(rs9923231)GG-0.012×年齡
注:
VKORC1(rs9923231)AA:AA=1,AG=0;
VKORC1(rs9923231)GG:GG=1,AG=0;
CYP2C9(rs1057910)GG:GG=1,AG=0。
本文所建立的華法林穩定劑量預測模型,可解釋61%華法林穩定劑量的個體差異,對變量進行逐步線性回歸時發現,基因遺傳因素對華法林穩定劑量差異的影響最大,在本模型中,常量及VKORC1(rs9923231)AA和GG可解釋36.4%個體劑量差異,而CYP2C9(rs1057910)GG在回歸過程中為0.053,說明CYP2C9(rs1057910)基因多態性在本模型中能解5.3%的個體差異,體重、年齡分別能解釋15.6%及3.7%的個體差異,在單因素線性回歸中,身高、胺碘酮、GGCX(rs699664)、BSA等雖然對華法林穩定劑量也有影響,但在逐步線性回歸過程中由于影響不顯著未能進入最終模型。
預測模型驗證[19]:
對比驗證組患者預測劑量及實際劑量,與實際預測劑量相差20%以內視為理想預測劑量;低于實際預測劑量20%視為偏低預測劑量;高于實際預測劑量20%視為偏高預測劑量。結果如表8所示。

表8 驗證組實際劑量與預測劑量
其中驗證組實際劑量與預測劑量對比圖如圖5所示。
本驗證結果,顯示驗證組中14%的患者預測劑量偏低,68%的患者預測劑量理想,18%的患者預測劑量偏高,即本模型在本研究中的準確率在68%左右,本文從基本的醫學角度收集數據,通過統計學對數據進行分析,得出變量之間的聯系,此研究結果可以幫助醫師指導患者更好的實現安全用藥,但本研究所建立的數據樣本區域性較強,故需進一步擴大樣本容量,為指導臨床用藥提供更準確的方法。
1.VKORC1和CYP2C9基因多態性可作為預測患病人群華法林穩定劑量的標記。
2.VKORC1基因多態性對患者華法林穩定劑量的影響大于CYP2C9基因多態性。
3.CYPA1、VG71A1及CCGX基因多態性不影響患者華法林穩定劑量。
4.由于個體存在差異性,預測患者實際藥物用量具有一定難度,經過模型驗證,本研究所建立的模型大概可預測68%左右人群華法林穩定劑量。