敖登托婭 綜述,王美英審校
1.內蒙古醫科大學第二附屬醫院檢驗科,內蒙古呼和浩特 010090;2.內蒙古醫科大學附屬醫院檢驗科,內蒙古呼和浩特 010010
血脂代謝紊亂是公認的心腦血管疾病發生的危險因素[1]。制訂合理的血脂控制目標,可有效降低心腦血管疾病的發病率和病死率。血脂指標檢測不僅是無癥狀人群進行風險評估的工具,更是患者降脂治療的依據。臨床常規檢測的血脂指標包括總膽固醇(TC)、甘油三酯(TG)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)、脂蛋白(a)、載脂蛋白A(ApoA)和載脂蛋白B(ApoB)。雖然這些血脂指標都是心腦血管疾病的影響因素,但僅有LDL-C是被多個權威學會指南推薦的治療靶標[2]。正因如此,準確測量LDL-C水平對于心腦血管疾病的預防、治療、監測等極為重要。
LDL-C定量檢測的參考方法是超高速離心法。但是該方法操作繁瑣,需要大量的血清標本和超高速離心機[3]。因此不適用于普通的臨床實驗室。1998年,SUGIUCHI等[4]率先報道了一種可以實現自動化檢測LDL-C水平的方法,即均相法。該方法的原理是利用α-環糊精硫酸鹽、硫酸葡聚糖、鎂離子抑制乳糜微粒和極低密度脂蛋白(VLDL)組分中的膽固醇與酶試劑(膽固醇酯酶、膽固醇氧化酶和過氧化物酶)的反應。聚氧化乙烯-聚氧化丙烯封閉共聚多醚則可抑制HDL-C與上述酶試劑的反應。最終,標本中只剩下LDL-C與酶試劑反應,借此達到選擇性檢測LDL-C水平的目的。此后,各種商業化的LDL-C檢測試劑盒應運而生,包括Roche,Sekisui,Denka,Kyowa,Sysmex,Wako和UMA等。這些試劑盒均基于均相法,只在試劑配方、濃度、反應條件、反應順序上進行一些調整或修飾。由于均相法測定LDL-C水平有樣本量小、操作簡便、易于自動化等優點,目前我國臨床實驗室測定血清LDL-C水平普遍采用此方法[5]。值得注意的是,按照國家膽固醇教育計劃的要求,LDL-C檢測的精密度和偏差均應<4%,總誤差應<12%。這些商業化試劑盒的評估結果表明:試劑盒的檢測性能各不一致,變異系數多在4%以下,與金標準(超高速離心法檢測)之間存在7%的偏差[6]。在血脂代謝紊亂的患者中,均相法與超高速離心法之間的檢測結果偏差更大[7]。此外,均相法也易受到一些標本因素的干擾,如脂蛋白X[8]。總體而言,均相法的檢測結果也并不是十分可靠。因此,人們發明了各種計算公式去間接計算LDL-C水平。這些間接計算公式(Friedewald公式、Martin-Hopkins公式、Sampson公式)主要利用3個檢測難度較低、準確度較高的血脂指標HDL-C、TC和TG去計算LDL-C水平。這些公式對計算LDL-C水平具有一定的準確度,且極大地節約了實驗室成本,在血脂實驗室得到廣泛應用。值得注意的是,我國有一項研究探討了均相法實測LDL-C水平與多種間接公式計算LDL-C水平的相關性[9],研究發現,這些公式均與均相法的結果具有良好的相關性,其中與Martin-Hopkins公式相關性表明,Martin-Hopkins公式可能是最適合中國人群的LDL-C計算公式。除此之外,機器學習也被應用于LDL-C水平的計算,且有研究指出機器學習構建的模型相比于間接計算公式能更準確地預測LDL-C水平[10]。本文在此主要介紹常見的LDL-C計算公式,以及機器學習在LDL-C水平計算中的應用。
Friedewald公式在1972年被首次提出,具體公式如下[11]:
LDL-C=TC-HDL-C-TG/5
該公式的假設是:外周血的TC主要來自3個部分,分別是HDL-C、LDL-C和VLDL中的膽固醇。其中,VLDL中膽固醇的含量是TG的1/5。Friedewald公式的提出,拉開了研發LDL-C水平計算公式的序幕。多個研究對Friedewald公式與超高速離心法結果之間的一致性進行探討[12]。總體來看,TG水平過高和HDL-C水平過低時,Friedewald公式會低估LDL-C水平,反之則會高估[13-14]。值得注意的是,Friedewald公式的應用可能存在地域差異,并不適用于所有的國家。來自歐洲和韓國的研究認為Friedewald公式會低估LDL-C的水平[13,15]。但在伊朗的一項研究中認為Friedewald公式會高估受試者的LDL-C水平[16]。因此,將來需要在不同國家開展更多的研究去驗證這一公式。
除此之外,也有研究比較了Friedewald公式與均相法的結果,在TG>400 mg/dL時,Friedewald公式的準確度并不令人滿意,推薦使用直接檢測法。這一結論得到了美國膽固醇管理指南的支持,并且該指南還補充Friedewald公式在LDL-C<70 mg/dL時準確度較差[17]。
盡管Friedewald公式存在著一些局限性,但是考慮到均相法有一定的成本,超高速離心法又較為繁瑣。因此,Friedewald公式在很長一段時間內仍然在血脂實驗室被廣泛使用,特別是對于TG<400 mg/dL、LDL-C>70 mg/dL的標本。
Friedewald公式的科學假設是VLDL中膽固醇的含量是TG的1/5[10]。這一假設明顯過于粗略,TG與VLDL中膽固醇的比值受很多因素的影響。2013年MARTIN等[18]對Friedewald公式進行了改進,提出了Martin-Hopkins公式。Martin-Hopkins公式認為,Friedewald公式中固定的TG不應該直接除以5,而是應該根據TG和非HDL-C的水平進行調整。Martin-Hopkins公式的具體公式如下:
LDL-C=TC-HDL-C-TG/可變系數
其中,可變系數是根據TG和非HDL-C的水平來確定的,具體可以從文獻[18]提供的一個6×30的表格中讀取。MARTIN等[18]PALMER等[19]的研究指出,在TG≤400 mg/dL時,Martin-Hopkins公式計算LDL-C水平的準確度高于Friedewald公式。但無論是Friedewald公式還是Martin-Hopkins公式可能均不適用于TG>400 mg/dL的患者。雖然Martin-Hopkins公式和Friedewald公式在計算TG高水平患者LDL-C中的準確度均較差,但Martin-Hopkins公式可能更準確一些。最新的一項基于111 939例TG水平在400~799 mg/dL的美國患者的研究指出,Martin-Hopkins公式的準確度仍然高于Friedewald公式[20]。在與超高速離心法的結果比較上,Martin-Hopkins公式計算LDL-C水平的準確度高于Friedewald公式,更接近參考方法。鑒于此,Martin-Hopkins公式于2018年被美國膽固醇指南推薦使用,同年,美國心臟學會心血管疾病標志物的指南也推薦了Martin-Hopkins公式作為檢測LDL-C水平的首選計算方法[17]。
一項來自韓國的研究指出Martin-Hopkins公式應用于韓國患者時,會出現高估患者的LDL-C水平的情況[21]。并且 ,該研究還指出當應用Martin-Hopkins公式時,由于種族地域不同可能需要對公式的系數進行調整。由于以往關于Martin-Hopkins公式的研究大多源于歐美國家,因此Martin-Hopkins公式能否在全球其他地區推廣尚不明確。將來仍有必要在不同地域和人群中開展相應的研究來探討這一問題。
2020年,來自美國國立衛生研究院(NIH)血脂代謝實驗室的SAMPSON的團隊提出了新的LDL-C計算公式,即Sampson公式[22]。具體公式如下:
LDL-C=TC/0.948-HDL-C/0.971-[TG/8.56+TG×(TC-HDL-C)/2 140-TG2/16 100]-9.44
該方程基于β定量和最小二乘回歸法改進了對VLDL-C水平的估計。該研究還指出,在TG≤400 mg/dL時,Friedewald公式、Martin-Hopkins公式和Sampson公式計算LDL-C的準確度相似,而TG水平在400~800 mg/dL時,Sampson公式準確度更高,尤其是與Friedewald公式比較,Sampson公式可減少35%的錯誤分類[21]。這表明,Sampson公式幾乎可以應用于所有患者,因為TG≥800 mg/dL的患者少之又少。已經有多項研究對Sampson公式進行了驗證與評估,認為Sampson公式是目前計算LDL-C水平準確度最高的公式[23-24]。值得注意的是,Sampson公式在兒童LDL-C計算上準確度也是很高[25]。
機器學習是一種將計算機科學與統計學融合的新興的十分具有前景的人工智能技術。目前,機器學習在醫學領域的應用越來越廣泛。機器學習的過程大致是:預先給計算機一定量的數據(訓練數據),并預先設定算法,讓計算機軟件根據訓練數據不斷優化算法參數,最終形成一個成熟的算法。之后,再利用該算法去測試新的數據(驗證數據)或外部數據(測試數據),以評估算法的準確度。算法是機器學習的核心,也是機器學習能否成功的關鍵。目前常用的算法包括K最近鄰法、支持向量機、隨機森林等。很多研究利用這些算法開發新的LDL-C水平計算方案[26-33]。總體來看,機器學習算法計算LDL-C水平的結果也較為準確。在一項研究中,機器學習算法與均相法的相關系數達到0.982,高于Friedewald公式(r=0.950)和Martin-Hopkins公式(r=0.962)[32]。在TG<400 mg/dL時,機器學習算法的準確度與傳統計算公式大致相似,并且在TG>400 mg/dL的個體中,機器學習算法的準確度與均相法的相關性也較高[27,29,31]。總體來看,機器學習是一種有前景的LDL-C水平計算方法。
值得注意的是,機器學習算法也有一些固有的缺陷。比如,機器學習算法本質上是一個“黑匣子”,無法像Friedewald公式和Martin-Hopkins公式那樣用傳統數學表達式來進行描述,必須借助計算機軟件才能實現,在臨床實踐中難以普及。可以預見的是,如果能將這些算法整合入實驗室信息系統(LIS),將極大地推動這些算法的臨床應用。此外,機器學習算法較多,各種算法得出的結果不盡相同。因此,機器學習算法能否準確地計算出LDL-C水平并具有泛化能力,很大程度上取決于研究者是否利用具有廣泛代表性的人群數據建立合理、穩健的機器學習算法。
目前,被廣泛認可的LDL-C計算公式僅3個,分別是Friedewald公式,Martin-Hopkins公式和Sampson公式。就準確度而言,Friedewald公式不如Martin-Hopkins公式,Martin-Hopkins公式不如Sampson公式。機器學習算法雖然也具有較高的準確度,但是該方法的計算過程復雜,臨床接受度尚待提升。筆者認為Martin-Hopkins公式的臨床認可度較高,這主要是因為該公式已經誕生了10余年,其準確度在不同的人群中已被廣泛驗證。相比之下,Sampson公式誕生不到3年。雖然初步研究顯示Sampson公式的準確度高于Martin-Hopkins公式,但這方面的證據還需要不斷加強,最終才可能被臨床接受。