蔣宇亮,李偉聰,趙子夜,吳 靜,寧守斌,劉 紅*
(1.首都醫科大學附屬世紀壇醫院消化科,北京100038;2.北京市航天中心醫院健康管理部,北京 100040;3.上海長海醫院肛腸外科,上海 200433;4.首都醫科大學附屬友誼醫院消化科,北京 100050;5.中國人民解放軍空軍特色醫學中心消化科,北京 100142)
Peutz-Jeghers綜合征(Peutz-Jeghers syndrome,PJS)是一種罕見的常染色體顯性遺傳疾病,發病率為1/50 000~1/200 000[1]。因該病發病率極低,有關PJS的報道多為病例報告、病例系列和病例回顧,而包含大量病例的隊列研究則很少。該病以胃腸道多發性息肉、皮膚黏膜色素沉著斑和腫瘤易感性為主要特征[2]。目前PJS診斷要素包括:胃腸道錯構性息肉、皮膚黏膜色素沉著斑和疾病家族史[3-4]。因PJS患者具有明顯的家族聚集性,且惡性腫瘤風險比一般人群高9~18倍,尤其大腸癌的腫瘤終生風險可達39%[5],故該病被納入遺傳性結直腸癌綜合征[4]之中,如Lynch綜合征、家族性腺瘤性息肉病等。隨著近年來研究的深入,多位學者研究發現不同突變位點及類型,可能影響PJS的臨床表現,尤其惡性腫瘤發生率[6-7]。在PJS患者中連續發現STK11突變,并確定絲氨酸-蘇氨酸激酶11(STK11 / LKB1,OMIM 602216)為PJS的主要致病基因。因檢測數量和采用的檢測方式不同,導致致突變檢出率差異較大。目前檢測方法包括Sanger測序、二代測序(next-generation sequencing,NGS)和多重連鎖依賴性探針擴增分析(multiplex ligation-dependent probe amplification,MLPA)等。其中,Sanger測序聯合MLPA或NGS聯合MLPA是目前為止最好的組合檢測策略,檢出率為60%~100%[2]。這些被檢測到的突變會被記錄在孟德爾遺傳在線(online mendelian inheritance in man,OMIM)、人類基因突變數據庫(human gene mutation database,HGMD)、ClinVar等數據庫中,臨床醫生可通過檢索并進行基因型-表型關聯、遺傳咨詢等相關工作。但是,隨著測序技術進步和突變命名規則確立等多種原因,數據庫所記錄的突變中存在的問題逐漸被認識。其中部分問題可能會影響上述臨床工作,如對PJS患者致病突變的鑒定和由此展開的遺傳咨詢,還會導致新發突變的錯誤報道,進而引起后續的報道錯誤。為了探究這些問題的發生原因,本研究對中國PJS患者中報道的STK11突變進行了全面檢索及分析。希望通過揭示該現象發生的原因,為新發現突變的標準表達提供參考。
1.1一般資料 檢索Medline、PubMed、Embase、萬方數據庫、中國期刊全文數據庫(CNKI)、中國生物醫學文獻數據庫(CBM & SinoMed)。檢索年限:從創刊至2020年12月31日。中文主題詞:“中國或中國人、Peutz-Jeghers綜合征或PJS、STK11或絲氨酸/蘇氨酸11或LKB1或肝激酶B1)”,英文主題詞:“China/Chinese、Peutz-Jeghers syndrome/PJS、STK11或Serine/threonine kinase 11或LKB1或Liver kinase B1”。此外對部分文獻進行人工檢索和核對交叉引用。
1.2納入標準和排除標準 納入標準:①包括隊列研究、病例對照研究和病例報告/病例系列,其中所報道中國的PJS患者均已明確診斷,并完成了對STK11基因的突變檢測;②突變檢測方法包括Sanger序列、全外顯子測序和MLPA等;③檢測對象包括PJS患者本人及其親屬,以及因發現胃腸道息肉而疑診為PJS的患者等。排除標準:①對PJS患者僅圍繞臨床診斷、臨床特征、治療、預后等臨床過程進行討論的研究;②未經同行評審的學位論文;③采用錯誤STK11基因序列進行突變命名者。
1.3定性分析和數據 提取對納入的研究進行多方面的質量評估,包括患者來源、實驗方法和報告形式,評估由兩名研究人員獨立進行。如果研究或案例的質量被認為不合格,則將其從以下分析中排除。如有任何分歧,應由調查員進行判斷。從最終納入的研究中提取以下有關變量:第一作者的姓氏,進行研究的時間和地點;突變檢出率;受檢的家系與檢出家系數量;突變的具體信息(外顯子、編碼區的位置、氨基酸改變);突變的性質(未報道、已報道);存在問題突變的細節。
1.4結果分析 采用描述性分析。結果包括中國PJS患者所攜帶的STK11突變,報告時間和地點,突變數及其性質以及報告錯誤和原因。為了對其進行判斷,檢索相關數據庫和文獻以確認所報道突變是否為新突變。
2.1文獻檢索結果及基本特征 按照上述檢索范圍、納入和排除標準進行檢索和篩選,共納入55篇文獻,經統計顯示,包含649個家系(一篇文獻因不能準確識別參檢和檢出家系數據未能參與家系統計),共報道301個突變,包括一些重復報道的突變。經過系統分析,最終確定181種突變,其中中國學者首次報道108種突變(圖1)。包含55條文章的具體信息見表1。迄今為止,HGMD中記錄了412種不同的STK11突變,這是目前為止可檢索最全面的PJS致病突變數據庫,中國PJS患者攜帶的突變占比26.2%。

圖1 文獻報道中國PJS患者STK11突變基因分布圖

表1 文獻報道中國PJS患者STK11突變匯總情況

表1 (續)
2.2突變報道錯誤統計 共發現27種錯誤報道(其中22種重復報道和5種新突變命名錯誤),占本文報道的所有病例的25%。導致命名錯誤原因包括:數據庫收錄不全,突變識別錯誤。重復報道原因包括:文獻綜述不足,因錯誤信息導致的后續錯誤報道,短期內重復報道,以及因重復序列而命名錯誤。見表2。因重復序列而命名錯位,是因為發生插入突變的位點位于重復序列之間,導致命名錯誤。為了證實上述情況,對其中帶有c.178insA,c.152insG突變PJS患者的STK11基因相應區域進行反向測序,并檢測到這兩個突變位點(圖2)。分別自178和152位開始前方的堿基序列出現雙峰,提示堿基插入位置在該兩個位點之前。并最終證實了正確命名方式為c.180insA和c.158insG。

表2 STK11突變報道錯誤原因匯總

圖2 c.158insG和c.180insA突變反向測序結果
PJS是一種常染色體顯性遺傳病。分子遺傳學研究表明,位于19號染色體短臂的STK11基因發生了雜合突變是該病的主要致病原因。Sanger測序聯合MLPA或NGS聯合MLPA是目前為止最好的組合檢測策略[2]。研究顯示,60%~78%PJS先證者的家屬攜帶相同的致病性突變,而17%~40%先證者為突變病例[5]。一旦在先證者中發現STK11基因突變,其高危的親屬就需進行預測性基因突變檢測。此外,STK11基因的突變檢測有助于PJS的基因型-表型的研究,而該研究尤其對于惡性腫瘤風險的評估,具有重要的臨床意義。STK11基因的編碼區由9個外顯子組成,其編碼433個氨基酸的蛋白質,主要由三個結構域組成:N末端非催化結構域、催化激酶結構域和C末端非催化調節結構域。截止目前,在PJS或其他疾病患者中檢測到的STK11突變可達412種,在全面回顧文獻后,發現中國人群貢獻了26.2%突變。在回顧文獻同時,發現了一部分突變報道錯誤的情況,對此進行整理、歸納,大致可分為兩大類:新發突變命名錯誤和已報道突變被重復報道。
新發突變命名錯誤的主要原因包括數據庫收錄不全和突變識別錯誤。中文期刊報道的三個突變,c.290+1G>T、c.109C>T和c.733C>T,因語言問題未被國外的數據庫識別、收錄[8,22]。在HGMD中記錄的以上三個突變是被其他學者報道的,但該學者的研究出版時間晚于中國學者。而突變識別錯誤方面:Zheng等[16]報道了一例兒童患者的錯義突變,命名為c.580G>T,并在文章中提到該突變先前被報道為PJS的新發致病突變。對文獻交叉對比發現,研究報道的突變是c.580G>A,因此推斷該情況是由于Zheng等將新發突變錯誤識別為已報道所致。而突變識別錯誤存在另外一種形式:Wang等[14]在2014年發現的c.891G>C突變,未被HGMD收錄并宣布該突變為首次報道。趙曉等[11]早在2012年就對其進行了報道,但該文中未指出該突變為新發突變,且未被數據庫收錄。所以Wang等的誤報是繼發于趙曉等的識別錯誤。
導致突變報道錯誤的另一原因是將已報道突變誤認為新發突變進行重復報道,原因包括:文獻綜述不足,因錯誤信息導致的后續錯誤報道,短期內重復報道以及因重復序列而命名錯誤。Zuo等[10]的c.180C>G,毛旭燕等[15]的c.180C>G、c.354C>G、c.521A>G、c.526G>A、c.862G>A,李蒙等[19]的c.298C>T、IVS4+1G>T、IVS8-2A>C、IVS1+1G>A、IVS7-2A>G,Zhang等[20]的c.598-1G>A,Wu等[21]的c.358G>T都被HGMD數據庫收錄,但是作者未進行全面、正確檢索和識別,誤認為是新發突變進而重復發表。短期內重復報道的主要原因是不同作者發現同一突變并短期內先后發表。如Wang等[14]在2014年報道了delexon3是一個新突變,但Ngeow等[24]在2013年已經報道過。相同情況同樣發生在c.419T>C、IVS5-2A>G、c.243delG、c.716G>C這些突變上。短期內重復報道存在另外一種情況:同一作者在兩篇不同文獻[12]中均將c.469_498del30這一突變報道為新發突變。此外,當插入或缺失突變的堿基位于重復序列區域時,突變堿基的定位、命名容易發生錯誤。嚴格地說,該問題目前尚存爭議,但常用方法是將重復序列最后一個核苷酸位點作為突變命名位點。相反,在重復序列的第一位核苷酸中的之前進行標記,并認為第一位核苷酸發生突變并不妥當。c.178insA,c.152insG實際上是命名錯誤,因為發生插入突變的位點應在第178~180位和第153~157位的重復序列之間。根據氨基酸的變化,正確的命名方式分別是c.179insA、c.180insA和c.153-158insG。為此對該PJS患者的STK11基因相應區域進行反向測序,并檢測到這兩個突變位點,并最終證實了正確命名方式為c.180insA和c.158insG。
在對PJS患者致病突變進行檢測過程中,部分學者發現一個特殊現象:在同一位PJS患者的STK11基因上可檢測到多個突變,便推斷PJS患者可能同時存在多個致病突變。在缺少對突變致病性鑒定的情況下,該推論并不嚴謹。Tan等[25]在該方面的處理方式值得借鑒。該學者在兩個不同的PJS家族中,檢測到先證者同時攜帶兩種突變c.890G>A、c.1062C>G和delexon1、c.1062C>G,先后通過突變數據庫檢索、家系和癥狀共分離情況、基因表達及功能試驗、蛋白結構和功能預測軟件的使用等多種方法證明,最終證實致病突變為c.890G>A和delexon1,而不是c.1062C>G。2015年美國醫學遺傳學學院和美國基因組學與分子病理學協會對于突變的報告方式,聯合給出了詳細的評定標準[26]。國內專家對其也進行了翻譯,在國內進行廣泛討論和學習。我國學者可通過學習和實踐該標準,對檢出數據進行更加條理化分析,最終獲得正確、有效的結果,并給予患者提供適當的家系檢測和隨訪計劃。