聶向民 朱傳福 朱海峰 張 毅 喬文本 劉 艷 邵靜茹
(山東省血液中心中華骨髓庫山東省分型實驗室/HLA研究室,濟南 250014)
人 類 白 細 胞 抗 原(human leukocyte antigen, HLA)是人類最復雜、最具多態性的免疫遺傳系統,在自我識別和免疫應答中發揮重要作用。HLA等位基因的發現鑒定對于闡明人類免疫系統的基因多樣性十分重要。截至2021年9月,已發現報道HLA等位基因30 862個[1]。隨著分子生物學技術與測序分型技術的發展,越來越多的HLA新等位基因被發現報道。一般僅對HLA新等位基因序列進行一般性描述,未對其編碼氨基酸差異在MHC分子結構中的可能影響進行分析,對其血清學表型一般也較少檢測鑒定。本實驗室在對山東地區中華骨髓庫造血干細胞供者進行HLA高分辨分型時,發現1例HLA-B位點新等位基因,被世界衛生組織HLA因子命名委員會命名為B*46:30。通過SWISS-MODEL同源建模及RCSB PDB軟件,對其氨基酸變異在MHC編碼蛋白分子三維結構中的可能影響進行模擬分析,應用Histocheck、FATCAT軟件在線對比分析其蛋白分子間差異,并對其血清型表型進行檢測鑒定,現報告如下。
1.1 資料 樣本來自中華骨髓庫,造血干細胞志愿捐獻者為山東淄博地區的漢族男性。
1.2 方法
1.2.1 Luminex液相流式PCR-SSOP分型 HLAA、B、DRB1高分辨分型采用Luminex平臺液相流式PCR-SSOP雜交分型,使用美國One Lambda LABType?HD分型試劑。首先進行HLA位點PCR擴增,然后對DNA擴增產物進行變性、中和,磁珠探針雜交,洗滌,SAPE(Streptavidin phycoerythrin)熒光標記,洗滌,上機檢測讀取數據。
1.2.2 PCR-SBT分型 PCR-SBT(Sequence based typing)復核使用ROSE Europe HLA SBT分型試劑。進行HLA位點PCR擴增,產物經ExoI/SAP酶純化后,對HLA-A/B位點2、3、4外顯子進行正反雙向測序PCR,測序產物經乙醇/醋酸鈉沉淀,熱變性速冷后ABI 3730毛細管測序電泳。Conexio分析軟件判讀分型結果。
1.2.3 單等位基因特異性測序 使用HLAssure SE SBT(Texas BioGene Inc., Texas, USA.)單等位基因組特異性測序分型試劑,首先對樣本HLA-B*46、B*57進行等位基因組特異性擴增,以分開該位點的雜合等位基因。擴增產物ExoI/SAP酶純化后,以陽性組PCR產物為模板,進行2、3、4外顯子正反雙向測序PCR,1、5外顯子正向測序PCR。測序PCR產物再經回收純化、熱變性速冷, ABI 3730測序儀測序電泳分析。AceuType SBT分型軟件數據分析。
1.2.4 MHC蛋白分子三維結構預測與差異分析
1.2.4.1 模擬分析差異氨基酸殘基在MHC蛋白分子三維結構中的空間位置、理化性質等變化 將新等位基因B*46:30及提交SWISS-MODEL同源建模在線服務器,結果數據文件通過RCSB PDB軟件,獲得MHC分子三維結構模擬圖像。HLA-B46蛋白分子結構由RCSB PDB數據庫獲得。模擬分析差異氨基酸殘基在MHC蛋白分子三維結構中的空間位置、理化性質等變化差異。
1.2.4.2 DSS值比較 HISTOCHECK在線比較B*46:01與B*46:30間差異,并將B*46:01與B*46:30及B*46常見及確認等位基因(common alleles and well documented alleles,CDW):B*46:08、B*46:09、B*46:12、B*46:18、B*46:19間DSS值(dissimilarity score),以及A*02:01與A*02:03間DSS值進行比較[2-3]。
1.2.4.3 RMSD值比較 FATCAT在線比較B*46:30與B*46:01間均方根偏差(root-mean-square deviation,RMSD),并將B*46:01與B*46:30及B*46 CDW常見及確認等位基因間RMSD值,以及A*02:01與A*02:03間RMSD值進行比較[4]。
1.2.5 血清學表型檢測鑒定 血清學表型檢測使用Terasaki HLA Class I Asian Dry Typing Tray,Lot#2 Cat. ASN72D分型板進行微量淋巴細胞毒試驗。重新采集捐獻者新鮮ACD抗凝靜脈血,One Lambda熒光磁珠法分離T淋巴細胞,RPMI1640培養液混懸調整細胞數為2 000個/μl,分型板每孔中加入淋巴細胞1 μl,OLI補體1 μl,37 ℃孵育1 h,加入熒光終止劑5 μl。Olympus熒光倒置顯微鏡觀察結果。NIH法分數判定:1%~10%死細胞為1分(陰性);11%~20%死細胞為2分(陰性可疑);21%~40%死細胞為4分(弱陽性反應);41%~80%死細胞為6分(陽性反應);81%~100%死細胞為8分(強陽性反應)。
2.1 Luminex PCR-SSOP分型 HLA Luminex流式SSOP雜交分型顯示B位點結果異常,無法給出完全匹配的分型結果。
2.2 PCR-SBT分型 HLA-B位點SBT雙鏈混合測序復核,顯示該位點無法給出完全匹配的分型結果。結果顯示該位點同源性最高的等位基因組合為B*46:01:01、57:01:01,但存在2個堿基差異,即第3外顯子第559位核苷酸序列為S(C/G)而非C,第560位為W(A/T)而非T(圖1),存在2個堿基差異替代。

圖1 PCR-SBT結果Fig.1 PCR-SBT results
2.3 單等位基因組特異性測序 單等位基因組特異性測序表明初次SBT結果所顯示堿基改變發生在B*46:01:01序列,即第3外顯子第559、560位核苷酸發生C->G、T->A替代改變(圖2),其相應第163位密碼子由CTG>GAG,其編碼氨基酸由亮氨酸(Leu,L)變為谷氨酸(Glu,E)。

圖2 單等位基因SBT測序結果Fig.2 Single allele specific SBT results
2.4 申報命名 將序列遞交NCBI GenBank數據庫,注冊序列號JN209964,經EMBL-EBI申報被世界衛生組織WHO HLA因子命名委員會正式命名為B*46:30。其HLA-A、B、DRB1位點最終分型結果為A*02:07,24:02;B*46:30,57:01:01;DRB1*07:01, 08:03。
2.5 新等位基因編碼蛋白分子三維結構模擬分析
2.5.1 蛋白分子三維結構 使用SWISS-MODEL同源建模及RCSB PDB軟件,獲得B*46:30編碼蛋白分子三維空間結構模擬圖像見圖3。HLA-B46蛋白分子結構(X-ray Diffraction 1.6 ?)由RCSB PDB數據庫獲得。

圖3 B*46:01與B*46:30編碼MHC蛋白分子三維結構預測Fig.3 Comparisons of predicted MHC molecular structures between B*46:01 and B*46:30 molecules
模擬分析顯示,B*46:30第163位差異氨基酸殘基位于α2結構域構成抗原結合凹槽groove側壁的α螺旋上。相較于B*46:01,HLA-B*46:30第163位氨基酸殘基由疏水性脂肪族亮氨酸(L)→B*46:30帶負電荷的酸性谷氨酸(E)。RCSB PDB模擬分析還顯示,B*46:30的該谷氨酸殘基(163E)側鏈上的羧基COOH可跨越groove凹槽與α1結構域α螺旋上第62位堿性精氨酸(62R)側鏈上的C=NH之間形成氫鍵。
2.5.2 Histocheck在線比較B*46:01與B*46:30差異 R值(Risler's score)及DSS(Dissimilarity score)值,見表1。B*46:01與B*46:30、B*46CDW(常見及確認等位基因)間DSS值[3],以及A*02:01與A*02:03 間DSS值比較,見表2。

表1 B*46:01與B*46:30 間結構比較DSS值及R值Tab.1 DSS Score and R Score compared between B*46:01 and B*46:30

表2 B*46:01與B*46:30、B*46 CWD間, A*02:01與A*02:03間DSS值Tab.2 DSS of structure comparisons between B*46:01 and B*46:30/B*46CWD,A*02:01 and A*02:03
2.5.3 FATCAT在線比較B*46:01與B*46:30、B*46 CDW間差異,以及A*02:01與A*02:03間差異 RMSD(root-mean-square deviation)值(?)比 較見表3。

表3 B*46:01與B*46:30、B*46 CWD間,A*02:01與A*02:03間結構比較RMSD值(?)Tab.3 RMSD(?) of structure comparisons between B*46:01 and B*46:30/B*46CWD, A*02:01 and A*02:03
2.6 血清學表型檢測鑒定 HLA-B位點血清學表型檢測鑒定反應格局,見表4。其中12D、12E、6E、12A孔反應結果見圖4、圖5。血清學檢測結果顯示B46特異性(12D、12E孔)呈強陽性反應。

圖4 Terasaki HLA Ⅰ類分型板表型鑒定12D、12E孔反應結果Fig.4 Reactions of 12D, 12E of Terasaki HLA class Ⅰasian typing tray

圖5 Terasaki HLA Ⅰ類分型板表型鑒定6E、12A孔反應結果Fig.5 Reactions of 6E,12A of Terasaki HLA class Ⅰ asian typing tray

表4 Terasaki HLA Ⅰ類分型板表型鑒定反應格局表Tab.4 Reaction results( Worksheet) of Terasaki HLA class Ⅰ asian typing tray
HLA編碼基因位于人類第6號染色體短臂6P21.31~21.33,由一組緊密連鎖的復等位基因位點組成,是人類基因組中已知基因最密集的區域。其基因結構以高度多態性為主要特征,每個位點含有大量的復等位基因,且其分布具有明顯的種族、地區差異。HLA的這種高度多態性顯示了遺傳背景的多態性和復雜性,被認為是人類在進化過程中抵御不良環境因素的一種適應性表現,使人類具有更大的抵抗病原體入侵的能力,對維持種群的生存與延續具有重要的生物學意義。
B*46等位基因在亞洲人群中頻率較高,明顯高于高加索白人和黑人。B*46:01在亞洲、高加索白人、黑人人群中基因頻率分別為7.46%、0.06%、0.05%[5]。B*46:01在 中 國 人 群 中 基 因 頻 率 為10.42%[3]。如按4位高分等位基因計算,B*46:01頻率高于B*40:01(9.787%)而在B位點中位列首位[3]。在本實驗室所作低分辨分型基因頻率統計中,B*46在山東地區(中國北方)人群中頻率(0.0558),位列B*13(0.1431)、B*15(62)(0.0727)、B*51(0.0702)、B*15(60)(0.0605)之后[6]。
為了對B*46:30差異氨基酸殘基在MHC分子三維結構中的空間位置及其可能的生物學影響進行模擬分析,使用SWISS-MODEL在線服務器及RCSB PDB軟件,對其MHC編碼蛋白分子結構進行模擬分析,以期對其編碼氨基酸殘基改變對MHC分子抗原多肽結合及TCR/抗體結合功能的可能影響進行初步預測分析。
既往研究顯示,構成抗原多肽結合凹槽的氨基酸殘基,對其抗原多肽結合特性至關重要,以上關鍵位置單個氨基酸殘基理化性質的改變,包括殘基側鏈的大小、伸展方向、疏水性等理化性質的改變,都可對結合凹槽與抗原多肽的結合產生影響,并可直接或通過與多肽結合特異性的改變,影響HLA等位基因與T細胞受體(T cell receptor,TCR)及抗體的結合。此外,α螺旋上表面朝向上外側殘基側鏈理化性質的改變,以及引起的可與TCR/抗體結合區域表面結構形狀的改變,都可引起與TCR和/或抗體結合功能的改變[7-8]。同時這些區域也是序列多態性集中的區域。
通過模擬分析可得,B*46:30的第163位差異氨基酸殘基位于抗原結合凹槽側壁的α螺旋上的關鍵位置。相較HLA-B*46:01,B*46:30第163位氨基酸殘基由疏水性脂肪族亮氨酸L變為帶負電荷的酸性谷氨酸E。PDB模擬分析還顯示,發生改變以后,該163位帶負電荷的酸性谷氨酸(163E)側鏈上的羧基COOH可跨越groove凹槽與α1結構域α螺旋上的第62位堿性精氨酸(62R)側鏈上的C=NH之間形成氫鍵。HistoCheck分析示其R值=32,并顯示163位為9肽P1、P2、P3位、HLA I類多肽以及TCR的結合位點[9]。以往研究顯示該位置是參與構成抗原多肽結合凹袋Pocket A的關鍵位置[10]。同時,該位置亦是B*46:01構成163LW eplet的關鍵位置,也是許多HLA-I類等位基因構成163 eplet的關鍵位置[11]。根據結果推測,以上改變將有可能對其groove結合凹槽的多肽結合特性,以及α螺旋與TCR和/或抗體的結合特性產生影響,引起其結合特性的改變。
R值是由RISLER等[12]提出的通過氨基酸距離矩陣計算單對氨基酸交換之間的差異。其基本概念是,如果兩種氨基酸越相似,則它們在功能相關蛋白中相互替換的頻率越高。因此具有低取代率的氨基酸對(代表功能差異)產生更高的分值。DSS值是將HLA分子的多態性殘基分為主要(肽結合凹槽和/或TCR接觸區域)和次要(剩余氨基酸殘基)潛在同種異體反應性區域,通過將不同區域中每對氨基酸差異的R值加權相加而得出DSS值,作為一種同種反應性指標[13]。
通過將B*46:30及B*46常見及確認等位基因與B*46:01間的DSS值比較可以看出,B*46:30與B*46:01的DSS值1.32處于較低水平,明顯低于A*02:01與A*02:03間的3.98。A*02:03與A*02:01是臨床低分辨分型需要分開的不同血清型的等位基因,具有較高的同種反應差異性。這可能與B*46:30與B*46:01間僅存在單個氨基酸差異有關。但通過FATCAT在線分析,獲得B*46:01與B*46:30間RMSD值為0.59 ?,可以看到B*46:01與B*46:30間RMSD值較高,甚至高于A*02:01與A*02:03間的0.44 ?,與DSS值之間并無較一致的對應關系。這也反映了現有眾多自動蛋白質結構對比算法常產生難以解釋的矛盾結果,且難以確定界值的現實狀況[14-15]。有國內研究將修正RMSD值定為0.50?,作為allo-HSCT異基因造血干細胞移植發生Ⅰ/Ⅱ級aGVHD與Ⅲ/Ⅳ級aGVHD間的分界值[16]。
B*46:30血清學表型檢測顯示其B46特異性呈強陽性反應,即其表型鑒定為B46,顯示該血清學抗原分型板中所含單克隆抗體微量淋巴毒反應未能對B*46:30的163LW→EW eplet改變產生可見差異反應。另外,本次檢測6E孔(B7+/-55)顯示存在部分死細胞的弱陽性反應,分析懷疑該交叉反應是否可能由B7的163EW的eplet引起,有待進一步驗證。此外,12A孔BW6反應陰性,考慮可能為抗體血清學反應質量問題。
雖然B*46:30血清學表型鑒定為B46未見明顯改變,但通過以上分析,本課題組推測其差異氨基酸殘基的改變,在可能導致B*46:30多肽結合功能的改變的同時,仍有可能直接及/或通過多肽結合功能的改變,影響其與TCR及抗體的結合特性,并可能對臨床造血干細胞移植及排異反應產生影響。上述推測尚需今后進一步研究證實。
在國內已發現HLA新等位基因的報道中,一般僅對其變異序列進行一般性描述報告,未對其結構差異及生物學影響進行探討分析。本文通過對B*46:30編碼蛋白分子三維結構模擬分析,對其差異氨基酸變異的可能影響進行初步探討分析,對今后新等位基因功能研究具有一定的借鑒意義。