











摘 要:本文使用國產24道遺傳分析儀搭配國產36 cm毛細管陣列,解決無膠篩分毛細管電泳技術為基礎的遺傳分析儀在測序中熒光信號校正、運行電壓、遷移校正問題。以24道遺傳分析儀原始光譜熒光信號為基礎,建立光譜校正模型,獲得基線噪聲閾值。通過運行電壓與峰間距值繪制標準曲線,利用測序分析軟件計算清晰片段長度,確定最佳運行電壓和峰間距,進而計算遷移偏移值,建立堿基大小與遷移時間的線性模型,實現堿基的準確識別。研究表明,在合適的光譜校正和基線噪聲閾值限制下,當運行電壓設置為10 kV,峰間距為13.05幀時,分析儀的最長清晰片段檢驗能力最強,為561 bp。通過遷移修正值的補償,建立堿基大小與遷移時間的線性模型,堿基G、A、T、C的R2(標準曲線)值分別從0.992 7、0.992 7、0.994 5、0.987 9提高到0.999 6、0.999 8、0.999 6、0.999 7,且修正后,各個熒光標記的堿基均能得到正確標記,無漏標和錯標,清晰片段長度延長到621 bp。本研究可以指導國產遺傳分析儀測序模塊的優化和設計,使分析儀的DNA 堿基識別功能更高效和準確。
關鍵詞:國產遺傳分析儀;無膠篩分毛細管電泳;堿基測序;運行電壓;遷移校正
中圖分類號:R394-33" " " " " " " " " " " " " 文獻標志碼:ADOI:10.3969/j.issn.1007-7146.2024.03.004
Optimization Design of Sequencing Module for Domestic Genetic Analyzer
GUAN Hua1, ZHANG Jian2,3, RUAN Delin1, ZHANG Xinxin1, ZHANG Tao1, YANG Liping4,
ZHANG Ningjie4, YAN Liang4, JIA Erhui1*
(1. First Research Institute of the Ministry of Public Security of PRC, Beijing 100048, China; 2. Institute of Forensic Science of China, Beijing 100038, China; 3. Bio-evidence Sciences Academy, Xi’an Jiaotong University amp; National Biosafety Evidence Foundation (NBEF), Xi’an 710049, China; 4. Beijing Zhongdun Anmin Analysis Technology CO. Ltd., Beijing 102200, China)
Abstract: A domestic 24 channels genetic analyzer combined with a domestic 36 cm capillary arrays were used to solve the problems of fluorescence signal correction, running voltage, and migration correction during sequencing on the genetic analyzer based on non-gel sieving capillary electrophoresis technology. Spectral calibration model and appropriate baseline noise values were obtained under the condition that the original spectral fluorescence signal of the analyzer was used as a regulation basis. A standard curve was plotted by combining an running voltage and a base spacing value, while a clear range length was also calculated by a sequencing analysis software, so as to determine the optimal running voltage and base spacing. In addition, a migration offset value was further calculated and a linear model was eventually established between the base size and the migration time, which achieved an accurate identification of bases. It was reported that with the appropriate spectral calibration model and baseline noise threshold limitation, the strongest ability to detect the longest clear range length, that is 561 bp, was found in the analyzer when the running voltage was set to 10 kV and the base spacing was 13.05 frames. By compensating for migration corrections, a linear model was established between the base size and the migration time. Among them, R2 values of bases G, A, T, and C increased from 0.992 7, 0.992 7, 0.994 5, and 0.987 9 to 0.999 6, 0.999 8, 0.999 6, and 0.999 7, respectively. After correction, all fluorescent bases were accurately labeled without any omissions or errors, clear range length extended to 621 bp. This study could better guide the optimization and design of a sequencing module of the domestic genetic analyzer, making the DNA base recognition function of the analyzer more efficient and accurate.
Key words: domestic genetic analyzer;" non-gel capillary electrophoresis; base" sequencing; run voltage;" migration correction
(Acta Laser Biology Sinica, 2024, 33(3): 217-226)
堿基序列是基因組學最基本最重要的數據,也是生命科學領域大數據時代的核心組成部分。雖然基因測序技術已在全球經歷了近50年的發展[1],但其相關設備主要還是依賴海外品牌。遺傳分析儀是采用無膠篩分毛細管電泳(non-gel capillary electrophoresis, NGCE)分離、激光誘導熒光檢測技術進行DNA片段及序列分析的設備,其在特定測序領域中具有一定的實戰應用優勢:1)插入質粒上的基因組測序[2];2)聚合酶鏈式反應(polymerase chain reaction,PCR)產物測序[3];3)法醫、公安對特定人的基因鑒定,親子鑒定[4-5];4)單核苷酸多態性(single nucleotide" polymorphism,SNP)檢測[6-8];5)微生物基因檢測[9-10];6)生物育種中的基因檢測[11-12];7)DNA條形碼物種識別研究[13]等。特別是在國家衛生健康委員會、國家中醫藥管理局和國家疾病預防控制局聯合發布的最新《全國醫療服務項目技術規范(2023年版)》[14]中,涉及遺傳分析儀完成的醫療服務項目已達59項,其檢測應用覆蓋多個醫療領域,包括病原體感染類項目30項、腫瘤項目11項、生殖遺傳9項、慢性病用藥指導4項、血液病2項、血型分類2類、病理基因檢測1項,可見該設備具有較高的社會效益和經濟效益。
當前,遺傳分析儀的研發生產領域仍由國外企業所主導,由此產生了檢驗成本高、DNA數據信息存在泄漏風險的弊端。為真正解決上述問題,公安部第一研究所承擔了國家科技支撐計劃重大項目,開展相關研究。從“十一五”到 “十四五”,經過不斷努力攻關,已成功研制了GA118系列遺傳分析儀及配套關鍵耗材——毛細管陣列,此研究填補了國內空白,打破了國外壟斷,推動了遺傳分析儀國產化替代的步伐。然而,如何提高國內基因測序技術的準確性和可靠性仍是未來國內研發者值得進一步深入探討的難題,國產遺傳分析儀產品優化完善任重而道遠。
在毛細管電泳(capillary electrophoresis,CE)中,電場強度是調節電泳速度的重要參數,而分離電壓又直接影響著電場強度的變化,兩者呈正比關系。當毛細管長度一定時,電壓越大,樣品峰的遷移速度也越快,單位時間內通過毛細管的離子也越多,導致焦耳熱增加,易出現峰展寬、遷移率變化等問題[15]。而基線過高會降低設備的靈敏度,影響堿基的正確識別[16]。遷移率是測序技術中的另一重要參數,它反映了序列讀長在時間單位上的推移??梢哉J為每種熒光染料的遷移率變化為定值,分析時通過使用此值對每次試驗結果進行補償,對于短序列,測序的遷移率受影響可能相對較小。然而在長序列識別時,這一因素可能會對結果產生顯著影響,導致高誤差率。往往在遷移率校正后,才能確定峰間距,并進行數據歸一化處理,最終準確識別各個熒光堿基。Manolakos[17]首先提出了用統計學方法解決堿基識別問題的研究思路。
因此,使用以NGCE技術為基礎的遺傳分析儀時,選擇合適的運行電壓,完善算法,保證檢測的準確性變得尤為重要。本文首次使用國產遺傳分析儀、國產毛細管陣列,并首次運用統計學分析方法提出并解決以NGCE技術為基礎的遺傳分析儀在測序中熒光信號校正、運行電壓、遷移校正問題,對研發設備的測序功能優化起到推進作用,力爭實現測序儀器上的創新。
1 材料與方法
1.1 材料和設備
國產遺傳分析儀(型號GA118-24B,公安部第一研究所),分析儀采用激光誘導熒光-NGCE技術,激光誘導熒光部分采用半導體505 nm激光器;進口遺傳分析儀(型號3130xl, ThermoFisher公司),技術原理與國產遺傳分析儀一致;24通道毛細管陣列(公安部第一研究所),有效檢測長度為36 cm,內部填充無膠篩分介質為POP-7?聚合物(ThermoFisher公司);光譜校正試劑,取基質標準品試劑盒BigDye? Terminator v3.1(Dye Set Z,ThermoFisher公司)中試劑12 μL加入238 μL高度去離子甲酰胺中混勻,制備成光譜檢驗樣品;電泳測序標準品為 BigDye? Terminator v3.1 制備的已知 1 200 堿基對序列的DNA片段(ThermoFisher公司),將其與300 μL高度去離子甲酰胺混合配制成測序檢驗樣品;實際測序樣品為已擴增的外周血液DNA樣品(公安部第一研究所),DNA樣品依照BigDye? Terminator v3.1說明書標記后純化,獲得最終實際測序樣品。
1.2 方法
1.2.1 光譜校正模型構建及熒光基線噪聲值確定
使用分析儀對配制的光譜檢驗樣品進行光譜校正,試驗重復10次。選取光譜檢驗樣品原始結果中各個熒光標記的DNA片段峰強最高位,提取該峰對應的熒光染料分布,構成4色測序熒光染料光譜分布圖,建立光譜校正模型。熒光基線噪聲通過光譜校正模型中的4色測序光譜熒光染料的噪聲標準差(SD)的10倍來評價,見公式(1)。其中Xi為第i次測得的熒光染料的最大噪聲強度;X為n次測量結果的算數平均值。最終基線噪聲閾值由4色測序光譜熒光染料中基線噪聲值的最高值確定。
SD=" "(1)
1.2.2 最佳運行電壓篩選
光譜校正模型建立后,在分析儀上依次設定運行電壓為8、9、10、12、15、18 kV和20 kV,并依次按相應電壓值對配制的測序檢驗樣品進行測序試驗,每個電壓設定值試驗重復10次。結果采用Sequencing Analysis 6軟件進行分析,獲得對應運行電壓下的峰間距值和清晰片段長度值,篩選最佳電泳參數。
1.2.3 遷移率偏移值計算
分析儀以1.2.1和1.2.2確定的最佳參數為基礎,進行測序標準品檢驗,試驗重復10次,獲得的原始數據導入MATLAB軟件。在MATLAB軟件中設定基線噪聲閾值進行去噪處理,所得結果繪制堿基大小L與堿基遷移率m的線性關系圖。從每種熒光染料的原始數據中選擇3個堿基L1、L2、L3以及對應的遷移率m1、m2、m3來計算遷移偏移值m0,3個堿基選擇盡量跨度要大,并且選擇原始線形圖中出現明顯彎曲附近的長度片段。認定連接任意兩點的斜率是相同的,從而可以定義經過這3點的直線:其中一條直線的斜率k1為公式(2),另一條直線的斜率k2是公式(3),令k1=k2,解出m0,并計算A、C、G、T 4種堿基的平均遷移偏移值。以堿基A為基礎,獲得其他3個堿基的最終遷移修正值,將修正值輸入MATLAB軟件,執行對原始數據的修正,繪制新的L與m的線性關系圖,并將修正前后的數據進行比對,確認方法的可行性。將最終確定的遷移率修正模型錄入分析儀測序模塊,對測序標準品進行檢驗;對實際樣品的檢驗為同一樣品分別在國產和進口遺傳分析儀上進行測序,上述結果均使用Sequencing Analysis 6軟件進行分析。
k1=(2)
k2=(3)
2 結果與分析
2.1 熒光基線噪聲確定
圖1為建立的測序染料光譜分布模型的原始熒光光譜圖,可以看出每個毛細管通道內有4個染料峰,均來自于光譜校正試劑中的4種不同大小的DNA片段。通過原始熒光光譜建立的光譜校正模型見圖2,每個通道內每種熒光染料與其他熒光染料相比的相對信號強度值(Q值)均在0.97以上,染料值間的重疊量(C值)范圍在3.10~3.40。經計算,測序的4種熒光染料(ROX、TAMRA ?、R110和R6G)的基線噪聲分別為83.51、130.18、83.34和111.10 RFU(relative fluorescence units)(圖3)。
2.2 運行電壓對測序結果的影響
對8、9、10、12、15、18、20 kV共7個運行電壓下測序樣品的分析可見,運行電壓與峰間距倒數間存在良好的線性相關:標準曲線R2=0.996 6(圖4)。采用Sequencing Analysis 6軟件對測序原始數據進行分析,結果顯示(表1),隨著運行電壓的升高,峰間距(平均值)從15.20幀減小到6.11幀,起始峰定位(平均值)從23 bp后移到34 bp。而堿基識別的清晰片段長度(平均值)在運行電壓達到10 kV、峰間距為13.05幀時出現最大值561 bp,當運行電壓小于或者超過10 kV時,清晰片段識別長度隨之逐漸縮小,即從561 bp減小到8 kV時的536 bp和20 kV時的508 bp。最終確定,分析儀在運行電壓設置到10 kV時,可達到清晰片段識別的最大長度和最佳峰間距。
2.3 遷移偏移對測序結果的影響
從圖5可見,堿基大小與遷移率(在分析儀中以堿基移動的幀數點表示)間存在線性關系,當堿基達到一定大小后這種線性會逐漸趨向弱化,出現明顯的彎曲(拐點),拐點在600~700 bp。從600 bp以前分別選取4種熒光染料標記的3個跨度較大的堿基繪制標準曲線圖,最終計算出4種堿基遷移修正值如表2所示。以堿基A 為基礎,調整堿基T向前2幀,堿基G和C 分別向后6幀和3幀。4種堿基的R2值,堿基G為0.992 7,堿基A為0.992 7,堿基T為0.994 5,堿基C為0.987 9。將T、G、C 3種堿基的遷移修正值編輯到MATLAB軟件中,對各熒光染料的遷移率標準曲線進行修正,獲得圖6的修正結果。經偏移修正后,600 bp前的線性相關性較修正前有明顯的提高,獲得的標準曲線圖中各堿基R2值,堿基G為0.999 6,堿基A為0.999 8,堿基T為0.999 6,堿基C為0.999 7。通過MATLAB軟件對偏移修正前后測序樣本的檢驗結果進行確認,如圖7所示,在未進行偏移修正時,會出現堿基漏標的情況,經修正后,各個熒光標記的堿基均能得到正確標記,無漏標和錯標。利用Sequencing Analysis 6軟件對國產遺傳分析儀測序模塊優化后的標準品檢驗數據進行分析,結果顯示(圖8):經偏移修正后,國產遺傳分析儀峰間距(平均值)為12.92幀,清晰片段長度(平均值)達到612 bp。對比國產和進口遺傳分析儀上的實際樣品測序結果(圖9),國產遺傳分析儀的峰間距(平均值)為13.09幀,清晰片段長度(平均值)為622 bp,進口遺傳分析儀的峰間距(平均值)為12.98幀,清晰片段長度(平均值)為637 bp。
3 討論
光譜校正主要解決一個光譜空間到染料空間的映射問題,以便在后續樣品檢驗中獲得準確有效的熒光光譜數據。此外,在實際測序中,基線噪聲會導致由于基底部分的信號干擾而出現假峰檢測的問題,同時個別真實堿基熒光信號被掩蓋,標記出現錯誤,使測序準確度下降。本文通過試驗研究首先確立了4色測序熒光光譜校正模型,評價指標C值范圍為3.10~3.40,Q值為0.97以上。通過對熒光信號基線噪聲計算,確定了熒光染料基線噪聲閾值為135.00 RFU,以此實現了光譜矩陣的優化和設計。
Cock等[18]研究發現,峰間距的大小與堿基峰的分辨率和峰形有關,峰間距的變化會直接影響堿基識別的準確性和可靠性。LI等[19]認為,過大或過小的峰間距可能導致堿基識別錯誤和測序質量下降,當峰間距在適當的范圍內時能提高堿基識別的準確性。本文認為,在測序中,峰間距與相鄰堿基之間的距離相關,每個測序片段的末端都添加了一個特定的標記,這個標記會在電泳過程中產生熒光信號,通過檢測熒光信號的峰強度和峰面積確定峰間距,然后使用模式匹配算法實現對堿基的準確識別。另外,Ewing等[20]的研究顯示,測序分析軟件應用的ABI算法(美國應用生物系統公司研發的一種用于測序分析的算法名稱)使用遷移率曲線來預測峰間距,從出現均勻間隔的峰區域中確定起始區域和起始峰。在測序中,起始峰是第一個原始數據點,是峰間距和遷移距離校正的基準點,對后續堿基識別起重要作用。線性以上的電壓會產生越來越大的焦耳熱效應,焦耳熱效應增加會導致電泳時間縮短,峰間距減小,影響峰形[21]和起始峰定位,同時引起信號的噪聲和失真,從而造成堿基識別錯誤率的增加,致使清晰片段長度縮短,檢驗效率降低[22-23]。因此,確定合適的運行電壓對峰間距和堿基識別尤為重要。本文以同技術原理的進口遺傳分析儀測序檢驗的運行電壓為參考,從其設定值8.5、13.4、15.0(最常見電泳電壓值)和19.5 kV擴展出8、9、10、12、15、18、20 kV共7個運行電壓對測序樣品進行檢驗,使試驗結果更接近實際應用,同時減少檢驗成本。結果發現,運行電壓與峰間距的倒數之間存在線性關系,標準曲線R2=0.996 6。隨著運行電壓的升高,峰間距從15.20幀減小到6.11幀,起始峰定位從23 bp后移到34 bp。當運行電壓為10 kV,峰間距為13.05幀時,分析儀可以達到最佳堿基識別能力,清晰片段長度為561 bp。以上結果說明,峰間距和運行電壓對堿基識別能力有一定影響,兩者與電泳篩分介質特性共同影響最終的清晰片段識別長度。
Mcdonell等[24]指出:在高電壓梯度下對DNA片段進行凝膠毛細管電泳時, lg(L)和m的曲線會出現夸張的彎曲,其中L為片段大小,m為遷移率;同樣,L與遷移率倒數1/m的曲線也會顯示出明顯的彎曲;不過,L和1/(m-m0)可以畫出一條直線。此外,Southern[25]通過試驗確定,在凝膠電泳測序中堿基位置跨度大的三個點所構建的直線可以進行更加精確的測量。從原理上說,在CE的理想狀態下,待分析物從進樣端遷移到檢測窗口,不會保留在毛細管管路內,所以CE中用“遷移時間”替代“保留時間”更為合適[26]。本文證實,在NGCE中,L與DNA的遷移時間[以電荷耦合器件(charge-coupled devices,CCDs)采集的幀數為對象]同樣具有上述提到的L與m類似的線性關系。而且在計算中加入遷移修正值后,這種趨勢也趨近于直線,經過這種簡單的修正就可以消除曲率。同時,通過繪制標準曲線圖,可以比較方便地定位大部分堿基。試驗還發現,在原始數據中, 600~700 bp以內線性相關性稍好,G、A、T、C 4種堿基的R2值分別為0.992 7、0.992 7、0.994 5和0.987 9,而大于700 bp以后的標準曲線出現了明顯的彎曲。錯誤的曲線會導致測量誤差,影響堿基識別的準確性。Fujii等[27]建議,以良好的運行區段導出的峰間距作為研究對象,對相鄰區段進行修正,使DNA的堿基大小與遷移時間可以在更長的片段范圍內保持良好的線性關系。這會使更長片段的堿基識別誤差更小。所以試驗在進行偏移修正過程中,選擇標準曲線上三個跨度大的堿基位置,起始兩點選擇了曲線出現明顯彎曲附近的點,確保修正值的可靠性,減小測定誤差。同時考慮到GC堿基間的氫鍵較多,測序過程產生的熱量更多,會造成遷移率的不穩定,因此研究選取20~600 bp的區段進行遷移偏移值計算,并以堿基A作為遷移修正的基礎。最終修正結果表明,在一定長度內,各個熒光標記的堿基均能得到正確標記,無漏標和錯標問題。試驗通過對增加遷移修正的檢驗結果分析證實,修正后清晰片段長度從561 bp延長到612 bp。對國產和進口遺傳分析儀上的樣品進行測序分析,兩者獲得的清晰片段長度分別為622 bp和637 bp,經優化后的國產遺傳分析儀達到了實際應用要求。
遺傳分析儀的國產化替代不僅是一項科技創新的重要舉措,也是保護我國國家安全的重要舉措,更是我國科技自主發展的必由之路。本文創新建立了適用于NGCE技術為基礎的遺傳分析儀測序模塊優化的統計學算法,并解決了在測序中熒光信號校正、運行電壓、遷移校正問題。試驗證明,此研究方法可以更好地指導國產遺傳分析儀測序模塊的優化和設計,使其在進行 DNA 堿基識別上更高效、準確,更具競爭實力。
參考文獻(References):
[1] SANGER F, NICKLEN S, COULSON A R. DNA sequencing with chain terminating inhibitors[J]." Proceedings of the National Academy of Science, 1977, 74(12): 5463-5467.
[2] HAYES P, MEADOWS H J, GUNTHORPE M J, et al. Cloning and functional expression of a human orthologue of rat vanilloid receptor-1[J]. Pain, 2000, 88(2): 205-215.
[3] KOID A, NELSON W C, MRAZ A, et al. Comparative analysis of eukaryotic marine microbial assemblages from 18S rRNA gene and gene transcript clone libraries by using different methods of extraction[J]. Applied and Environmental Microbiology, 2012, 78(11): 3958-3965.
[4] Al-SHUHAIB M B S, HASHIM H O. Mastering DNA chromatogram analysis in Sanger sequencing for reliable clinical analysis[J]. Journal of Genetic Engineering and Biotechnology, 2023, 21(1): 115.
[5] CHONG M D, CALLOWAY C D, KLEIN S B, et al. Optimization of a duplex amplification and sequencing strategy for the HVI/HVII regions of human mitochondrial DNA for forensic casework[J]. Forensic Science International, 2005, 154(2/3): 137-148.
[6] OGDEN R, BAIRD J, SENN H, et al. The use of cross-species genome-wide arrays to discover SNP markers for conservation genetics: a case study from Arabian and scimitar-horned oryx[J]. Conservation Genetics Resources, 2012, 4(2): 471-473.
[7] CABRAL G B, AHAGON C M, DE SOUZA GUIMAR?ES P M, et al. Use of Sanger protocols to identify variants of concern, key mutations and track evolution of SARS-CoV-2[J]. Journal of Virological Methods, 2022, 300(4): 114422.
[8] AZAD N A, SHAH Z A, PANDITH A A, et al. Analysis of ABL kinase domain mutations as a probable cause of imatinib resistance in chronic myeloid leukemia patients of Kashmir[J]. Meta Gene, 2018, 17(5): 93-98.
[9] FIDA M, KHALIL S, ABU SALEH O, et al. Diagnostic value of 16S ribosomal RNA gene polymerase chain reaction/Sanger sequencing in clinical practice[J]. Clinical Infectious Diseases, 2021, 73(6): 961-968.
[10] SHAIBU J O, ONWUAMAH C K, JAMES A B, et al. Full length genomic sanger sequencing and phylogenetic analysis of Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) in Nigeria[J]. PLoS One, 2021, 16(1): e0243271.
[11] AZEVEDO G H F," BOUGIE T, CARBONI M, et al. Combining genomic, phenotypic and Sanger sequencing data to elucidate the phylogeny of the two-clawed spiders (Dionycha)[J]. Molecular Phylogenetics and Evolution, 2022, 166: 107327.
[12] WU F H, CHAN M T, LIAO D C, et al. Complete chloroplast genome of Oncidium Gower Ramsey and evaluation of molecular markers for identification and breeding in Oncidiinae[J]. BMC Plant Biology, 2010, 10(1): 1-12.
[13] THINH B B, DOUDKIN R V, CHAC L D, et al. Identification of Tinomiscium petiolare from Vietnam using the DNA barcode[J]. Proceedings on Applied Botany, Genetics and Breeding, 2021, 182(2): 114-122.
[14] 中華人民共和國國家衛生健康委員會.全國醫療服務項目技術規范(2023年版)[EB/OL]. (2023-09-20)[2023-12-04] . http://www.nhc.gov.cn/caiwusi/s7785t/202309/914aec9618944ee2b36621d33517e576/files/f15b986edd1f4bf08bab3b1b8ce64d9a.pdf.
National Health Care Commission of the People’s Republic of China. Technical specifications for the national medical service program (2023 edition) [EB/OL]. (2023-09-20) [2023-12-04] . http://www.nhc.gov.cn/caiwusi/s7785t/202309/914aec9618944ee2b36621d33517e576/files/f15b986edd1f4bf08bab3b1b8ce64d9a.pdf.
[15] STELLWAGEN N C, STELLWAGEN E. Effect of the matrix on DNA electrophoretic mobility[J]. Journal of Chromatography A, 2009, 1216(10): 1917-1929.
[16] KHAN O G M, ASSALEH K T, HUSSEINI G A, et al. DNA base-calling using artificial neural networks[C]//2011 1st Middle East Conference on Biomedical Engineering. IEEE, 2011: 96-99.
[17] MANOLAKOS E S. Clustering methods for accurate DNA base-calling[C]//Conference Record of the Thirty-Sixth Asilomar Conference on Signals, Systems and Computers, 2002. IEEE, 2002, 1: 311-315.
[18] COCK P J A, FIELDS C J, GOTO N, et al. The Sanger FASTQ file format for sequences with quality scores, and the solexa/illumina FASTQ variants[J]. Nucleic Acids Research, 2010, 38(6): 1767-1771.
[19] LI H, HANDSAKER B, WYSOKER A, et al. The sequence alignment/map format and Samtools[J]. Bioinformatics, 2009, 25(16): 2078-2079.
[20] EWING B, HILLIER L D, WENDL M C, et al." Base-calling of automated sequencer traces using phred. I. accuracy assessment[J]. Genome Research, 1998, 8(3): 175-185.
[21] 陳義. 色譜技術叢書: 毛細管電泳技術及應用(第三版)[M]. 北京: 化學工業出版社, 2019: 44-45.
CHEN Yi. Series of chromatographic techniques: capillary electrophoresis technology and applications (third edition) [M]. Beijing: Chemical Industry Press, 2019: 44-45.
[22] LUCKEY J A, NORRIS T B, SMITH L M. Analysis of resolution in DNA sequencing by capillary gel electrophoresis[J]. The Journal of Physical Chemistry, 1993, 97(12): 3067-3075.
[23] LUCKEY J A, SMITH L M. Optimization of electric field strength for DNA sequencing in capillary gel electrophoresis[J]. Analytical Chemistry, 1993, 65(20): 2841-2850.
[24] MCDONELL M W, SIMON M N, STUDIER F W. Analysis of restriction fragments of T7 DNA and determination of molecular weights by electrophoresis in neutral and alkaline gels[J]. Journal of Molecular Biology, 1977, 110(1): 119-146.
[25] SOUTHERN E M. Measurement of DNA length by gel electrophoresis[J]. Analytical Biochemistry, 1979, 100(2): 319-323.
[26] 丁曉靜, 郭磊. 毛細管電泳技術[M]. 北京: 科學出版社, 2015: 72-73.
DING Xiaojing, GUO Lei. Capillary electrophoresis technology [M]. Beijing: Science Press, 2015: 72-73.
[27] FUJII H, KASHIWAGI K. Compensation for mobility inequalities between lanes computed from band signals in on-line fluorescence DNA sequencing[J]. Electrophoresis, 1992, 13(1): 500-505.