陳 翀 黃杰庭
1.廣州血液中心 廣州市血液安全重點實驗室質量控制部,廣東廣州 510095;2.廣州血液中心 廣州市血液安全重點實驗室輸血研究所,廣東廣州 510095
丙型肝炎病毒(hepatitis C virus,HCV)感染已成為全球性問題,約有1.7 億感染者,其中中國感染者有一千多萬[1-2]。HCV 感染早期病情隱匿,無典型癥狀,55%~85%未發現被感染而轉變為慢性HCV,若不及時予以合理治療,HCV 會加速肝纖維化,增加肝硬化的風險,一旦發展為肝硬化,則每年有1%~5%會發展至肝癌[3-5]。因此,HCV 早期篩查和分型,對預防HCV 傳播和提高HCV 治療效果有重要的臨床意義[6]。本研究應用拉曼光譜(raman spectrum,RS)技術分析HCV 及健康人的血清,并評價其對HCV 診斷和6a 亞型鑒別的臨床價值。
本研究對象來源于廣州血液中心,HCV 組共165 例,均為2018 年1 月至2019 年6 月在血液中心確診HCV 感染患者,納入標準:①符合HCV 的診斷標準[7];②初篩血清HCV 抗體陽性;③血清RT-PCR 法完成HCV DNA 定量檢測,其載量>最低檢測限(5×102),證實為HCV 感染。排除標準:①HBV、梅毒、HIV 等感染;②其他特殊全身性疾病;③近期急性感染;④免疫系統疾病;⑤標本不合格。另選擇本中心同期無償獻血體檢健康者120 例(所有檢查項目未見異常者)為非HCV 組。本研究遵循《世界醫學會赫爾辛基宣言》,入選對象均簽署知情同意書。HCV 組年齡23 ~75 歲,平均(47.53±8.51)歲;男91 例,女74 例;基因分型:1b 87 例,3b 39 例,6a 19 例,其 他20 例。非HCV組年齡22 ~72 歲,平均(46.91±7.82)歲;男68 例,女52 例。兩組一般資料比較,差異無統計學意義(P>0.05),具有可比性。
1.2.1 標本采集 采集兩組受試者空腹(禁食過夜8 h 以上)靜脈血5 ml,室溫靜置0.5 h 后離心(3000 r/min)10 min,上層血清分裝收集到EP 管中,-80℃冰箱保存待測。檢測時將待測樣本置于室溫下靜置0.5 h 讓其充分溶解,吸取血清30 μl,靜置15 min,待樣本狀態穩定后再進行檢測,所有樣本都統一進行上述預處理。
1.2.2 檢測方法 使用DXR3 激光RS 儀(賽默飛公司),最低波數10 cm-1,光譜范圍50 ~9000 cm-1,光譜分辨率≤0.35 cm-1,配備共焦顯微鏡,在50 倍鏡下觀察記錄RS。每次檢測開始前,在532 nm 激光下用質控品觀察300 ~3000 cm-1位移范圍內的RS 數據,儀器校準后再開始樣本檢測。參數設置:激光波長532 nm,光譜分辨率5 cm-1,拉曼位移范圍300 ~3000 cm-1,掃描時間1.0 s。每份樣本在不同位置分別檢測3 次,所得圖譜用Spectrum Analyzer 檢測軟件進行光譜記錄分析。
觀察記錄RS 診斷HCV 的結果和6a 亞型的鑒別結果。
采用Spectrum Analyzer 和Matlab 軟件進行數據分析,應用自適應迭代重加權懲罰最小二乘法(airPLS)扣除所得光譜圖的熒光背景,應用偏最小二乘法(PLS)進行模型構建和支持向量機分類法(SVM)判別分析,計量資料以()表示,采用t檢驗,計數資料以[n(%)]表示,采用χ2檢驗,應用受試者工作特征(ROC)曲線評價airPLS-PLS-SVM 統計模型的診斷效果,P<0.05 為差異有統計學意義。
圖1a、b、c 中虛線為HCV 組165 個樣本的平均譜圖,實線為非HCV 組120 個正常樣本的平均譜圖;圖1a 使用airPLS 扣除所得光譜圖的熒光背景后得到圖1b,可見airPLS 扣除熒光背景前存在較大噪聲干擾,這一操作是非常有必要的。進一步的數據分析比對得到圖1c,可見在HCV 組與非HCV組300 ~3000 cm-1位移范圍內的血清RS 圖像形態相似,但部分位移處仍存在差異。

圖1 HCV 組與非HCV 組拉曼數據的平均譜圖
使用PLS 對扣除熒光背景后的數據進行降維、簡化處理,提取9 個主成分,獲得9 個(PLS-1 ~PLS-9)主成分繪制的散點圖,見圖2a、b、c,菱形為非HCV 組9 個主成分,圓形為HCV 組9 個主成分。由圖2a、b、c 可見,HCV 組與非HCV9 個主成分在三維空間上存在部分重疊,但可區分開,這一點說明RS 技術能將HCV 患者血清與正常健康人血清區分開。

圖2 HCV 組與非HCV 組PLS-1 ~PLS-9 散點圖
應用SVM 對降維后的9 個主成分數據進行判別分析,采用簡單隨機抽樣法將所有研究對象分組,大概按4 ∶3 的比例,其中訓練集285 例(HCV 165 例,健康120 例),測試集122 例(HCV 70 例,健康52 例)。使用網格尋優法對SVM 中的參數懲罰因子(c)、核函數(g)進行尋優,所獲結果見圖3a,可見HCV 組與非HCV 組血清光譜數據被很好的區分開。應用ROC曲線評估airPLS-PLS-SVM 統計模型對測試集122 例血清的診斷效果,測試集中經RT-PCR 有70 例 確診為HCV,非HCV 感染者52 例;本統計模型診斷正確陽性66 例,診斷正確陰性52 例,見表1,靈敏度為94.29%,特異度為96.15%,準確率為95.08%,ROC曲線見圖3b,曲線下面積(AUC)為0.953。

表1 RSairPLS-PLS-SVM統計模型診斷HCV的結果

圖3 3D 圖及ROC 曲線圖
使用Matlab 軟件對19 例6a 及146 例其他型HCV 患者的原始數據進行繪圖,圖4a 使用airPLS扣除所得光譜圖的熒光背景后得到圖4b,虛線為6a 亞型19 個樣本的平均譜圖,實線為146 個其他亞型樣本的平均譜圖,可見airPLS 扣除熒光背景前存在較大噪聲干擾,這一操作是非常有必要的。進一步的數據分析比對得到圖4c,可見在6a 亞型與其他亞型300 ~3000 cm-1位移范圍內的血清RS圖像形態相似,但部分位移處仍存在差異。

圖4 6a 亞型和其他型HCVRS 的平均譜圖
使用PLS 對扣除熒光背景后的數據進行降維、簡化處理,提取6 個主成分,獲得6 個(PLS-1 ~PLS-6)主成分繪制的散點圖,見圖5a、b,菱形為6a 亞型6 個主成分,圓形為其他亞型6 個主成分。由圖5a、b 可見6a 亞型與其他型6 個主成分在三維空間上存在部分重疊,但可區分開,這一點說明RS 技術能將6a 亞型患者血清與其他型患者血清區分開。
應用SVM 對降維后的6 個主成分數據進行判別分析,采用簡單隨機抽樣法將所有HCV 患者分組,其中訓練集165 例(6a 19 例,其他146 例),測試集71 例(6a 9 例,其他62 例)。使用網格尋優法對SVM 中的參數懲罰因子(c)、核函數(g)進行尋優,所獲等高線圖見圖5c,可見6a 亞型與其他型血清光譜數據被很好的區分開。應用ROC 曲線評估airPLS-PLS-SVM 統計模型對測試集71 例血清的診斷效果,本統計模型診斷正確陽性9 例,診斷正確陰性60 例,見表2,靈敏度為100%,特異度為96.77%,準確率為97.18%,AUC為0.976。

圖5 6a 亞型與其他型PLS-1 ~PLS-6 散點圖及等高線圖

表2 RSairPLS-PLS-SVM統計模型診斷6a亞型的結果
RS 的光學原理為拉曼散射,是印度科學家在1928 年發現的,當一定頻率的激光照射到樣本表面時,一部分光被發生偏離,其波長較入射光長且短,運動方向、頻率都發生變化,還有能量交換[8-9]。RS 技術具有快速、非侵入、非接觸、高靈敏度、高分辨率、高特異性等獨特優勢,已廣泛應用于生命科學、地質學、藥學、考古學等領域[9-10]。血清RS 圖譜一度被稱為“指紋圖譜”,通過RS 技術可發現患者因疾病而出現的蛋白質、核酸、脂類等的差異變化,憑借這一點血清RS 技術被用于臨床疾病的鑒別診斷[11-13]。
圖1 中虛線為HCV 組165 個樣本的平均譜圖,實線為非HCV 組120 個正常樣本的平均譜圖;圖1a 使用airPLS 扣除所得光譜圖的熒光背景后得到圖1b,可見airPLS 扣除熒光背景前存在較大噪聲干擾,這一操作是非常有必要的。進一步的數據分析比對得到圖1c,可見在HCV 組與非HCV 組300 ~3000 cm-1位移范圍內的血清RS 圖像形態相似,但部分位移處仍存在差異。這些差異可能與HCV 感染后導致的機體代謝或免疫變化有關,如血清中某些物質的成分、含量或結構發生改變,與健康人相比,HCV 患者血清中膠原蛋白、核酸、磷脂含量可能增加,兒糖類、氨基酸含量可能下降[14-15]。圖2 可見HCV 組與非HCV 9 個主成分在三維空間上存在部分重疊,但可區分開,這一點說明RS 技術能將HCV 患者血清與正常健康人血清區分開。圖3a 可見HCV 組與非HCV 組血清光譜數據被很好的區分開,RS 診斷HCV 的靈敏度為94.29%,特異度為96.15%,準確率為95.08%,AUC 為0.953;表明文中所用統計方法較可靠。
圖4a 使用airPLS 扣除所得光譜圖的熒光背景后得到圖4b,虛線為6a 亞型19 個樣本的平均譜圖,實線為146 個其他亞型樣本的平均譜圖,可見airPLS 扣除熒光背景前存在較大噪聲干擾,這一操作是非常有必要的。進一步的數據分析比對得到圖4c,可見在6a 亞型與其他亞型300 ~3000 cm-1位移范圍內的血清RS 圖像形態相似,但部分位移處仍存在差異。由圖5a、b 可見6a 亞型與其他型6 個主成分在三維空間上存在部分重疊,但可區分開,這一點說明RS 技術能將6a 亞型患者血清與其他型患者血清區分開。圖5c 可見6a 亞型與其他型血清光譜數據被很好的區分開。應用ROC曲線評估airPLS-PLS-SVM 統計模型對測試集71 例血清的診斷效果,本統計模型診斷正確陽性9 例,診斷正確陰性60 例,靈敏度為100%,特異度為96.77%,準確率為97.18%,AUC為0.976;說明RS 在6a 亞型鑒別中有較強的應用潛力。
綜上所述,血清RS 可用于HCV 診斷和6a 亞型的鑒別,有望成為HCV 快速篩查及分型工具,但國內相關報道并不多,本研究為RS 在HCV 診斷和6a 亞型鑒別的應用奠定良好基礎。但本研究樣本量較少,數據結果可能存在部分偏倚,仍需大樣本進一步證實。