999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工神經網絡在流式細胞術數據分析中的應用

2023-09-20 07:52:26李智偉郭玉娟擺文麗芮東升
醫學信息 2023年18期
關鍵詞:方法模型

雷 偉,李智偉,郭玉娟,擺文麗,芮東升,王 奎

(1.石河子大學醫學院,新疆 石河子 832000;2.新疆維吾爾自治區人民醫院臨床檢測中心,新疆 烏魯木齊 830001)

流式細胞術(flow cytometry,FCM)是一種能夠對懸浮的細胞或微粒進行快速而精確地分析和分選的檢測技術,被廣泛應用于生物學研究及臨床診斷中[1-3]。FCM 應用過程中會產生高維數據,傳統數據分析是基于設門的方法,通常分析者會在FlowJo 等可視化軟件中根據經驗選擇測量通道繪制能夠代表細胞抗原表達水平的散點圖,在散點圖中圈出門以區分出不同的細胞亞群,以此得到疾病的相關信息。目前FCM 向多參數方向發展,給數據分析帶來巨大挑戰,基于人工設門的細胞分群方法的局限性日益顯著。首先,人工分群缺乏客觀性,由于沒有可量化的標準,不同分析者得到的結果可能存在差異;其次,人工分群過程繁瑣,重復性工作耗費大量時間導致效率低下;此外,人工分群要求分析者有一定的專業知識,能夠根據經驗準確設門和識別亞群,這可能是一般使用者不具備的[4-7]。因此,提出自動分群方法,并已成為近年來國內外研究熱點[8-11]。人工神經網絡(artificial neural network,ANN)是一種受到人腦神經元的啟發而產生的多參數非線性計算模型,其具備了機器學習的能力,常被用于解決數據分析問題[12,13]。本研究旨在通過構建ANN 模型實現在FCM 數據上的細胞自動分群,并且同其他方法進行比較,探究該方法應用的可行性。

1 資料與方法

1.1 資料來源 數據來源于新疆維吾爾自治區人民醫院臨床檢測中心2016-2017 年流式檢測存檔數據,包括10 名健康志愿者的骨髓標本FCM 數據。納入標準:①人員無發熱、咳嗽或其他不適;②血常規和生化檢測結果正常;③近期未使用過影響免疫功能的藥物;④體檢未發現免疫性疾病;⑤肝腎功能檢查正常。排除標準:①患有急性病毒感染性疾病、先天性免疫缺乏癥、獲得性免疫缺陷綜合征、霍奇金病、白血病、惡性腫瘤、瓦爾登斯特倫巨球蛋白血癥等疾病;②處于外科手術恢復和腫瘤化療期間從事輻射接觸工作、使用淄醇類藥物及免疫抑制劑的人員;③實驗室血清學檢測確診乙肝、丙肝、艾滋病、梅毒者;④近期有飲酒情況(如酗酒)的對象;⑤近期獻血的對象。本項目已通過當地倫理委員會批準,所有參與者均簽署知情同意書。檢測儀器為BD 公司的FACS Canto Ⅱ雙激光八色流式細胞儀,標本中加入CD45 標記分子與骨髓細胞結合,細胞在激光光源的照射下發射出代表細胞體積大小及粒度的散射光信號及代表細胞生化性質的特異性熒光信號。提取前向散射光高度(FSC-H)、前向散射光面積(FSC-A)、側向散射光面積(SSC-A)及CD45 熒光強度。單個細胞被激發后產生的散射光和熒光信號以單個事件的形式被記錄下來,所有的事件匯聚成被測細胞群完整的FCM 數據,以FCS 格式存儲。

1.2 人工設門分析方法 在FlowJo 分析軟件中打開FCS 文件,以FSC 和SSC 為坐標繪制散點圖,其中FSC 反映細胞粒徑,SSC 反映細胞復雜度,結合兩者可以排除凋亡細胞和細胞碎片,得到有核細胞群體。在有核細胞群體中單細胞的FSC-H 和FSC-A 呈線性相關,故可在散點圖中用直線劃定范圍區分單細胞和黏連細胞。在單細胞群中繪制以CD45 和SSC為坐標的散點圖,根據細胞聚類特征并結合經驗圈出不同亞群的邊界,通常包括淋巴細胞、單核細胞、有核紅細胞、粒細胞和幼稚細胞等。在臨床檢驗中,對CD45 和SSC 的設門是許多血液疾病診斷的初始策略,為區分主要的造血細胞群體提供一個有用的起點,可以結合其他標記物進行下一步診斷[14]。

1.3 ANN 分群模型

1.3.1 數據集準備 采用R 4.0 中Bioconducter-flowcore 軟件包讀取數據[15],對SSC 和CD45 分別使用對數轉化和雙指數轉化進行去偏態化。采用Python 3.7 中sklearn 軟件包的MinMaxScaler 函數對納入的變量進行歸一化,使變量范圍在[0,1]之間。以人工分群結果作為金標準,賦予數據標簽(0:淋巴細胞;1:單核細胞;2:幼稚細胞;3:嗜酸性粒細胞;4:中性粒細胞;5:有核紅細胞)。

1.3.2 模型架構及運算 采用Python 3.7 中keras 軟件包搭建ANN 模型,由輸入層、2 個隱含層、輸出層和分類器組成。輸入層有2 個節點,分別用于輸入CD45 和SSC,每個隱含層包括10 個神經元,各層之間采用tanh 激活函數;輸出層有6 個節點,對應6個細胞亞群,在輸出層后加入softmax 函數作為分類器,用來計算多分類概率。設置初始學習率為0.01,迭代次數為20,優化器為隨機梯度下降法(SGD)。訓練時,訓練樣本在各層的神經元間傳遞,向前傳播得到輸出值,網絡通過計算損失函數得到實際輸出與期望輸出間的殘差,再將殘差反向傳播回網絡中,逐層更新網絡中各層神經元的權重和偏置,在迭代過程中損失函數逐漸下降,網絡參數趨于穩定,訓練結束后將模型以h5 文件存儲。

1.3.3 模型驗證 采用交叉驗證的方式,每個樣本依次作為測試集,未被選中的樣本合并后作為訓練集。分別在各訓練集進行模型訓練,計算模型在各測試集上的準確率,計算平均準確率和置信區間,并繪制混淆矩陣,并計算各亞群的F1 值,計算方法為:

式中,P 代表精度,R 代表召回率,F1 值是綜合評價模型識別能力的指標,值越接近1 代表模型識別效果越好。

1.4 其他分群方法 決策樹和K-means 分別作為有監督和無監督機器學習的代表算法之一,被用于亞群分群中[7,8]。

1.4.1 決策樹分類算法 決策樹算法是一種逼近離散函數值的方法,可以在已知各種情況發生概率的基礎上對未知情況做出評價。每個決策樹都表述了一種樹型結構,由它的分支來對該類型的對象依靠屬性進行分類。每個決策樹可以依靠對源數據庫的分割進行數據測試,這個過程可以遞歸式的對樹進行修剪,當不能再進行分割或一個單獨的類可以被應用于某一分支時,則完成了遞歸過程,訓練好的決策樹可以直接用于對新樣本的分類。

1.4.2 K-means 聚類算法 K-means 算法是一種基于迭代求解原理的聚類算法,其通過距離作為聚類參照的指標,首先隨機選取數據中的若干對象作為聚類中心,然后計算其他每個對象和這些聚類中心的距離,并把每個對象分配給最近的聚類中心,每分配一個對象時,聚類中心則被重新計算,直到最后一個對象被分。為盡可能將亞群區分,研究中設置簇個數為10,略大于目標亞群數,聚類后人工合并和識別亞群,給予相應標簽。

2 結果

2.1 ANN 模型訓練過程 訓練時,損失函數在迭代過程中逐漸下降,表明模型能夠從訓練集中學習到有用的特征。同時,準確率隨之提高并趨于穩定,逐漸接近于1,說明模型在訓練集上擬合良好,見圖1。

圖1 ANN 模型訓練中準確率和損失函數變化圖

2.2 ANN 模型分群結果 以SSC-A 和CD45 為坐標繪制散點圖,可知ANN 模型能夠區分細胞亞群,在亞群輪廓上與人工設門結果基本一致,見圖2;混淆矩陣顯示,ANN 模型對于各類細胞亞群均有較高的識別精度,見圖3。

圖2 人工分群方法和ANN 分群結果比較

圖3 混淆矩陣

2.3 三種自動分群方法比較 以人工設門結果作為金標準,對ANN 模型、K-means 模型和決策樹模型自動分群方法進行相同的交叉驗證,計算各亞群的F1 值和總體分群準確率,結果顯示ANN 和決策樹準確率及在各亞群上F1 值均優于K-means 模型,見表1。

表1 三種自動分群方法分群結果

3 討論

隨著FCM 的廣泛應用,目前最先進的流式細胞儀可以檢測超過30 個參數[16]。檢測能力提升的同時也給基于人工設門的FCM 數據分析帶來挑戰,不斷有自動分析方法被提出。Cheung M 等[17]對現有自動分析方法進行調查后指出,雖然一些方法已經被證明在FCM 數據分析中有不錯的效果,并已發布相關軟件包,但軟件的跨平臺使用問題依然難以解決。目前多數方法采用無監督的機器學習實現亞群聚類,這種方法得到的分群結果需要分析者進行人工識別,難以實現完全自動化。因此,進一步探究新方法在FCM 數據分析中的應用是十分必要的。

ANN 是一種受到人腦神經元處理信息方式的啟發而產生的多參數非線性計算模型,其具備了機器學習和模式識別的能力,針對復雜的非線性關系問題,只需要預先給予正確的訓練數據,神經網絡就可以快速找到其中隱含的規律,從而得到最優模型。目前,ANN 被廣泛的應用于醫學領域,在輔助診斷、預測疾病預后等方面表現良好,為解決許多臨床問題提供了新思路[18-20]。本研究提出了一種基于ANN的細胞亞群分群方法,作為一種有監督的機器學習,模型能夠自動區分并識別細胞類型,避免了分析者的主觀性,具有客觀高效的特點。且經過測試,ANN模型可以很好的復現人工設門的結果,對于設門中處于亞群交界處未被納入的細胞,ANN 模型也能將其合理分配,在聚類輪廓上與設門結果基本一致,可以作為人工設門的補充和替代。此外,本研究以人工設門結果作為金標準,對ANN 模型、K-means 模型和決策樹模型自動分群方法進行相同的交叉驗證,計算各亞群的F1 值和總體分群準確率,結果顯示三者總體分群準確率分別為0.970、0.972 和0.899,且ANN 和決策樹在各亞群上F1 值均優于K-means 模型。同時需要指出,在有監督機器學習方法中,當訓練數據較少的情況下,ANN 模型表現一般低于或接近其他方法,但隨著數據量的增加,ANN模型明顯優于其他方法,具有更大潛力[21]。另外,由于本研究中僅通過少量骨髓樣本產生的FCM 數據作為訓練集,因此未能充分展現出ANN 模型的大數據優勢。并且在本研究中僅以健康個體作為對象,如需驗證模型在特定疾病上的表現,還需要收集更多患者的FCM 數據,以進一步探究ANN 在FCM 數據自動分析中的價值。

綜上所述,基于ANN 模型的FCM 數據細胞分群方法實現了對骨髓細胞的自動分群,證明了將ANN 應用于FCM 數據分析中的可行性,可以為后續相關研究提供參考。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 中文字幕不卡免费高清视频| 国产成人亚洲欧美激情| 精品撒尿视频一区二区三区| 无码粉嫩虎白一线天在线观看| 欧美高清国产| 亚洲免费毛片| 高潮毛片无遮挡高清视频播放| 91免费精品国偷自产在线在线| 浮力影院国产第一页| 一区二区日韩国产精久久| 五月婷婷精品| 久久精品人人做人人爽97| 亚洲欧美日韩动漫| 亚洲成人网在线观看| 五月婷婷欧美| 中国黄色一级视频| 啪啪永久免费av| 亚洲欧美不卡| 啪啪永久免费av| 手机精品视频在线观看免费| 亚洲人精品亚洲人成在线| 成人福利在线看| 欧美日韩国产成人高清视频| 中文字幕1区2区| 伊伊人成亚洲综合人网7777| 亚洲日本中文综合在线| 91口爆吞精国产对白第三集 | 亚洲人成网址| 国产无码精品在线| 亚洲成aⅴ人片在线影院八| 91极品美女高潮叫床在线观看| 国产丝袜第一页| 99热这里都是国产精品| 久久精品丝袜| 国产精品久久久久久搜索 | 中国一级毛片免费观看| 成人免费视频一区| 911亚洲精品| 亚洲狠狠婷婷综合久久久久| 九九热精品在线视频| 成人中文在线| 国模视频一区二区| 欧美69视频在线| 又黄又湿又爽的视频| 日韩乱码免费一区二区三区| 熟妇人妻无乱码中文字幕真矢织江| 国产自在自线午夜精品视频| 亚洲精品卡2卡3卡4卡5卡区| 国产波多野结衣中文在线播放| 手机精品福利在线观看| 免费xxxxx在线观看网站| 国产无人区一区二区三区| 91免费国产高清观看| 激情综合图区| 亚洲第七页| 成人a免费α片在线视频网站| 熟女成人国产精品视频| 在线免费亚洲无码视频| 欧美成人二区| 国产精品粉嫩| 亚洲三级a| 亚洲欧洲自拍拍偷午夜色| 99热在线只有精品| 日韩福利视频导航| 日韩一级毛一欧美一国产| 日本午夜三级| 成人在线欧美| 国产欧美日韩资源在线观看| 免费在线一区| 中文毛片无遮挡播放免费| 免费午夜无码18禁无码影院| 99视频在线精品免费观看6| 日本人妻丰满熟妇区| 国产黄色爱视频| 国产超碰一区二区三区| 日韩欧美91| 久久精品最新免费国产成人| 免费在线成人网| 日本一区二区三区精品视频| 91免费国产高清观看| 午夜丁香婷婷| 亚洲欧洲日产国码无码av喷潮|