999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于放射組學的泌乳素腺瘤和生長激素腺瘤分類研究

2021-05-13 07:16:04代湖明陳彥如袁平卓碧華
現代計算機 2021年8期
關鍵詞:特征模型

代湖明,陳彥如,袁平,卓碧華

(1.四川大學計算機學院,成都610065;2.重慶市第二師范學院技術與信息工程學院,重慶400067;3.武警警官學院信息技術教研室,成都610213)

0 引言

垂體腺瘤是常見的良性神經內分泌腺瘤,起源于垂體前葉,主要存在于鞍區,其在人群中的發病率大致為每年每10 萬人中有80-90 例,約占所有腦腫瘤中的15%[1-4]。

在腺垂體細胞的分化過程中,垂體轉錄因子決定著腺垂體祖細胞的分化方向。根據2017 版世界衛生組織對垂體腫瘤的分類解讀,垂體轉錄因子主要包括t-box 垂體轉錄因子、表達垂體特異性POU-同源結構域的轉錄因子(PIT-1)、T-PIT 轉錄因子和類固醇生成因子(SF-1)[5-6]。其中,泌乳素細胞和生長激素細胞由表達PIT-1 轉錄因子的細胞分化而來,然而泌乳素腺瘤患者和生長激素腺瘤患者在臨床上的治療有明顯的差異。大多數接受藥物治療的泌乳素腺瘤患者都有較好的效果[7],而生長激素腺瘤患者則必須進行手術切除,故對泌乳素腺瘤和生長激素腺瘤的正確分類在臨床上具有重要的意義。

放射組學能夠把醫學影像數據轉換成大量的定量影像特征,目前已廣泛應用于各種腫瘤特征的提取[8-10]。此研究通過提取泌乳素腺瘤和生長激素腺瘤在核磁共振成像(Magnetic Resonance Imaging,MRI)上的放射組學信息,建立出一個基于放射組學信息的機器學習模型,然后對泌乳素腺瘤和生長激素腺瘤進行精準分類。

1 數據獲取

1.1 圖像采集

本次研究搜集了2016 年1 月至2019 年2 月間確診的110 例垂體瘤患者的術前MRI 圖像(增強T1 加權成像),其中38 例為泌乳素腺瘤,72 例為生長激素腺瘤。兩位經驗豐富的神經外科醫生對所有診斷材料進行了回顧,以獲得準確的診斷結果。數據的納入標準如下:①所有患者均經過組織學診斷為垂體瘤,并通過免疫組化染色對垂體瘤進行了明確的分級;②MRI 圖像質量良好,無明顯偽影,所有MRI 圖像均在術前一周獲得。排除標準包括:①垂體瘤免疫組化染色不清楚;(②MRI 圖像質量差,偽影明顯。從醫院的圖像檔案和通信系統中獲取所有患者的MRI 醫學數字成像(Digital Imaging and Communications in Medicine,DICOM)原圖,用于進一步的定性和定量分析。

1.2 腫瘤手動分割

首先將患者的每一張MRI 序列的DICOM 圖像切片載入到開源軟件ITK-SNAP(version 3.8.0, www.itksnap.org)中,然后由一名神經外科醫生和一名神經放射學家(分別有14 年和13 年的神經腫瘤診斷經驗)在每一張MRI 圖像中勾畫出腫瘤區域,根據勾畫出的腫瘤區域,ITK-SNAP 會為每一個患者的一系列DICOM 圖像切片生成一個NRRD 格式的圖像文件,最后的勾畫結果由另外兩名放射專家進行回顧。

2 特征提取與處理

2.1 圖像預處理

提取放射組學特征的方法是基于1.2 小節中獲得的分割結果。首先對每個患者的原始DICOM 圖像進行標準化處理,如公式(1)所示,然后再對標準化后的圖像進行小波變換,得到8 張小波變換圖像。

公式(1)中x 表示圖像中的每一個像素點,μx表示圖像的均值,σx是圖像的標準差。

2.2 提取放射組學特征

首先,把每個患者的一系列MRI 的DICOM 原圖合并成一張三維圖像,并把1.2 小節中提取到的分割圖像也合并成一張三維圖像,接著把兩張三維圖像輸入提取放射組學信息的開源軟件Pyradiomics(https://pyradiomics.readthedocs.io/)中提取放射組學特征。從原始圖像中提取出18 個一階統計特征、14 個形狀特征、22 個灰度共生矩陣(Gray Level Co-occurrence Matrix,GLCM)特征、16 個灰度行程矩陣特征(Gray Level Run Length Matrix,GLRLM)、16 個灰度區域大小矩陣(Gray Level Size Zone Matrix,GLSZM)以及14 個灰度相關矩陣(Gray Level Dependence Matrix,GLDM),總共從每個患者的MRI 原始圖像中提取100 個特征,從8 張小波變換圖像中提取出688 個相同類型的紋理特征(沒有提取形狀特征),所以總共從每個患者的MRI 序列圖像中提取出了788 個放射組學特征。所有特征的詳細描述信息可以從網站(http://www.radiomics.io/pyradiomics.html)中找到。對每個患者MRI 圖像(增強T1 加權成像)均進行上述的特征提取。

2.3 數據增強

從1.1 小節中可知,收集到的110 名垂體瘤患者中,有38 名患者為泌乳素腺瘤,72 名生長激素腺瘤,數據存在嚴重的類別不平衡現象。通常而言,分類學習方法中都假設不同類別的訓練樣例數目相同。如果某一類別的訓練樣例數比其他類別的訓練樣例數多,那么機器學習模型會更偏向于樣例數多的類別,這是由于機器學習模型只要將樣本的結果判定為樣例數多的類別,模型就能取得較高的精確率,但這樣的模型對于實際應用而言是沒有意義的。為了解決數據中存在的類別不平衡現象,利用SMOTE(Synthetic Minority Oversampling Technique)算法對訓練集進行數據增強。

SMOTE 算法的目的在于生成新的少數類樣本,生成的策略如下:對樣本中的每個少數類樣本a,從它的最近鄰樣本中隨機選出一個樣本b,然后再樣本a、b 之間的連線上隨機選一個點生成新的少數類樣本,如圖1所示。

SMOTE 算法流程:

(1)從少數類中的樣本a,計算它到少數類樣本集中其他所有樣本的歐氏距離,得到k 個與樣本a 距離最近的點。

(2)計算樣本不平衡的比例,從而確定過采樣的倍率N,少數類中的每一個樣本a,從其k 個距離最近的樣本中隨機選擇N 個樣本,假設選擇的樣本為b。

(3)對于每一個隨機選出的樣本b,分別與樣本a按照公式(2)生成新的樣本c。

圖1 SMOTE算法

2.4 數據標準化

從每個病人的MRI 序列中提取到的788 個特征存在量綱上的差異,有的特征值并不是同一個數量級,然而量綱上的差異并不能真實表達出特征的重要性。在模型學習的過程中,量綱大的特征對最終學習到的結果影響更大,會導致最終學到的模型不可信。為了解決這一問題,通過標準化可以使得不同的特征變量具有相同的尺度,那么在使用梯度下降法學習模型參數的時候,不同特征對參數的影響程度就一致了。同時,通過將數據標準化,還可以加速損失函數的收斂速度。本文使用的標準化方法為z-score 標準化,如公式(3)所示。

其中μ為所有樣本數據的均值,σ為所有樣本數據的標準差。

2.5 數據降維

數據集特征維度太高會導致過擬合的現象,特別是當數據樣本較少的時候。由2.2 小節可知,每個病人的MRI 序列可以提取出788 個特征,然而數據集中只有110 個樣本,由此可知目前的特征維度太高。為了增加機器學習模型的泛化能力,減少過擬合的現象,需要對當前的數據集進行降維。

主成分分析(Principal Component Analysis,PCA)是常用的數據降維方法,PCA 通過低維的特征去盡可能的表達原樣本中的高維特征空間,不僅可以將數據壓縮到低維,保留樣本的主要信息,同時還可以使降維之后的數據特征之間相互獨立。另外,PCA 將不重要的信息去掉,能起到一定的去噪效果。

3 實驗

為了更好地評估模型的泛化能力,本文使用五折交叉驗證對模型進行訓練與測試。首先將38 個泌乳素腺瘤樣本和72 個生長激素腺瘤樣本按比例隨機的平均分成5 折,然后將其中四折的共88 個樣本數據作為訓練集用于訓練模型,剩余一折的樣本數據用于測試模型的泛化能力,循環測試5 輪。劃分好訓練集與測試集之后,由于泌乳素腺瘤的樣本數比較少,使用sklearn(https://scikit-learn.org/stable/)的SMOTE 函數對訓練集進行數據增強,得到增強后的訓練集共116個樣本,新生成的樣本均為泌乳素腺瘤樣本。

圖2 五折交叉驗證

對訓練集進行數據增強后,然后使用z-score 對訓練集和測試集分別進行標準化,最后再使用PCA 分別對訓練集和測試集進行數據降維。通過不斷測試,發現把數據降到44 維的時候,模型的泛化能力最好。

把降維后的訓練集樣本輸入到邏輯回歸(Logistics Regression)中進行訓練,然后用測試集測試學習到的模型的效果,得到五折的正確率分別82.6%、91.3%、77.2%、80.95%、85.7%,平均正確率為83.5%。從測試結果可以看出,有幾折的正確率相差較大,這是由于測試集的樣本較少,少量的判斷錯誤就會導致正確率有比較大的降低。

4 結語

本文提出了基于放射組學信息對泌乳素腺瘤和生長激素腺瘤進行精準分類的機器學習模型,通過提取放射組學的專用軟件包Pyradiomics 提取出兩種腫瘤在MRI 圖片上的放射組學信息,再通過SMOTE 算法生成新樣本以平衡樣本數據集,然后再對平衡后的樣本數據集進行z-score 標準化以去除特征間的量綱差異,并利用PCA 對樣本數據集進行特征降維以增強機器學習模型的泛化能力,之后利用五折交叉驗證對邏輯回歸模型進行訓練和測試,模型的平均正確率為83.5%,能精準地對泌乳素腺瘤和生長激素腺瘤進行分類,具有較高的臨床實用價值。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产美女一级毛片| 成人国产免费| 日韩欧美视频第一区在线观看| 99精品国产自在现线观看| 国产综合日韩另类一区二区| 免费无码一区二区| 国产精品成人第一区| 成人av手机在线观看| 欧美亚洲中文精品三区| 欧美h在线观看| 日本免费一区视频| 自慰高潮喷白浆在线观看| 久一在线视频| 亚洲Av激情网五月天| 日韩亚洲综合在线| 青草视频免费在线观看| 91香蕉视频下载网站| 国产精品极品美女自在线| 国产一级毛片网站| 精品国产99久久| 久久黄色视频影| 毛片基地美国正在播放亚洲 | 欧美中文字幕一区| V一区无码内射国产| 国产拍揄自揄精品视频网站| 亚洲天堂久久久| 四虎在线观看视频高清无码| yy6080理论大片一级久久| 国产亚洲精品无码专| 国产91在线|中文| 欧美一区精品| 亚洲日韩AV无码精品| 欧美午夜视频在线| 国产麻豆aⅴ精品无码| 夜精品a一区二区三区| 午夜日韩久久影院| 欧美激情一区二区三区成人| 国产精品冒白浆免费视频| 欧美日韩动态图| 中文字幕 91| 青青草欧美| 久久精品这里只有精99品| 亚洲精品第一页不卡| 精品一区二区三区视频免费观看| 99视频只有精品| 草草线在成年免费视频2| 国产精彩视频在线观看| 欧美亚洲日韩中文| 26uuu国产精品视频| 国产成人高清精品免费软件| 99re经典视频在线| 国产97公开成人免费视频| 亚洲最大综合网| 亚洲天堂久久| 国产又粗又爽视频| 91黄视频在线观看| 国产xxxxx免费视频| 99久久精品视香蕉蕉| 国产永久无码观看在线| 4虎影视国产在线观看精品| 国产专区综合另类日韩一区| 日韩av电影一区二区三区四区 | 无码中文字幕乱码免费2| 欧美日韩动态图| 欧美三级自拍| 亚洲精选无码久久久| 呦系列视频一区二区三区| 国产在线欧美| 欧美成人综合视频| 亚洲a免费| 五月天在线网站| 欧美三级不卡在线观看视频| 色屁屁一区二区三区视频国产| 国产人人乐人人爱| 亚洲区欧美区| 99伊人精品| 国产三级视频网站| 亚洲精品无码人妻无码| 伊在人亞洲香蕉精品區| 素人激情视频福利| 亚洲国产精品日韩欧美一区| 97久久免费视频|