馮熙然 李思婷 趙娜

摘 要:惡性胰腺癌(pancreaticcancer)其實是一種消化道惡性腫瘤,具有很高的惡性癌變程度,診斷和早期治療困難很大。近幾年來,發病率和患者死亡率顯著提高。胰腺癌的早期手術確診死亡率一般較低,手術晚期死亡率高,治愈性能也較低。胰腺癌是否發生的尚不清楚??蒲袡C構希望利用與人工智能相關的大數據技術輔助放射科醫生進行醫學圖像識別,提高醫療成像數據的準確性,降低放射科醫生的壓力,達到早發現和治療疾病的目標。本課題采用大數據技術分布存儲胰腺光影像數據,利用深度學習技術將大量胰腺X光圖像從自動特征中提取,并通過大數據技術研究了癌癥藥物。
關鍵詞:胰腺癌;X光影像;大數據技術;對比治療機制
前言:
近幾年來,隨著大數據技術的迅速發展,基因組拷貝變化、突變、甲基化數據和轉錄組、蛋白質組、代謝群等與癌癥有關的組學數據也在迅速積累,為癌癥的研究和精確醫學的發展提供了大量的機會。通過前期的調查,胰腺癌是最差預后的惡性腫瘤之一,被稱為"癌中的王子",在前期難以發現,藥物作用也不理想。針對目前存在的問題,我們對于胰腺癌前期X光片及藥物治療效果進行了大數據處理并構建了對比治療機制。
1.設計思路
對比 alexnet 神經網絡, mobilenets 神經網絡, vgg16 神經網絡模型,以及胰腺 x 光圖像識別的精確度,根據分析效果優劣,選擇 vgg16 網絡模型對算法進行改進,分別命名 vggy 和 vgg y1 ,標準卷在 vgg16 網絡上。積被 vggy 網絡模型改為深度分離的卷積,并將改進的網絡模型應用于胰腺梗阻性慢性胰腺炎,癥狀糖尿病,血栓型靜脈炎,黃疸性肝炎,膽石癥,膽囊病和正常七種類型的識別。
2.設計原理
2.1基于轉錄組大數據和深度學習的藥物重定位預測
在這部分研究中,基于 lincs 計劃的藥物刺激下細胞反應轉錄組的大數據,構建了一個基因共表達網,它由不同的治療性質組成,并由此基因共表達網絡構成,并由此基因共表達網絡的核心成分 dgcn 組成。 dgcn 基因共表達關系的聯結可以被用來探究基因誘導的藥物表達方式,從而使研究人員更深入地理解藥物作用的機制。接下來,利用 lincs 計劃的 l1000 數據集中的藥物擾動和基因沉默轉錄組中的大數據以及深度學習,構建了一個深度神經網絡 dnn 模型,系統進行了藥物靶標的關聯預測。通過交叉驗證,發現 dnn 模型的精確度比其他預測算法要高,而且所預測的藥物靶標相關聯系在其他相關的數據庫中明顯集合。
2.2基于多組學數據融合的癌癥共識分子亞型辨識的Web計算實現
在第二個部分的研究中,使用 tcga 、 icgc 和 target 國際大型項目的癌癥多組學資料和多聚類算法,建立了 comsuc 癌癥認識分子亞型的 web 計算工具。 comsuc 彌補了由不同測序平臺,預處理過程和聚類法等因素引起的分子亞型不一致缺陷,這是 comsuc 彌補的。 comsuc 實現了多個應用場景,多種聚類算法,可以展示并輸出分析的發表等級。以辨別腎上腺皮質癌 acc 的共識分子亞型為例,展示了 comsuc 在癌癥分子亞型識別方面的實用性。本研究展示了轉錄組和多組學數據融合的計算分析,并在藥物重定位預測和癌癥分子亞型識別方面的應用。
3.設計優勢分析
3.1 構建了藥物誘導的基因共表達網絡
經過一系列預處理的數據,構建了藥物擾動轉錄反應的表達譜數據。計算不同的藥物刺激細胞系中所有基因之間的 pearson 相關系數和 p 值,按一定篩選規則進行合并,構成了不同的治療性藥物刺激下基因共表達網,從而形成了一個核心藥物引導基因共表達網。該網絡幫助研究者更深入地理解了藥物作用的機制。
3.2 將深度學習方法引入到藥物重定位領域
相對傳統新藥研發模式,藥物重定位策略發現藥物新用途具有顯著的成本效益優勢,能加快藥物上市步伐,滿足惡性腫瘤、罕見病、個性化醫療等特定領域藥物臨床用藥需求。而深度學習可以有效提取圖像隱含特征,在醫學影像識別方面的應用快速發展。采用遞增擴充卷積并且融合批量標準化和LeaklyReLU函數對輸入胰腺癌早期X光片及藥物效果數據進行特征提取與學習;然后通過結合遞減擴充卷積和ReLU函數對提取的特征進行圖像重構;二者結合,將深度學習方法引入到藥物重定位領域,可以提高藥物-靶標關聯關系預測的準確率。
3.3 搭建了包含多個組學數據和多個聚類方法的癌癥共識分子亞型Web計算工具
復雜性疾病常由環境因素和遺傳性因素(多組學層次)共同作用引起。對認知疾病發生的全面分析,對認知疾病發生的進程至關重要。多組學數據整合分析可以提高特征檢查的效率,提高疾病的預測精確度。癌癥共識分子亞型網絡計算工具可以將不一致的聚類方法融合到多個組學和聚類方法中,從而發現與癌癥共識分子亞型相關的生物標志和相關診斷,有助于對醫療進行針對性診斷。
4.可行性
近幾年來,隨著惡性功能腫瘤基因組學的迅速研究發展,與各種癌癥發病有關的基因組織科學分析數據也在迅速發展積累,這些基因組的科學分析數據與各種癌癥發病有關。為癌癥藥物的研發和精確醫學的發展創造了大量的機會。轉錄組數據是生物醫學的一個重要組成成分,在生物醫學和臨床應用中得到了廣泛的應用。而細胞擾動表達譜測量的轉錄組在各種擾動情況下的變化,通過對組織細胞不同的生理,病學,藥物作用等基因表達譜印記的對比分析,可以在不同的生理,病學作用和藥物作用中建立聯系。
5. 推廣前景
近幾年來,機器學習尤其是深度學習技術的發展,使得深度學習成為計算機視覺,語音識別,自然語言處理的成功。藥物大數據與深度學習相結合,將為生物醫學在包括藥物開發在內的各個領域帶來新的發展機會。隨著基因測序、高通量基因芯片和低成本轉錄組技術的迅速發展,積累了大量關于藥物擾動、基因沉默和癌癥的多組學資料,這些大量數據不僅對生物學基礎研究產生了深遠的影響,而且對藥物重定位、癌癥分子的分型等應用研究也產生了深遠的影響并為癌癥大數據提供重要的機遇。
參考文獻:
[1]宋欣雨,文昱琦,劉禎,何松,伯曉晨 基于LINCS轉錄組大數據的藥物誘導基因共表達網絡構建【J】軍事科學院軍事醫學研究院 2018(06)
[2]宋欣雨 基于組學大數據的藥物重定位預測和癌癥共識分子亞型辨識【J】軍事科學院 2019
[3]熊阿珍,孟光興 藥物重定位候選藥物篩選路徑【J】中國醫藥工業雜志 2020(02)
作者簡介:
姓名:馮熙然,性別:女,籍貫:云南省昆明市西山區,出生年月:2002年10月28日,學歷:本科;研究方向:醫學影像技術
姓名:李思婷,性別:女,籍貫:福建省漳州市薌城區,出生年月:2001年11月12日,
學歷:本科;研究方向:醫學影像技術
姓名:趙娜,性別:女,籍貫:山東省威海市環翠區,出生年月:1991年10月10日,學歷:本科,職稱:講師,研究方向:臨床醫學
(山東協和學院? 山東? 濟南? 250000)