999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于生物醫學文本挖掘工具的白血病和基因關系研究

2015-03-22 00:42:38,,
中華醫學圖書情報雜志 2015年10期
關鍵詞:關聯利用文本

,,

白血病是常見的血液惡性腫瘤,是一類造血干細胞惡性克隆性疾病。大量研究表明,克隆性白血病細胞因為增殖失控、分化障礙、凋亡受阻等機制在骨髓和其他造血組織中大量增殖累積,并浸潤其他組織和器官,同時使正常造血受到抑制。因此,其發生發展與基因關系十分密切,探究白血病和基因的關系有助于更好地了解其發病機制,從而為白血病的預防和治療提供依據。

文本挖掘是近幾年數據挖掘領域的一個新興分支[1]。隨著生物醫學的不斷發展,數據量爆炸式的增長,文本挖掘在生物醫學上的應用越來越廣泛、深入。生物醫學文本挖掘通過計算機,幫助人們從爆炸式增長的非結構化的生物醫學文本數據中發現知識、抽取關系,減輕醫學研究人員的信息獲取和利用負擔[2]。研究人員利用生物醫學文本挖掘工具探究出生物實體之間的內在聯系,如石麗君等[3]利用COREMINE Medical工具對篩選出的基因進行文本挖掘,找出與多藥耐藥及腫瘤耐藥存在線性相關的基因;吳西發[4]在新疆維吾爾族乳腺癌骨轉移相關基因分析中,利用Chilibot軟件對差異基因的文獻注釋進行分析,結果顯示有44個差異表達基因與轉移有關;Ombretta Melaiu等[5]利用多種文本挖掘工具確定多種惡性胸膜間皮瘤的標志物,確定了PTGS2, BIRC5, ASS1, JUNB等標志物。

常見的生物醫學文本挖掘工具有COREMINE Medical,PubGene,iHOP[6],Chilibot,CoPub[7-8],NetCutter,FACTA/FACTA+[9]等。這些系統都是以基因作為主線,在非結構化的生物醫學文獻信息中挖掘生物醫學實體之間的潛在聯系。本文擬采用COREMINE Medical和Chilibot對白血病和基因的作用關系進行挖掘分析。

1 研究工具和步驟

1.1 研究工具

本文的研究工具包括COREMINE Medical和Chilibot。

COREMINE Medical是基于本體的醫學信息檢索平臺,由挪威與中國科學院、中國醫學科學院、美國國立醫學圖書館等機構聯合開發,是國際上最先進的醫學信息檢索平臺。COREMINE Medical可查詢相同研究課題的專家,構建基因與其他生物醫學詞匯之間基于文獻的共現網絡和通過顯著性值來定量分析關聯強度,可以將與查詢詞相關的內容分類呈現并提供PubMed、Wikipedia、Google、Clinical Trial.gov等鏈接;可以進行基因序列的同源相似性分析,能查閱到查詢基因所影響的生物學過程。

Chilibot是Hao Chen[10]和Burt M Sharp設計開發的網絡程序,是基于文獻內基因與其他生物學醫學實體之間的共現關系進行文本挖掘的系統工具,所分析的生物學醫學文獻數據來源于PubMed數據庫。Chilibot不僅能揭示基因與基因之間、基因與蛋白質或者基因和其他關鍵詞之間的共現關系強度,還可以挖掘他們之間的相互作用信息,并將句子中的基因關系分成促進、抑制、中性、既有促進又有抑制作用、并聯、單純的文獻內共現關系等六類。Chilibot為生物學醫學研究人員創建了內容豐富的基因關系拓撲網絡,并利用這個網絡試圖發現基因、蛋白質、藥物等生物學醫學實體間隱含的關系,為生物學醫學研究推斷出假設的關聯[11]。

1.2 研究步驟

本文以白血病(Leukemia)為研究對象,通過COREMINE Medical系統找到與白血病關聯程度較高的基因,進而利用Chilibot系統得到白血病和這幾種基因的相互作用結果,對結果進行人工分析,最后得出結論。

具體研究步驟如圖1所示。

圖1 研究步驟

2 結果與分析

2.1 利用COREMINE Medical尋找基因

將白血病“Leukemia”輸入COREMINE Medical的檢索框中,結果如圖2所示。圖2中左側為Leukemia與各類別詞的共現關系可視化圖,右側為各類別詞列表選項卡,展開后為每個類別詞具體包含的詞。

圖2 COREMINE Medical檢索“Leukemia”的結果

點擊右側基因/蛋白質選項卡,可以得到基因列表,基因的右側是顯著性值,深色小格子越多表明關聯強度越大。選取顯著性值≥5的基因作為目標基因,即圖2中方框所圈出的排在前五的基因,它們分別是LIF,PML,MKT2A,LIFR,RUNX1。

2.2 利用Chilibot分析白血病與基因之間的相互作用關系

利用Chilibot分析從PubMed中檢出文獻的摘要。摘要中有相互作用句和平行句,其中相互作用句是能體現兩者間促進、抑制、中性、既有促進又有抑制作用、并聯、單純的文獻內共現關系的句子,平行句不能直接說明二者關系。因此分析的主要依據是相互作用句。

2.2.1 白血病和PML之間的相互作用關系

對Leukemia 和 PML進行關聯分析,用Chilibot分析了PubMed 7627篇文獻中100個最新的摘要,得到5個相互作用句和12個平行句。

通過分析這5個相互作用句,可以得到如下結論:PML具有診斷意義,PML的轉錄物越多,則急性早幼粒細胞白血病的風險越大。

在這5個相互作用句中,每句都包含了短語“Acute Promyelocytic Leukemia (APL,急性早幼粒細胞白血病)”,因此將PML和APL關聯起來。

Chilibot分析了4258篇文獻中的100個最新的摘要,得到13個相互作用句和104個平行句,如圖3所示。

圖3 Chilibot對APL和PML相互作用關系的分析

通過分析13個相互作用句,可以得到APL和PML相互作用的過程(圖4)。

圖4 APL和PML相互作用過程

從圖4可以看出,PML RARα融合基因蛋白的表達增加會使骨髓細胞的分化停滯在早幼粒階段。這個過程值得我們探討;而且從APL和PML的13個相互作用句中,可發現PML和RARα總是成對出現的。

在COREMINE Medical中輸入“Acute Promyelocytic Leukemia”,結果如圖5所示。

從圖5可以看出,RARα和PML的顯著性值都很高(均為6),表明RARα和APL之間有很高的關聯性。然后利用Chilibot繼續探討RARα和PML之間的關系。

圖5 COREMINE Medical檢索APL的結果

RARα有不同的表示形式,如RARα,RARA,RAR alpha, RARI 等,但Chilibot沒有截詞檢索功能。于是用RARα,RARA和RAR alpha分別與APL進行關聯分析,分別得到0,25,13個相互作用句。通過分析可知,PML RARα是一種核受體轉錄抑制劑,所產生的蛋白干擾核受體信號和PML核質體的組裝,從而抑制骨髓分化基因。將此句添加到圖4中,得到新的作用過程圖(圖6)。

圖6 APL和PML/RARα相互作用過程

2.2.2 白血病和LIF之間的相互作用關系

對Leukemia 和LIF進行關聯分析,利用Chilibot分析PubMed 2961篇文獻中100個最新的摘要,得到2個相互作用句子和42個平行句子。通過分析2個相互作用句子,表明LIF(leukemia inhibitory factor)是白血病抑制因子,對白血病具有抑制作用。由于相互作用的句子太少,無法得出具體的作用關系。

2.2.3 白血病和KMT2A之間的相互作用關系

對Leukemia 和KMT2A進行關聯分析,利用Chilibot分析了PubMed 9篇文獻中9個最新的摘要,得到1個相互作用句子和4個平行句子。從1個相互作用的句子中無法得出結論,但是從這個相互作用句中發現,KMT2A有個別名叫MLL1。因此利用Chilibot將Leukemia和MLL1關聯起來,分析了PubMed的313篇文獻中100個最新的摘要,得到了13個相互作用句和15個平行句。通過人工分析這13個相互作用句得知,MLL1位于11號染色體。由于染色體異位產生了MLL1融合蛋白,這是一種特殊類型白血病的分子標志,是白血病發展過程中非常有力的腫瘤驅動器,可以使造血前體轉化成白血病干細胞。

2.2.4 白血病和LIFR之間的相互作用關系

對Leukemia 和LIFR進行關聯分析,利用Chilibot分析PubMed的336篇文獻中的100條最新的摘要,得到7個相互作用句和41個平行句。通過人工分析這7個相互作用句,得到以下結論:LIFR是功能性LIF受體,LIF通過作用這個受體來抑制白血病細胞。

2.2.5 白血病和RUNX1之間的相互作用關系

對Leukemia 和RUNX1進行關聯分析,利用Chilibot分析PubMed的2083篇文獻中100個最新的摘要,得到25個相互作用句和34個平行句。通過人工分析這25個相互作用句,得到以下結論:RUNX1的突變會誘導白血病的發生,尤其是急性髓系細胞白血病(AML)。

從上述結論獲知,RUNX1主要針對AML起作用。于是利用Chilibot將AML和RUNX1關聯起來,分析PubMed的182篇文獻中100個最新的摘要,得到39個相互作用句和25個平行句。雖然只有182篇文獻,但是卻有39個相互作用句,說明二者關聯程度是很高的。通過人工分析這39個相互作用句得出結論:RUNX1對AML起促進作用(具體機制見結論部分)。

3 結論

通過以上分析,我們發現白血病與4種基因存在作用關系。

LIF(白血病抑制因子)對白血病具有抑制作用,LIFR是功能性LIF受體,LIF通過作用這個受體來抑制白血病細胞。

PML主要對急性早幼粒細胞白血病具有促進作用。15,17號染色體易位使得PML基因和RARα基因融合,從而使PML RARα 融合基因蛋白的表達增加。PML RARα是一種核受體轉錄抑制劑,所產生的蛋白干擾核受體信號和PML核質體的組裝,而抑制骨髓分化基因。骨髓細胞的分化停滯在早幼粒階段,從而早幼粒細胞的異常累積,促進了急性早幼粒細胞白血病的發生。

KMT2A(MLL1)位于11號染色體,對白血病的發生具有促進作用。由于染色體易位產生了MLL1融合蛋白,這是一種白血病的分子標志,是白血病發展過程中非常有力的腫瘤驅動器,可以使造血前體轉化成白血病干細胞。MLL1基因和髓樣淋巴細胞白血病以及嬰幼兒型白血病的產生有密切聯系。

RUNX1主要對急性髓系細胞白血病(AML)具有促進作用,RUNX1基因突變會破壞骨髓分化,從而導致AML。兩種主要的融合基因AME和AML1 ETO都是由于染色體易位產生的突變。其中AML1 ETO通過抑制和髓系分化有關的基因,增加無性系髓系祖細胞的replating能力,從而抑制髓系祖細胞分化。此外,那些認為能夠解除對造血祖細胞正常的分化和增值至關重要的基因的表達的限制,通過招募輔抑制物復合體到DNA上,導致AML。

猜你喜歡
關聯利用文本
利用min{a,b}的積分表示解決一類絕對值不等式
中等數學(2022年2期)2022-06-05 07:10:50
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
利用一半進行移多補少
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
利用數的分解來思考
Roommate is necessary when far away from home
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 色欲色欲久久综合网| 日韩av在线直播| 欧美第九页| 欧美一级高清片欧美国产欧美| 成人一级免费视频| 手机精品福利在线观看| 欧美日韩中文国产| 国产毛片高清一级国语 | 国产在线精品99一区不卡| 国产毛片片精品天天看视频| 2021国产精品自产拍在线| 久久人人97超碰人人澡爱香蕉| 99这里只有精品6| 久久香蕉国产线看精品| 亚洲一级毛片免费观看| 成人福利在线看| 久久福利片| 欧美国产中文| 性色在线视频精品| 97久久精品人人| 在线观看视频99| 久草网视频在线| 欧洲日本亚洲中文字幕| 毛片在线播放网址| 中文字幕亚洲电影| 久久黄色一级视频| 国产亚洲男人的天堂在线观看| 人妻精品久久无码区| 国产原创演绎剧情有字幕的| 午夜福利网址| 国产午夜在线观看视频| 天天综合天天综合| 亚洲精品动漫在线观看| 在线观看免费人成视频色快速| 午夜视频免费试看| 亚洲v日韩v欧美在线观看| 伊人查蕉在线观看国产精品| 99热最新网址| 91亚瑟视频| 毛片久久网站小视频| 69视频国产| 夜夜操国产| 国产精品亚洲а∨天堂免下载| 国产精品免费露脸视频| 91久久偷偷做嫩草影院精品| 欧美日韩亚洲综合在线观看| 国内精品久久人妻无码大片高| 亚洲人成人无码www| 97精品伊人久久大香线蕉| 日韩福利视频导航| 激情在线网| 亚洲色图在线观看| 国产va在线观看免费| 四虎影视8848永久精品| 91久久国产热精品免费| 黑人巨大精品欧美一区二区区| 国产一区三区二区中文在线| 国产成人一区在线播放| 国产在线观看第二页| 欧美精品不卡| 国产福利在线观看精品| 福利在线免费视频| av在线手机播放| 无遮挡国产高潮视频免费观看| 国产精品国产三级国产专业不| 亚洲国产成人在线| 成人字幕网视频在线观看| 久操中文在线| 国产精品福利尤物youwu| 国产成人一级| 欧美精品另类| 91免费国产在线观看尤物| 色老二精品视频在线观看| 亚洲看片网| 无码精品国产dvd在线观看9久| 亚洲中文字幕在线观看| 精品国产成人高清在线| 成人国产精品一级毛片天堂| 在线国产91| 国内精品伊人久久久久7777人| 这里只有精品在线播放| 国产精品永久不卡免费视频|