999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用Weka挖掘白血病與基因的關系

2015-03-22 03:18:14,
中華醫學圖書情報雜志 2015年1期
關鍵詞:融合

,

白血病是造血干細胞功能異常的克隆性惡性疾病,是國內十大高發性惡性腫瘤之一。目前醫學界普遍認為白血病的發病機制與感染、放射、化學和遺傳等因素有關,但其確切病因至今尚未明確。近年來,有關基因與白血病關系的研究較熱,文獻也較多。本文利用Weka平臺挖掘文獻中白血病與基因的潛在關系。

1 研究工具

1.1 聚類挖掘平臺Weka

Weka平臺(Waikato Environment for Knowledge Analysis)的全名是懷卡托智能分析環境,是一個公開的數據挖掘工作平臺。它集合了大量能承擔數據挖掘任務的機器學習算法,包括對數據進行預處理、分類、回歸、聚類、關聯規則以及在新的交互式界面上的可視化,是現今最完備的數據挖掘工具之一。Weka的數據格式要求為ARFF(Attribute-Relation File Format)文件,這是一種ASCII文本文件,也是一種二維表格。Cobweb是Weka提供的聚類算法之一,是現在流行的一種簡單增量概念聚類算法。它用分類屬性-值對描述輸入對象,以一個分類樹的形式創建層次聚類[1]。

1.2 數據處理工具BICOMS

書目信息共現分析系統(Bliographic Item Co-Occurrence Mining System,BICOMS) 是文本挖掘的基礎工具,所生成的矩陣可以進一步應用于聚類分析和社會網絡分析等[2-3]。

2 研究步驟和結果

2.1 利用BICOMS抽取高頻詞、生成矩陣

以“leukemia [majr] AND genes [majr]”為檢索策略,檢索PubMed,得到4 069條文獻記錄,并將結果保存成xml文件。利用BICOMS抽取主要主題詞/副主題,設定出現頻次的閾值為100,即頻次大于100的42個詞為高頻詞。這些高頻詞出現9 662次,累計百分比為39.222%(9 662/24 634)。其中排名前10位的高頻詞見表1,出現頻次最高的為原癌基因(706次)。

表1 排名前10位的高頻詞及其出現頻次

再利用BICOMS生成高頻詞的共現矩陣(表2)和零一矩陣(即詞篇矩陣),以txt形式導出,并利用Excel將零一矩陣轉置(表3),再分別保存成Weka所需的csv格式文件。

表2 高頻詞共現矩陣(42行×42列)(部分)

表3 高頻詞詞篇矩陣轉置矩陣4069(行)×42(列)(部分)

2.2 采用Weka中聚類算法Cobweb實現聚類

打開Weka3.6.8,進入Explorer模塊,通過Preprocess的Open功能導入csv文件,以未監督的過濾器NumberToNomal過濾數據,然后保存成ARFF文件以用于聚類分析。

選擇Weka提供的聚類算法Cobweb,根據研究需要設置不同參數,對比聚類結果,選擇聚類結果最優時的參數設置為Weka.clusters.Cobweb -A 1.0 -C 0.0028209479177387815 -S 42,聚類模型選擇use training set,選擇store clusters for visualization以保存聚類結果用于可視化。運行后得到的聚類樹結果如圖1所示。

圖1 聚類樹結果

2.3 對聚類結果進行優化

Cobweb共進行了7次聚合,5次剪切,形成一棵節點數為12、葉子數(即主題詞數)為42的聚類樹。分析得出各葉子節點,具體數據見表4。

表4 高頻詞的Cobweb聚類結果

注:此結果是經過加工優化的結果

3 分析和討論

3.1 聚類效果分析

本文的目的是試圖找出各類白血病與各個基因之間的關系,因此理想的聚類結果是每類中都有白血病高頻詞和相關基因,且越多越好。從表5可見,第1,2,4,5類中沒有白血病或基因高頻詞,聚類效果較差;其余類既有白血病相關高頻詞,也有基因相關高頻詞,聚類效果較好。

表5 各類聚類效果比較

注:染色體和泛指的基因名詞也算基因;聚類率=(白血病數+基因數)/該類總葉子樹,且越大越好

聚類結果較差的原因有三:一是高頻詞中存在非白血病相關主題詞或基因相關主題詞,二是因Cobweb把所有高頻詞看作要聚類的屬性而不能百分之百地將基因和白血病聚在一起,三是數據存在局限性。本文使用的42個高頻詞中,白血病數與基因數分布不均,白血病數(11)小于基因數(15)。

3.2 基因關系研究分析

根據聚類結果,查閱并分析每類,即聚類效果較好的第3,6,7類文獻,得出白血病與基因關系的研究熱點和方向,總結如下。

第3類聚類結果表明B淋巴細胞白血病和骨髓增生異常綜合癥與免疫球蛋白基因和癌基因融合及表達相關。Yone J等[4]發現,bcl-2基因第五側翼區是免疫球蛋白基因重排的一個端點集中區。與14號染色體長臂第32個基因和18號染色體長臂第21個基因易位影響bcl-2基因第三區域相比,bcl-2基因第五區域不僅能融合重鏈基因,也能融合兩條輕鏈基因位點。他們克隆并測定了11條B淋巴細胞腫瘤中的bcl-2基因第五側翼區與免疫球蛋白的融合鏈,這些腫瘤細胞由長距離聚合酶鏈式反應聚合而來。bcl-2基因第五區域與免疫球蛋白融合基因的異構解剖激活bcl-2基因。特異性癌基因-免疫球蛋白基因重組的形成機制與14號染色體和18號染色體易位不同。

第6類聚類結果表明實驗性白血病、成人T細胞白血病和成紅細胞細胞白血病與病毒基因、abl基因和bcr-abl融合蛋白及其轉錄相關。Kamihire S等[5]將人類T細胞白血病病毒整合成人T細胞白血病細胞基因組DNA,發現Ⅰ型人類T細胞白血病病毒是成人T細胞白血病的病原體,且白血病細胞總是攜帶前病毒基因組,以單克隆的方式與宿主基因組同一序列位點整合,稱為單克隆整合。部分前病毒基因組缺失最先出現在gag區域,然后擴散到pol和env區域,而且長末端重復和pX區域幾乎總是守恒的。前病毒狀態的分析可提供有用的診斷和病毒學—腫瘤學信息,包括成人T細胞白血病和Ⅰ型人類T細胞白血病病毒的病理學,尤其是pX基因在腫瘤形成中重要作用的信息。

第7類結果表明淋巴瘤與人類第11號染色體、原癌基因和ras基因突變及表達相關。自然殺傷細胞腫瘤是一種很罕見的疾病,已經報道的常見異常腫瘤抑制基因有Rb,p53,p15INK4B和p14ARF。Sugimoto KJ等[6]用DNA印記法、聚合酶鏈式反應單核苷酸多態性檢測法、蛋白質印跡法和免疫組織化學著色法分析N-ras,K-ras,H-ras,c-myc,n-myc和mdm2等癌基因的狀態,發現ras基因家族沒有發生點突變,c-myc和N-myc沒有發生突變,c-myc蛋白沒有過度表達,但mdm2蛋白在一部分案例中表達度很高,且mdm2蛋白的過度表達與p14ARF,p53和Rb基因不相關。最后得出結論:mdm2的過度表達可能與自然殺傷細胞腫瘤有關,尤其是有攻擊性的子類。

4 結論

本文利用Weka軟件平臺對PubMed數據庫中的白血病與基因相關數據進行Cobweb聚類挖掘分析,得出白血病在基因方面的3個研究熱點。根據癌癥基因組圖譜研究網(The Cancer Genome Atlas Research Network)發表于國際權威雜志NEJM 2013年5月30日在線版上的成果[7],9種基因與白血病有關。

它們分別是轉錄融合基因、編碼核仁磷蛋白的基因(npm1)、腫瘤抑制基因、DNA甲基化相關基因、信號轉導基因、染色質修飾基因、黏連蛋白復合物基因、隨性轉錄因子基因和剪接體復合物基因。本文得出的白血病研究相關熱點基因均在其列。

猜你喜歡
融合
一次函數“四融合”
兩個壓縮體融合為一個壓縮體的充分必要條件
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
寬窄融合便攜箱TPFS500
寬窄融合便攜箱IPFS500
從創新出發,與高考數列相遇、融合
寬窄融合便攜箱IPFS500
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
“四心融合”架起頤養“幸福橋”
福利中國(2015年4期)2015-01-03 08:03:38
主站蜘蛛池模板: 国产精品自拍合集| 欧美区在线播放| 999国产精品永久免费视频精品久久 | 国产人碰人摸人爱免费视频| 九九免费观看全部免费视频| 欧美色丁香| 无码一区二区三区视频在线播放| 中文字幕无线码一区| 性色生活片在线观看| 国产人人射| 中文字幕在线看| 久久久久亚洲AV成人人电影软件| 午夜精品一区二区蜜桃| 热99精品视频| 欧美亚洲欧美区| 亚洲a免费| 亚洲成人www| 亚洲三级视频在线观看| 影音先锋丝袜制服| 国产精品va| 亚欧成人无码AV在线播放| 欧美另类第一页| 国产大片喷水在线在线视频| 国产超碰一区二区三区| 99久久性生片| 日韩免费毛片视频| 国产精品综合久久久| 99视频免费观看| 色网在线视频| 国产剧情国内精品原创| 青青草一区| 高清国产在线| 久久精品国产91久久综合麻豆自制| 九月婷婷亚洲综合在线| 国产成人av大片在线播放| 中国特黄美女一级视频| 色网站免费在线观看| 国产乱子伦手机在线| 青青草欧美| 欧美在线国产| 欧美在线伊人| 波多野结衣一区二区三区88| 精品欧美一区二区三区在线| 在线色国产| 第一页亚洲| 亚洲av无码成人专区| 91视频首页| 国产97公开成人免费视频| 99精品免费在线| 国产精品成人AⅤ在线一二三四| 亚洲日韩每日更新| 亚洲综合极品香蕉久久网| 一级一级特黄女人精品毛片| 国产精品亚洲一区二区三区在线观看| 四虎免费视频网站| 欧美天天干| 91色在线观看| 播五月综合| 露脸国产精品自产在线播| 一区二区三区精品视频在线观看| 日本亚洲国产一区二区三区| 蜜桃视频一区| 一本大道无码日韩精品影视| 欧美区一区| 日韩国产欧美精品在线| 国产亚洲欧美在线视频| 国产欧美视频综合二区| 91福利免费| 538精品在线观看| 欧美亚洲激情| 欧美日韩激情| 日韩国产黄色网站| a毛片在线免费观看| 99热这里只有精品在线观看| A级全黄试看30分钟小视频| 国产在线高清一级毛片| 色婷婷在线影院| 国产成人高清精品免费软件| 精品国产女同疯狂摩擦2| 成年人国产视频| 激情乱人伦| 国产91特黄特色A级毛片|