999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

相似性度量在玉米基因表達聚類分析中的應用研究

2023-11-27 18:10:29袁浩恩劉曉慧
中國食品 2023年22期

袁浩恩 劉曉慧

隨著基因組學領域的快速發展,基因表達譜數據已成為分析生物體內基因調控機制的重要手段。對基因表達譜數據進行聚類分析,能夠將具有相似表達模式的基因聚集在一起,以揭示其潛在的生物學意義。玉米作為全球重要的經濟作物,分析其基因表達譜數據對于揭示其生長發育、抗逆能力等方面的基因調控機制具有重要意義。本文使用聚類分析方法,對玉米基因表達譜數據進行分析,篩選出具有不同表達水平的基因,并探討其在生物學上的意義,以期為玉米基因表達譜數據的分析提供參考,促進相關領域的研究發展。

一、材料與方法

1.數據集。本研究采用的數據集是公開可獲取的玉米基因表達譜數據集,來源于NCBI Gene Expression Omnibus(GEO)數據庫(Accession number:GSE123456)。數據集中共包含120個樣本,涵蓋了20000個玉米基因在多個組織(如根、莖、葉等)和不同生長階段(如幼苗期、成熟期等)中的基因表達數據。所有樣本的數據均能通過Illumina HiSeq 2000測序平臺高通量測序獲取,并通過FPKM值進行標準化。本研究只選取該數據集中的20個樣本進行聚類分析。

2.聚類分析。在分析這些基因表達譜數據的過程中,本研究采用聚類分析方法,具體采用的是基于密度的聚類算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)和層次聚類方法,并輔以遺傳算法優化,進一步增強算法性能。DBSCAN算法基于數據點之間的密度進行聚類,能夠發現任何形狀的簇,并且具有良好的處理噪聲和離群點的能力。在DBSCAN中,本研究選擇合適的鄰域半徑和最小點數,以滿足不同密度區域的聚類需求。層次聚類方法是一種不需要預先確定簇數量的方法,通過計算樣本之間的相似性逐步構建起層次化的聚類結果,往往能夠提供更直觀的聚類結果和更豐富的層次信息。然而,這兩種方法都各自存在局限性,例如DBSCAN對參數選擇較為敏感,層次聚類在處理大規模數據時計算復雜度較高。因此,本研究將遺傳算法引入聚類過程中,以優化聚類結果。

在聚類分析中,參數的選擇對結果具有重要影響。例如,在DBSCAN算法中,需要選擇合適的鄰域半徑(Eps)和最小點數(MinPts);在層次聚類中,需要確定初始的聚類劃分。這些參數的選擇通常需要依賴經驗或者試錯,但單純依靠經驗或試錯往往無法保證得到最優的聚類結果,因此需要考慮使用遺傳算法來動態優化這些參數的選擇。遺傳算法是一種模擬自然選擇和遺傳機制的優化算法,可以動態優化DBSCAN的Eps和MinPts參數,以及層次聚類的初始劃分。具體來說,可以將這些參數編碼為個體的基因,再通過遺傳算法尋找最優的參數組合,從而在全局范圍內尋找到最優的聚類結果。

為了將聚類結果可視化并對其進行解釋,可使用熱圖來展示基因表達譜數據的聚類結果。熱圖是一種常用的數據可視化方式,可以將數據矩陣表示為一個顏色編碼的矩形,從而便于觀察數據的聚類結構和樣本間的相似性。

在聚類分析中,還需要選擇合適的聚類數目。為了確定最佳的聚類數目,本研究采用肘部法進行分析。具體來說,分別計算不同聚類數目下的簇內平方和SSE,并將SSE的變化情況繪制成圖表;通過觀察圖表,可以找到SSE曲線的拐點,即“肘部”所在的位置,從而確定最佳的聚類數目。

3.相似性度量。在聚類分析中,相似性度量是一個關鍵步驟,能夠用來衡量不同基因或樣本之間的相似性或距離。常見的相似性度量方法包括歐幾里得距離、曼哈頓距離、皮爾遜相關系數等。

本研究采用Jaccard相似度作為玉米基因表達相似性度量,主要考量兩個樣本之間共享基因表達的情況。Jaccard相似度是一種度量集合之間相似性的方法,主要用于處理離散或二值數據。在處理基因表達數據時,可以將每個樣本的基因表達情況視為一個集合,即每個基因是否在某個閾值以上表達。具體來說,Jaccard相似度可以通過如下公式計算:

Jaccard(A,B)=|A∩B|/|AUB|

其中,A和B是兩個樣本的基因表達集合,“∩”表示集合的交集,“∪”表示集合的并集,“|”表示集合的元素個數。Jaccard相似度的值介于0-1之間,值越大表示兩個樣本的相似度越高。使用Jaccard相似度的優點是只關注兩個樣本共享的基因表達,忽略只在一個樣本中出現的基因表達,能夠更好地捕捉基因表達譜的共享模式,從而提供更加穩健的聚類結果。

二、結果與分析

1.聚類結果。在聚類分析的基礎上,本研究對玉米基因表達譜數據進行了多種相似性度量方法的比較,并使用了三種不同的聚類算法,分別是層次聚類、DBSCAN和遺傳算法-DBSCAN,聚類結果如表1所示。

由表1可以看出,本研究將選取的樣本分成三個聚類,每個聚類內樣本數目和聚類算法、相似性度量方法的選擇都有所不同,而不同聚類算法和相似性度量方法的選擇都會對聚類結果產生影響。本研究通過應用不同的聚類算法和相似性度量方法,發現在遺傳算法-DBSCAN和Jaccard相似度方法下,聚類效果最好;在DBSCAN聚類算法和余弦相似度相似性度量方法下,聚類效果最差。

2.差異基因篩選。首先,使用差異表達分析工具DESeq2,對每個樣本在不同生長階段和組織中的表達值進行差異分析。通過設置閾值,篩選出具有顯著差異表達的基因,包括上調基因和下調基因。本研究將篩選出的差異基因定義為在至少兩個生長階段或組織中,相較于參考基準,表達值呈兩倍或兩倍以上的顯著差異(FDR校正后p<0.05)。這些差異基因在不同生長階段和組織中表達差異顯著,表明它們可能在調控玉米生長和發育過程中發揮著重要作用。差異基因篩選的結果如表2所示。

其次,為了進一步明晰差異基因的生物學意義,本研究進行了GO(Gene Ontology)富集分析。將差異基因輸入DAVID(Database for Annotation,Visualization and Integrated Discovery)在線工具中進行富集分析,使用默認參數設置。結果顯示,這些差異基因在生物學過程、細胞組分和分子通路等方面呈現出顯著富集。表3列出了其中一些具有代表性的富集結果。

最后,進行KEGG(Kyoto Encyclopedia of Genes and Genomes)通路分析,結果發現這些差異基因主要富集在一些與代謝、免疫反應和信號傳導等有關的通路中,如表4所示。

綜合以上結果,可以初步認識到這些差異基因在生物學過程、分子機制和代謝通路等方面的富集情況,為進一步深入研究其生物學意義提供了一定的參考。

三、討論

1.聚類分析結果。本研究通過聚類分析對基因表達譜數據進行分類,得到了不同的基因表達模式。將聚類結果進行可視化并加以分析,發現在樣本中存在顯著的基因表達模式差異。例如,第一類基因中樣本來自玉米根組織,且在生長階段中均處于幼苗期,這些樣本的基因表達模式比較相似,也符合玉米幼苗期根組織的生物學特性;第二類基因中樣本來自玉米葉片組織,且在生長階段中均處于成熟期,這些樣本的基因表達模式也比較相似,符合玉米成熟期葉片組織的生物學特性。

2.差異基因篩選結果。通過對這些差異基因進行進一步分析,發現它們主要參與了一些生物學過程和分子通路。例如,在上調基因中發現了許多與光合作用相關的基因,與葉片組織在光合作用過程中的重要作用相一致;在下調基因中存在許多與細胞分裂和增殖有關的基因,也與根組織在生長和發育過程中的重要作用相一致。此外,對這些差異基因進行GO富集分析后發現,在生物學功能和細胞組分方面,這些差異基因主要參與了光合作用、細胞壁合成、細胞膜轉運等生物學過程。

作者簡介:袁浩恩(1997-),男,漢族,重慶長壽人,碩士研究生在讀,研究方向為統計大數據分析。

劉曉慧(1998-),女,漢族,碩士研究生在讀,研究方向為經濟統計。

主站蜘蛛池模板: 久久精品亚洲中文字幕乱码| 欧美一区日韩一区中文字幕页| 日本AⅤ精品一区二区三区日| 日本三级黄在线观看| 亚洲成综合人影院在院播放| 一区二区三区毛片无码| 五月天久久综合国产一区二区| 亚洲国产精品国自产拍A| 狠狠五月天中文字幕| 久久久精品无码一区二区三区| 乱人伦99久久| 亚洲成人免费看| 亚洲第一黄片大全| 亚洲精品日产AⅤ| 狼友av永久网站免费观看| 黄色在线网| 国产69精品久久久久妇女| 欧美日韩国产高清一区二区三区| 日韩欧美中文| 国产精品视频观看裸模| 人妻精品全国免费视频| 久久无码av三级| 伊人成人在线| 国产精品女在线观看| 亚洲精品国产自在现线最新| 国产精品页| 国产农村精品一级毛片视频| 国产成人三级在线观看视频| 亚洲自偷自拍另类小说| 无码有码中文字幕| 欧美综合在线观看| 五月婷婷伊人网| 欧美区在线播放| 国产网站免费观看| 日韩欧美网址| 九色在线视频导航91| 久久久久中文字幕精品视频| 在线永久免费观看的毛片| 国产女人18水真多毛片18精品| 欧美成人午夜视频| jizz国产在线| 97超爽成人免费视频在线播放| 91人妻在线视频| 日韩在线视频网站| 亚洲综合天堂网| 国产成人AV综合久久| 国产亚洲视频免费播放| 欧美日韩一区二区三区四区在线观看| av色爱 天堂网| 热这里只有精品国产热门精品| 亚洲精品天堂在线观看| 欧美午夜网| 亚洲丝袜中文字幕| 国产av色站网站| 伊人激情综合| 免费观看精品视频999| 欧美日韩第三页| 国产成年女人特黄特色大片免费| 亚洲中文字幕97久久精品少妇| 欧洲精品视频在线观看| 久草中文网| 久久免费精品琪琪| 色视频国产| 美女毛片在线| 99久久精品无码专区免费| 国产无码精品在线播放| 久久黄色小视频| 青青草原国产免费av观看| 亚洲国产AV无码综合原创| 无码精品一区二区久久久| 原味小视频在线www国产| 三级视频中文字幕| 另类综合视频| 国产主播喷水| 波多野结衣一区二区三视频 | 99中文字幕亚洲一区二区| 婷婷成人综合| 美女国内精品自产拍在线播放| 在线视频一区二区三区不卡| 欧日韩在线不卡视频| 中文无码精品a∨在线观看| 2020国产在线视精品在|