999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

生物數(shù)據(jù)可視化研究

2021-03-02 01:18:33紀兆華王春云高春紅于靜紅
關鍵詞:可視化

紀兆華 王春云 高春紅 于靜紅

【摘? 要】論文探討生物大數(shù)據(jù)可視化直觀展現(xiàn)測序數(shù)據(jù)、分子結構數(shù)據(jù)等多種生物學數(shù)據(jù)。數(shù)據(jù)可視化幫助生物大數(shù)據(jù)科學分析數(shù)據(jù)結果,如同時間或空間相關的信息等,通過計算機圖形學、統(tǒng)計學等技術轉變?yōu)楦又庇^生動的圖或表。計算機可視化操作能夠將抽象的信息進行直觀的分析并表示出來,有助于更好地理解數(shù)據(jù),增強認知數(shù)據(jù)。

【Abstract】This paper discusses the biological big data visualization and visual presentation of sequencing data, molecular structure data and other biological data. Data visualization helps biological big data analyze data results scientifically, such as information related to time or space, etc., which can be transformed into more intuitive and vivid graphs or tables through computer graphics, statistics and other technologies. Computer visualization can analyze and represent abstract information intuitively, which is helpful to better understand data and enhance cognitive data.

【關鍵詞】云計算技術;生物大數(shù)據(jù);可視化

【Keywords】cloud computing technology; biological big data; visualization

【中圖分類號】TP311.1;Q811.4? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻標志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章編號】1673-1069(2021)01-0193-02

1 引言

生物大數(shù)據(jù)中蘊含著生命起源、疾病健康和農(nóng)作物培育等重要信息,對生物大數(shù)據(jù)的高效準確解讀事關人類健康、糧食安全等重要問題。由于生物大數(shù)據(jù)有著類型復雜、結構異質、冗余性高和體積龐大等特點,科研人員需要借助數(shù)據(jù)可視化等方法才能理解其組成特征和內在聯(lián)系,進而更加快速和有針對性地從中挖掘出相關知識信息[1]。

2 生物學進入了大數(shù)據(jù)時代

隨著生物技術的不斷發(fā)展,海量數(shù)據(jù)信息正在得以飛速累計,生物學跨入大數(shù)據(jù)時代,以二代高通量測序為代表的各種新型實驗技術正在快速產(chǎn)生和累積出海量的數(shù)據(jù)集合,這些蘊藏著豐富知識信息的數(shù)據(jù)集合被稱為生物大數(shù)據(jù)。近年來,世界范圍內產(chǎn)生多個大型生物學大數(shù)據(jù)產(chǎn)出項目,如癌癥基因組圖譜計劃(TCGA)、千人基因組計劃等,這些數(shù)據(jù)存儲在歐洲生物信息學研究所(EBI)、美國國立生物技術信息中心(NCBI)等公共數(shù)據(jù)庫中,我國自主創(chuàng)辦的生命與健康大數(shù)據(jù)中心(BIGD)也已建成并對外提供服務[2]。

3 數(shù)據(jù)可視化有利于科學地展示數(shù)據(jù)分析的結果

數(shù)據(jù)可視化將具有大量數(shù)據(jù)的數(shù)據(jù)庫中的文本或者二進制數(shù)據(jù)的特征信息,如同時間或空間相關的信息等通過計算機圖形學、統(tǒng)計學等技術轉變?yōu)楦又庇^生動的圖或表,計算機可視化操作能夠將抽象的信息進行直觀的分析并表示出來,有助于更好地理解數(shù)據(jù),增強認知數(shù)據(jù),并挖掘出大量數(shù)據(jù)中蘊含的事務之間的規(guī)律或內在信息[3]。生物學大數(shù)據(jù)可視化分析的作用主要包括三個方面:幫助科研人員快速從體積龐大、缺乏組織脈絡的原始數(shù)據(jù)集中抽取出本質特征,為研究工作提供理論指引;抽取出生物學大數(shù)據(jù)中某一維度的特征,以圖形化的方式進行直觀展示和強調;可以有效地將生物學大數(shù)據(jù)進行解構,去除其中的冗余信息和背景噪音,得到更加具有科學意義的數(shù)據(jù)分析結果[4]。

4 基于云計算生物大數(shù)據(jù)可視化

4.1 云計算

隨著生物學大數(shù)據(jù)的不斷快速累積,國內外科研人員一直在尋找高效快速解決大數(shù)據(jù)問題的有效途徑,其中云計算技術是被廣泛認可的一種較為成熟的技術體系。云計算的常用服務模式包括“平臺即服務”(PaaS)、“軟件即服務”(SaaS)、“基礎設施即服務”(IaaS),這些服務模式的出現(xiàn)都旨在使用戶更加容易地獲取和使用到足夠的計算資源,同時免除自行維護計算機硬件的負擔。常用的云計算框架則包括了Hadoop、Spark等,通過將整體運算、存儲和數(shù)據(jù)傳輸負載均勻分配到計算機集群中的每個節(jié)點,達到了加速數(shù)據(jù)分析速度的目的,基于這些技術構建的應用程序在處理大數(shù)據(jù)時可以表現(xiàn)出優(yōu)異的性能。

云計算技術是計算機科學中為了解決大數(shù)據(jù)問題而提出的一套技術體系,在生物學大數(shù)據(jù)分析中也被多次證明其實用性和可行性。基于云計算技術可以構建生物學大數(shù)據(jù)可視化平臺,進行高效易用的大數(shù)據(jù)可視化分析,各可視化工具密切配合,共同協(xié)作完成生物學大數(shù)據(jù)可視化這一重要分析任務。

鑒于此,近年來先后出現(xiàn)了多個基于云計算技術的生物學大數(shù)據(jù)分析軟件,在相關文獻的評價測試中,這些軟件也取得了較為令人滿意的成績。隨著輸入數(shù)據(jù)集大小的增加,這些基于云計算技術開發(fā)的生物學分析軟件性能指標超過了傳統(tǒng)軟件乃至數(shù)倍。

4.2 傳統(tǒng)數(shù)據(jù)可視化軟件

常用的可視化工具通常采用一些專業(yè)工具如Tableau、DataV等,開發(fā)簡單并且不用開發(fā)代碼,具有較好的展示效果。傳統(tǒng)的數(shù)據(jù)可視化方案大多是針對規(guī)模較小的數(shù)據(jù)集進行設計和實現(xiàn),無法高效、直觀地展現(xiàn)出生物學大數(shù)據(jù)所蘊含的關鍵信息。這些軟件所存在的共有問題還包括了可定制程度低,只能在其提供的可視化樣式之中選擇。對于有更深層次定制化需求的用戶,使用基于R語言或者Python語言的可視化工具,如BioConductor(http://www.bioconductor.org/)和BioPython(http:// biopython.org/)等[5]。

4.3 基于云計算生物大數(shù)據(jù)可視化技術

近年來先后出現(xiàn)了多個基于云計算技術的生物學大數(shù)據(jù)分析軟件,隨著輸入數(shù)據(jù)集大小的增加,這些基于云計算技術開發(fā)的生物學分析軟件性能指標超過了傳統(tǒng)軟件乃至數(shù)倍。采Web技術和Web前端技術相互結合實現(xiàn),如常用的技術為Web技術、數(shù)據(jù)庫技術和前端技術,其特點是可定制能力強。Web的生物大數(shù)據(jù)挖掘,采用了云計算存儲和處理架構、分布式數(shù)據(jù)挖掘算法和大數(shù)據(jù)存儲、處理服務模式,易于使用基于Web的大數(shù)據(jù)挖掘技術構建基于Web的大數(shù)據(jù)分析環(huán)境[6]。

Hadoop和Spark技術是云計算領域中常用的數(shù)據(jù)分析技術,在生物大數(shù)據(jù)可視化工具的后端分析計算任務,通過盡量均勻地將分析任務計算負載和數(shù)據(jù)傳輸負載分散到計算機器中的每個節(jié)點,達到提高系統(tǒng)整體并行加速性能指標的目的。Hadoop是開源分布式計算框架,在大數(shù)據(jù)分析和半結構化數(shù)據(jù)集方便具有良好的存儲功能,其中HDFS提高了大數(shù)據(jù)文件的存取速率,MapReduce將大規(guī)模數(shù)據(jù)集切分成多個不同大小的數(shù)據(jù)分片map,執(zhí)行map任務,之后將結果通過hash分區(qū)分發(fā)到reduce任務的多個節(jié)點進行存儲。Spark為基于內存計算的大數(shù)據(jù)并行計算框架,可以處理實時的大數(shù)據(jù),在性能上比MapReduce高,有較強的容錯性和高可伸縮性。Spark與Hadoop結合,共享集群節(jié)點提供的資源,提高運行效率,速度快、通用性強[7]。

基于云計算技術的生物大數(shù)據(jù)可視化分析平臺可視化強、效率高。雖然目前在生物學大數(shù)據(jù)可視化的相關研究領域中,云計算技術缺乏成熟應用,但是許多通用型大數(shù)據(jù)可視化軟件已經(jīng)流行開來,如Highcharts(https://www.highcharts.com/)、D3(https://d3js.org/)和ZoomData(https://www.zoomdata.com/)等。這些軟件大多采用HTML5技術來實現(xiàn),有著交互性強、界面美觀、易于使用等特點,并且提供動態(tài)網(wǎng)頁作為輸出可視化結果選項,大大方便了軟件工具間的整合。基于HTML5的可視化技術,相比于傳統(tǒng)的靜態(tài)可視化展現(xiàn)方式,基于HTML5的可視化展現(xiàn)方式有著高交互性、界面更加美觀、易于和其他軟件工具相互結合和便于傳播分享等優(yōu)點。D3圖形可視化庫來完成項目設計的可視化展示,更加適應生物大數(shù)據(jù)可視化需求。采用云計算技術可以構建運行效率高、實用性強和可擴展性好的生物學大數(shù)據(jù)可視化平臺,科研人員通過該平臺可以直觀展現(xiàn)測序數(shù)據(jù)、分子結構數(shù)據(jù)、關系網(wǎng)絡數(shù)據(jù)等多種生物學數(shù)據(jù),為生物學和醫(yī)學等領域中的可視化問題提供基礎軟件設施[8]。

5 結語

生物大數(shù)據(jù)在處理流程上和傳統(tǒng)的生物數(shù)據(jù)處理流程沒有大的差異,關鍵在于生物大數(shù)據(jù)處理要分析大量非結構化數(shù)據(jù)。生物學數(shù)據(jù)可視化貫穿科研工作的各個階段,在實驗材料選擇、實驗方案設計、結果分析討論和論文發(fā)表等階段均起到不可替代的重要作用,生物學數(shù)據(jù)可視化軟件的運行效率、易用與否將直接決定了相關科研人員的工作效率。生物大數(shù)據(jù)規(guī)模大、維度高、非結構化,通過生物大數(shù)據(jù)可視化分析展現(xiàn)了數(shù)據(jù)實時場景及交互性能,更有利于理解數(shù)據(jù)及對相關數(shù)據(jù)時間、空間信息知識的展現(xiàn)。

【參考文獻】

【1】周琳,孔雷,趙方慶.生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[J].科學通報,2015,60(Z1):547-557.

【2】張廣旭.基于Spark的基因數(shù)據(jù)聚類分析及可視化[D].長沙:湖南大學,2017.

【3】傅耀威,賈燕紅,張軍,等.大數(shù)據(jù)可視分析發(fā)展現(xiàn)狀與趨勢[J].中國基礎科學,2019,21(04):53-58.

【4】楊立博.云計算技術發(fā)展分析及其應用探討[J].網(wǎng)絡安全技術與應用,2014(04):89+92.

【5】劉江濤,邢輝.淺析生物大數(shù)據(jù)可視化的現(xiàn)狀及挑戰(zhàn)[J].中國新通信,2016,18(02):152.

【6】王玉.大數(shù)據(jù)時代Hadoop和Spark技術研究[J].品牌研究,2020(04):88-90.

【7】檀照望.基于Spark的大數(shù)據(jù)處理可視化工具的設計和實現(xiàn)[D].北京:北京郵電大學,2017.

【8】李萬鋒.基于Java EE的數(shù)據(jù)可視化平臺設計及主要功能實現(xiàn)[D].北京:中國科學院大學(中國科學院工程管理與信息技術學院),2017.

猜你喜歡
可視化
無錫市“三項舉措”探索執(zhí)法可視化新路徑
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統(tǒng)
北京測繪(2022年6期)2022-08-01 09:19:06
三維可視化信息管理系統(tǒng)在選煤生產(chǎn)中的應用
選煤技術(2022年2期)2022-06-06 09:13:12
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統(tǒng)
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
可視化閱讀:新媒體語境下信息可視化新趨勢
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
主站蜘蛛池模板: 九九久久精品免费观看| 在线国产综合一区二区三区| 国产黄视频网站| 国产亚洲精久久久久久久91| 色首页AV在线| 成人在线天堂| 手机精品视频在线观看免费| 国产精品专区第一页在线观看| 91外围女在线观看| 国产一区二区网站| 婷婷亚洲最大| 国产欧美自拍视频| 欧美福利在线观看| 国产免费久久精品44| 情侣午夜国产在线一区无码| 香蕉色综合| 日韩乱码免费一区二区三区| 无码精品国产VA在线观看DVD| 九色视频在线免费观看| 国产中文一区二区苍井空| 九九免费观看全部免费视频| 亚洲视频在线观看免费视频| 色综合色国产热无码一| 久久久久久久蜜桃| 久久永久精品免费视频| 国产在线观看人成激情视频| 一本一道波多野结衣av黑人在线| 国产区成人精品视频| 国产综合在线观看视频| 国产在线98福利播放视频免费| 国产真实乱了在线播放| 国产成人午夜福利免费无码r| 青青草综合网| 久久精品视频一| 欧美国产精品不卡在线观看| www精品久久| 亚洲国产成人精品青青草原| 亚洲天堂精品视频| 久久久噜噜噜| 国产va视频| 高清亚洲欧美在线看| 国产综合精品日本亚洲777| 日韩a在线观看免费观看| 国产亚洲精品无码专| 亚洲综合九九| 精品少妇人妻一区二区| 国产欧美日韩在线一区| 国产网友愉拍精品视频| 综合久久五月天| 亚洲一区二区无码视频| 91av国产在线| 亚洲精品国产精品乱码不卞| 蜜臀AVWWW国产天堂| 秋霞一区二区三区| 在线网站18禁| 欧美精品综合视频一区二区| 中文字幕 91| 99久久精品国产麻豆婷婷| 国产精品美女免费视频大全| 国产成年无码AⅤ片在线| 亚亚洲乱码一二三四区| 最新国产精品鲁鲁免费视频| 成人欧美日韩| 欧美亚洲一区二区三区导航| 国产污视频在线观看| 久久性妇女精品免费| 91精品免费久久久| 国产美女丝袜高潮| 国产高清在线丝袜精品一区| 日本三区视频| 欧美一级高清片久久99| 亚洲精品福利视频| aⅴ免费在线观看| 亚洲成在线观看 | 国产成人精品一区二区免费看京| 精品视频在线观看你懂的一区| 五月天丁香婷婷综合久久| 97超级碰碰碰碰精品| 亚洲天堂区| 毛片久久网站小视频| 国产老女人精品免费视频| 成人免费网站在线观看|