拜文睿
(尚德中學 陜西 渭南 714000)
引言:生物信息學,顧名思義,它是生命科學和計算機科學兩門學科的結合,是21世紀自然科學的核心領域之一。生物信息學是以生物學為基礎,而信息學,為生物學科的發展提供了強有力的工具,亦或是一種思考角度,來揭示生物學的奧秘,幫助人們更好的理解生命世界。生物信息學的核心是解決生物學問題,其研究對象可以簡單地描述為生物大分子的序列,結構和功能,當然還有它們之間的相互關系。
生物信息學是一門交叉學科,要學好生物信息學,除了要有較好的生物學知識儲備外,還需要有應用數學的基礎知識以及信息學素養和較強的計算機操作能力。
生物信息學中的研究工具是計算機。首先,從自然界中收集和篩選生物信息,然后進行數據處理(編輯,分類,管理和展示),最后利用處理結果對生物信息進行分析(計算、模擬),作出相關預測。
人類的科學活動,很大程度上是做認知。認知世界,認知自己。世界發展的盡頭是人,一切都為人服務,向人靠近。比如:人工智能。近些年,人工智能熱帶給我們更多的思考和革新,雖然已有很大突破,但仍有較大的發展空間。在人工智能領域中,計算機科學,量子計算科學和生物學發展最快。
從本質上講,人工智能是為了創造與人類相同的智慧并模擬人類的思維。計算機科學領域雖然做出了一些結果,但是現代計算結構體系存在一些固有限制。量子計算有望為當前計算機科學方向的人工智能注入強有力的計算能力,希望能有較大的突破和發展。要模擬人的智能,為什么不模擬人類大腦呢?生命科學領域也是一個發展變化極快的領域,生命科學是距離人類大腦最近的領域,當然也是一個充滿挑戰的領域。
人類的遺傳信息是由DNA序列編碼的,通過DNA測序后,我們可以得到大量的序列數據,這些序列到底編碼了多少信息?人這一生中多少生命活動都由它來決定?為什么同樣都是人,但是人和人之間的差別有大有小?人類有DNA序列,那么世界上的其他生命呢?不同物種之間DNA序列的差異是什么?
DNA序列編碼遺傳信息,蛋白質執行生命功能,基因作為它們之間的通信單元存在。從信息存儲到信息表達再到功能執行,這個過程充滿著生命活動。一個基因和一個蛋白質是什么關系?我們能否用一定的“生命零件”構建一個類生命的系統?
20世紀后期,以DNA測序為代表的現代分子生命科學與醫藥技術迅猛發展,生物醫學數據資源快速積累,極大的豐富了人們對生命本質的認識,并快速推動新的分子生物技術和新式探測技術的開發和應用。
1995年,美國在人類基因組計劃第一個五年總結報告中,給了生物信息學一個較為完整的定義:生物信息學是一門交叉科學,它包含生物科學領域的信息獲取、加工、存儲、分析、解釋等在內的所有方面,綜合運用數學、計算機科學、生命科學技術理論和工具,闡明高通量生物數據的所包含的生物學意義。
21世紀的到來,使得一切都進入了信息時代,互聯網的發展,移動端的普及,在各個領域中,數據無時無刻不在產生,所以,我們又迎來了大數據時代。作為信息的載體,數據也是信息時代最具價值的資源之一。在生命科學領域中,大數據便指的是龐大的序列數據,顯微鏡圖片以及質譜數據,研究依靠數據,對數據收集,整理,注釋,分析。
自2010年以來,新一代測序技術經歷了以“邊合成邊測速”為基本原理的第二代測序技術和以“單分子測序”為典型特征的第三代測序技術,測序類別涵蓋基因組、轉錄組、表觀組等多層面的數據信息,大量非編碼基因、DNA細微變化、全局性的表觀遺傳學信息分布得到識別和鑒定。新一代測序技術,使得之前基礎性難題的解決成為可能,像基因組組織形式、以RNA結構和功能為代表的細胞組織實現、基因組罕見變異對疾病和表型形成的影響等,將原來難以鑒定的大量非編碼基因、RNA剪切方式、罕見多肽位點、甲基化圖譜、蛋白質和核酸互作等功能基因組信息展現出來。除此之外,新一代測序技術還直接推動了基因組、轉錄組等研究技術手段運用到臨床診斷、生物制藥、動植物育種等現代高新技術產業,顯然,新一代從測序技術的發展在疾病診療、藥物研發、經濟動植物開發等各個方面都將產生巨大的經濟和社會價值。
組學概念是參照基因組概念,針對不同層面的生物大分子數據的產生而演化來的詞匯,主要用來描述高通量分子生物數據資源。作為一門新興的交叉學科,生物信息學的一個重要研究對象就是組學數據,同時研究成千上萬個基因、蛋白質等大分子集合的生物特性和潛在的關聯性。類比于生物學的中心法則,生物信息學對于組學研究的中心法則可以概括為:基因組->轉錄組->蛋白質組->功能組學,這一規則也從多個層面闡述了生物信息學與各組學之間,及組學與組學之間的相互關系。
據報道,據報道,21世紀的醫學將完成從組織病理學研究模型到分子醫學(分子生物學,分子細胞學,分子藥理學)模型的過渡。疾病發生和發展的過程是一個多基因,多步驟,復雜的生物過程。如果僅選擇根據病理類型,臨床分析和臨床特征(如患者年齡和行為狀況)進行治療,通常是不滿足個性化診斷和治療的要求,并且治療效果不是很顯著。而以生物信息學為主導的基因組、轉錄組、蛋白質組學等生物醫學大數據技術的開發和資源累積,最終將促使復雜疾病的研究和診療、新興藥物的開發和產業化過程,逐漸從局限于病房、藥房,進入到生物信息學、醫學、藥學相結合的實驗室數字化模擬過程。基于生物醫學大數據開發的新生物信息學技術和新成果,也將因其科學性、可靠性,很快將離開實驗室而進入到轉化實施階段,對患者的治療,愈后提供有力的保障,進而發揮其巨大的社會價值。