廉士珍、胡博 朱言柱 王彧 劉海燕 張海玲 呂爽 閆喜軍
摘要:當前社會是一個信息數據時代,大數據處理以迅速性、準確性、真實性的特點在許多領域得以應用,在基因測序與重組領域中大數據處理更發揮出其特有的優勢,將復雜的基因工程產業化,使其產生龐大的經濟效益,本文以經濟類動物為例,論證大數據處理如何在基因測序、重組中的應用,將基因科學轉化為經濟效益。
關鍵詞:大數據處理,基因測序,基因重組,經濟效益
中圖分類號:S8-1 文獻標識碼:B 文章編號:2096-3637(2017)05-0023-02
現代社會處于信息快速流通、整合、及管理的進程中,信息逐步的數據化、精細化是其發展的必然趨勢,在這樣的時代背景下,“大數據”應運而生,大數據處理是將海量的數據信息進行收集、整合、計算、分析的過程,它將計算機數據分析與現有的物質數據結合起來,實現了互聯網與物聯網的完美融合。
1大數據處理概述
隨著網絡與信息的發展,對于世界的認識由宏觀到微觀,研究的重點也由自然轉化為社會信息,因此許多數據也逐漸產生,從而形成了“大數據”,這些數據已經不是傳統意義上的“數字”,大數據是動態的,結合各種信息不斷地發展,并在此基礎上進行創造性的發展。
大數據處理在現代社會中最常用的一種方式是云計算,云計算是利用網絡進行的一種可收縮的計算模型。云計算呈現出超大規模、成本低、虛擬化、通用性、高可靠性、高可伸縮性等的特點。云計算的載體可以分為3種軟件、平臺、基礎設施。因此其服務類型也可以相應的分為三類,軟件服務云計算、平臺服務云計算、基礎設施服務云計算。
2大數據處理特有的優點
全面提升數據處理效率。大數據處理將零散的數據整合起來,從全局入手,提高了數據處理的效率,并且這種效率的提升是跨越式的,以幾何技術的速度增長,大大提升了效率,節約了時間,并且解放出大量的人力,有助于行業產業化。
了解事物發展客觀規律。人們的認識是有限的,所做的決定常常被困于特定的時間與空間之內,大數據處理通過整合全面的、時間跨度長的信息,可以分析出最佳的問題解決策略。
創造經濟價值。大數據應用于各個行業中都可以創造巨大的商業價值,通過建立數據庫,整合行業所需信息,進行分析與數字性的轉化,建立起模型,當數據信息發生變化時,只需通過模型進行相應的變化即可。
3基因測序與基因重組
隨著生物技術的進步,人們對于基因的認識也越來越充分,并在認識的基礎長對基因有了更進一步的探索與改造。
基因是有遺傳作用的DNA片段,基因在根本上決定了生物體的基本性狀與生命信息,生命體的發展中不可避免的具有許多缺陷,現代科學家已經認識到,對基因進行測序與重組可以發現生命體的遺傳缺陷并對其進行改造。
基因測序是對基因進行重組的先決條件。基因測序通過分析測定基因的全部序列,來預測分析生命體的性狀表現,可能發生疾病的概率等,以精確地,根本性的手段解決生命體面臨的諸多疾病威脅。
1953年,沃森和克里克發現了DNA雙螺旋結構,之后遺傳中DNA的半保留復制也被進一步的發現,之后“中心法則”的發現與遺傳密碼子的破譯成功的為基因重組的發現與發展提供了基礎。DNA的重組技術在理論上可以在體外對DNA分子進行重新組合,之后將重組分子誘導人受體細胞,使其在細胞中進行繁殖,從而得到重組后DNA分子的大量復制,表達出相關的基因產物。DNA重組的意義重大,解決了自古以來生物鐘屬間不可跨越的障礙,縮短了漫長的進化時間,能夠定向進行基因改造,獲取優良性狀。
4大數據處理在基因工程中的應用
生物體的基因中隱藏著生物體遺傳的秘密,對生物體的形狀表現具有決定性的作用,但是基因數據庫龐大而復雜,并且隨著生物科技的發展,基因數據庫的規模仍在不斷地擴大,在諸多基因信息中篩選出對人類有用的基因序列是一項復雜的工程,另外對篩選出的基因進行多種信息的表達與控制也需要對諸多的基因信息進行分析,面對海量的基因庫數據,為更有效、更準確的進行分析需要應用大數據處理。
大數據處理可以將同一種屬的千萬個生物體的生理數據整合提煉,利用計算機技術及統計學原理,將生物體的性狀表現以圖譜的展現出來,進而結合數據進行基因的測序與重組的基礎分析。另外,大數據不僅包含基因信息,與形狀表現有關的生活環境、生活方式、飲食衛生等非基因信息也包含在大數據處理之中。
基因測序的經過了幾代的發展,借助大數據處理的幫助也逐漸趨向成熟。
基因重組。基因重組是有性生殖過程中,通過結合不同性狀的基因產生新的生物體基因的過程。目前,對生物體進行基因重組的最快速、便捷的方式即育種。當前,育種已經發展至第五代,其中,第一代,自發選種,其主要表現在人類生活的初期;第二代為雜交育種、誘變育種,通過將兩個或多個產品的優良基因結合起來,或是利用物理、化學因素誘導基因發生突變,第三代是分子標記輔助育種,其通過選定目的基因,改變目的性狀,不產生額外的影響,直接。迅速;第四代,基因組輔助育種;第五代,設計育種,通過預先設定表現性狀,通過基因測序來選定基因,改造成想要使其表現的性狀。因基因的改造需要對基因庫的全部信息進行分析,因此需要利用大數據的計算方式來進行處理。
以經濟型動物為例,如狐貍、貂等,其皮毛具有十分重要的商業價值,經濟價值高的皮毛要求皮毛順滑,毛色美觀、順滑,因此,通過對其基因庫的數據分析,選擇決定毛發的基因,其中,客戶對于毛色的需求較為分散,各種天然顏色的毛發都有其市場,因此對于狐貍、貂等動物的繁殖和育種可以朝向增加天然色彩方向發展。
動物皮毛的毛色表現受到了遺傳物質、環境、以及二者相互作用產生的影響,其體內的黑色素決定了毛色的變化,黑色素在體內含量以及分布情況的不同會使毛色產生不同的變化,黑色素分為兩種,真黑色素與褐黑色素,真黑色素表現性狀為棕褐色或者黑色,褐黑色素表現性狀為黃色或者紅棕色。黑色素的形成如下所示:
酪氨酸→多巴→多巴醌→多巴素→5,6-二羥基吲哚羧酸→5,6-二羥基吲哚→5,6吲哚醌
通過對基因的測序分析,科學家們發現哺乳動物毛色與150多個基因有關,經過數據處理分析,發現毛色與Agouti基因最為密切相關。Agouti基因作用于Agouti信號蛋白,使其通過拮抗黑素細胞刺激素α對黑素皮質手提進行刺激,從而控制真黑色素生物的合成,從而直接影響動物的毛發顏色。狐貍較為常見的毛色白色、紅色、褐色等都與Agoufi基因的表達與黑色素的分布密切相關。
以狐貍為例,通過對不同毛色的狐貍進行繁殖培育,對不同毛色的狐貍之間進行基因重組,在其后代的毛發顏色中選擇理想的毛色進行進一步的培育。最終使得毛色達到理想要求。
另外,在經濟型動物養殖過程中,動物的疾病情況也是影響其經濟價值的重要因素,在養殖過程中,一旦出現某種疾病,其后果往往是蔓延式的,會影響整個養殖場中的動物,因此,對于動物的疾病預防也是必要的。可以對利用大數據處理對養殖動物的基因庫進行針對性的分析,可以提前了解動物面臨著什么疾病威脅,進而做好預防。確保經濟效益不會因突發疾病而受損。
通過將基因庫與大數據處理技術結合起來,使基因庫能隨著數據的變更而進行的實時的更新,另外還可以在海量基因庫中提取有效的信息,這些信息具有針對性,幫助人們隨時投入使用。大數據處理對于基因芯片的建立也具有很好的參考性。總之,大數據處理將基因、分子、性狀表現、生物體種群結合起來,幫助人們從系統的生物學對生物體進行更加詳盡的了解與探索,幫助我們破解生物體的奧秘。
結語
基因組的數據復雜多樣,并且隨著生物技術的發展,生物體性狀的復雜性更加凸顯出來,數據庫也在相應的不斷的完善與發展,大數據處理在基因中的成功應用,為基因信息數據的采集與分析提供了新的思考方式與計算模型,可以幫助分析基因信息,并且與基因測序、重組等結合起來,以直觀的方式體現出基因所攜帶的遺傳信息的表現,并且根據人類的需求對某些物種的基因改造,從而保障利益的最大化,創造巨大的商業價值,并且能保障市場的需求并帶來巨大的市場效益。