文/郭林忠(杭州睿笛生物科技有限公司)
在現代科技時代背景下,海量數據爆發式增長使得信息技術的發展面臨巨大的挑戰,如海量數據存儲、海量數據分析等帶來的能耗、效能挑戰等,要求信息技術尋找新的發展契機與方向,才能滿足于科技時代創新發展對信息技術的具體要求。結合生物技術的啟發,從生物結構中探尋信息技術創新發展方案,已經成為當前國際研究的重要方向之一[1]。DNA數據存儲和神經形態計算,作為新興研究領域,是具有廣闊發展前景的代表性方向。鑒于此,基于信息技術創新發展及應用范圍拓展角度考慮,本文深入分析“生物技術與信息技術的融合發展”具有一定現實意義。
進入到智能化和大數據時代,生物技術與信息技術的融合發展已經是必然趨勢,當前,一些國家在“精準醫學計劃”“半導體合成生物學”等計劃領域中,開始廣泛使用信息技術手段,并進行了重點布局,這些都是生物技術和信息技術融合發展的重要舉措,并促進了生命科學解決方案的開發,并催生了西寧西技術大數據存儲和分析的需求。另外,在市場經濟不斷發展中,各實力強大的信息技術企業紛紛順應市場發展潮流,積極與生物技術企業建立長期戰略合作關系,如微軟、谷歌等大型信息技術企業,都與實力一絕的生物技術企業建立了戰略合作關系;再比如,作為半導體設備領域的龍頭企業,泛林公司在合成生物學研究等方面進行了戰略布局,旨在實現創新性發展來適應時代發展需求,繼而為企業的持續發展保駕護航[2-3]。
生物技術與信息技術的融合發展催生了大量新興布局項目,如人體微生物組計劃、腦科學計劃,且可以促進人工智能、健康等新興項目的布局。尤其是生命組學與半導體領域的相融合發展,更是促進了生物電子細胞等的進一步發展,其與通信、互聯網領域的融合發展,可以促進人機交互和遠程醫療的進一步發展[4-5]。另外,信息技術與腦科學領域的融合發展,可促進計算神經科學、3D生物學等領域的進一步發展。由此可見,生物技術與信息技術的融合發展將會促進大量新興項目的出現,對新型布局空間的優化起到了積極的促進作用[3]。
近年來,基于生物技術的信息技術發展取得了階段性的成績,其中,DNA存儲已經成為全球研究的重點和熱點。DNA存儲技術以人工合成的脫氧核苷酸鏈為存儲介質,以此實現文檔、音頻等信息的存儲與讀取,具體而言,基于A、T、C、G4種堿基對應二進制進行數據編碼,使得數據可以通過脫氧核苷酸鏈形式合成DNA分子進行存儲[6-7]。DNA數據存儲方式相比傳統數據存儲方式,具有顯著優勢,如低能耗、安全穩定性高、存儲密度大等,在未來可以發展成滿足海量數據爆發式增長的存儲需求的創新型技術。但當前的DNA存儲技術發展與應用,仍然面臨諸多挑戰,要求專業領域的科學家從以下幾個方面進行研究,才能為DNA存儲技術的發展與應用夯實基礎。
(1)優化和完善生物技術。在DNA存儲中,考慮存儲操作的便捷性和成本,要求深入研究操作簡便的DNA合成及測序技術,繼而才能整體降低DNA存儲成本,這既是現代分子生物學中研究的重要技術方向之一,又是降低基于生物技術的DNA存儲成本的重要舉措,可以為DNA存儲技術的發展創造更大的空間[8-9]。
(2)編解碼方式與糾錯機制。編碼方案的優化和完善,充分利用DNA存儲空間,減少數據冗余及誤差。編碼方案在DNA存儲研究中已經形成成熟體系,四進制轉換模型已經發展成為DNA存儲的主流轉換模型,但現有的存儲方案的儲存密度,仍然需要通過模型建立來進行優化和提高,才能滿足于海量數據爆發式增長的存儲需求。另外,考慮到DNA的人工合成無法應用在活細胞中酶的校正機制,合成、擴增等環節的校正方案研究,也是重點研究方向之一,在此領域Blawat等嘗試采取前向糾錯技術方式進行校正,可以大幅度提升DNA存儲數據讀取的準確性。
(3)隨機存取。早在2016年華盛頓大學與微軟公司共同研究的DNA存儲,已經實現了內容重寫、隨機訪問等功能,具體是通過聚合酶鏈式反應實現了字符串副本的精準復制,極大地提升了字符讀取速度,但相比傳統磁介質存儲讀取速度,仍然具有較大的提升空間。因此,接近于傳統存儲方式的隨時讀取與寫入功能,仍然是DNA存儲技術發展研究的重點方向之一。
以“神經形態”為核心的類腦芯片,指的是仿照大腦結構中神經元(計算)和突觸(存儲)單元集于一體,能夠根據傳遞的信號強弱進行相應的調整,并在此過程中,既可以確保信息傳遞效率,又可以實現數據并行、分布式處理,且整個過程的能源消耗是極低的。在類腦芯片中,憶阻器作為模仿大腦神經元功能的關鍵電子器件,伴隨此電子器件研究開發的成功及推廣應用,使得神經網絡芯片研究取得突破性的進展。另外,輔以類腦計算方法的深層次研究與應用,實現神經擬態,在攻克傳統計算范式局限性的基礎上,形成了傳“自主認知”的新范式,使得計算機整體性能得以優化和增強。
現階段,我國圍繞類腦研究已經成立了多個研究中心,參與單位眾多,具體有浙江大學、清華大學等,并已經取得了多項技術成果。以“天機”系列類腦芯片為例,由清華大學團隊研究開發,既實現了大規模神經元網絡模擬,又支持脈沖神經網絡算法和人工神經網絡算法。另外,清華大學團隊并在原有網絡算法的基礎上,建立了卷積神經網絡新算法。由此可見,現階段,類腦芯片技術的研究已經取得了重大進展,但距離大規模應用還要解決諸多問題,才能確保類腦芯片技術應用效果,具體包括以下幾點:
(1)處理能力有待提高。類腦芯片雖然能夠滿足智能算法的實用性需求,但任務性處理能力仍然具有較大的提升空間[10]。與之相匹配的架構、算法和模型等,都處于初期研發階段,需要基于計算要求進一步提煉神經網絡處理中的共性運算特性,以此發展類腦神經元計算模型,以此增強神經計算電路模塊的任務處理能力的同時,提高模塊的通用性,為大規模應用類腦芯片提供支持。
(2)硅晶片工藝成本有待降低。當前,類腦芯片材料主要以硅晶片電路為基礎實現神經元模擬,但硅晶片工藝生產成本過高,導致類腦芯片大規模應用存在成本限制。針對這種情況,要實現類腦芯片的大規模使用,則要積極尋找可以替代硅晶片,且與生物神經系統相似的材料,以此設計出高性價比的類神經計算芯片,才能降低類腦芯片大規模使用的成本。
(3)在類腦芯片設計中,單純地借鑒了腦信息處理中諸如神經元連接、脈沖放電機制等最基本的單元和機制,但對于相對復雜的信息處理單元的作用機制,如神經微環路、多腦區協同等,尚未引進類腦芯片計算機制研究中,使得類腦芯片在復雜信息處理中存在一定的局限性[11-12]。因此,在未來類腦芯片技術研究中,要實現類腦芯片大規模應用目的,要求借鑒和研究多尺度信息處理機制,并重點關注全腦不同尺度計算單元之間的協同處理能力,以便進一步提升類腦芯片信息處理能力,滿足于信息時代發展對類腦芯片信息處理能力的實際要求,才能為類腦芯片的大規模使用夯實基礎。
綜上所述,在現代科技不斷發展和人們需求不斷提高的背景下,信息技術領域涌現出大量技術桎梏問題,在此環境中,如何實現信息技術的創新發展與廣泛應用,使得其在社會各個領域中產生更大的效能,已經成為相關專業領域人員重點研究的課題。而生物技術與信息技術的融合發展,為信息技術的發展開辟了新的路徑,如基于DNA特殊的結構模式,解決了信息技術發展中存在的存儲空間和時間問題,神經形態計算通過模仿人腦構造實現了計算機信息處理能力和反應能力,且大幅度降低了計算機運行能耗。不僅如此,類腦芯片在海量數據處理方面具有顯著的低能耗、高效性等優勢,且能夠為人工智能、動態調節等功能的實現提供支持,從而能夠為信息技術的進一步發展及推廣應用提供了技術支持。