張 玲,劉國柱,2,于宗光
(1.中國電子科技集團公司第五十八研究所,江蘇無錫 214035;2.東南大學電子科學與工程學院,南京 210096)
隨著信息化時代的發(fā)展,數(shù)據(jù)處理以爆發(fā)式方式快速增長(平均數(shù)據(jù)量為2.5×1018B/d,每40個月增加1倍[1],預計到2025年全球數(shù)據(jù)總量將達到175 ZB[2]),大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、5G通信、人工智能等技術的應用對計算速度和計算能效提出了更高的要求。傳統(tǒng)的馮·諾依曼計算架構因存算分離引發(fā)“存儲墻”和“功耗墻”問題而不再滿足智能大數(shù)據(jù)應用場景快、準、智的響應需求[3-14],尤其在速度、功耗、面積等方面難以滿足未來龐大數(shù)據(jù)量的處理需求,其計算體系與架構的短板愈顯突出。同時,傳統(tǒng)CMOS器件尺寸正在逼近物理極限,摩爾定律難以延續(xù),同樣也限制了計算機的性能提升[3-14]。人工智能的三大要素是算力、數(shù)據(jù)與算法,目前,傳統(tǒng)計算架構的帶寬、算力和功耗問題已經(jīng)成為人工智能發(fā)展的瓶頸。因此,類腦計算與存算一體化是現(xiàn)階段實現(xiàn)高帶寬、低功耗、計算需求的必由之路,其中,人工神經(jīng)形態(tài)器件是解決“存儲墻”和“功耗墻”問題的有效途徑,發(fā)展以新材料和新器件為支撐的新型非馮計算架構成為解決問題的關鍵點[3-4,13-14]。構建基礎器件、電路、架構、系統(tǒng)、應用等多個層面協(xié)同創(chuàng)新平臺,是發(fā)展神經(jīng)形態(tài)新型計算體系的基礎,同時也是真正實現(xiàn)人腦神經(jīng)網(wǎng)絡模擬抽象的必要條件。本文基于神經(jīng)元與突觸原理,綜述了神經(jīng)形態(tài)器件與電路的基本發(fā)展概況,并對人工神經(jīng)形態(tài)器件發(fā)展存在的問題與未來趨勢進行了分析與總結。
大腦是控制生物學習、記憶、感知、語言、運動、情感等生命活動的信息處理中心。神經(jīng)元是構成生物大腦神經(jīng)網(wǎng)絡系統(tǒng)基本結構和功能的單位,主要包括細胞體(Cell Body)、樹突(Dendrites)、軸突(Axon),具有學習、可塑、興奮、抑制、遺忘等多種特性和功能,具體結構如圖1所示[6-11]。神經(jīng)元之間相互接觸部位為突觸(Synapse),即突觸是實現(xiàn)突觸前神經(jīng)元(Presynaptic Neuron)與突觸后神經(jīng)元(Postsynaptic Neuron)之間信息傳輸?shù)耐ǖ溃巧窠?jīng)系統(tǒng)傳遞的最小功能單位,具有非易失性和可塑性的特點,其結構包括突觸前膜、突觸間隙和突觸后膜。一個神經(jīng)元具有多個軸突分支,其軸突末梢與多個神經(jīng)元的細胞體或樹突相接觸。一般生物神經(jīng)系統(tǒng)是由數(shù)以億計的神經(jīng)元細胞通過錯綜復雜的連接方式組成的,樹突用來接收輸入信號并改變細胞體的膜電位,從而實現(xiàn)大腦脈沖信號傳遞。一般人腦中約有1011個神經(jīng)元和1015個突觸[6-14]。

圖1 生物大腦神經(jīng)網(wǎng)絡基本組織結構[11]
生物神經(jīng)網(wǎng)絡的突觸功能特性通過權重指標進行衡量,其形態(tài)、功能、強度和效率發(fā)生較為持久的改變的特性或現(xiàn)象被稱為可塑性(Synaptic Plasticity),這種實現(xiàn)神經(jīng)元之間連接強度可調節(jié)的可塑性功能是生物系統(tǒng)學習、推理和其他智能的基礎[7,11-20]。在人工神經(jīng)網(wǎng)絡中,根據(jù)突觸可塑性數(shù)學模型來構造神經(jīng)元之間的聯(lián)系,其可塑性一般可分為短時程可塑性(Short-TermPlasticity,STP)、 長 時 程 可 塑 性(Long-Term Plasticity,LTP)、放電時間依賴可塑性(Spiking-Timing-Dependent Plasticity,STDP)、放電速率依賴可塑性(Spiking-Rate-Dependent Plasticity,SRDP)、經(jīng)驗學習(Learning-Experience)、非聯(lián)想性學習(Non-Associative Learning)、聯(lián) 想 性 學 習(Associative Learning)、突觸縮放(Synaptic Scaling)等[7,11-21]。其中,短時程可塑性是由短促的刺激觸發(fā),并在短時間內能夠迅速恢復,包括雙脈沖抑制(Paired-Pulse Depression,PPD)、雙 脈 沖 易 化(Paired-Pulse Facilitation,PPF)、 強 直 后 增 強(Post-Tetanic Potentiation,PTP)[7];長時程可塑性是由大量外界刺激引起的,連接程度持續(xù)性增強或抑制,其表現(xiàn)為LTP和長時程抑制(Long-Term Depression,LTD),被公認為是學習記憶活動的細胞水平生物學基礎,一般的LTP主導新信息的學習,而LTD去除不必要的舊信息,維持學習和遺忘的平衡關系[7,15-16,18]。作為赫布(Hebbian)學習規(guī)則之一的STDP很好地詮釋了LTP和LTD之間的關系:當突觸前脈沖先于突觸后脈沖到達時(Pre-Post Spiking),能夠引起LTP;當突觸后脈沖先于突觸前脈沖到達時(Post-Pre Spiking),能夠引起LTD[18]。
人工智能正引領時代的變革,人工神經(jīng)形態(tài)技術在圖像、語音識別等領域取得突破性進展,但距離人腦智能或者具有自我意識的強人工智能還存在很大的差距。類腦神經(jīng)網(wǎng)絡具備自主學習能力、獲取新信息和新技能的能力,以及進行交互、推理從而做出決策的能力,同時具有高并行性、高容錯性、高連接性、存算融合和低功耗特性。其中,存算融合特性從根本上解決了馮·諾依曼體系架構的“存儲墻”、“功耗墻”瓶頸問題。世界各國政府、研究機構和企業(yè)都在類腦神經(jīng)形態(tài)技術方面爭相布局,投入巨資開展了類腦神經(jīng)形態(tài)器件及其應用系統(tǒng)的研究。目前,人工神經(jīng)形態(tài)器件的發(fā)展主要包括2條技術路線:一種是基于傳統(tǒng)成熟的CMOS技術的SRAM或DRAM構建,其原型器件在信息存儲方面屬于易失型;另一種是基于非易失性FLASH器件或新型存儲器件、新材料構建。
目前,基于傳統(tǒng)CMOS工藝技術突破了多款以數(shù)字神經(jīng)元為特征的神經(jīng)形態(tài)芯片。如基于2008年美國DARPA的SyNAPEs項目,2011年,IBM公司首先推出2款TrueNorth類腦芯片原型,單核含256個神經(jīng)元和256×256個突觸,其腦容量僅相當于蟲腦的水平[24];2014年,IBM公司基于三星28 nm工藝技術終于在復雜性和使用性方面取得了突破性成果,完成了4096個內核集成、含100萬個神經(jīng)元、2.56億個突觸、面積約4.3 mm2的類腦芯片,是2011年原型芯片大小的1/16,而且能耗只有不到70 mW[23-24];2017年IBM公司和美國空軍實驗室聯(lián)合宣布了由該芯片構成的新超級計算機具有6 400萬個神經(jīng)元和160億個突觸,功耗僅有10 W[24]。基于2013年歐盟的“人腦計劃”項目,曼徹斯特大學的SpiNNaker類腦芯片組成擁有100萬個ARM處理器核心和1200塊互連電路板的超級計算機,支持部分大腦模型,皮質模型、基底神經(jīng)節(jié),或表示為棘波神經(jīng)元網(wǎng)絡的多個區(qū)域[22]。2017年Intel公司推出的Loihi類腦芯片,由128個神經(jīng)形態(tài)的核心和3個低功耗的英特爾x86核心組成,擁有13萬個神經(jīng)元和1.3億個觸突,支持可編程的學習規(guī)則,每個神經(jīng)形態(tài)核心都包含一個學習引擎,在操作中可以通過編程去適配網(wǎng)絡參數(shù),支持監(jiān)督學習、無監(jiān)督學習、強化學習和其他的學習范式[25],同時,分別于2019年和2020年先后基于Loihi芯片推出Pohoiki Beach和Pohoiki Springs系統(tǒng)[26-27]。2019年,清華大學研制成功了全球首款異構融合類天機(Tianjic)類腦芯片[28],芯片采用UMC公司的28 nm工藝制造,尺寸約為3.8 mm×3.8 mm,由156個FCore組成,包含大約40000個神經(jīng)元和1000萬個突觸,僅用一個芯片就可以在無人駕駛自行車系統(tǒng)中同時處理多種算法和模型,實現(xiàn)實時目標檢測、跟蹤、語音控制、避障和平衡控制。2019年8月,浙江大學基于55 nm工藝技術研制出了達爾文2類腦芯片,單芯片由576個內核組成,每個內核支持256個神經(jīng)元,神經(jīng)突觸超過1千萬,通過系統(tǒng)級擴展,可構建千萬級神經(jīng)元類腦計算系統(tǒng),目前完成手勢識別、圖像識別、語音識別、腦電識別等多個應用開發(fā),功耗比傳統(tǒng)計算芯片低2個數(shù)量級以上。2020年9月,浙江大學聯(lián)合之江實驗室共同研制成功了我國首臺基于自主知識產(chǎn)權、規(guī)模最大的類腦芯片組成的類腦計算機(Darwin Mouse),包含792顆達爾文2代類腦芯片,支持1.2億脈沖神經(jīng)元、近千億神經(jīng)突觸,與小鼠大腦神經(jīng)元數(shù)量規(guī)模相當,典型運行功耗為350~500 W。
這類芯片雖然區(qū)別于傳統(tǒng)集成電路和人工神經(jīng)網(wǎng)絡加速AI芯片,但芯片中基本人工神經(jīng)元和突觸依然是采用數(shù)字電路或者數(shù)模混合電路搭建,存在集成度、功耗和功能模擬準確度等瓶頸技術問題。如,SRAM由于密度和功耗的限制,大規(guī)模的神經(jīng)網(wǎng)絡模型依然需要將參數(shù)儲存在外置的DRAM上。DRAM的數(shù)據(jù)量存儲比較多,但劣勢在于采用電容存儲數(shù)據(jù),需要經(jīng)常刷新,且讀出來的數(shù)據(jù)需要先進行區(qū)分再放到運算單元做相關運算,使得提升的效率有限。目前主流的典型類腦神經(jīng)形態(tài)芯片統(tǒng)計情況見表1。

表1 目前主流典型的類腦神經(jīng)形態(tài)芯片統(tǒng)計情況
模擬仿生突觸的功能是構建人工神經(jīng)網(wǎng)絡硬件化的關鍵一步。傳統(tǒng)CMOS器件的神經(jīng)形態(tài)計算芯片中的數(shù)字神經(jīng)元采用了大量的電路元件,如MOS晶體管、電容等,其面積開銷過大,使得人工神經(jīng)網(wǎng)絡的密度遠遠低于生物神經(jīng)網(wǎng)絡的密度[30-34],因此需尋找新的元器件和模擬方式,降低功耗、提高密度,使人工神經(jīng)網(wǎng)絡達到具備和生物神經(jīng)網(wǎng)絡可比擬的高度。非易失性神經(jīng)形態(tài)器件是一種具有人工神經(jīng)形態(tài)特性的憶阻器(Memristor),其具有獨特的非線性特性,并已成為新型模擬生物神經(jīng)元與突觸的基本信息處理單元,得到了人們的廣泛研究。1971年華裔科學家蔡少棠教授在研究電荷、電流、電壓和磁通量之間的關系時首次提出了憶阻器概念[30]。2008年惠普實驗室在Nature雜志上首次報道了憶阻器[31],這種器件具有多比特、非易失、速度快、集成度高等特點,在功耗、硬件開銷等方面具有顯著優(yōu)勢,但目前新型非易失性神經(jīng)形態(tài)器件的研究主要集中在機理和功能模擬兩個方面。現(xiàn)階段國內外在阻變存儲器(Resistive Random Access Memory,ReRAM)、相變存儲器(Phase Change Memory,PCM)、鐵電存儲器(Ferroelectric Random Access Memory,F(xiàn)eRAM)、磁 存 儲 器(Magnetic Random Access Memory,MRAM)、離子柵控晶體管等新型器件實現(xiàn)了模擬突觸和神經(jīng)元的功能并取得了重要進展,但尚處在探索研究階段。相比于傳統(tǒng)的Flash存儲器,新型非易失性存儲器件不僅可以具有相當?shù)拇鎯θ萘浚移湓谧x取和寫入速度、數(shù)據(jù)保持特性、抗疲勞特性、能耗方面具有明顯的優(yōu)勢[32,34],見表2。

表2 非易失性器件的基本特征參數(shù)[32]
3.2.1 基于ReRAM的人工神經(jīng)形態(tài)器件研究
ReRAM是由金屬/阻變材料薄膜/金屬構成,利用阻變材料電阻在外加電場激勵作用下具有高阻態(tài)(High Resistive State,HRS)與低阻態(tài)(Low Resistive State,LRS)之間可逆改變特性實現(xiàn)對數(shù)據(jù)信息的存儲功能,其中,由HRS向LRS轉變被稱為置位(Set)過程,與之相反的則為復位(Reset)過程,置位與復位之間轉變過程是因電壓極性而改變的阻變行為被稱為雙極性阻變(Bipolar),而對于置位與復位轉變過程僅需同種電壓極性阻變行為被稱為單極性阻變(Nonpolar),一般涉及的電阻轉變機制包括離子遷移、電荷俘獲/釋放、熱化學反應等,典型離子遷移工作原理如圖2所示[30-41]。該器件具有結構簡單、非易失、功耗低、速度快、多阻態(tài)、尺寸小、易三維集成等諸多優(yōu)點,同時,由于ReRAM具有模擬生物神經(jīng)突觸功能,已被廣泛應用于硬件神經(jīng)網(wǎng)絡系統(tǒng)的研究[31-41]。

圖2 典型的離子遷移型ReRAM的電特性和離子傳輸機制[32]
目前,國內外多家著名高校及研究機構都發(fā)布了基于ReRAM器件構建的神經(jīng)形態(tài)芯片原型,并在圖像、語音識別等應用領域進行了廣泛的測試與驗證。2015年,美國加州大學圣巴巴拉分校(UCSB)研究人員利用Al2O3/TiO2-x憶阻器建立了一個12×12交叉陣列的單層感知機神經(jīng)網(wǎng)絡,成功實現(xiàn)了簡單的人類視覺圖像分類功能,該網(wǎng)絡可以使用delta-rule算法的粗粒度變化進行現(xiàn)場教學,完成了將3×3像素黑白圖像完美地分為3類(代表字母“z”、“v”、“n”),具體如圖3所示[34]。2016年,圣塔芭芭拉分校的謝源教授團隊提出基于RRAM構建存算融合的深度學習神經(jīng)網(wǎng)絡(PRIME),與傳統(tǒng)馮·諾依曼計算架構相比,PRIME功耗降低約為原來的1/20、速度提高約50倍,PRIME成功高效地實現(xiàn)了向量矩陣乘法運算[32,35]。2016年,英國南安普頓大學研究人員基于TiOx憶阻器展示了一個可擴展片上存儲的高效數(shù)據(jù)壓縮技術,其構建的交叉陣列規(guī)模為32×32[36]。2017年,清華大學錢鶴教授課題組利用具有模擬非易失特性的憶阻器構建了一個128×8交叉陣列,采用并行在線訓練的方法實現(xiàn)了人臉識別功能[37]。2018年,美國麻省大學WANG[38]等研究人員基于SiOxNy:Ag介電膜的擴散型記憶電阻器研制出了具有隨機漏積分和火災動力學以及積分時間可調的人工神經(jīng)元,該人工神經(jīng)元的積分時間取決于銀的遷移或其與電路電容的相互作用,建立了完全記憶性人工脈沖神經(jīng)網(wǎng)絡,并驗證了其具有無監(jiān)督的突觸權重更新和模式分類功能。2019年,美國密歇根大學CAI等[39]基于WOx憶阻器研制出了一款混合集成憶阻器/CMOS的神經(jīng)形態(tài)芯片,其憶阻器的交叉陣列規(guī)模50×108,驗證了具有綜合分類功能的感知器網(wǎng)絡、稀疏編碼和PCA算法。2020年,清華大學吳華強教授團隊成功研發(fā)出一款基于憶阻器的多陣列神經(jīng)形態(tài)芯片(如圖4所示),并實現(xiàn)了卷積網(wǎng)絡的完整硬件化,集成了8個包含2048個憶阻器的列陣,構建了一個5層的卷積神經(jīng)網(wǎng)絡進行圖像識別,精度高達96%以上,在處理卷積神經(jīng)網(wǎng)絡(CNN)時能效比前沿的圖形處理器芯片(GPU)高2個數(shù)量級[40]。2020年,HRL實驗室報告了采用納米級VO2活性記憶電阻器構建的神經(jīng)元,其為實現(xiàn)全記憶抑制神經(jīng)形態(tài)皮層計算機提供了解決思路[41]。2020年,東北師范大學紫外線發(fā)光材料與技術教育部重點實驗室報道了基于Bienenstock-Cooper-Munro學習規(guī)則,采用WO3-x記憶突觸模擬了STDP可塑性,顯示了突觸前和突觸后的活動,并彌補了抑郁癥區(qū)域沒有增強的抑郁效應[42]。2020年,CHEN[43]等采用化學氣相沉積法制備的六角氮化硼,可以制作高密度記憶交叉陣列介質層,并將其用于圖像識別的人工神經(jīng)網(wǎng)絡模型,陣列具有較高的良率和一致性。雖然ReRAM在人工智能領域是實現(xiàn)仿生神經(jīng)元和突觸器件較為理想的選擇,但因材料、器件結構、工藝、編程方法等眾多因素,目前依然存在諸多技術瓶頸問題有待進一步解決,如漏電流和熱串擾引起的耐久性與阻態(tài)保持特性變差、器件性能參數(shù)一致性差等問題。

圖3 利用Al2O3/TiO2-x憶阻器實現(xiàn)的視覺圖像分類功能[34]

圖4 基于TiO x憶阻器的神經(jīng)形態(tài)芯片實現(xiàn)圖像識別功能[40]
3.2.2 基于MRAM的人工神經(jīng)形態(tài)器件研究
1975年,Julliere通過Co/Ge/Fe磁性隧道結(Magnetic Tunnel Junctions,MTJ)發(fā)現(xiàn)了隧穿磁電阻(Tunneling Magnetoresistance-TMR)效應,其機理是利用電流誘導的自旋轉移力矩(Spin-TransferTorque,STT)驅動磁矩變化,從而產(chǎn)生隧穿磁電阻變化的響應,可以進行信號輸出與功能表達[44-49]。MTJ由自由層/勢壘層/釘扎層構成的三明治結構組成,其中釘扎層材料為磁化取向被釘扎固定的鐵磁層,自由層為磁矩可以自由轉動的鐵磁層,勢壘層是非磁性絕緣層[46],具體結構和工作原理如圖5所示。當兩鐵磁層的磁化取向平行排列時,MTJ表現(xiàn)出低電阻狀態(tài)(P);當兩鐵磁層的磁化取向反平行排列時,MTJ表現(xiàn)出高電阻狀態(tài)(AP)。近來研究表明,利用自旋電子器件中磁矩進動產(chǎn)生的TMR可實現(xiàn)仿生突觸和神經(jīng)元特性,因此,基于磁性隧道結的自旋神經(jīng)形態(tài)器件在神經(jīng)形態(tài)計算領域具有廣泛的應用前景。

圖5 MTJ結構及工作原理[46]
利用電子的磁性和電學性質的自旋電子納米器件,可以提高能量效率并縮小神經(jīng)形態(tài)電路的面積,而磁性隧道結作為神經(jīng)形態(tài)計算元件特別受關注,因為它們與標準集成電路兼容,可以支持多種功能[48]。SRINIVASAN[44]等提出一個由MTJ和重金屬組成的隨機二元突觸異質結構,并基于SNN理論和分類手寫MNIST數(shù)據(jù)訓練集證明了MTJ突觸結構和隨機STDP學習算法的有效性。SENGUPTA[45]等展示了皮層錐體神經(jīng)元的概率尖峰特性與存在熱噪聲的MTJ隨機切換行為的映射,并說明了基于概率神經(jīng)元的神經(jīng)形態(tài)系統(tǒng)中存在側向抑制和穩(wěn)態(tài)時的模式識別任務的效率(如圖6所示),這種隨機的MTJ神經(jīng)元也有可能提供一個直接映射到信念網(wǎng)絡中的概率計算元素,以執(zhí)行再生任務。基本的記憶功能,包括電寫入和讀出已經(jīng)在反鐵磁體中得到了證明,在自旋軌道轉矩開關電脈沖長度已從毫秒縮短到皮秒,開啟了超快磁存儲器的前景[46]。GUILLAUME[47]等研究了一種新的MRAM技術,其寫入方案依賴于自旋軌道轉矩(SOT),與STTMRAM相比,它具有非常快的開關速度、準無限長的續(xù)航時間,并且由于讀寫路徑分開,解決了讀干擾問題,提高了可靠性。

圖6 MTJ在皮層錐體神經(jīng)元的應用[45]
3.2.3 基于PCRAM的人工神經(jīng)形態(tài)器件研究
相變存儲器(Phase Change Random Access Memory,PCRAM)是利用相變材料作為存儲介質(如Sb-Te、Ge-Te、Ge-Sb-Te等硫系材料),在電流的焦耳熱作用下,實現(xiàn)相變材料在結晶相態(tài)(即低阻態(tài))和非晶相態(tài)(即高阻態(tài))之間快速可逆轉換,利用這一電阻率隨晶態(tài)轉化的特性來實現(xiàn)信息存儲的NVM技術[50-56]。目前,PCRAM主要結構分為T型結構、μ-Trench結構、邊緣接觸型結構和平面結構等,其中T型結構是業(yè)界廣泛采用的主流結構,由底電極、相變材料層和頂電極3個部分構成[50-56],如圖7所示。PCRAM具有工藝簡單、集成度高(納米尺度)、響應速度快(納秒級)等優(yōu)點,同時兼容于CMOS。自2010年以來已有多家企業(yè)實現(xiàn)了PCRAM技術產(chǎn)業(yè)化,具體如表3所示。

圖7 T型PCRAM器件[50]

表3 典型PCRAM發(fā)展情況[50-56]
PCRAM因具有高集成度、高響應速度,也被廣泛應用于高密度憶阻神經(jīng)-突觸陣列,構建神經(jīng)形態(tài)芯片[52-55]。TUMA[51]等基于硫系化合物的相變材料研究了人工神經(jīng)元,通過利用可逆的非晶態(tài)到晶體相變的物理特性,證明了突觸后電位的時間積分可以在納秒時間尺度上實現(xiàn)。NANDAKUMAR[54]等評估了使用納米尺度和隨機模擬記憶突觸來實現(xiàn)高性能事件驅動的原位監(jiān)督學習系統(tǒng)的可行性,原型芯片中有超過170000個基于PCM的突觸根據(jù)事件驅動的學習規(guī)則進行訓練,在1250 ms長的尖峰模式中,在25 ms的耐受間隔內產(chǎn)生超過85%的尖峰,這項工作將具有監(jiān)督SNN的計算潛力與內存計算的并行計算能力相結合,為下一代高效的大腦啟發(fā)系統(tǒng)鋪平了道路,PCRAM突觸器件SNN神經(jīng)網(wǎng)絡訓練實驗如圖8所示。BHATTACHARJEE[55]等利用重摻雜(n型)和摻鈮(p型)二硫化鉬(MoS2)晶體管中電子俘獲事件產(chǎn)生的短期/長期記憶效應,該晶體管模擬神經(jīng)遞質的交換并模擬其STDP,其中至少有50個電導值。但是,相變神經(jīng)元的功能具有一定的局限性:由于大多數(shù)隨機性質直接來自結晶的物理性質,故隨機響應、神經(jīng)元參數(shù)和膜電位動力學可以按最小電路要求進行調整的程度受到限制[56]。而且,由于器件的易變性和納米尺度的物理效應,極小技術節(jié)點上的實現(xiàn)可能會呈現(xiàn)出固定模式以及時間噪聲的增加,這對于必須嚴格控制隨機性的算法可能是不利的[56]。

圖8 PCRAM突觸器件SNN神經(jīng)網(wǎng)絡訓練實驗
3.2.4 基于FeRAM的人工神經(jīng)形態(tài)器件研究
FeRAM是一種非易失存儲器,具有高速、高密度、低功耗和抗輻射等優(yōu)點,目前主要的鐵電材料有鈣鈦礦結構系列,包括PbZr1-xTixO3、SrBi2Ti2O9和Bi4-xLaxTi3O12等,而傳統(tǒng)的FeRAM存在尺寸收縮和集成度問題,經(jīng)過科學家不斷地探索,發(fā)現(xiàn)鐵電隧道結(FTJ)具有尺寸小、易于集成、靈敏度高、使用壽命長等優(yōu)點,可以很好地解決傳統(tǒng)的FeRAM瓶頸技術問題[57-63]。同時,利用在電極之間施加電場來調控其鐵電極化從而調控其電阻,這種純電學調控電阻變化的特性同樣受到廣泛關注并用于突觸特性模擬研究[63]。
CHANTHBOUALA[57]等首次報道了基于鐵電材料采用電壓調控鐵電極化方法實現(xiàn)了憶阻器功能,實驗得到阻態(tài)變化范圍超過2個數(shù)量級,操作速度10 ns,具體的FTJ調諧電阻和鐵電疇結構與電壓振幅關系如圖9所示。BOYN[58]等報告了基于FTJ非均勻極化特性模擬神經(jīng)突觸的放電時間依賴可塑性,同時,結合了SEM成像、電輸運和原子尺度分子動力學,研究發(fā)現(xiàn)電導的變化可以用晶核主導的疇反轉來模擬,并完成了FTJ陣列的模式識別性能預測,為脈沖神經(jīng)網(wǎng)絡(SNN)的無監(jiān)督學習開辟了道路。CHEN[59]等通過利用具有可調雙極特性的石墨烯-鐵電晶體管(GrFeFET)實現(xiàn)了互補性突觸,并構造了互補的突觸和神經(jīng)元電路執(zhí)行SNN的遠程監(jiān)控方法(ReSuMe),同時,將其應用于3 pixel×3 pixel圖像分類的監(jiān)督學習(Supervised Learning,SL)任務中,通過網(wǎng)絡級仿真實現(xiàn)了學習功能。MA[60]等報告了一種基于Ag/BaTiO3/Nb:SrTiO3FTJ的高性能記憶電阻器,它具有600 ps的最快運算速度和32個狀態(tài)或5 bit的最高狀態(tài)數(shù),其電阻開關可保持在358 kΩ,寫入電流密度低至4×103A·cm-2,超快操作也獲得了脈沖時間依賴性可塑性的STDP功能,同時證明了較高載流子濃度的Nb:SrTiO3電極和功函數(shù)較低的金屬電極有利于提高操作速度,這些結果可為克服不同層次的存儲性能差距和開發(fā)超高速神經(jīng)形態(tài)計算系統(tǒng)提供了思路。BERDAN[61]等證明了非線性鐵電隧道結記憶體可以在超低電流下進行線性計算,利用對數(shù)線驅動器,證明了模擬電壓幅度矢量矩陣乘法器(Vector-Matrix Multiplication,VMM)可以在無選擇FTJ交叉陣列中通過一個在多個導電狀態(tài)下保持恒定的器件非線性,同時,F(xiàn)TJ交叉陣列可模擬VMM密集型應用(如神經(jīng)推理引擎),F(xiàn)TJ實現(xiàn)的憶阻器具體特性如圖10所示。

圖9 調諧電阻和鐵電疇結構與電壓振幅關系[FTJ:BaTiO3(2 nm)=LaO:67SrO:33MnO3(30 nm)(BTO/LSMO)][57]

圖10 FTJ器件特性及無選擇器交叉桿編程[61]
3.2.5 基于Flash浮柵型晶體管的人工神經(jīng)形態(tài)器件研究
NOR Flash浮柵器件具有工藝成熟度高、集成度高、成本低等優(yōu)點,從非易失性、高密度和可實現(xiàn)多位編程特性等方面看,F(xiàn)lash器件也非常適合深度學習和人工智能應用,尤其在端側AIoT領域。利用Flash浮柵器件的模擬特性,可直接在其存儲單元內進行全精度乘加運算,并存儲神經(jīng)網(wǎng)絡的權重參數(shù),從而可以將乘加法運算和存儲融合到一個Flash單元里面,實現(xiàn)神經(jīng)形態(tài)計算的存算融合基本特性。因此,目前基于NOR Flash實現(xiàn)神經(jīng)形態(tài)芯片的技術受到了產(chǎn)業(yè)界關注,自2016年UCSB發(fā)布第一個樣片以來,尤其在高性能計算技術方向的存算融合方面,多家知名企業(yè)、高校和研究所開始著手研發(fā),如Intel、Micron、Mythic、Amazon、Microsoft、Walden、Lam Research、中芯國際集成電路制造有限公司、北京知存科技有限公司、北京大學、中國科技大學、中國電子科技集團公司第五十八研究所等。2017年北京知存科技有限公司報道了神經(jīng)形態(tài)的存算融合AI芯片的最高峰值運算效率為40 TOPS/W,平均值為10 TOPS/W[4]。2019年,合肥恒爍半導體科技公司與中國科技大學團隊共同研發(fā)了基于65 nm NOR Flash架構、具有邊緣計算和推理能力的神經(jīng)形態(tài)AI芯片,實現(xiàn)一個3×3卷積核的Flash陣列,能耗比能夠達到0.18 TOPS/W,能實時檢測通過攝像頭拍攝的人臉頭像并給出計算概率,可應用于人工智能的圖像識別、心電圖監(jiān)測等領域[64]。2019年12月,Nature Electronics報道了以色列理工學院副教授KVATINSKY領導的團隊和JAZZ科研人員合作,基于180 nm CMOS工藝,研發(fā)出一款用于神經(jīng)形態(tài)計算的低功耗雙端浮柵晶體管(Y-Flash),可實現(xiàn)65個不同的阻態(tài),并且其阻值范圍能夠隨著信號的微小變化在2個數(shù)量級范圍內線性改變,模擬數(shù)據(jù)存儲時長達到10年,該晶體管不需要選通管就可以構建出能夠執(zhí)行基本神經(jīng)形態(tài)計算的器件陣列,包括STDP、VMM、聯(lián)想記憶、分類訓練等,研究人員認為該器件未來有潛力在更先進的技術節(jié)點上實現(xiàn)[65],該器件具體結構及性能如圖11所示。2019年12月,IEDM報道了北京大學微電子研究所面向DNN的多位Flash存儲可靠性技術研究,采用一種動態(tài)Vd編程方法獲得到了多位Flash精細Id電流分布,在1 Mb閃存陣列中,不同溫度下實現(xiàn)了16個狀態(tài),其可靠性優(yōu)異,對基于多位Flash DNN的邊緣計算技術研究具有指導意義[66]。

圖11 Y-Flash憶阻器[65]
面對傳統(tǒng)馮·諾依曼架構和摩爾定律發(fā)展的技術瓶頸問題以及人工智能應用的需求,以高度并行、極低功耗和存算融合為特征的神經(jīng)形態(tài)計算技術受到了廣泛關注。神經(jīng)形態(tài)計算技術是通過神經(jīng)網(wǎng)絡對信息感知與決策方式進行信息收集、傳輸、處理和存儲,滿足多模態(tài)等非結構化數(shù)據(jù)與智能任務處理應用場景的技術。其中,具有獨特物理機制的神經(jīng)形態(tài)器件是神經(jīng)形態(tài)計算硬件的基本組成單元,從實現(xiàn)方式分析,神經(jīng)形態(tài)技術發(fā)展主要分為2種路線,分別為易失性與非易失性存儲器構建的神經(jīng)元和突觸。前者雖然區(qū)別于傳統(tǒng)集成電路和人工神經(jīng)網(wǎng)絡加速AI芯片,但芯片基本人工神經(jīng)元和突觸依然采用數(shù)字電路或者數(shù)模混合電路搭建,存在集成度、功耗和功能模擬準確度等瓶頸技術問題;后者是基于新型非易失型存儲器件實現(xiàn)的神經(jīng)形態(tài)計算芯片,在功耗、能效、硬件開銷、自適應、自學習、自演化、容錯性等方面展現(xiàn)出了顯著優(yōu)勢。新型非易失型類神經(jīng)形態(tài)器件具備獨特的動態(tài)特性和可重構特性,不僅能表現(xiàn)出多樣化與時間可塑性,還能天然地實現(xiàn)人工神經(jīng)網(wǎng)絡與脈沖神經(jīng)網(wǎng)絡的兼容,實現(xiàn)PPD、PPF、PTP、SRDP、STDP等功能。因此,非易失性存儲器構建的神經(jīng)元和突觸方案是推動神經(jīng)形態(tài)計算、實現(xiàn)人腦功能的較佳技術路徑,但目前ReRAM、PCRAM、MeRAM等工藝、器件尚處于探索性研究與應用階段,存在基準工藝尚未成熟、制作成本高等問題,如阻變機理不完善,阻變開關比,多阻態(tài)線性度、對稱性、一致性與穩(wěn)定性等,需要從新材料、器件結構、原理等方面進一步優(yōu)化與提升。縱觀十余年的科學研究與發(fā)展,新型非易失型類神經(jīng)形態(tài)器件技術已取得了豐碩成果,并有望成為大數(shù)據(jù)及智能化時代應對海量實時數(shù)據(jù)的顛覆性計算范式,對新型非馮·諾依曼架構芯片的研發(fā)乃至類腦智能時代的最終實現(xiàn)都具有重要意義。