張 聰,劉 杰,解樹一,徐 斌,尹海清*,劉斌斌,曲選輝
(1 北京科技大學 北京材料基因工程高精尖創新中心,北京 100083;2 北京科技大學 鋼鐵共性技術協同創新中心,北京 100083;3 北京科技大學 新金屬材料國家重點實驗室,北京 100083;4 北京科技大學 新材料技術研究院,北京100083)
金屬材料有著悠久的歷史和廣泛的應用,通常傳統金屬材料的設計方法一直都是以一種或兩種金屬元素為主元,通過添加少量的合金化元素來改善組織結構及性能[1-2]。高熵合金[3-4](high-entropy alloys, HEAs)至少含有四個主要元素,其元素原子分數通常在5%~35%之間[5-8]。起初對于高熵合金的研究大多是多相合金,而不是單相固溶體。近年來,隨著對單相高熵合金的研究逐漸深入,在無其他相混雜影響下揭示了高熵合金的基本機制[5]。目前單相高熵合金的研究主要包括以Cantor合金為代表的FCC型單相體系[4]和以Senkov合金為代表的BCC型單相體系[9]。針對高熵合金單相研究而言,合金元素的數量、類型和濃度等變量可以系統地變化,并與合金物理力學性能直接相關,這對理解某些多相合金有更廣泛的適用性。高熵合金如今發展到包括金屬間化合物、納米沉淀、陶瓷化合物以及只有三種主要元素的非等原子比高熵/中熵合金材料[10-12]。為了追求更好的力學性能,高熵合金的成分空間正在迅速拓展,例如曾報道過的具有超高強度和良好低溫韌性的Al0.5Cr0.9FeNi2.5V0.2高熵合金[13]。針對高熵合金成分設計而言,當前可開發的成分空間巨大,因此如何更有效地選擇最合適的成分以獲得最理想的相結構和性能是一個重大挑戰。
在尋找新合金的過程中,實驗一直都是最有效的方法之一。為了克服傳統“試錯法”的偶然性,提高合金開發效率,高通量制備技術得以出現,其核心是設計并制備成分梯度以實現一批合金成分的高通量表征,例如擴散耦、超重力場和激光增材制造都有助于形成具有成分梯度的塊體合金,或者使用多靶濺射來制備成分梯度薄膜[14-17]。
材料基因工程中的“高通量”思想可以加速高熵合金成分篩選,且有效促進高熵合金的開發。通常在追求目標性能時可能會存在元素成分或者種類偏離高熵合金規則的現象,若非規則外的性能優于靜態合金設計規則的性能,則可認為這種現象是合理的[18]。對于高熵合金不斷增長的成分空間,不僅增加了實驗探索難度,而且對計算提出了更高的要求,也同時為機器學習的應用帶來了機遇[19]。針對高熵合金工藝設計而言,采用機械設計的原則將傳統合金力學機制轉化應用于高熵合金是一種可行的手段[18]。在整個設計過程中,保持高熵合金特征優勢的同時,將其與描述機制結合起來,極大地促進了高熵合金變體的開發研究[20-21],例如孿生誘發塑性(twinning induced plasticity, TWIP)高熵合金[20,22-24]、間隙高熵合金[25-27]、相變誘發塑性(tranformation induced plasticity, TRIP)高熵合金[28-30]以及多相高熵合金[31-32]。
激光增材制造技術有著良好的應用前景[33],基于高通量思想的增材制造技術可以大大縮短高熵合金開發周期[34-36]。與傳統加工方法相比,增材制造在制備時自下而上逐層增加,突破了傳統方法的限制,能夠制備結構復雜的精密器件,且在制備大規模金屬部件上也有著顯著優勢[37]。高熵合金具有高強度、優異的高溫性能、良好的耐腐蝕性和耐磨性等優越性質,而使用傳統鑄造方法在工業上生產塊狀高熵合金存在固有的高精度工藝復雜性。增材制造有助于對局部過程進行高水平的控制,能夠生產出復雜的幾何形狀,適合用于高熵合金的制備[38]。
目前應用在高熵合金領域的增材制造技術主要包括激光選區熔化(selective laser melting, SLM)[39]、激光熔融沉積(laser metal deposition, LMD)[40]和電子束選區熔化(electron beam melting, EBM)[41]。在現有的一些高熵合金中,基于增材制造技術進行的研究主要集中在以下體系[42]:CoCrFeNi系高熵合金、CoCrFeMnNi系高熵合金、AlCoCrFeNi系高熵合金、過渡族金屬系難熔高熵合金等。其中增材制造難熔高熵合金(refractory high-entropy alloys, RHEAs)由于易產生成分偏析,一般采用高能量密度的小光斑激光器作為熱源促進其元素均勻化,主要應用在制備具有一定優異性能(耐腐蝕性[43]、高硬度[44]、耐磨性[45-46]等)的高熵合金涂層方面。除此之外還可以根據層錯能大小組合不同的缺陷進行微觀結構設計[21,47]。針對高熵合金的性能設計,目前主要集中在高強度、強韌性[48-51]、抗氧化、耐磨性[52-56]等研究方面,制備并研究具有優越性能的目標合金。
近年來,理論和計算研究在材料科學中發揮著越來越重要的作用。計算機模擬和實驗數據的結合有助于理解和闡釋物理機制,從而能夠有效地預測合金的性能。本工作主要介紹了三種方法,并提供了它們在高熵合金開發中的成功應用實例,包括高通量熱力學計算、高通量第一性原理計算和機器學習。此外,還說明了不同高通量計算技術的優缺點和適用場景、存在的問題以及未來的展望,以便為高熵合金的開發設計提供指導。
“高通量(high throughput)”一詞在研究中廣泛使用,2011年材料基因組計劃(國內啟動了相應的材料基因工程計劃)提出后在材料領域廣泛使用,并成為材料基因工程計算和實驗區別于傳統計算和實驗表征的顯著特征。材料領域的高通量計算(high throughput calculation,HTC)不同于計算機科學的高性能計算(high performance computing,HPC),前者旨在通過并行計算、高性能計算等手段,以提高計算通量的形式加速材料計算。高通量計算方法主要特征是并發式計算、自動流程計算,可以實現高數量級任務的高效計算而非多任務順序自動計算。材料計算涉及多個尺度,高通量計算最早在量子尺度開展,充分滿足了加速尋找新材料和優異性能的需求,尤其是新型功能材料和高性能材料的發現。高通量第一性原理計算方法在發現新材料、預測新材料性能或優化現有材料上應用較廣。
高通量第一性原理計算可以解決材料成分的高效篩選問題,其經典案例是計算了80種二元合金的176種晶體結構并對其各性能進行了應用分級[57]。該思路用于多類材料的發現,其中包括高熵陶瓷材料的性能計算。國際上已經開發了基于高通量第一性原理計算的架構平臺,如AFLOW[58]是包含352余萬種化合物的7.3億個性能數據的大型數據庫。高通量第一性原理計算被認為是有潛力的快速材料篩選方法。
近年來高通量計算的概念被應用于微觀熱動力學尺度,成為金屬結構材料快速獲取相信息的方法[59]。高通量熱動力學計算是近年發展起來的集熱力學與動力學于一體的計算方法。基于熱/動力數據庫可以高效模擬任意數量組元間的熱力學和動力學相變。對于擴散型相變模型可處理單相的均勻化、析出相的溶解和長大、第二相粒子的粗化以及凝固過程中的顯微偏析等問題,從而實現材料成分和工藝設計。高通量第一性原理計算和高通量熱動力學已在快速發現及篩選新材料方面廣泛應用,包括工業鋁合金篩選、高溫合金組織設計、高熵合金成分優化等。
數據科學作為理論研究、計算和實驗外的科學發現“第四范式”,在2007年提出后即被各領域各學科廣泛接受和應用。機器學習(machine learning, ML)是一個致力于理解和構建“學習”方法的研究領域,即利用數據提高某些任務集性能的方法[60]。隨著以人工智能、大數據等為主導的“第四次工業革命”時代的到來,人工智能的新分支——機器學習已被廣泛應用于機器人技術、計算機視覺、數據挖掘和生物醫學等眾多領域。機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論以及算法復雜度理論等[61]。
機器學習概念最早在1959年由Samuel提出[62],現已發展成為一個涉及計算機科學、統計學等多領域的交叉學科。機器學習因其高效的計算和預測能力,逐漸被用于材料科學研究領域。基于充分的實驗研究和理論計算,機器學習方法可以快速完成數據挖掘,揭示其中所蘊含的信息和規律,并準確預測材料性能進而篩選目標材料。近年來,機器學習受到廣泛關注,在材料科學開發新材料方面也展現出了卓越的能力。2016年發表在《自然》雜志封面的文章“Learning from failure”,挖掘大量失敗實驗數據成功實現化學反應預測和新化合物形成,這一案例進一步助推了機器學習在材料中應用的研究熱潮[63]。
隨著對材料基因工程思想的深入理解,高通量計算與機器學習在材料的成分設計篩選及性能預測與優化上得到大量應用。數據驅動方法可以明顯加快研發速度,縮短研發時間,降低計算成本。不論是微觀還是宏觀層面,該方法都可以被應用于材料科學領域中的新材料發現、材料性能預測等[64]。
高熵合金[3-4]因其新穎的合金設計原理而引起了人們的極大興趣。高熵合金盡管最初被定義為單相多元的等原子比或近等原子比的合金,但優異的性能不斷被發現,所期望的合金性能有時會由于元素間的非直觀相互作用而產生。圖1歸納了Web of Science數據庫中2013~2022年期間高熵合金相關熱點詞出現的次數以及高熵合金文章中一些關鍵詞出現的頻次(圖1)。高熵合金的成分選擇和制備涉及復雜的跨尺度物理化學現象,其原材料、合金成分和制備工藝等因素均會對微觀組織和性能產生重要影響[1,65]。僅通過實驗方法探索高熵合金組織及性能的作用規律較為耗時,而材料計算和機器學習技術被越來越多的人所接受和應用,成為高熵合金設計的有效研究手段[66]。

圖1 Web of Science數據庫中2013~2022年高熵合金領域相關熱點詞變化趨勢Fig.1 Trend of hot words in the field of high-entropy alloys from 2013 to 2022 in the Web of Science database
2.1.1 高通量第一性原理計算
隨著超級計算機的發展,第一性原理的高通量計算作為一種成熟的計算方法研究材料性能,可以更加便捷和高效地解決復雜問題,對從微觀角度理解和設計預測目標材料起到了不可或缺的作用。第一性原理計算基于量子力學計算凝聚態原子和電子的行為,定量描述原子鍵合的能力。第一性原理計算不依賴經驗參數,通過輸入元素種類和原子坐標,即可對材料性質數據進行預測,是理解材料本征、分析物理性質、設計新材料的重要工具。通過計算模型設計和參數優化,定量預測材料成分優選、物相組成、組織結構與性能的構效關系,實現高通量計算數據在新材料設計研發中的應用。基于第一性原理計算的高熵合金研究論文數量呈指數增長,證明了第一性原理計算方法的高計算精度可建立結構和特性之間的聯系,為新材料的設計提供了充足的數據信息。高通量第一性原理計算具體作用與優勢表現為三個方面:
(1)精準構建長程無序、短程有序結構。高熵合金是一種多主元混合合金,其結構特點為長程無序且短程有序,因此精準構建其原子排布結構是預測高熵合金材料特性的關鍵。目前已經開發的特殊準隨機結構(special quasi-random structure,SQS)[67-68]與小集合有序結構(small set of ordered structures,SSOS)[69-70]能夠反映高熵合金長程無序特性。第一性原理計算可以模擬高熵合金的平衡態結構,計算分析短程有序形成的影響因素,并且基于預選小集合有序結構(preselected small set of ordered structures, PSSOS)方法(圖2[70])可以實現高熵合金的高通量第一性原理計算。因此,在構建多元組分長程無序、短程有序結構高熵合金方面,高通量第一性原理計算具有高精度優勢。

圖2 高熵合金中基于SSOS方法的高通量第一性原理計算及篩選策略[70]Fig.2 Computational screening strategy based on SSOS high-throughput first-principle calculations method for high entropy alloys[70]
(2)準確預測高熵合金相穩定性。第一性原理計算可以獲得合金原子級物理參數,判斷合金的相穩定性以揭示合金元素添加對相穩定性的影響及合金分解中總能量的變化[71]。這種計算可以涉及任何系統,甚至是不存在的假設系統。隨著高熵合金單一固溶體的形成,平衡狀態可能包括多種固溶體和金屬間沉淀物的形成。高通量第一性原理計算可確定單相的穩定性并預測單相中的元素偏析,這有助于深入理解難熔高熵合金的相結構性能[72]。從能量角度出發,基于FCC和BCC結構之間的晶格穩定性能量,高通量第一性原理計算可以篩選出具有BCC穩定性的候選合金。
(3)準確計算高熵合金的力學性能。具有單相晶體結構的高熵合金具有比強度高、延展性好及耐腐蝕性強等優異性能。第一性原理計算可得出單相體系彈性常數、剪切模量、體積模量和泊松比等參量,但當合金元素種類增加后可能會形成多相,其結構設計和性能預測則變得復雜得多。將量子力學的第一性原理計算與統計力學相結合,通過比較BCC相和第二相(如Laves相)對自由能的貢獻來預測多相材料力學性能[73]。
2.1.2 高通量熱動力學計算
高熵合金在制備過程中涉及復雜的熱力學和動力學現象,材料的組織結構是其系統狀態變量和制備工藝的產物,對性能有決定性作用,并對微觀組織和性能產生重要影響[1-3]。高熵合金的性能很大程度上取決于其成分及微觀組織,即組元數量、體系混合熵、體系混合焓、相體積分數、元素分布等,這些均可通過熱動力學計算獲得。高通量熱動力學計算具體作用與優勢表現為三個方面:
(1)精確獲得高熵合金的相圖及熱動力學性質。熱動力學計算方法基于相的吉布斯自由能和原子擴散系數來描述不同合金成分和制備工藝下多組元體系的相圖和熱動力學性質。較其他合金相比,熱動力學計算高熵合金顯得尤為重要,因為高熵合金已經不再受限于最初發現時的多元等原子比單相合金,還會出現雙相或第三相,而性能也影響較大,甚至比單相時更佳。
(2)快速獲得高熵合金關鍵組織參數。高通量熱動力學計算可以快速獲取廣泛成分空間內合金的微觀組織和熱動力學性質,結合微觀結構實驗表征能夠高效地研究組織結構的演變規律及其控制機理。掌握材料體系的熱動力學信息不僅是研究材料微觀組織演變的重要基礎,也是開展不同尺度組織結構模擬(如擴散、相場、流場和有限元模擬)的必要條件。
(3)實現跨尺度分析。高熵合金制備過程中微觀組織的定量描述是研發新型合金及提升現有合金性能的重要基礎。結合微觀組織的高通量熱動力學計算并進行成分和工藝篩選是獲得高性能高熵合金的有效途徑。而高通量熱動力學計算與高通量第一性原理計算相耦合,能夠進一步加快合金開發中跨尺度集成計算的效率。在高熵合金研究中,基于高通量計算可以完成在包含百萬、甚至千萬個成分組合的超大成分空間中進行合金成分篩選與設計,實現從材料本征特性出發探索材料機理并研制新材料。
當考慮非等摩爾比的高熵合金時,研究者發現高熵合金擁有巨大的成分設計空間和自由度。而巨大的成分空間與對高熵合金理論認識的匱乏形成強烈反差,使得基于大數據的數據挖掘和機器學習方法成為除實驗探索與計算模擬之外的有效方法之一,能夠實現非等摩爾比高熵合金的設計。具體作用與優勢表現為兩個方面:
(1)高熵合金相形成的判定。基于體量較大但較為分散的數據集,以材料熱動力學等參數或自定義參數為判據,機器學習可對數據進行分類以判定固溶體相的形成[74],這一類工作屬于相對早期研究時采取的研究手段。隨著研究的深入,發展了以合金的不同化學元素含量作為輸入,或者以單質元素的物理、力學等本征特性的各類組合形式作為特征,如原子半徑差、價電子數、構型熵、混合焓等,可直接建模得到元素組合與相形成的關系。例如基于人工神經網絡算法建模獲得相評估靈敏度矩陣,能夠定量評估并調整設計參數實現形成固溶體、金屬間化合物或非晶相的精準設計[75]。這為熱動力學計算的相形成提供有力補充。
(2)高熵合金的成分與性能的關聯關系。基于成分和元素的各類本征特性及其組合,以及基于材料理論知識[76]及特征工程思想對元素本征特征進行優化,可獲得的綜合反映合金不同特性的特征參量。通過構建特征參量與強度等性能的關聯關系模型,可實現基于化學成分快速預測材料性能。該方法結合一定量的實驗數據補充可為合金成分設計提供較好的指導作用[77],因此成為目前高熵合金成分設計的主要手段之一,尤其是對合金機理研究不足的情況下。機器學習技術在高熵合金上的成功應用,使得高熵合金在巨大成分空間的探索上能夠兼顧可操作性與高效性。
(1)長程無序、短程有序分析。隨著高熵合金微觀結構研究的深入,高熵合金中原子的排布并非理想的無序狀態,短程有序或多相共存現象是普遍存在的,同時也促進了第一性原理在高熵合金上的應用向更小尺度探索。在接近臨界有序無序轉變溫度時,高熵合金的原子結構排列從完美的長程有序向局部的短程有序轉變,而對于高熵合金短程有序(short-range ordering, SRO)結構的構建,將是高熵合金理論計算的基礎和難點[78]。因此基于密度泛函理論(density functional theory, DFT)計算高熵合金的復雜性對模型構建方法提出了更高的要求。任縣利等[79]提出了用蒙特卡洛結合密度泛函理論構建高熵合金平衡態結構的計算方法,分析短程有序形成的影響因素(原子間相互作用、原子間混合焓以及原子尺寸等)及短程有序的出現對高熵合金性質的影響,主要體現在電子分布、磁性以及力學性能方面。Nataraj等[80]采用第一性原理計算和團簇展開法考察了短程有序如何影響相穩定性和力學性能,其中團簇展開法用成對、三線態和高階相互作用來表示結構的能量。通過幾種線性和非線性算法對模型進行選擇,確定了有效的團簇相互作用,進而研究高熵合金的相穩定性與溫度的關系。
短程有序現象也與層錯能有關,Tsuru等[81]結合蒙特卡洛模擬和第一性原理計算分析了Si元素的摻雜對FCC高熵合金性能的影響。研究表明Si的加入增加了局域晶格畸變,短程有序的形成引起了層錯能的劇烈波動,并使其增加。低層錯區和高層錯區分布到基體中作為非均勻形核位置,這一特性導致了Si摻雜合金中超細孿晶的形成,被認為是提高合金強度和塑性的主要因素,使其在提高強度和延性方面具有很大的潛力[13]。對于高熵合金無序固溶體中存在短程有序的現象,第一性原理獲得的晶體化學鍵信息可以作為評價高熵合金短程有序及各項性能的關鍵指標,如圖3所示[82]。

圖3 高通量第一性原理計算所得合金的鍵序(a)和鍵長(b)[82]Fig.3 Bond order(a) and bond length(b) of alloy by high-throughput first-principles calculations[82]
(2)穩定相篩選。由于高熵合金成分空間廣泛,目前尚無法穩定預測元素組合的單相形成能力。基于第一性原理計算提出了通過使用二元化合物形成焓的模型成為預測單相高熵合金體系的一種有效方法,如圖4所示[83]。此第一性原理焓矩陣也可用于搜索單相合金的特定元素添加物,預測結果與已報道的實驗結果表現出極好的一致性。

圖4 二元化合物相對于分離成最低能量結構純元素的形成焓[83]Fig.4 Formation enthalpy of lowest energy structure of binary compounds relative to phase separation into pure elements[83]
(3)計算高熵合金的力學性能。難熔高熵合金的相結構、體系能量和彈性模量直接影響高熵合金的力學性能。在固溶體中,層錯能的大小影響部分位錯的形成以及平面滑移和雙交叉滑移的發生,它可以作為合金設計的可靠參數[84-86]。高通量第一性原理計算可以計算高熵合金的堆垛層錯能(γusf)和表面能(γsurf),進而確定評估合金的強度和韌性。結合以BCC型難熔高熵合金γusf和γsurf為目標參量的統計回歸替代模型,已通過VASP+SQS方法得到的計算值驗證[87],證明高通量第一性原理計算在探究高熵合金強度塑性關系上具有優勢。
單相晶系具有獨立的彈性常數,因此第一性原理計算出的彈性常數需要根據現有的經驗法則獲得定量表達材料彈性性能的參數,如表1[88]所示。
通過計算原子尺寸差、價電子濃度和原子分布確定該合金主要結構為單一的無序BCC固溶體,采用第一性原理計算可獲得合金化元素含量對體積模量、楊氏模量、剪切模量、韌脆轉變指標B/G及泊松比的影響規律,進而可以確定最佳合金體系[89]。
隨著對高熵合金固溶體以及相變的研究,高熵合金熱動力學計算數據庫持續完善,熱動力學計算在高熵合金研究中的應用也越來越多。
(1)計算高熵合金體系相組成。美國空軍研究實驗室[7,90]通過對數千種等摩爾成分高熵合金的高通量熱動力學計算、篩選和分析,發現幾乎所有單相等摩爾合金都是固溶體型合金,而大多數多相合金是固溶體與金屬間化合物的混合型合金。計算結果與實驗結果顯示出良好的一致性[16,91]。美國田納西大學[92]評估了固溶體相形成規律并確定這些經驗規則適用于大多數合金成分,指出熱動力學方法是一種有效的手段來預測高熵合金的相組成和相形成溫度。
(2)快速篩選獲得組織性能匹配的高熵合金體系。圖5為基于高通量熱力學計算篩選高熵合金的過程,首先利用平衡計算和非平衡希爾凝固計算相結合,基于高通量計算預測高熵合金加工后的熔點、相組成、熱力學性質,快速獲得滿足熔點判據、相體積分數判據的合金成分空間,從而快速輔助分析有效的合金成分,降低實驗試錯頻次[93]。
(3)輔助增材制造技術加工。通過高通量熱力學計算結合多通道送粉增材制造技術,實現難熔高熵合金的高通量制備,利用離位X射線衍射(X-ray diffraction, XRD)和掃描電子顯微鏡(scanning electron microscopy, SEM)表征,獲得各成分合金的相構成及元素分布,為MoNbTaW難熔高熵合金材料篩選提供關鍵信息[94]。
目前國內外已普遍接受采用高通量熱動力學計算來篩選并優化高熵合金的成分和熱處理工藝,對高熵合金廣闊成分空間的探索有著重要的理論和實際意義。在篩選得到成分的基礎上可開展高通量制備與表征,系統地掌握高熵合金組織及性能的演變機理,為高熵合金的開發設計奠定重要的理論基礎。
機器學習在近年來被廣泛應用于高熵合金,利用機器學習方法進行材料性質預測和新材料設計的文章數量也呈現激增趨勢。大數據時代的到來,得益于越來越多的開源數據庫建立、算法不斷改進以及計算機算力的飛速增長,基于數據庫與機器學習的材料信息學已成為材料科學領域的重要研究手段。

表1 定量表達材料彈性性能的參數[88]Table 1 Parameters for quantitative expression of elastic properties of materials[88]

圖5 高通量熱力學計算篩選高熵合金[93]Fig.5 High-throughput thermodynamic calculation for screening high-entropy alloys[93]
(1)基于機器學習的固溶強化模型改進。機器學習特征篩選方法與高熵合金固溶強化模型結合,可以改進傳統物理模型,其過程如圖6[77]所示。通過構建高熵合金固溶強化的機器學習模型,發現電負性之差和剪切模量對高熵合金的固溶強化有顯著影響,并能夠構建比現有模型更加適用于高熵合金的硬度預測,同時可以進一步理解高熵合金元素電負性的差異驅動復雜原子環境中電荷的相互作用[95]。

圖6 固溶強化模型改進流程圖[77]Fig.6 Flow chart of solution strengthening model improvement[77]
(2)高熵合金相種類預測。機器學習在相形成方面應用較多的方法主要包括神經網絡(neural networks,NNs),高斯過程(Gaussian process,GP),K近鄰(k-nearest neighbor,KNN),支持向量機(support vector machines,SVMs),主成分分析(principal component analysis,PCA),隨機森林(random forests,RFs)和邏輯回歸(logistic regression, LR)。這些研究表明價電子濃度、電負性、原子半徑和混合焓都是決定相形成的重要特征。但是基于理想構型熵得到的混合熵相對較小,這可能是由于有限溫度下的有序效應降低了材料的實際熵。基于晶系、晶胞尺寸以及形狀結構參數并非主要因素,對于低溶解度/低濃度體系甚至適得其反。遺傳算法在減少特征空間方面優于其他方法,如LASSO(least absolute shrinkage and selection operator)算法、隨機森林和梯度提升決策樹(gradient boosting decision tree, GBDT),而神經網絡方法在固溶體形成類型方面具有優勢。
高熵合金的相組成可分為固溶體相(SS)、金屬間化合物(IM)以及混合相(SS+IM)。準確預測多組元高熵合金的相組成是篩選高熵合金性能的基礎。根據高熵合金四大核心效應[96],使用機器學習算法建立了相預測模型可以高精度實現相分類,可以為合金設計提供指導[97]。
改進機器學習模型與材料描述符的組合可以進一步加快高熵合金的相分類。通過映射目標屬性與材料描述符之間的關系,機器學習模型快速有效地構建材料描述符的最佳組合。Zhang等通過遺傳算法系統框架從大量方案中有效選擇最佳組合,該方法對固溶體和非固溶體的識別準確率高達88.7%,并進一步識別固溶體相中的BCC,FCC和BCC+FCC相,該遺傳算法過程如圖7所示[98]。

圖7 遺傳算法選擇最佳模型與特征組合的步驟[98]Fig.7 Steps of genetic algorithm to select the optimized model and feature combination[98]
(3)機器學習模型預測高熵合金力學性能。在高熵合金的設計中,合金力學性能是至關重要的一部分。然而高熵合金存在原子相互作用復雜、原子環境和位錯相互影響的問題[99]。Huang等在研究Cantor合金的硬度時使用了13個特征,包括第一電離能、價電子濃度等,顯著多于相分類的5個特征,構建了優于傳統理論硬度模型的高熵合金機器學習模型[100]。根據高精度硬度模型中特征對硬度的影響,在模型中引入電荷轉移修正項,優化了傳統經驗公式預測精度,不同模型預測高熵合金硬度結果如圖8所示。

圖8 機器學習模型與傳統理論模型的硬度預測結果(a)以及理論硬度模型修正前后預測FCC,BCC合金硬度的對比(b)[100]Fig.8 Comparison of hardness predicted by ML model and the physical ones(a), as well as the hardness predicted by the modified physical models on FCC and BCC HEA alloys(b)[100]
(4)基于自適應設計的高熵合金優化。由于高熵合金的實驗數據較少,用文獻中收集的實驗數據所構建的模型具有一定預測局限性,可采用自適應設計來提升模型精度以解決小數據機器學習建模問題。在高熵合金設計時采用一種以性能為導向的材料設計策略,結合機器學習、實驗設計和實驗反饋來尋找具有優異性能的高熵合金[101]。Rao等基于自適應設計思路在幾乎無限的成分空間中加速新型高熵合金的設計(圖9)[102]。利用該方法篩選并制備17種高熵合金,其中兩種四主元高熵合金熱膨脹系數與經典FeNi二元合金相當,兩種五主元高熵合金的熱膨脹系數比FeCoNiMnCu高熵合金低56.2%。

圖9 基于機器學習模型、第一性原理計算、熱力學模擬和實驗反饋相結合的主動學習框架[102]Fig.9 Active learning framework based on combination of machine learning models,DFT calculations, thermodynamic calculations and experimental feedback[102]
該主動學習策略包括三個主要步驟:開發基于深度生成模型Wasserstein自動編碼器體系的高熵合金生成方法HEA-COGS,結合無監督學習和隨機抽樣過程進行候選空間采樣。采用包括多層感知器和梯度提升決策樹的二階段集成回歸模型(TERM)進行物理信息篩選,建立基于高通量成分和原子特征的集成模型,在候選空間中推斷出1000個可能的合金成分組合,再輸入第一性原理和熱力學計算的物理性質構建集成模型,將候選合金數量進一步縮小至20~30個。基于排名策略選擇最有潛力的前三個候選合金,然后在物理性能測量系統(PPMS)中進行實驗測量并反饋回數據庫,重復迭代直到發現性能符合需求的目標合金。
優異的性能賦予高熵合金許多潛在的應用前景,但是也存在一些問題會限制其發展。盡管有許多文獻已報道過多種高熵合金力學性能方面的研究,但是對其變形機理的了解卻很少,例如變形過程中的位錯亞結構分析以及位錯與溶質原子之間的相互作用機制等。
高熵合金主元的增加雖然使其擁有更大的成分空間,并引入更多的可能性,但是也給理論建模和仿真帶來了重大挑戰。主元數的增加使得在構建模型時需要考慮更多的化學相互作用,難以構建經驗原子相互作用模型,若是使用傳統的簇擴展方法或嵌入式原子法,則會導致過擬合。在進行第一性原理計算時,由于高熵合金結構的復雜性,需要使用超大的晶胞來構建結構模型,這會使計算成本以及時間大大增加。
雖然機器學習模型屬于黑箱模型,其在作出預測的過程中進行的一系列操作是未知的、缺乏透明度且可解釋性較差,但是機器學習仍可以幫助理解材料科學中的物理機制問題。例如,當使用可靠的機器學習模型與精心挑選的算法建模時,模型選擇的描述符可能在變形機制中擔任著重要的角色。同樣可以使用機器學習來發現能夠重現材料演變過程的新描述符,能夠為構建理論模型提供參考。
盡管機器學習在高熵合金設計上具有優勢,但是仍存在一些挑戰。首先是模型置信度,機器學習預測的結果不能盲目地相信,需要對模型的不確定性進行量化,嚴格地估計每個預測的不確定性[103]。在實踐中,有不同的方法來評估模型的不確定性[104](如圖10所示),有DS理論[105]、模糊集[106]、區間方法[107]、概率方法[108]、貝葉斯方法等。通過了解和量化不確定性的來源,可以得出模型的置信區間,這不僅幫助理解預測的可靠性,也能通過在不確定性高的區域添加數據來實現主動學習[109]。

圖10 不確定性量化UQ-ML模型中不確定性組成部分[104]Fig.10 Uncertainty quantification (UQ)-the components of UQ in ML models[104]
原子在材料中的排列具有各種對稱性,如平移、旋轉和晶體對稱性,只有特定的點和線才能表示高維特征空間中的真實系統,保證原子的真實環境。目前主流的方法是構造一個保持對稱性的描述符,但是相比之下,端到端的神經網絡模型在自動捕獲三維晶格上的物理相關描述符更具有優勢,然而端到端的模型通常需要更大數據集來訓練。獲得高質量的數據集也是存在的問題,其難點在于不同的研究小組獲得數據的實驗條件不同,這使得在合并數據時需要仔細校準;此外,這些數據的獲取比較耗時,在高熵合金問題上通常都只有小數據集能夠使用。可以預見到,高質量的數據集依然是制約高熵合金機器學習發展的一大難題。
盡管近幾年眾多學者對高熵合金開展了研究,但目前對高熵合金的成分、工藝、微觀組織與性能的復雜關系尚未完全揭示。總而言之,在材料計算和機器學習方面尚存在以下問題:
(1)第一性原理計算。由于包括多種合金組分和微觀結構,第一性原理計算高熵合金往往比傳統材料更加困難。而且,所需要的計算能力隨著組元增加而不斷增加。而一些傳統的數據庫對于高熵材料的計算遠遠不夠,預測結果可能與實驗結果差別較大。由于精度和計算力問題,第一性原理計算除了等原子比單相高熵合金之外,對非等原子比合金的探索工作應用較少。
(2)熱力學計算。熱力學計算的可靠性嚴重依賴于熱力學數據庫的準確度,目前商用高熵合金數據庫在開發過程中仍存在計算精度低、部分體系相組成關系預測不準確等問題。同時,數據庫的數據加密,用戶無法自行增加和修正數據。國內缺乏可支撐高熵合金材料計算和設計的熱力學數據庫,嚴重制約著我國新材料的研發。
(3)機器學習。機器學習對高質量數據的依賴度較高。高熵合金數據的獲取成本高且分布不均勻,易導致機器學習的過擬合問題,直接影響模型預測效果。另外,機器學習的可解釋性差,難以說明因果關系的問題一直存在。無論在性能預測還是機理模型構建上,在研究時間尚短且積累數據有限的高熵合金上此問題可能更為突出。
隨著對高熵合金的研究深入和潛力應用的探索,第一性原理計算、熱動力學計算、機器學習等作為材料發現與機理探究的先進工具,將在今后研究中充分發揮其效力。
(1)高精度的第一性原理計算加速方法。計算效率與精度的矛盾在高熵合金計算上顯得更加突出,目前國際上支撐高通量第一性原理計算及機器學習技術與工具包括AiiDA和MatCloud等,都難以適應高熵合金的計算。因此,開發基于機理且兼具高通量與高精度的第一性原理加速器,將滿足高熵合金研發提速的需求。
(2)適應高熵合金復雜性與數據稀缺問題的機器學習新方法。微軟研究院的計算機專家與數據專家推出的AI for Science,將推動機器學習和人工智能與材料領域研究的深度合作。人工智能助力高熵合金機理模型、人工智能與高性能計算兩大手段,有望突破高熵合金的復雜、高維、小數據的問題,也將形成今后高熵合金研究發展中的一個交叉學科分支。
(3)基于高通量計算與機器學習相融合的材料性能及服役行為全局優化。近年來我國材料的研究和生產強調全產業鏈管控,材料服役行為將逐步成為材料成分設計過程的約束條件之一,這使得研究過程進一步復雜。制備過程各工序的機理研究都涉及不同尺度,包括利用第一性原理和分子動力學方法對缺陷的研究,采用高通量跨尺度計算或機器學習輔助建模,機器學習實現各工序間的跨越,最終對材料性能與服役行為全局優化。
(4)高通量計算助力高熵合金的功能開發。未來高熵合金的研究與應用不局限于結構材料,功能材料同樣存在巨大潛力。而高通量第一性原理在功能材料的構效關系研究上一直具有顯著的優勢,第一性原理計算探索高熵合金用作電池材料、磁性材料、核聚變/裂變材料等研究已開展,今后可能在新能源材料等亟需發展的材料領域上取得突破。
(5)助力未來高熵合金智能制造與數據庫。智能制造是我國制造業提高產品質量的解決方案,而數據化轉型是實現智能制造和降低人工勞動力的重要舉措。高通量計算與機器學習是智能制造和數字化轉型的落地實施手段,高質量數據是機器學習的基礎。因此學習發達國家幾十年高質量數據積累的經驗,整合高通量計算、機器學習及實驗數據,構建高質量高熵合金數據庫,以期實現未來高熵合金數字化和智能化制造。