李亞豪,葉益聰,趙鳳媛,唐 宇,朱利安,白書欣
(國防科技大學 空天科學學院 材料科學與工程系,長沙 410073)
鋼鐵、鋁合金及鎂合金等傳統合金是以單一元素為主要元素,摻雜少量其他元素來改善材料性能,因此合金的性能常常受限于其主元的性質。Yeh 等[1]和Cantor 等[2]提出的高熵合金(high entropy alloy,HEA)打破了傳統合金的設計理念,它是一種無主元或多主元合金,每種組成元素都是合金的主元,這使得高熵合金的原子分布混亂無序,而恰恰是這種高混亂度產生了意想不到的穩定性,使得高熵合金更傾向于形成固溶體結構。通過對高熵合金組成主元的自由設計,有望解決傳統結構材料低溫和高應變速率下韌脆轉變、強度塑性矛盾等問題[3-5],擁有廣泛的應用潛力[6-7]。例如,Li 等[3]設計的相變增塑的雙相Fe50Mn30Co10Cr10高熵合金,相比同等晶粒尺寸的CrMnFeCoNi 合金,塑性提高超過20%的同時強度增加近30%。
高熵合金多種主元的復雜性造成其潛在成分空間過于龐大以及合金相結構與性能的影響因素眾多等問題,若采用傳統的材料研究方法,合金設計過程將十分困難,研發及性能優化周期也比較長。研究人員曾試圖從以往的數據中總結高熵合金相形成的規律[8-12],例如Zhang 等[8]通過計算Ω參數來分辨高熵合金是否形成固溶體結構。然而受限于可視化分析和高熵合金樣本的數據量,在對合金的參數進行結構判據的歸納總結過程中,僅支持2 個至多3 個參數同時分析,難以充分考慮高熵合金相結構影響因素,使得經驗參數的判據只能局限于小體系中。隨著數據挖掘技術和人工智能的高速發展,以機器學習方法為代表的數據驅動材料科學能夠有效聯合經驗、理論、實驗和計算機模擬方面的優勢,更準確地探究高熵合金成分-結構-性能間的關系與規律[13-14]。近年來,使用機器學習手段輔助高熵合金設計的報道逐漸增多[15-20],通過這種數據驅動的方法,能夠極大減少新型合金設計的時間和成本。目前機器學習模型已經在高熵合金各種性質的預測上有所研究,例如,Yan 等[16]通過訓練好的梯度提升(gradient boosting,GB)模型,預測并驗證了10 種新型固溶體結構的難熔高熵合金。Sun 等[18]利用XGBoost 模型實現了對TiZrNbTa 合金硬度的精準預測,經過實驗驗證,其預測值的準確率高達97.8%。Liu 等[19]在利用機器學習方法研究γ′相增強的Co 基高溫合金的工作中,將合金的γ,γ′相分類模型和γ′相固溶度的回歸模型同時用于成分空間的高通量篩選,取得了較好的結果。
AlCoCrCuFeNi 系高熵合金具備良好的軟磁性能[21]、力學性能[22]、耐磨性[23]等特點。馮力等[23]將AlCoCrCuFeNi0.5 合金作為耐磨涂層用于45#鋼表面。自該體系高熵合金提出以來已被眾多學者研究報道,特別是關于其相組織和硬度的研究,至今已積累了大量相關的材料數據,為數據驅動的研究提供了有利條件。目前已有一些建立機器學習模型輔助AlCoCrCuFeNi 合金體系研究的相關報道,例如Huang 等[24]基于神經網絡算法構建了AlCoCrCuFeNi合金的相分類模型,對于該體系合金固溶體和金屬間化合物的分類準確率高達94.3%。然而,僅做了模型計算工作,并未進行實際的實驗驗證,無法證明其模型的實際泛化能力。Wen 等[20]以AlCoCrCuFeNi 合金的成分作為輸入,硬度作為輸出,通過支持向量機模型設計了硬度高達880HV 的新型合金。本工作采用機器學習的方法,以AlCoCrCuFeNi 高熵合金為切入點,通過同時建立高熵合金的相預測模型和硬度預測模型,以期使用相對傳統實驗方法更低的設計成本和時間,在高熵合金設計空間中快速篩選出相種類和硬度皆符合預期的新合金,并通過實驗檢驗模型結果,開展合金設計的新模式。
建立機器學習模型的過程,本質上是利用特定的機器學習算法,根據所給的數據集計算特定的參數組合,學習數據集中隱含的知識,得到與數據擬合程度較高且具有一定泛化能力的預測模型。
1.1.1 數據集的建立
多年的高熵合金研究積累了大量的數據,關于高熵合金的相結構和硬度預測模型,也有很多相關的文獻報道。本工作借鑒了Senkov 等[25-27]、Machaka[28]、Wen 等[20]和Qiao 等[29]的工作。其中Machaka[28]使用1460 個高熵合金相數據來訓練模型,并對高熵合金面心立方(face centered cubic, FCC)相、體心立方(body centered cubic, BCC)相和FCC+BCC 雙相的三分類進行了較為準確的預測,然而該數據集中涉及到制備方法和熱處理工藝等影響因素,使得合金成分上存在較多重復。由于工藝因素影響復雜,且驗證過程較難控制,本工作將不考慮這些因素造成的影響,僅選擇報道最多的電弧熔煉法制備的鑄態合金數據,最終得到一個包含323 條數據的高熵合金相結構數據集。硬度數據集則沿用Wen 等[20]所用的一個包含155 條Al-CoCrCuFeNi 系高熵合金硬度的數據集。此外,注意到Senkov 等[27]的報道中含有18 個額外的AlCoCr-CuFeNi 系高熵合金硬度數據。本工作將兩個硬度數據合并,樣本增加至173 個。至此,構建了一個較大的高熵合金相結構數據集和一個較小的硬度數據集,兩個數據集中的樣本成分覆蓋了大部分現有的AlCoCr-CuFeNi 系高熵合金成分。
值得一提的是,前人的工作中在建立相預測模型時使用了很多經驗參數,而較少使用成分作為特征,而建立硬度預測模型時常使用成分作為特征,較少增添經驗參數。為了探究AlCoCrCuFeNi 系高熵合金的相結構和硬度模型,選用由合金成分及元素物理性質計算得到的價電子濃度(valence electron concentration, VEC)[9]、電負性差Δχ[11]、原子尺寸差δ[8]、平均熔點Tm、混合焓ΔHmix[8]、混合熵ΔSmix[8]和Ω[12]等7 種經驗參數。原因是:(1)這些經驗參數都曾經被用來研究過對高熵合金相形成的影響,并取得了一定的研究成果,說明這些參數是對合金設計有一定影響作用以及指導意義的;(2)這些參數的計算較為方便,所涉及到的元素物理基本性質都較易獲取,其中元素的價電子數、Pauling 電負性和原子尺寸的數據來源于文獻[30],元素之間的ΔHmix數據來源于文獻[31]。
1.1.2 機器學習算法
雖然一般的機器學習算法都能解決分類和回歸任務,但是由于其原理不同,在問題解決的方式上會有所偏好,因此使用合適的機器學習算法來擬合數據集,能夠得出最優的效果。因此,機器學習模型的選擇尤為重要,這需要了解每種模型的特點。其中表1中所示的支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)和人工神經網絡(artificial neural net,ANN)三種經典算法分別代表著經典二分類算法、樹集成算法和黑箱模型算法,本工作選擇這三種算法分別訓練并對比高熵合金的相預測模型和硬度預測模型。

表1 機器學習算法及描述Table 1 Machine learning algorithms and characteristics
分類和回歸是兩種不同的任務,使用的評價標準也不同。對于相分類模型的訓練,選擇準確率作為評價標準,對于回歸模型的訓練,選擇可決系數R2和均方根誤差(root mean square error,RMSE)作為評價標準。此外,為了提高模型的泛化能力,避免過擬合,采用5 折交叉驗證(5-fold cross validation,5-CV)求取平均準確率的方法獲得模型最適合的超參數。
圖1 為機器學習指導高熵合金設計的路線圖,模型部分即是高熵合金相預測模型和硬度預測模型的建立過程。完成模型建立后,進一步選擇串聯兩個準確率都較高的相分類模型和硬度回歸模型,對未知成分空間中的高熵合金進行相和硬度的高通量預測,從中選擇目標相和硬度的成分,實現對含有特定相和硬度可控的高熵合金高效設計。

圖1 機器學習指導高熵合金設計的路線圖Fig.1 Flow chart of ML assisted HEA design
本工作所用的Al,Co,Cr,Cu,Fe,Ni 單質金屬原料都是直徑1 mm、長度3 mm 左右的金屬顆粒,純度在99.5%以上。稱重配料后使用電弧熔煉法制備鑄態合金,爐內真空度7×10-3Pa,0.025 MPa 的氬氣保護氣氛,每個錠子反復熔煉5 次以上,保證合金中金屬原料混合均勻。
使用CuKα 射線源對制備的合金進行X 射線衍射分析(XRD, RIGAKUD/MAX-C);硬度測試采用HMAS-C1000SZD 型號顯微硬度計,測試力為10 N,保壓時間10 s,每個合金測試3 次,取平均值。
2.1.1 數據集分析
高熵合金中的固溶體(solid solutions, SS)相與金屬間化合物(intermetallics, IM)相是最重要的兩種相結構,它們分別代表著高熵合金中“熵”主導結構與“焓”主導結構。結合所得相結構數據集中的信息,本工作只研究固溶體相(包括FCC 結構和BCC結構)和IM 相(包括B2 相及其他IM 相)兩種相結構。
數據集中含有不同相的合金樣本數量存在較大差異,并且多數合金為多相結構,直接建立多分類模型需要考慮的類別較多。例如單相FCC、單相IM、FCC+BCC 相和FCC+IM 相等多種類別組合,使得每一類的數據量較少,難以達到較好的訓練效果。因此,為了充分利用數據,將數據只分成兩類,建立多個二分類模型,保證每一類別的數據量。
相結構數據集中的每個樣本根據其組織中的相組成被賦予IM 類、FCC 類和BCC 類三種二分類標簽:含有IM 相(1 類)和不含有IM 相(0 類)、含有BCC相(1 類)和不含有BCC 相(0 類)以及含有FCC 相(1類)和不含有FCC 相(0 類)。例如,其中的樣本Al0.7Co0.3CrFeNi 合金,其組織為FCC+BCC+IM 混合相結構,因此在上述的IM 類、FCC 類和BCC 類的標簽中都為1 類。通過上述三種二分類的數據來分別訓練模型辨別合金中是否含有IM 相、FCC 相和BCC相的能力。
一般而言,相關性較大的特征不宜同時存在于數據集中。因此,在將數據用于模型訓練之前,通常會計算特征之間的皮爾遜相關系數(Pearson correlation coefficient,PCC),來初步判斷不同特征之間是否存在較大的線性相關性。一般認為|PCC|≥0.8 時,兩個特征之間具有強相關性(線性相關);0.3<|PCC|<0.8時,兩個特征之間具有弱相關性;|PCC|≤0.3 時,兩個特征之間沒有相關性。圖2 為高熵合金相數據集中特征之間的PCC 熱度圖和相結構數據集中三種分類方式下的樣本數據分布圖。由圖2(a)可知,相關性最大的兩個特征為ΔHmix和δ,其PCC 值為-0.76。而據上述的評價標準,這兩個特征僅是具有弱相關性。因此,通過PCC 值的初步評判,在相結構數據集中選用的13個特征兩兩之間不存在強相關性,該數據集是適合用于機器學習模型訓練的。

圖2 高熵合金相數據集中特征之間的PCC 熱度圖(a)和相結構數據集中三種分類方式下的樣本數據分布圖(b)Fig.2 PCC heat maps between features in HEA phase data set(a) and data distribution map under three types of classification in phase data set(b)
數據集的樣本分布情況也是模型訓練之前需要研究的重要部分。圖2(b)給出了數據集在三種分類方式下的樣本分布情況,圖中斜線左邊的數字表示該類樣本的數量,右邊的數據是該類樣本所占的比例,例如樣本集中IM 相的正樣本有118 個,占所有樣本的37%。由此可見,三種樣本分布都不均勻,其中IM 類和FCC 類樣本分布差異較大,說明數據集中含有IM相的樣本數以及不含有FCC 相的樣本數目較少,這類有偏數據集對模型的學習訓練將帶來一定的挑戰,有可能使得模型的學習結果產生偏好性。
2.1.2 預測模型結果分析
采用SVM,RF 和ANN 算法分別構建基于IM 類、FCC 類和BCC 類三種分類方式的二分類模型,并使用5-CV 方法求取平均準確率,如表2 所示。

表2 三種算法在各個標簽下的準確率Table 2 Accuracy of three algorithms under each tag
對比表2 中模型的訓練效果,發現基于三種算法的模型對于相同標簽的預測準確率較為相近,其中SVM 模型在三種標簽的數據集中都有相對較高的分類準確率,說明SVM 算法在本工作所用的較小數據集中的二分類能力更有優勢。反觀RF 模型和ANN模型,其測試集準確率則是基本相當,但是通過對比兩個模型的訓練集和測試集準確率,可以發現,兩個模型的訓練集準確率顯著高于測試集準確率;兩個模型的測試集準確率基本相當,而ANN 模型的訓練集準確率更高,說明兩個模型都存在一定的過擬合,且ANN 模型的過擬合程度要更高一些。
此外,IM 類的分類準確率都較低,測試集準確率僅有約80%,而FCC 類和BCC 類的識別準確率都在90%以上,說明模型對IM 類的識別能力比較差。三個模型的訓練結果都較差,因此問題可能出在數據集的質量上。前文提到有偏數據集會給模型的訓練帶來一些挑戰,FCC 類數據是比IM 類更為偏的一組數據,然而FCC 類的預測準確率確很高。具體分析需要借助混淆矩陣(confusion matrix)的計算,混淆矩陣能夠直觀地觀察到每一個類別的預測情況,幫助判斷模型是否存在過擬合。
圖3 為三個模型基于5 折交叉驗證方法在各個標簽類別下的混淆矩陣。圖3(a-1),(a-2),(a-3)分別表示SVM 模型在IM 分類、FCC 分類和BCC 分類情況下計算得到的混淆矩陣。由于訓練時使用了5 折交叉驗證,而混淆矩陣只用測試集數據計算,因此這里將5次計算的混淆矩陣相加,最終得到全樣本集預測結果的混淆矩陣。
以圖3(a-1)為例,該圖表示SVM 模型在IM 標簽二分類下5 次交叉驗證混淆矩陣的和,其中縱坐標為樣本的實際標簽,橫坐標為模型預測標簽。因此右下角0.73/86 表示實際為含有IM 類(1 類),并且SVM 模型的預測也為1 類的樣本數為86,占IM 標簽總數(118)的0.73,即正樣本的召回率為73%。
有偏數據集的訓練結果往往存在偏好性,模型往往傾向于把樣本判斷為類別比較多的那一方。若發生在圖3(a-1)中所示的混淆矩陣中,則會導致把IM類認為是不含有IM 類,即左下角的樣本數會比較多。這種偏好性往往是模型過擬合導致的,在樣本較多的類別召回率接近模型訓練集準確率的情況下,樣本較少的類別召回率與訓練集相差較大,而這種訓練集準確率異常高于測試集準確率的情況稱為過擬合。
圖3 (a-1),(b-1),(c-1)中的結果表明,三個模型在IM 類別的預測上確實存在一定程度上的過擬合,其中RF 模型的過擬合程度最為嚴重,其測試集預測平均準確率為0.805,但是IM 類的召回率僅有61%。而ANN 模型擁有不遜于SVM 的測試集預測準確率的同時,其召回率達到了三個模型最高的0.75,與平均準確率0.808 較為相近。因此,在IM 相的預測模型中,盡管SVM 的測試集平均預測準確率最高,但由于存在一定程度的過擬合,憑借0 類樣本更高的準確率提升了其平均準確率,不利于模型對未知合金的預測。綜合上述考慮,ANN 模型在IM 類預測上的泛化能力更優。
與IM 類數據類似,FCC 相標簽中兩種類別的數據量比例失衡更為嚴重,因此也需要通過混淆矩陣輔助判斷是否存在過擬合現象。圖3(a-2),(b-2),(c-2)的結果表明,數據更少的不含FCC 相類別(0 類)并沒有被模型更多地預測為含有FCC 相類(1 類),即左上角的數值較高表明較大的負樣本召回率。通過比較三個模型的混淆矩陣,可以發現SVM 模型在FCC 類的預測上不僅有最高的召回率,平均預測準確率也是最高的,并且兩個準確率相近,因此可以初步判定,本工作訓練的SVM 相分類模型沒有發生過擬合,為FCC 類預測的最佳模型。而RF 模型與ANN 模型雖然有相同且與SVM 模型相近的平均準確率,但RF 模型的召回率僅有0.82,遠低于0.923 的平均準確率,ANN 模型的召回率同樣較低,說明這兩個模型存在較大的過擬合。
相比上述兩類數據,BCC 相標簽中的兩類數據量則更為接近1∶1,不會造成模型有偏好地學習。圖3(a-3),(b-3),(c-3)中的結果也證明了這一點。可以看出,正負樣本的預測準確率比較相近,都在90%左右。其中又以SVM 模型的準確率最高,其兩類樣本的召回率都高于RF 模型和ANN 模型。
2.1.3 相形成影響因素分析
三個測試表現最佳的相分類模型分別是ANNIM,SVM-FCC 和SVM-BCC。然而機器學習模型不僅是一個高效的預測篩選器,研究者們往往更想知道模型為什么做出這樣的預測,從而分析影響結果的因素,輔助理論解釋的完善。圖4 為基于ANN-IM 模型的特征重要性排序和SHAP(Shapley additive explanations)值分布圖。圖4(a)給出了基于ANN-IM 模型的特征重要性排序,圖中縱坐標為特征名稱,橫坐標為該特征對模型輸出值的平均影響占比。結果表明,Tm,ΔHmix,VEC 和Al 元素的含量是影響IM 相形成最重要的4 個特征。圖4(b)給出了基于ANN-IM 模型的SHAP 值分布圖,其中縱坐標同樣為特征名稱,并且是按照特征重要性排序,橫坐標為特征中每個樣本計算得到的SHAP 值,該值大于0 表示樣本對模型的輸出有正影響,即對IM 相(1 類)的形成有促進作用。右邊的彩色柱代表特征數值的大小,具體表現在圖中每一個點代表一個樣本,在某一個樣本中該特征的數值越大則該點越紅,反之該特征的數值越小該點越藍。以影響最大的Tm為例,Tm越高,合金越傾向于形成IM 相。

圖4 基于ANN-IM 模型的特征重要性排序(a)和SHAP 值分布圖(b)Fig.4 Feature importance ranking(a) and SHAP value distribution(b) based on ANN-IM model
圖5 為基于SVM 的FCC 相預測模型和BCC 相預測模型的SHAP 值分布圖。由圖5(a)可知,Al 元素的含量、VEC 和Tm是影響高熵合金FCC 相形成的最重要的三個特征,并且Al 元素含量越低,VEC 越高或者Tm越低,合金越會傾向于形成FCC 相。由圖5(b)可知,ΔSmix和Tm是影響高熵合金BCC 相形成的最重要兩個特征,并且ΔSmix越大,Tm越低,越容易形成BCC 相。

圖5 基于SVM-FCC 模型(a)和SVM-BCC 模型(b)的SHAP 值分布圖Fig.5 Distribution of SHAP values based on SVM-FCC model(a) and SVM-BCC model(b)
可知,ΔHmix越小,越容易形成IM 相。ΔHmix代表元素之間的親和性以及形成化合物的傾向性,因此,ΔHmix很低時容易形成IM 相在材料學中是容易解釋的。此外,從圖4 和圖5(a)中還能發現,VEC 和Al 元素含量都是影響IM 相和FCC 相形成的關鍵因素,其中VEC 越高,IM 相和FCC 相都越易形成。VEC 對于合金結構的影響主要取決于合金金屬鍵的強弱。一般而言,較強的金屬鍵往往具有較高濃度的價電子,金屬鍵越強,意味著晶體結構的平衡原子間距更短、密堆程度更高。因此,價電子就像金屬原子之間的黏結劑,VEC 越大,往往更傾向于形成致密程度較高的晶體結構。而IM 相和FCC 相一般都是密堆結構,與VEC 較大時這兩相更易形成的結論吻合。Al元素含量則對兩相起到相反的影響作用,Al 含量越多越容易形成IM相,且越難形成FCC 相,這可能與Al 原子的尺寸與其他3d 過渡族為主的金屬原子相差較大且ΔHmix較負的因素有關。圖5(b)的結果表明,影響BCC 形成的最重要因素是ΔSmix,且ΔSmix越大越容易形成BCC 相。ΔSmix越大越容易形成固溶體結構,再結合圖4 的結果,在AlCoCrCuFeNi 體系中,ΔSmix大不僅僅容易形成固溶體結構,還易形成BCC 固溶體結構。
2.2.1 數據集分析
構建機器學習硬度預測模型之前,同樣需要對數據進行預分析。圖6 為硬度數據集的PCC 熱度圖和硬度值分布圖。由圖6(a)的PCC 熱度圖可知,Tm,Δχ與Ω兩兩之間都存在強相關性,說明在硬度數據集中,這三個特征存在一定的信息重疊,理應刪除其中兩個特征。但是,一方面,PCC 只能說明兩個特征之間的關系,在同時考慮多特征時可能出現不同的結果;另一方面,機器學習在處理高維度問題上擁有強大能力,能夠同時納入多特征進行多維度計算。因此,在硬度模型計算中仍保留這13 個特征。

圖6 硬度數據集中特征之間的PCC 熱度圖(a)和樣本分布圖(b)Fig.6 PCC heat maps(a) and data distribution maps(b) between features in hardness data set
圖6 (b)給出的硬度值分布表明,數據集中除了100~200HV 低硬度的數據較多外,基本服從正態分布。但是對于機器學習來說,均勻分布的數據更適合其學習,正態分布的數據會使機器學習在兩端的極值處獲得較少信息。因此,以該數據集建立的機器學習模型對于數據分布較少的端部預測能力可能會較差,這將對高硬度合金預測與設計帶來挑戰。
2.2.2 預測模型結果分析
在硬度預測模型的訓練中同樣采用5 折交叉驗證,并采用R2和RMSE 兩個評價指標。圖7 為基于SVM,RF 和ANN 三種算法的計算結果。可知,在5 折交叉驗證方法下,RF 模型與ANN 模型的測試結果非常相近且較差,而SVM 模型擁有最高的R2值和最低的RMSE,表明SVM 回歸在硬度數據的學習和預測上有著較大的優勢。此外,模型帶來的差異不可忽視,因此選擇多種算法構建模型來對比結果是有必要的。

圖7 硬度預測模型結果對比Fig.7 Comparison of results for hardness prediction models
2.2.3 硬度影響因素分析
圖8 為基于SVM 模型計算得到的特征重要性柱狀圖和SHAP 值分布圖。結果表明,Al 元素含量、δ、Ni 元素含量、VEC 和ΔHmix是影響較大的特征。

圖8 基于SVM 硬度預測模型的特征重要性排序(a)和SHAP 值分布圖(b)Fig.8 Feature importance ranking(a) and SHAP value distribution(b) based on SVM hardness prediction model
由圖8(b)的結果可知,Al 元素含量與δ的值越大,對形成高硬度合金的影響越顯著。事實上這兩個特征存在一定的關系,相對于Co,Cr,Cu,Fe 和Ni 的原子半徑(都約為12 nm),Al 原子的原子半徑較大(約14 nm),當Al 原子與其他元素組成新合金后,δ會變得很大,導致晶格畸變較為嚴重,產生原子級別的固溶強化作用,從而提升合金的硬度。此外,Ni 元素含量、VEC 和ΔHmix的值越小,對形成高硬度合金的影響越顯著 。實際上這幾種特征之間是相互關聯的,例如提高Al 元素含量并且降低Ni 元素含量,導致δ增大的同時,還會降低合金的VEC(Al 價電子數為3,Ni 價電子數為10)。此外,由于Al 元素和其他元素都有較低的ΔHmix,Al 元素含量較高同樣也會降低合金ΔHmix,而ΔHmix較小時傾向于形成IM 相,IM 相往往具有比SS相更高的硬度,使得合金整體硬度提高。
2.3.1 機器學習模型指導AlCoCrCuFeNi 高熵合金設計方法
如圖1 所示,進一步選擇串聯兩個準確率都較高的相分類模型和硬度回歸模型,對未知成分空間中的高熵合金進行相和硬度的高通量預測,從中選擇目標相和硬度的成分,實現對含有特定相和硬度可控的高熵合金高效設計。具體步驟如下:首先根據兩個數據集的成分范圍構建AlCoCrCuFeNi 系合金的成分空間,數據集中各個元素成分上下限即為成分空間的上下限(5%≤Al≤47%,5%≤Co≤22%,6%≤Cr≤34%,5%≤Cu≤16%,5%≤Fe≤31%,5%≤Ni≤22%,原子分數),將成分變化步長設為1%,只保留四元、五元和六元合金,得到2730995 個成分。
進一步對成分空間進行相預測和硬度預測的雙重約束預測。考慮到SVM-FCC 模型的分類結果較好,擁有超過90%的準確率,并且FCC 相在合金中常常起到增塑的作用,因此使用SVM-FCC 模型對合金是否含有FCC 相進行初步預測篩選,得到1408950 個含有FCC 相的成分點,再對這些數據(1408950 個成分點)進一步使用硬度回歸模型預測其硬度,最后選出5種硬度較高的合金(Al28Co10Cr27Cu10Fe5Ni20,Al28Co10Cr25-Cu15Fe22,Al18Co21Cr34Cu10Fe12Ni5,Al18Co21Cr33Cu7Fe13Ni8及Al18Co22Cr6Cu12Fe30Ni12,以每個成分最后一個元素的含量代表該成分的合金,分別表示為Ni20,Fe22,Ni5,Ni8,Ni12)來驗證模型的準確性。Ni20,Fe22,Ni5,Ni8,Ni12 的硬度預測值分別為623.68HV,618.90HV,651.13HV,668.16HV,503.29HV。
2.3.2 新型AlCoCrCuFeNi高熵合金制備與模型驗證
圖9 為5 種合金試樣的XRD 譜圖。可知,5 種合金中或多或少含有一些FCC 相,此與相預測模型相吻合,也證明本工作的機器學習相預測模型的準確率較高。

圖9 所制備合金的XRD 譜圖Fig.9 XRD patterns of prepared alloys
表3 為5 種合金的預測硬度和測試硬度值。為了更直觀對比預測硬度和實際硬度,圖10 給出5 種合金硬度的分布情況。可以看到,預測硬度和測試硬度較為接近,基本都在對角線附近,其R2達到0.944,并且RMSE 僅有12.58HV。

圖10 合金的預測硬度與測試硬度對比Fig.10 Comparison of predicted hardness and experimental hardness of alloys

表3 所制備合金的測試硬度和預測硬度Table 3 Experimental hardness and predicted hardness of prepared alloys
在5 種合金中,Ni8 合金擁有最高的硬度。圖9 中Ni8 合金的XRD 結果表明,B2 相和FCC 相的峰強相差較大,說明兩相含量相差較大,更多的B2 相導致合金具有更高的硬度。通過合金顯微組織分析,可以進一步揭示不同合金硬度差異的原因。圖11 為5 種合金的BSE 圖及點成分分析。可以觀察到,每種合金都具有明顯的兩相組織,圖中深色的相為基體相,少量的淺色相為第二相。以硬度較大的Ni5 和Ni8 合金為例,如圖11(a),(b)所示,合金中存在白色條狀或點狀分布的FCC 相,并由成分分析可推測該相為FCC 結構富Cu 的固溶體析出相,基體相為硬度較大的B2 相,與XRD 譜圖中含有少量FCC 相與大量B2 相的結果相吻合。此外,從圖11(b)高倍數下照片能夠觀察到,基體相中存在納米級別的白色細小第二相,其引入更多的相界面也能在一定程度上提升材料的硬度。再結合圖11(c)~(e)中兩相的比例,不難發現合金的硬度和白色的FCC 相的含量有關,與圖9 的XRD 譜圖中兩相的峰強比結果也吻合。
為了進一步確認合金的相結構,選擇5 種合金中硬度最高的Ni8 合金,對其進行TEM 觀察,如圖12 所示。圖12(a)為Ni8 合金的TEM 圖,能夠明顯觀察到兩種相的存在,分別是淺色的基體相與深色的析出相。圖12(b),(c)分別為圖12(a)中1,2 處所指兩種相的選區電子衍射(SAED)圖,根據圖中所示的衍射斑點,確認基體相為B2 結構的硬質相,析出相為FCC 結構的相。因此,類比到其他4 種合金,結合圖11 的BSE 圖,可以確認FCC 相結構預測模型的結果與實際相吻合。

圖12 Ni8 合金的TEM 圖(a)及合金中基體相(b)和析出相(c)的SAED 圖Fig.12 TEM image of Ni8 alloy(a),SAED images of matrix phase(b) and precipitated phase(c) in alloys
此外,對合金進行EDS 表征來觀察合金的元素分布,如圖13 所示。可以發現,基體相基本包含各種元素,而析出相是一種富Cu 相,且含有少量的Al,基本不含有其他元素,表明Cu 元素與基體相難以相容,凝固時容易析出。
(1)在數據集較小的材料體系中,SVM 擁有比RF和ANN 更好的訓練結果,其中SVM 模型在FCC 相的平均識別準確率高達0.944,SVM 硬度預測模型的RMSE 為56.065HV,達到一個較好的訓練水平。
(2)VEC,Al 元素含量,ΔHmix是影響高熵合金形成FCC 相、BCC 相、IM 相最重要的因素。Al 元素的加入對合金的硬度影響最明顯,且Al 含量越高,形成高硬度合金的可能性越大。
(3)通過兩個訓練好的模型,對高熵合金成分的巨大成分空間進行高通量相與硬度預測,篩選并制備了5 種新合金來驗證模型。XRD,SEM 和TEM 等結果表明,5 種合金的相都是FCC+IM,與預測相吻合,且實驗測試硬度與預測硬度的R2為0.944,RMSE 僅有12.58HV,模型預測結果良好。