孫敬淇 吳緒才 闕志雄 張衛兵
(長沙理工大學物理與電子科學學院,柔性電子材料基因工程湖南省重點實驗室,長沙 410004)
尋找具有高居里溫度的鐵磁材料是凝聚態物理的熱點問題.本文建立了有效的基于材料組分信息的居里溫度機器學習模型,并預測了多種高居里溫度鐵磁材料.基于收集到的1568 個鐵磁材料數據,并以鐵磁材料的組分信息作為描述符,通過超參數優化和十折交叉驗證,構建了支持向量回歸、核嶺回歸、隨機森林及極端隨機樹四種高效的機器學習模型.這其中,極端隨機樹模型具有最好的預測性能,其交叉驗證R2 評分可達81.48%.同時,還應用極端隨機樹模型對Materials Project 數據庫36949 種鐵磁材料進行了預測,發現了338 個居里溫度大于600 K 的鐵磁材料.本文提出的方法可以為獲取具有高居里溫度的鐵磁材料提供有價值的幫助,加快鐵磁材料設計的過程.
作為一種重要的智能材料,鐵磁材料在現代科學技術中得到廣泛的應用.居里溫度(Curie Temperature,Tc)高于室溫是鐵磁材料工業化應用的重要前提.遺憾的是,目前Tc高于室溫的候選鐵磁材料不多.為滿足信息技術發展需要,近年來許多研究者通過不同的方法試圖合成高Tc的鐵磁材料[1-3].另一方面,密度泛函理論已成為模擬鐵磁材料的典型理論方法,它結合海森伯哈密頓量,求解磁交換相互作用,并通過蒙特卡羅方法求解Tc.這種方法計算量大、效率低,不適用于高通量材料計算和設計.
在材料基因組計劃的推動下,基于機器學習的材料設計[4-14]已成為當前材料研究的一個熱點領域.機器學習方法縮短材料設計周期,也被廣泛地應用于磁性材料的預測.Kabiraj 等[6]利用高通量自動化代碼和數據驅動模型,遍歷了二維(twodimension,2D)材料數據庫,并預測了大量具有高Tc的二維鐵磁(ferromagnetic materials,FM)材料.盧帥華等[7]通過將先進的機器學習技術與高通量密度泛函理論計算相結合,開發了一個自適應框架,以加速二維內秉鐵磁材料的發現.Vishina 等[12]通過對ICSD (inorganic crystal structure database)中包含3d 和5d 元素的已知晶體結構進行數據挖掘,使用特定材料的篩選方法結合電子結構計算的高通量方法來尋找無稀土永磁體的可能候選材料.磁性是一種典型的量子效應,與材料組成、結構、化學鍵、電子結構等密切相關,發展簡單高效的磁性如Tc預測模型仍存在挑戰.
材料的化學組分是決定材料物性的基礎.常用的永磁材料包括鋁鎳鈷系永磁合金、鐵鉻鈷系永磁合金、永磁鐵氧體、稀土永磁材料和復合永磁材料等.通過分析現有的永磁材料[15]及鐵磁材料數據集[16-19],可以發現絕大多數磁性材料含有Fe,Co,Mn,Ni,O 以及稀土等元素.這表明,材料的組分信息如元素和化學配比,對材料的磁性如Tc起著至關重要的作用.
本文力圖基于材料的化學組成信息,建立鐵磁材料Tc預測模型,并發掘具有高Tc的鐵磁材料.本文構建和優化了具有較好的回歸和泛化性能的多種機器學習模型.最后,還利用具有最佳性能的極端隨機樹模型,預測了多種Tc超過室溫的鐵磁材料.
從參考文獻[16-19]中收集了1568 個鐵磁材料作為數據集,該數據集只包含鐵磁材料的化學成分信息(元素、化學配比)和相應的Tc.圖1 展示了鐵磁材料的Tc分布情況,可以看出數據集中鐵磁材料的Tc范圍為0–1400 K,大多數數據樣本分布在600 K 以下,而高于600 K 的數據僅占總數據的20%左右,這表明高Tc的鐵磁材料在數據集中相對較為稀缺.

圖1 1568 個鐵磁材料數據集Tc 的分布情況Fig.1.Distribution of Tc in 1568 ferromagnetic material data sets.
圖2 顯示了數據集中Tc分別大于300 和600 K時的鐵磁材料元素的分布情況,元素分布主要集中在Fe,Co 和O.通過分析數據集中大于300 K 的數據,發現Fe,Co 和O 元素分別占總元素的34.3%,11.6%和16.8%,而在600 K 時,Fe,Co 和O 元素分別占總元素的32.2%,25.8%和15.8%,說明Fe,Co和O 是本數據集高Tc鐵磁材料的主要元素.Ni,Mn也是常見的磁性元素,在高Tc的數據中相對Fe,Co 元素占比較少,從圖2 可以得知,Ni,Mn 的占比相對其他元素依舊擁有一定的數量,對模型的訓練不會產生太大的影響.

圖2 數據集中鐵磁材料的元素分布情況 (a) Tc 大于300 K 時元素分布;(b) Tc 大于600 K 時元素分布Fig.2.Element distribution of ferromagnetic materials in data set: (a) Element distribution when Tc is greater than 300 K;(b) element distribution when Tc is greater than 600 K.
本文采用sklearn[20]平臺上的支持向量機(support vector regression,SVR)、核嶺回歸(kernel ridge regression,KRR)、隨機森林(random rorest,RF)以及極端隨機森(extremely randomized trees,EXT)四個機器學習模型.針對SVR 和KRR 算法的超參數采用了遺傳算法[21]進行優化.KRR 和SVR選取了高斯核函數(rbf),對模型中的alpha 參數進行了優化,其值設置為0.00567165.對于SVR模型,其模型性能取決于參數c和gamma.參數c是一個常數,它決定了對估計誤差的正則化懲罰,其設置為181.8797945,gamma 是核系數的系數,其設置為0.18646131.針對RF 和EXT 模型,主要由3 個超參數決定模型的性能.通過在一定的超參數區間內,采用均勻網格搜索[22]的方式選取最佳超參數(圖3 所示),“n_estimators”被設置為從100 到300,步長為10;“max_features”以0.02 步,從0.10 到0.60;“min_samples_leaf”默認選擇最小的0.001.不同模型的優化結果見表1.

表1 本研究中四種機器學習模型的超參數Table 1. Hyperparameters of four machine learning models in this study.

圖3 均勻網格搜索 (a) 隨機森林參數優化圖;(b) 極端隨機樹參數優化圖Fig.3.Uniform grid search: (a) Random forest parameter optimization map;(b) extreme random tree parameter optimization map.
特征選擇可以降低過擬合的風險,更好地去除與目標值無關的特征從而達到優化模型以及縮短訓練時間的目的.本文總共生成了397 個特征,其中使用matminer 庫生成了362 個特征,參考文獻[8,9,18,23]生成了35 個特征.在這些特征中,根據化學配比的關系,采用了加權比例的方法來構建特征,如Fe2O3,其原子序數特征被定義為:8(3/5)+26(2/5)=15.2.針對397 個特征,我們發現前20%的特征幾乎占據了95%以上對Tc預測模型的貢獻度,因此提取了前20%的80 個特征作為新一輪的候選特征.之后考慮到特征之間可能存在相似性高的情況,影響模型的預測結果,采用皮爾遜相關系數[24],計算兩個特征之間的相似性且去除相似度大于90%的特征,最終得到了表2 中21 個化學參數作為鐵磁材料的描述符.

表2 基于特征篩選獲得的化學參數描述符Table 2. Chemical parameter descriptors obtained based on feature screening.
本研究采用80%數據作為訓練集,20%數據作為驗證集,構建并比較了四個不同的機器學習模型.使用平均絕對誤差(MAE),均方根誤差(RMSE)和決定系數(R2)三項指標對四種機器學習模型的結果進行評估,評估結果見表3 (CS MAE,CS RMSE,CSR2分別表示十次交叉驗證結果的平均絕對誤差、平均均方根誤差、平均決定系數).其中,KRR 模型的CS MAE,CS RMSE 和CSR2分別為94.41,141.21 和73.70%;SVR 模型的CS MAE,CS RMSE和CSR2分別為88.64,137.62 和74.92%;RF 模型的CS MAE,CS RMSE 和CSR2分別為81.18,124.13和79.45%;EXT 模型的CS MAE,CS RMSE 和CSR2分別為74.04,117.98 和81.48%.

表3 本研究中四種機器學習模型的最終評估結果Table 3. Final evaluation results of four machine learning models in this study.
為了更好地展示不同機器學習模型的預測性能,圖4 給出了四種機器學習模型在實驗值和預測值之間的二維散點圖.經過比較,發現無論是模型本身還是交叉驗證的結果,EXT 模型都擁有最低的MAE 和RMSE 以及最高的R2評分.這表明相對于其他三種模型而言,EXT 模型具有更加優秀的性能,在鐵磁材料Tc的預測方面表現出色.

圖4 四種機器學習模型實驗值和預測值對比的二維散點圖 (a) 核嶺回歸;(b) 支持向量機;(c) 隨機森林;(d) 極端隨機樹Fig.4.Two-dimensional scatter plots comparing experimental and predicted values of four machine learning models: (a) Kernel ridge regression;(b) support vector machine;(c) random forests;(d) extremely random tree.
圖5 展示了EXT 模型在訓練過程中,描述符的重要性情況.在所有描述符中,“型在訓練過GSmagmom”(原子的單元素固體磁矩的平均值)是最重要的特征,占特征重要性的21.6%.其次,“Composition of Fe”和“Composition of Co”分別占重要性的11.0%和15.1%.這表明在化合物中,Fe 和Co 元素的含量對預測高Tc鐵磁材料具有很大的影響.

圖5 基于極端隨機數模型的特征重要性排序圖Fig.5.Feature importance ranking graph based on extreme random number model.
還將建立的EXT 模型用于預測已有數據庫中化合物的Tc.使用了Materials Project 數據庫[25]中所有的鐵磁材料,經過去重復處理,得到了包含36949 個數據的預測數據集.如圖6 所示,我們的預測模型發現在2531 個Tc大于300 K 的材料中,主要元素成分以O,Fe 和Co 為主,分別占據了28.2%,21.5%和6.9%.在Tc大于600 K 的338 個材料中,主要元素成分以Fe,O 和Co 為主,分別占據了36.2%,33.8%和9.6%,相較于Tc大于300 K 的元素分布,Tc大于600 K 的元素分布中Fe,O 和Co在元素中的占比得到了提升,這表明,如果要獲取較高的Tc鐵磁材料,則在這些元素組合的化合物中進行尋找相對更為合理.

圖6 預測集中鐵磁材料元素分布情況 (a) 2531 個Tc大于300 K 數據的元素分布圖;(b) 338 個Tc 大于600 K 數據的元素分布圖Fig.6.Element distribution of ferromagnetic materials in prediction set: (a) Element distribution of 2531 data with Tc greater than 300 K;(b) element distribution of 338 data with Tc greater than 600 K.
在不存在于訓練集且Tc大于600 K 以上的預測數據中,找到了6 個有實驗值的數據,AlFe3預測值為750 K,實驗值為755 K[26];AlFe 預測值為756 K,實驗值為640 K[27];FeNi 預測值為701 K,相對實驗值為785 K[28];Fe3Pd 預測值為595 K,實驗值為463 K[29];Fe3Sn 預測值為704 K,實驗值為743 K[30];Mn4N 預測值為758 K,實驗值為710 K[31].數據分析可知實驗值和預測值的平均相對誤差為11.7%.由于鐵磁材料的Tc微觀物理機制復雜,目前仍缺少精確的預測方法.常用的平均場方法預測Tc誤差在10%–20%之間,且根據磁性物質的具體特征和實驗條件等因素,實際的誤差范圍可能會更大.因此,EXT 模型在預測鐵磁材料的Tc方面表現良好.同時,圖7 還給出了預測的338 個數據中Tc的分布情況,結果表示FeCo9,Li3Zn(Fe5O8)4,Fe3B,FeCo2Ge,Li9Fe23O32,Li3Fe7O12等鐵磁材料可能具有較高的Tc,其預測值都在800 K 以上.

圖7 預測集中338 個Tc >600 K 的鐵磁材料的Tc 分布情況Fig.7.Curie temperature distribution of 338 ferromagnetic materials with Tc >600 K in prediction set.
本文使用元素基本的物理性質等信息構建了一系列特征,針對鐵磁材料的Tc進行了訓練,使用了四種機器學習方法(SVR,KRR,RF 和EXT).通過模型優化和交叉驗證等方法,對不同機器學習方法得到的相關評價分數進行了比較,最終發現EXT 模型表現最佳,其R2值達到了81.48%,展現了良好的精度和泛化能力.基于EXT 模型,本文預測了Materials Project 數據庫中36949 個不同組分和配比的數據,并從中篩選出338 個Tc很可能大于600 K 的鐵磁材料,這將有助于加速鐵磁材料的設計.