李 劍
(貴陽(yáng)職業(yè)技術(shù)學(xué)院 貴州 貴陽(yáng) 550081)
隨著材料科學(xué)的發(fā)展,新型材料的大量出現(xiàn),已成為人們?nèi)粘I詈蜕a(chǎn)的重要組成部分。計(jì)算機(jī)技術(shù)作為信息時(shí)代的產(chǎn)物,是現(xiàn)代工業(yè)發(fā)展的重要組成部分,在現(xiàn)代社會(huì)的生產(chǎn)、生活中占有重要地位,各種行業(yè)對(duì)計(jì)算機(jī)技術(shù)的需求與日俱增。因此,本文從材料研發(fā)的視角,探討了計(jì)算機(jī)技術(shù)在材料研發(fā)方面的應(yīng)用,以促進(jìn)二者的相互結(jié)合,以及新材料的開發(fā)與利用。
新型材料是近年來(lái)開發(fā)的具有優(yōu)良特性的新型結(jié)構(gòu)和功能性材料。與傳統(tǒng)的材料相比,這種新型材料有了更多的新特性,可以更好地適應(yīng)社會(huì)和人們對(duì)新材料的需求。新材料不只是已經(jīng)開發(fā)的,還有部分材料也正在研究中。新材料技術(shù)從性能研究、材料設(shè)計(jì)、加工等一系列的研究與設(shè)計(jì)過(guò)程中,適應(yīng)不同的應(yīng)用要求。
新材料設(shè)計(jì)是新材料開發(fā)的關(guān)鍵。研發(fā)環(huán)節(jié)是對(duì)材料的組成、內(nèi)部結(jié)構(gòu)、材料性能進(jìn)行預(yù)測(cè)和設(shè)計(jì)的過(guò)程。在新材料研發(fā)的實(shí)踐中,材料研發(fā)可分為3個(gè)層面:微觀研發(fā)層次、連續(xù)模型層次和工程層次研發(fā)。在此基礎(chǔ)上,微觀研發(fā)層次提出了新材料的原子層次和電子層次的研發(fā)。而連續(xù)模型層則是一種新型材料的連續(xù)介質(zhì),其大小為1 μm。工程研發(fā)層面指的是宏觀材料,它是指有關(guān)大型物料的處理與應(yīng)用特性的設(shè)計(jì)。
近年來(lái),隨著計(jì)算機(jī)硬件技術(shù)的迅速發(fā)展,材料的理論計(jì)算日益增多,量子第一性原理、分子動(dòng)力學(xué)等已成為材料領(lǐng)域的重要前沿課題。長(zhǎng)期以來(lái),國(guó)內(nèi)外的開發(fā)者均在編寫各種材料計(jì)算軟件,部分已經(jīng)發(fā)展到較為成熟的地步,如VASP、ABINIT、Quantum Espresso等。為了更好地利用計(jì)算機(jī)軟件進(jìn)行材料的研究,研究者已經(jīng)設(shè)計(jì)了一套數(shù)據(jù)處理軟件和科學(xué)工作流程,并在此基礎(chǔ)上發(fā)展出了一套能夠?qū)崿F(xiàn)大規(guī)模、自動(dòng)化的、可批量生產(chǎn)的高通量計(jì)算平臺(tái)。
計(jì)算材料科學(xué)中各種材料計(jì)算專用軟件的輸入/輸出形式也不盡相同,并有相應(yīng)的分析方法。過(guò)去,從事材料計(jì)算工作的科研工作者大多是手工操作,對(duì)大量的計(jì)算資料進(jìn)行分析、加工,工作量大且不易操作。利用材料計(jì)算軟件,可以對(duì)材料的結(jié)構(gòu)、屬性的數(shù)據(jù)進(jìn)行讀寫、格式轉(zhuǎn)換、分析,從而極大地提高了科研工作的效率。當(dāng)前,世界上最具代表性的材料計(jì)算分析工具有:Pymatgen、Atomate、ASE(atomic simulation environment)等。
Pymatgen是以python為基礎(chǔ)的高流量計(jì)算軟件,其性能非常好。該系統(tǒng)支持多種輸入/輸出形式,如VASP、ABINIT、高斯等。該系統(tǒng)可以從電子中直接提取出電子的能帶、電子密度、電子結(jié)構(gòu)等數(shù)據(jù),對(duì)各種類型的相關(guān)運(yùn)算進(jìn)行綜合分析,并進(jìn)行數(shù)據(jù)處理。同時(shí),可以對(duì)各種元素、點(diǎn)位、分子、結(jié)構(gòu)等進(jìn)行不同的表征。另外,Pymatgen的功能也被封裝到了Materials項(xiàng)目中。
Atomate是一種開放的python架構(gòu),用于材料模擬、特性分析和設(shè)計(jì)。該軟件將Pymatgen、Fireworks、custodian等軟件集成一體,使其具有較強(qiáng)的數(shù)據(jù)處理能力和解析能力。
ASE包括一組工具,用以建立、控制、操作、可視和分析原子模擬。它具有使用方便、靈活和可定制的特點(diǎn)。
科學(xué)的工作流可以用來(lái)計(jì)算材料的性質(zhì),也可以進(jìn)行數(shù)據(jù)的分析。在材料的研究中,大部分的材料計(jì)算工作均是經(jīng)過(guò)規(guī)范化、程序化,形成一套科學(xué)的工作流程,從而提高了科研工作的效率。目前,很多工作流程應(yīng)用于材料計(jì)算工作流的計(jì)算平臺(tái)。在AIIDA平臺(tái)上,應(yīng)用了一種科學(xué)的工作流程,可以實(shí)現(xiàn)對(duì)復(fù)雜的數(shù)據(jù)進(jìn)行自動(dòng)處理,并能在處理各種計(jì)算任務(wù)間進(jìn)行數(shù)據(jù)共享;Materials項(xiàng)目中采用Fireworks來(lái)管理工作流程,從而使計(jì)算任務(wù)能夠自動(dòng)完成。圖1為科學(xué)工作流功能示意圖,其主要特征為:一是能實(shí)現(xiàn)從材料結(jié)構(gòu)到性能的自動(dòng)計(jì)算;二是能實(shí)時(shí)監(jiān)測(cè)和自動(dòng)糾正運(yùn)算過(guò)程。

圖1 科學(xué)工作流功能示意圖
工作流結(jié)構(gòu)示意圖如圖2所示,可視為一個(gè)有向圖,其中每個(gè)均可以被看成是一個(gè)步驟計(jì)算、一個(gè)操作或者一個(gè)子流程。它還支持循環(huán)運(yùn)行,可以根據(jù)設(shè)置的終結(jié)條件來(lái)完成迭代。

圖2 工作流結(jié)構(gòu)示意圖
為了適應(yīng)物料計(jì)算的批量化、自動(dòng)化,研究者利用計(jì)算機(jī)技術(shù)將不同的計(jì)算軟件與編碼相結(jié)合,建立了一個(gè)高通量的計(jì)算平臺(tái)。計(jì)算平臺(tái)負(fù)責(zé)管理和調(diào)度各種資源,方便物料工作者對(duì)物料數(shù)據(jù)的采集與分析。目前,在世界范圍內(nèi),已有許多高通量的材料計(jì)算平臺(tái)。典型的材料計(jì)算平臺(tái)有:AFLOW、AIIDA、高通量物質(zhì)綜合計(jì)算與數(shù)據(jù)管理平臺(tái)(Matcloud)、高通量計(jì)算平臺(tái)與信息平臺(tái)(Materials Informatics Platform, MIP)、Pylada和MPInterfaces等。
AFLOW是一種以VASP為基礎(chǔ)的高通量材料計(jì)算方法,其支持力學(xué)、磁學(xué)、熱動(dòng)力學(xué)、電子結(jié)構(gòu)等方面的數(shù)值模擬。
AIIDA是一種用于計(jì)算機(jī)科學(xué)應(yīng)用的自動(dòng)化交互基礎(chǔ)設(shè)施。這是一種介于用戶與高性能計(jì)算機(jī)的中間層。用戶可以通過(guò)API與這個(gè)平臺(tái)進(jìn)行交互。在ADES模型的指導(dǎo)下,開發(fā)了一個(gè)基于ADES模型的工作平臺(tái)。
Matcloud是一種高通量的材料仿真系統(tǒng)。其目的在于方便材料研究人員對(duì)材料進(jìn)行模擬和計(jì)算,并獲得所需要的材料特性。Matcloud為用戶提供了一組工作流程模板。另外,Matcloud還為用戶提供了一個(gè)方便的圖形用戶接口。
材料信息平臺(tái)是一種基于一級(jí)原理的高通量計(jì)算平臺(tái)。該系統(tǒng)能夠完成結(jié)構(gòu)查詢、自動(dòng)計(jì)算、功能特性顯示等一系列高通量的標(biāo)準(zhǔn)過(guò)程。
Pylada是一個(gè)模塊化的python架構(gòu),用來(lái)進(jìn)行物理模擬。其目的在于提供一個(gè)能夠構(gòu)建各種哈密頓量的基礎(chǔ)結(jié)構(gòu)塊。Pylada可以讓使用者輕松地計(jì)算出聲子或產(chǎn)生焓。
MPInterfaces是一款高通量過(guò)濾接口系統(tǒng)的軟件,該技術(shù)可以應(yīng)用于固體/固體雜化結(jié)構(gòu)、固體/隱含溶劑體系、納米粒子/配位體系的界面結(jié)構(gòu)的創(chuàng)建和運(yùn)行。
機(jī)器學(xué)習(xí)(machine learning,ML)是在學(xué)習(xí)模式的基礎(chǔ)上,通過(guò)對(duì)具體的數(shù)據(jù)進(jìn)行分類、歸納和總結(jié),從而達(dá)到預(yù)期效果的一種有效途徑。在新材料的研究中,深度學(xué)習(xí)(deep learning,DL)的作用尤其明顯。本文主要介紹電催化材料、熱電材料、有機(jī)光電材料、鋰離子電池材料等方面的應(yīng)用。
3.1.1 篩選電催化材料
僅用手工的方法來(lái)篩選電催化劑是一項(xiàng)非常繁瑣、工作量很大的工作。因?yàn)殡姶呋磻?yīng)是一種加速和促進(jìn)電極與電解質(zhì)的化學(xué)反應(yīng)。表面催化反應(yīng)受到多種因素的影響,如:材料選擇、晶面選擇、反應(yīng)位置的選擇等。Tran等利用主動(dòng)機(jī)器學(xué)習(xí)的方法,提出了一種用于CO2RR和HER的電催化劑的篩選和計(jì)算方法。本文以材料專題數(shù)據(jù)庫(kù)中的金屬間化合物為訓(xùn)練集,采用python材料基因組學(xué)工具對(duì)所選擇的材料進(jìn)行了列表,并采用三角剖分技術(shù)對(duì)各表面的吸附位置進(jìn)行了詳細(xì)的分析。每一吸附位點(diǎn)的指紋識(shí)別均是最關(guān)鍵的一步,該過(guò)程是ML的輸入數(shù)據(jù),并利用ML模型對(duì)吸附位置進(jìn)行預(yù)測(cè)。
另外,Tran等還通過(guò)密度泛函理論對(duì)最佳預(yù)報(bào)進(jìn)行了驗(yàn)證,從而提高了預(yù)報(bào)精度,且選出了10個(gè)適合CO2RR和HER的金屬間化合物14個(gè)。以往的催化劑研究均是在現(xiàn)有的知識(shí)體系中進(jìn)行,很難對(duì)其未來(lái)的發(fā)展做出準(zhǔn)確的預(yù)測(cè)。主動(dòng)的機(jī)器學(xué)習(xí)模式可以有效地解決這一問(wèn)題,從而大大提高了研究的效率,甚至可以從催化劑的本質(zhì)出發(fā),探索其規(guī)律,這無(wú)疑是一種新的材料篩選手段。
3.1.2 發(fā)現(xiàn)熱電材料
利用塞貝克效應(yīng)和佩爾捷效應(yīng),可以使熱電材料的熱能轉(zhuǎn)化為電能。高效率熱電材料是一種全固態(tài)熱電器件,結(jié)構(gòu)簡(jiǎn)單,體積小,無(wú)排放,效率高,具有廣闊的發(fā)展前景。開發(fā)性能優(yōu)異的熱電材料是關(guān)鍵,在過(guò)去幾十年來(lái),人們致力于提高熱電材料的性能。在微觀層面,試圖了解不同的載流子,如電子與聲子的交互作用。ML方法在熱電材料領(lǐng)域具有很好的應(yīng)用前景。Furmanchuk等利用回歸分析法,研制出了一種能夠預(yù)測(cè)300~1 000 K溫度范圍內(nèi)結(jié)晶材料塞貝克系數(shù)的新方法。在此基礎(chǔ)上,他們提出了一種新的描述方法,用以預(yù)測(cè)塞貝克系數(shù)。該設(shè)備能對(duì)多種結(jié)晶的特性、制備工藝和化學(xué)結(jié)構(gòu)的組成進(jìn)行對(duì)比。如果能夠?qū)⒃摴ぞ咔度氲骄W(wǎng)絡(luò)應(yīng)用程序中,那么將有助于科學(xué)家在新型熱電材料方面的研究。
3.1.3 有機(jī)光電材料
改變傳統(tǒng)的有機(jī)光電材料發(fā)展模式,必須在分子設(shè)計(jì)、有機(jī)合成、分子結(jié)構(gòu)特點(diǎn)等方面開展更大規(guī)模的試驗(yàn)研究。在此基礎(chǔ)上,采用了卷積神經(jīng)網(wǎng)絡(luò)的DL方法,將其圖像視為圖像的特征描述。首先,利用1 700個(gè)不同的物質(zhì)資料,對(duì)其進(jìn)行模擬,并對(duì)其光電轉(zhuǎn)化效率進(jìn)行了預(yù)測(cè)。結(jié)果表明,該方法的預(yù)測(cè)準(zhǔn)確率在91%以上。通過(guò)試驗(yàn)對(duì)10種新的供體材料進(jìn)行了光電轉(zhuǎn)化,得到了與試驗(yàn)一致的結(jié)果。這也說(shuō)明了ML方法的正確性。相信ML的最大價(jià)值在于節(jié)省時(shí)間、節(jié)省資源,大大促進(jìn)了受體材料的開發(fā),加速了高效率的有機(jī)光電器件的研究。
3.1.4 鋰離子電池電極材料的設(shè)計(jì)
鋰離子電池的主要特性是由電極材料決定的,但是從發(fā)現(xiàn)到應(yīng)用的全過(guò)程是非常復(fù)雜的。在此基礎(chǔ)上,提出了一種基于ML的方法,既可以避免手工操作,又可以利用大量的數(shù)據(jù)進(jìn)行建模,從而總結(jié)出材料的特性和結(jié)構(gòu)之間的相互關(guān)系。為高性能電極材料的篩選和開發(fā)提供了新的思路,并將理論與試驗(yàn)數(shù)據(jù)結(jié)合起來(lái)。采用SVM法,對(duì)LISICON型超離子導(dǎo)體進(jìn)行了有效的、大規(guī)模的掃描,獲得了LISICON超離子導(dǎo)體的組分和相位空間。這樣,ML就大大加速了材料的設(shè)計(jì)。
ML方法是一種以數(shù)據(jù)為基礎(chǔ)的新的研究范例,它對(duì)數(shù)據(jù)和學(xué)習(xí)模式的依賴性較強(qiáng),因此具有較好的預(yù)測(cè)能力。在各種材料數(shù)據(jù)庫(kù)的支撐下,ML對(duì)材料的性能進(jìn)行了預(yù)測(cè),其結(jié)果具有以下代表性。
3.2.1 二元化合物的結(jié)構(gòu)
ML是一種包含多種不同的技術(shù),它包含了從數(shù)據(jù)中獲取有用的信息和模型。它的知識(shí)和技能來(lái)自于統(tǒng)計(jì)學(xué)、圖論、數(shù)據(jù)庫(kù)、數(shù)學(xué)和計(jì)算機(jī)。在此基礎(chǔ)上,提出了一種廣泛適用的數(shù)據(jù)挖掘算法,并將其用于許多二元化合物系統(tǒng),它們已經(jīng)被廣泛地用于實(shí)驗(yàn)樣本。利用非監(jiān)督學(xué)習(xí)的方法,按照晶體的結(jié)構(gòu),把很多化合物分成子集。采用有監(jiān)督學(xué)習(xí)的方法對(duì)未知化合物進(jìn)行分類,將具有相似特征的化合物列入同一類化合物,共55個(gè)化合物具有正確的結(jié)構(gòu),其平均識(shí)別精度可達(dá)95%。討論該化合物的特殊性質(zhì)(熔點(diǎn)),通過(guò)計(jì)算和試驗(yàn),預(yù)測(cè)了44個(gè)化合物的熔點(diǎn),結(jié)果表明,該方法的相對(duì)誤差約為12.8%。這是預(yù)測(cè)材料性能的一項(xiàng)新突破。
3.2.2 材料的形成能
形成能晶體結(jié)構(gòu)的預(yù)測(cè)與表征是材料研究和發(fā)展的一個(gè)重要課題。通常情況下,利用離散傅里葉變換(discrete fourier transform,DFT)方法對(duì)候選結(jié)構(gòu)進(jìn)行精確的運(yùn)算,或從大量的試驗(yàn)數(shù)據(jù)中抽取經(jīng)驗(yàn)規(guī)律。
3.2.3 致密有韌性的二氧化硅玻璃
ML比較于常規(guī)的測(cè)試技術(shù)有其自身的優(yōu)勢(shì),不僅具備通用性和高效率,還具備強(qiáng)大的可開發(fā)性,能夠把測(cè)試數(shù)據(jù)和工藝參數(shù)密切的關(guān)聯(lián)起來(lái),由此增強(qiáng)了對(duì)產(chǎn)品的檢測(cè)功能。大彈性模量、小密度SiO2基玻璃的化學(xué)結(jié)構(gòu)正成為研發(fā)熱門。
ML方法在數(shù)據(jù)分析、規(guī)則發(fā)現(xiàn)、關(guān)聯(lián)等方面具有很強(qiáng)的應(yīng)用價(jià)值,而ML方法的應(yīng)用有助于加速材料的研究。但在實(shí)踐中,仍然存在著許多問(wèn)題。首先,ML的實(shí)際應(yīng)用需要大量的數(shù)據(jù),而在實(shí)際應(yīng)用中,ML模型會(huì)出現(xiàn)適用性差、精確度低等問(wèn)題。最后,提出了一種能夠解釋的ML模型。由于資料的缺乏,可以在小樣本中添加領(lǐng)域知識(shí),或通過(guò)隨機(jī)抽樣、分割等方式進(jìn)行數(shù)據(jù)的擴(kuò)展。由于研究對(duì)象的不同,其適應(yīng)性和準(zhǔn)確性也存在差異。研究者通過(guò)對(duì)各種ML模型的對(duì)比和確認(rèn),選擇出最優(yōu)的模型。在模型的解釋性問(wèn)題上,一方面要深入地探討可解釋性的SISSO、符號(hào)回歸等ML方法;另一方面要通過(guò)對(duì)其特征的重要性進(jìn)行推理,進(jìn)而提高其對(duì)屬性的預(yù)測(cè)能力。
本文對(duì)當(dāng)前材料研究中的計(jì)算機(jī)技術(shù)作了較為詳盡的介紹,并對(duì)當(dāng)前所使用的部分軟件工具、平臺(tái)以及ML方法在材料研發(fā)中的應(yīng)用作了概述。計(jì)算機(jī)技術(shù)為材料科學(xué),特別是材料基因組項(xiàng)目的實(shí)施提供了有力的技術(shù)支持和保證,并將在今后的材料科學(xué)和工程領(lǐng)域中扮演更重要的角色。