黃 琳,苗亦新,岳忠孝,楊晶晶
(1. 云南大學(xué),云南 昆 明 650093;2. 云南省科學(xué)技術(shù)院,云南 昆明 650500)
我國稀貴金屬材料產(chǎn)業(yè)與國外稀貴金屬材料產(chǎn)業(yè)相比,仍存在基礎(chǔ)研究薄弱、高端產(chǎn)品技術(shù)難以突破、部分關(guān)鍵材料卡脖子等問題。云南稀貴金屬材料產(chǎn)業(yè),擁有全球最完整的錫產(chǎn)業(yè)鏈,全國最完整的貴金屬、鍺、鈦、液態(tài)金屬(鎵)等產(chǎn)業(yè)鏈,擁有國內(nèi)貴金屬、錫、銦、鍺、鎵等稀貴金屬材料最全的產(chǎn)品門類體系,鈦產(chǎn)品在國內(nèi)鈦材產(chǎn)業(yè)鏈中具有舉足輕重的地位。但是,云南省新材料產(chǎn)業(yè)依然處于價值鏈中低端,國內(nèi)高端稀貴金屬新材料產(chǎn)品大多依賴進口。材料基因工程利用超大計算能力和大數(shù)據(jù)處理技術(shù),交叉融合高通量計算、高通量實驗和數(shù)據(jù)庫技術(shù),以更短的時間、更低的成本,創(chuàng)新材料研發(fā)模式,加速稀貴金屬新材料設(shè)計與研發(fā)。文章介紹了云南省稀貴金屬材料基因工程數(shù)據(jù)庫平臺情況,包括涵蓋多個稀貴金屬元素性能和特性參數(shù)庫,圍繞計算、實驗、服役、生產(chǎn)的貴金屬、錫、銦、鍺、鈦、液態(tài)金屬等重點金屬領(lǐng)域的專用數(shù)據(jù)庫。概述了機器學(xué)習(xí)的稀貴金屬材料數(shù)據(jù)庫建模與數(shù)據(jù)分析,以及人工智能方法在材料基因工程數(shù)據(jù)庫平臺的應(yīng)用,提出了進一步研究重點。
材料從物理化學(xué)屬性來看,可分為金屬材料、無機非金屬材料、有機高分子材料和不同類型材料所組成的復(fù)合材料。材料數(shù)據(jù)種類繁多,包括實驗、計算、生產(chǎn)、文獻數(shù)據(jù)等,表現(xiàn)形式有文本、圖像、視頻等多樣格式,材料數(shù)據(jù)存儲在關(guān)系數(shù)據(jù)庫中。隨著數(shù)據(jù)庫技術(shù)的發(fā)展,材料領(lǐng)域在國內(nèi)外出現(xiàn)了一大批材料數(shù)據(jù)庫,國外主要的材料信息數(shù)據(jù)庫平臺有MaterialsAtlas[1]、Materials project、Aflowlib、NIMS 等[1]。
我國積極建設(shè)材料數(shù)據(jù)庫,取得積極效果。2015 年啟動建設(shè)“國家材料科學(xué)數(shù)據(jù)共享網(wǎng)”,初步建成了較為完整的材料科學(xué)數(shù)據(jù)體系和共享與服務(wù)網(wǎng)[2]。2016 年啟動“國家材料基因工程高通量計算、高通量制備表征、數(shù)據(jù)庫”等重點研發(fā)計劃;2018 年啟動了“國家材料基因工程數(shù)據(jù)匯交與管理服務(wù)技術(shù)平臺”和“材料基因工程專用數(shù)據(jù)庫平臺建設(shè)與示范應(yīng)用”等有關(guān)國家重點研發(fā)計劃項目[3]。北京有色金屬研究總院的有色金屬數(shù)據(jù)庫,包括360 種鋁合金數(shù)據(jù),還有銅合金和部分稀有金屬數(shù)據(jù);中科院材料基因?qū)嶒炇襇atclud,高通量材料集成設(shè)計平臺,包含大量計算數(shù)據(jù)庫[4]。
現(xiàn)有的材料庫主要是材料基本性能參數(shù)數(shù)據(jù)庫,收錄的稀貴金屬材料種類和性能數(shù)據(jù)不全面,極少建立專門的稀貴金屬數(shù)據(jù)庫。
傳統(tǒng)的材料研究以實驗研究為主,一般而言,新材料的應(yīng)用時間跨度非常長。美國在2008 年首先提出“材料基因組計劃”(MGI),包含利用互聯(lián)網(wǎng)計算機與材料數(shù)據(jù)相結(jié)合實現(xiàn)跨層次多尺度計算,加快材料設(shè)計研發(fā)進程,使新材料研發(fā)至少加快1 倍,成本至少降低一半。我國積極行動應(yīng)對材料基因組計劃,先后啟動了“材料基因組計劃”重大項目。2015 年科技部將“材料基因工程關(guān)鍵技術(shù)及支撐平臺”列為“十三五”國家重點研發(fā)計劃目。云南省于2018 年啟動稀貴金屬材料基因工程專項[5]。
云南省具有得天獨厚的稀貴金屬資源例如錫、銦、鈦、鍺、鋅、銀、鉑族等多種稀貴金屬儲量位居全國前列,已初步形成了稀貴金屬材料產(chǎn)業(yè)集群,擁有全球最完整的錫產(chǎn)業(yè)鏈,全國最完整的貴金屬、鍺、鈦、液態(tài)金屬(鎵)等產(chǎn)業(yè)鏈,鈦產(chǎn)品在國內(nèi)鈦材產(chǎn)業(yè)鏈中具有舉足輕重的地位,擁有30 余個國家級、省級研發(fā)平臺。云南省稀貴金屬材料基因工程專項集中稀貴金屬領(lǐng)域的優(yōu)勢資源和力量共同開展工作,重點開展貴金屬、錫銦、鈦、鍺等材料基因工程的高通量計算、高通量制備與表征、數(shù)據(jù)庫3 大平臺建設(shè),實施一攬子核心關(guān)鍵材料攻關(guān)及產(chǎn)業(yè)化,構(gòu)建基于數(shù)據(jù)驅(qū)動的稀貴金屬材料研發(fā)及工程化應(yīng)用示范協(xié)同創(chuàng)新體系。云南省稀貴金屬材料基因工程(一期)總體布局如圖1 所示。

圖1 云南省稀貴金屬材料基因工程(一期)總體布局
稀貴金屬材料基因工程數(shù)據(jù)庫平臺是云南省稀貴金屬材料基因工程重點建設(shè)平臺,主要搭建稀貴金屬材料基礎(chǔ)參數(shù)庫及專業(yè)數(shù)據(jù)庫,采用人工智能與機器學(xué)習(xí)技術(shù)變革材料研發(fā)與應(yīng)用過程,發(fā)揮稀貴金屬材料專業(yè)數(shù)據(jù)的引領(lǐng)作用[6]。平臺以稀貴金屬參數(shù)數(shù)據(jù)庫為基礎(chǔ),各稀貴金屬材料板塊為專題數(shù)據(jù)庫,涵蓋金、銀、鉑、鈀、銠、銥、釕、鋨、錫、銦、液態(tài)金屬共11 個元素的稀貴金屬參數(shù)數(shù)據(jù)庫建設(shè),其中專題庫包括貴金屬基礎(chǔ)數(shù)據(jù)、合金材料數(shù)據(jù)、催化材料數(shù)據(jù)、電子漿料數(shù)據(jù)、分子材料數(shù)據(jù)、熔渣相圖數(shù)據(jù)、錫材料數(shù)據(jù)、液態(tài)金屬材料數(shù)據(jù)共8 大板塊、15 個數(shù)據(jù)子庫,數(shù)據(jù)量超1 400 萬條;專業(yè)數(shù)據(jù)庫數(shù)據(jù)數(shù)據(jù)量200萬余條,存儲容量270TB。稀貴金屬參數(shù)數(shù)據(jù)庫平臺采取集中加分布模式來部署系統(tǒng),同時,為了確保知識資產(chǎn)的安全性,根據(jù)內(nèi)外網(wǎng)隔離的實際情況,稀貴金屬參數(shù)數(shù)據(jù)庫分為內(nèi)網(wǎng)稀貴金屬參數(shù)數(shù)據(jù)庫平臺和外網(wǎng)稀貴金屬信息服務(wù)平臺兩個平臺。稀貴金屬材料基因工程數(shù)據(jù)平臺建設(shè)內(nèi)容如圖2 所示。

圖2 稀貴金屬材料基因工程數(shù)據(jù)平臺建設(shè)內(nèi)容
稀貴金屬參數(shù)數(shù)據(jù)庫建設(shè)包括稀貴金屬材料相關(guān)歷史數(shù)據(jù),通過開發(fā)軟件采集、加工和處理技術(shù),被整理、融合、入庫,形成系統(tǒng)性的、具有統(tǒng)一標準、融合多尺度數(shù)據(jù)的稀貴金屬材料基因工程基礎(chǔ)參數(shù)數(shù)據(jù)庫。從已具備的工作基礎(chǔ)和數(shù)據(jù)資源考慮,參數(shù)庫建立金、銀、鉑、鈀、銠、銥、釕、鋨8 個貴金屬元素以及錫、銦、液態(tài)金屬,共11 個元素的數(shù)據(jù),數(shù)據(jù)內(nèi)容包括所有能搜集到、可獲得的材料成分、結(jié)構(gòu)、組織、工藝參數(shù)、熱力學(xué)參數(shù)、晶體學(xué)參數(shù)、材料性能、服役性能等常規(guī)數(shù)據(jù)和各類材料特性性能參數(shù)數(shù)據(jù),以及產(chǎn)品數(shù)據(jù)、企業(yè)數(shù)據(jù)、行業(yè)數(shù)據(jù)和相關(guān)知識庫資源,為后續(xù)專用數(shù)據(jù)庫的建設(shè)奠定基礎(chǔ)。其技術(shù)路線如圖3 所示。
稀貴金屬專業(yè)數(shù)據(jù)庫圍繞貴金屬、錫、銦、鈦、液態(tài)金屬等重點金屬領(lǐng)域,建設(shè)各系列材料專業(yè)數(shù)據(jù)庫。研發(fā)相應(yīng)的數(shù)據(jù)庫技術(shù)、材料智能化的設(shè)計開發(fā)技術(shù)與高通量制備表征關(guān)鍵,建立符合通則要求的元數(shù)據(jù)、數(shù)據(jù)庫及數(shù)據(jù)生產(chǎn)過程與數(shù)據(jù)應(yīng)用等標準體系和相關(guān)管理規(guī)范,研發(fā)在三大平臺間數(shù)據(jù)自動采集傳輸技術(shù)和解析處理技術(shù),開發(fā)面向各類計算實驗數(shù)據(jù)文件的數(shù)據(jù)后處理程序,培養(yǎng)和匯聚軟件開發(fā)、材料計算、實驗研發(fā)、生產(chǎn)工藝等多學(xué)科多領(lǐng)域的人才團隊,為數(shù)據(jù)驅(qū)動下的數(shù)據(jù)庫智能化應(yīng)用搭建堅實的平臺與技術(shù)基礎(chǔ)。平臺建設(shè)包含貴金屬材料專業(yè)數(shù)據(jù)庫含8個專業(yè)子庫、錫銦專用數(shù)據(jù)庫,鈦合金專業(yè)數(shù)據(jù)庫,液態(tài)金屬專用數(shù)據(jù)庫等。
2.2.1 貴金屬專用數(shù)據(jù)庫
貴金屬專用數(shù)據(jù)庫平臺以《材料基因工程數(shù)據(jù)通則》為建設(shè)指導(dǎo),設(shè)計和建立貴金屬子庫的元數(shù)據(jù)標準規(guī)范,數(shù)據(jù)庫系統(tǒng)包括結(jié)構(gòu)層級管理,數(shù)據(jù)表構(gòu)建管理,數(shù)據(jù)權(quán)限管理,數(shù)據(jù)關(guān)聯(lián)匯總等功能;數(shù)據(jù)管理系統(tǒng)包括數(shù)據(jù)可視化分析,數(shù)據(jù)存儲管理,數(shù)據(jù)接口管理等功能。整合數(shù)據(jù)調(diào)用與數(shù)據(jù)管理、應(yīng)用需求,在貴金屬合金與熔渣、釬焊材料、電接觸材料、存儲材料、鍵合材料、電子漿料等專業(yè)子庫的高通量計算實驗數(shù)據(jù)。設(shè)計以樣品編號作為關(guān)聯(lián)信息,來構(gòu)建各類實驗數(shù)據(jù)和計算數(shù)據(jù)的樣品信息、源數(shù)據(jù)、衍生數(shù)據(jù)的關(guān)聯(lián)架構(gòu),支持8 個子庫的專業(yè)數(shù)據(jù)入庫存儲管理,支持不同子庫間的數(shù)據(jù)調(diào)用和數(shù)據(jù)關(guān)聯(lián),支持基于OpenAPI 的數(shù)據(jù)訪問接口,解決計算數(shù)據(jù)、實驗數(shù)據(jù)相關(guān)的存儲訪問的關(guān)鍵技術(shù)問題。同時,設(shè)計支撐8 個子庫的實驗計算數(shù)據(jù)入庫的數(shù)據(jù)表模板270 余個,形成貴金屬專業(yè)數(shù)據(jù)性能指標5 000 余個。
2.2.2 錫銦專用數(shù)據(jù)庫
錫銦材料專用數(shù)據(jù)庫平臺,本地化部署平臺的機器學(xué)習(xí)通用性算法,形成了三個材料標準化數(shù)據(jù)規(guī)范。高純銦信息化改造方案中的軟、硬件現(xiàn)場驗證、高純銦生產(chǎn)管理系統(tǒng)以及錫銦材料知識發(fā)現(xiàn)系統(tǒng)的開發(fā),并通過大屏可視化硬件、服務(wù)器、防火墻、交換機等硬件部署完成數(shù)據(jù)的可視化。高可靠無鉛錫基焊料合金,完成高速焊點推拉力試驗機安裝調(diào)試,實現(xiàn)從塊體合金性能評價到焊點、界面斷裂性能的評價、實現(xiàn)焊點性能快速評價,建立了助焊劑原料性能數(shù)據(jù)庫和助焊劑剖析的研究方法,建立錫基阻燃材料應(yīng)用專用數(shù)據(jù)庫。全鏈條錫銦材料專用數(shù)據(jù)庫數(shù)據(jù)量超過10 000 條。
2.2.3 鈦合金專業(yè)數(shù)據(jù)庫
鈦合金專業(yè)數(shù)據(jù)庫平臺,包括鈦合金材料數(shù)據(jù)、實驗數(shù)據(jù)規(guī)劃及數(shù)據(jù)模板研發(fā)及合金材料數(shù)據(jù)、鈦合金性能數(shù)據(jù)、標準管理、行業(yè)字典等結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)存儲及管理研發(fā)。采用形式化語言定義鈦合金數(shù)據(jù)庫中涉及的各類結(jié)構(gòu)化、半結(jié)構(gòu)、無結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)模板,定義數(shù)據(jù)樣式,對鈦合金材料的成分、物相組成、晶體結(jié)構(gòu)、制備及生產(chǎn)工藝、性能及其測試方法等各方面的數(shù)據(jù)建立數(shù)據(jù)描述模型。根據(jù)鈦合金全流程數(shù)據(jù)規(guī)范及數(shù)據(jù)模板研發(fā)要求,圍繞鈦合金從研發(fā)、實驗、生產(chǎn)、產(chǎn)品等環(huán)節(jié),以鈦合金材料管理、化學(xué)成分管理、產(chǎn)品圖片管理、實驗管理、標準管理、模擬系統(tǒng)生產(chǎn)工藝管理等為主制訂了20 余個典型或可配置的數(shù)據(jù)規(guī)范及數(shù)據(jù)模板。
2.2.4 液態(tài)金屬專用數(shù)據(jù)庫
液態(tài)金屬專用數(shù)據(jù)庫基礎(chǔ)平臺,開發(fā)了液態(tài)金屬材料專用數(shù)據(jù)庫V1.0 版軟件系統(tǒng),目前在試用階段,支持對文獻數(shù)據(jù)、實驗表征以及制備工藝數(shù)據(jù)的動態(tài)錄入。形成液態(tài)金屬專用數(shù)據(jù)庫,積累高通量計算數(shù)據(jù)4 萬條,行業(yè)信息數(shù)據(jù)5 000條。推動基于機器學(xué)習(xí)等數(shù)據(jù)挖掘算法,開發(fā)了一套液態(tài)金屬材料的數(shù)據(jù)計算分析框架,研發(fā)了基于集成學(xué)習(xí)的液態(tài)金屬深度集成網(wǎng)絡(luò),采用多元集成模型搭建液態(tài)金屬專屬預(yù)測模型,能夠較為準確預(yù)測指定金屬元素配比下的液態(tài)金屬的電導(dǎo)率、熱導(dǎo)率、黏度等性能指標,目前已根據(jù)模型預(yù)測模擬數(shù)據(jù)超20 萬條。
云南稀貴金屬材料數(shù)據(jù)庫建立了人工智能分析應(yīng)用平臺,將深度學(xué)習(xí)方法在結(jié)構(gòu)、特征建模與數(shù)據(jù)分析充分利用[7]。分析稀貴金屬材料基因高性能計算平臺數(shù)據(jù),對材料數(shù)據(jù)的時空特征和動態(tài)相關(guān)性進行建模,設(shè)計稀貴金屬材料的時空圖卷積網(wǎng)絡(luò)模型,挖掘稀貴金屬材料結(jié)構(gòu)與性能間的內(nèi)在關(guān)系屬性,構(gòu)成網(wǎng)狀的材料知識結(jié)構(gòu),建立高魯棒性的特征提取和表征模型[8]。搭建稀貴金屬材料的深度學(xué)習(xí)數(shù)據(jù)分析平臺,基于GPU高性能計算資源,集成深度學(xué)習(xí)算法,構(gòu)建面向多種稀貴金屬材料的聯(lián)合數(shù)據(jù)分析軟件集群。
在稀貴金屬材料數(shù)據(jù)挖掘與機器學(xué)習(xí)領(lǐng)域,利用大數(shù)據(jù)分析和機器學(xué)習(xí)方法,通過人工智能分析應(yīng)用工具庫平臺,包括回歸分析、貝葉斯優(yōu)化、蒙特卡羅樹、模擬退火、遺傳算法、粒子群優(yōu)化算法,對數(shù)據(jù)進行機器學(xué)習(xí)和應(yīng)用驗證,獲得材料性能、趨勢、設(shè)計等數(shù)據(jù)并入庫[8]。在貴金屬電接觸材料、鍵合材料、電子漿料用、催化等數(shù)據(jù)庫及所建立的構(gòu)效關(guān)系模型上,進行機器學(xué)習(xí)和應(yīng)用驗證,預(yù)測和發(fā)現(xiàn)新材料、新性能。
在錫銦數(shù)據(jù)庫,建設(shè)綜合運用算法庫中各類算法的智能化機器學(xué)習(xí)平臺。高純銦數(shù)據(jù)平臺上,研發(fā)穩(wěn)定生產(chǎn)優(yōu)化模型并研發(fā)優(yōu)化控制軟件,利用上海大學(xué)自主知識產(chǎn)權(quán)的模式識別最佳投影技術(shù),建立高純銦穩(wěn)定生產(chǎn)的機器學(xué)習(xí)優(yōu)化模型,開發(fā)優(yōu)化控制軟件,具備自學(xué)習(xí)的模型維護、對實時數(shù)據(jù)的診斷與預(yù)測、優(yōu)化操作的指導(dǎo)等功能。在機器學(xué)習(xí)與數(shù)據(jù)挖掘算法庫建設(shè)上,將機器學(xué)習(xí)與數(shù)據(jù)挖掘算法示范應(yīng)用于錫、銦材料基因工程全研究鏈,包括設(shè)計、制備、表征、性能優(yōu)化。建立基于機器學(xué)習(xí)的變量篩選、模型優(yōu)化、模型評價、由結(jié)果指導(dǎo)實驗等人工智能技術(shù)。構(gòu)建錫銦知識圖譜與知識發(fā)現(xiàn)系統(tǒng),以知識圖譜理論與技術(shù)為基礎(chǔ),在錫銦材料領(lǐng)域構(gòu)建智能搜索引擎,研發(fā)錫銦知識發(fā)現(xiàn)系統(tǒng)。通過定義錫銦材料本體、數(shù)據(jù)模式,在整合錫銦數(shù)據(jù)基礎(chǔ)上進行知識抽取、知識推理、更新迭代,形成高質(zhì)量的知識庫,構(gòu)建錫銦知識圖譜。
稀貴金屬材料基因工程工程化建設(shè)是數(shù)據(jù)的生產(chǎn)、管理與應(yīng)用示范,針對稀貴金屬功能材料、催化材料、電子漿料、分子材料等二元到更多元的稀貴金屬材料體系,以及高純稀貴金屬材料,進行微觀、介觀、宏觀等多維度、多尺度材料的高通量計算和實驗,自動采集解析入庫,形成覆蓋材料計算數(shù)據(jù)、實驗數(shù)據(jù)、生產(chǎn)過程數(shù)據(jù)和產(chǎn)品性能數(shù)據(jù)的完整貴金屬數(shù)據(jù)庫體系。稀貴金屬材料基因工程工程化應(yīng)用示范如圖4 所示。

圖4 稀貴金屬材料基因工程工程化應(yīng)用示范
利用稀貴金屬材料基因工程技術(shù)開展 “理性設(shè)計- 高效實驗- 數(shù)據(jù)分析”深度融合、協(xié)同創(chuàng)新的稀貴金屬新材料研發(fā)示范,開發(fā)列產(chǎn)品,并開發(fā)出了相關(guān)材料。支撐新建年產(chǎn)5 噸高純銦擴大線、年產(chǎn)200 噸的高性能錫基阻燃劑應(yīng)用示范線及貴金屬催化材料、低成本高耐蝕鈦合金、液態(tài)金屬相變散熱片等生產(chǎn)線。
下一步,繼續(xù)將材料領(lǐng)域知識與機器學(xué)習(xí)技術(shù)相結(jié)合的材料智能研究[9],構(gòu)建稀貴金屬材料基因知識庫建設(shè),高效的知識組織模型的稀貴金屬知識圖譜,材料領(lǐng)域知識進行表示、組織和推理,智能水平,并進一步擴展稀貴金屬材料知識庫范圍。針對稀貴金屬材料基因大數(shù)據(jù)庫的數(shù)據(jù)價值挖掘,進行稀貴金屬材料數(shù)據(jù)之間的合作,促進數(shù)據(jù)的共享和流通,搭建云南稀貴金屬材料基因大數(shù)據(jù)的開放共享平臺。同時,基于稀貴金屬材料基因工程數(shù)據(jù)庫進行戰(zhàn)略核心關(guān)鍵材料的開發(fā)與規(guī)模產(chǎn)業(yè)化,對“卡脖子”材料開展的計算、實驗、生產(chǎn)及應(yīng)用的全鏈條數(shù)據(jù)入庫并學(xué)習(xí)挖掘[10]。構(gòu)建大數(shù)據(jù)驅(qū)動新材料研發(fā)的協(xié)同創(chuàng)新體系,積極推進國際一流、國內(nèi)領(lǐng)先的建成系統(tǒng)、智能、部分數(shù)據(jù)可安全共享的全國首個貴金屬、錫、銦、鍺、鈦、鎵、銅等材料國家參數(shù)庫,提升云南省稀貴金屬材料產(chǎn)業(yè)國際競爭力,全面推進有色金屬產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型和數(shù)字產(chǎn)業(yè)化。