











關鍵詞:數據治理;ECDC體系;高通量;大數據;數字化研發
0 引言
《“十四五”數字經濟發展規劃》中指出,數據要素是數字經濟深化發展的核心引擎,數據成為最具時代特征的生產要素。中共中央國務院下發的數據二十條(《關于構建數據基礎制度更好發揮數據要素作用的意見(2022年12月2日)》)中再次強調數據作為新型生產要素的重要性,指出數據基礎制度建設事關國家發展和安全大局。中國鋼鐵行業產量規模已位居全球第一,面對鋼鐵行業積累的海量數據(包括生產數據和研發數據),將數據轉換為生產要素,充分發掘數據的價值,促進該行業由高速發展轉向高質量發展已成為鋼鐵行業工作人員研究的重要課題。近年來國內鋼鐵行業正在開展數字化轉型工作,在數據治理、數字化和智能化應用技術方面,大多數鋼鐵企業部署的數字化項目已開始產生一定作用,但數字化研發和數據的高效利用仍處于探索起步階段。放眼國外,為支撐德國工業4.0戰略,以西門子、西馬克為代表的一批企業整合了鋼鐵行業積累幾十年的生產數據,開發了數字孿生系統,借助將物理世界的傳感器數據反饋到虛擬世界分析優化,實現閉環控制,大幅優化了鋼鐵生產流程。以亞琛工業大學為代表的研發機構,利用海量的研發數據和數字化研發手段,實現了全新鋼鐵產品高效開發,為德國工業4.0戰略的實施提供了有力保障。未來,試驗、數據治理、物理建模和計算建模等不同工具的智能組合將在鋼鐵行業的數字化進程中發揮重要作用。有研究表明,數字化轉型將用于構建更具生產力、效率、競爭力及技術先進性、安全性和平等性的研發生產體系。在鋼鐵公司中,研發數字化、過程數字化、高級分析數字化、機器人化和自動化被認為是最大的機遇所在,尤其是在研發、生產、制造過程控制以及維護和工程領域,對提高產量和質量、降低能耗具有顯著影響。
1 材料研發數據治理
材料研發數據治理的目標為整合原理性試驗儀器、過渡性中試裝備、企業實際生產線3類底層數據,支撐材料數字化研發以實現“底層信息感知獲取、生產過程數字孿生,多目標優化科學決策、產線閉環賦能”的目的,力爭實現鋼鐵產品價值再造。在這個過程中,關鍵在于“原理性試驗儀器、過渡性中試裝備以及企業實際生產線的底層數據”3個維度數據的整合,旨在從研發角度將3個維度的數據在項目空間內以產品為中心實現整合,從而實現數字孿生和閉環賦能的
作用。
材料研發數據治理的范圍包含原型產品設計數據、生產工藝設計數據、材料計算產生數據、高通量制備數據、中間試驗數據、工業試制數據、穩定生產數據及各階段的表征數據。從廣義角度來看,還會涉及銷售數據、成本數據、制造數據、物流數據、全流程質量數據、環境能效數據等,涉及鋼鐵企業生產的各個方面。
數據治理過程大致分為數據采集、數據處理、信息構建、價值實現等環節,如圖1所示。在數據采集環節,要求針對特定場景的數據進行全面采集,盡可能避免人工輸入繁瑣、易錯的問題,同時保證數據符合用戶認可體系的要求,接口通信是這一環節的核心,數據集中化是目的。在數據處理環節,以產品設計、制造、檢測、服役使用為主線,建立數據間的強關聯關系,利用分析工具進行有效性清洗校核,確保每條數據的真實、完整、有效,原始數據經過清洗后被提煉為對科研人員有用的信息,解決數據存放雜亂無章的問題,獲得“活的、正確的”業務信息,這一步治理完成后就得到了存儲的原始信息,實現數據的業務化。在信息構建環節,科研人員需要針對自身使用場景對信息進行二次凝練處理,通過經驗模型、機理模型、大數據模型一系列的分析工具對信息進行加工處理,將活化業務信息轉化為支撐材料計算和數字孿生的分析參數、模型或材料卡片等知識,這一過程可以視為數據治理過程中信息向知識轉變的過程。在價值實現環節,科研人員將知識應用于新產品、新工藝的開發實現過程中,將知識轉變成數字資產,實現其商業價值。綜上所述,研發數據在數據治理中經過了場景、數據、信息、知識、價值的轉化,最終實現了鋼鐵數據價值的再造。
作為新興生產要素,數據治理輸出物應包含數據來源、數據處理過程、形成知識過程及價值再造過程等數據治理全過程信息。為整合上述信息,強調數據在材料科學中的中心地位,提出了數字材料基因(Digital Material Gene, DMG)概念,如圖2所示。
DMG明確了數據采集的目的、采集的場景、數據治理的處理方法、價值再造的過程及資產最終的保存形式。作為最終目標的輸出物,DMG應包含現有外部材料數據、材料計算數據、材料高通量制備數據、材料中試數據、材料工業生產數據、材料應用數據6個部分。具體體現為:
1)現有外部材料數據應包含對標鋼種的成分、工藝、組織、性能、碳排放等生產系統中的數據。處理方法為采用歸集、清洗、靈敏度分析等方法開展數據分析,對用戶需求、工藝缺陷改進需求進行分析整理,找出關鍵成分及工藝控制點,總結出研發需重點解決的科學問題,制定詳細的解決方案。保存形式為在課題空間內,以樹狀結構保存研發數據。目標輸出為產品相比例及強化機理設計目標。
2)材料計算數據應包含針對確定問題及解決方案的基于相變表征全流程機理計算數據、冶煉過程化學反應模擬數據、連鑄流程模擬數據、軋制加工過程的產線模擬數據、熱處理過程的模擬數據等。處理方法為利用化學反應方法完成冶煉過程的模擬,利用多場耦合有限元模擬確定連鑄、軋制及熱處理過程的邊界條件,利用熱力學、動力學及相場方法計算出材料的相變溫度、相比例、第二相析出溫度、相變過程,采用歸一化方法處理不同尺寸維度的數據傳遞,以實現多維度融合。保存形式為在課題空間內,以結構化方式留存原始計算文件及程序源碼,以序列化形式存儲圖表數據。目標輸出為計算所得初步成分及
工藝。
3)材料高通量制備數據應包含利用材料計算所確定方案開展的高通量試驗過程、表征過程數據及最終確定成分體系及工藝方案。處理方法為開展冶煉、熱軋、冷軋、熱處理等高通量試驗,并利用表征設備驗證計算結果可行性,對成分工藝進行調整,制定相對準確的成分體系及工藝參數。保存形式為在課題空間內,以結構化方式留存的高通量成分及工藝數據和以序列化形式存儲的表征數據。目標輸出為準確成分設計及制造
工藝。
4)材料中試數據應包含為開展中試試驗所確定的成分、工藝及其工業化可行性評估結果。處理方法為利用中試冶煉爐及相關中試設備,開展1~2輪中試試驗,測定標準試樣的力學性能及表征數據,并制備材料應用表面性能檢測所需的樣片。保存形式為在課題空間內,以結構化方式存儲化學、力學結果,以序列化形式存儲表征的非結構數據。目標輸出為最終制定的工業化生產可行性方案。
5)材料工業生產數據應包含新鋼種或改進鋼種的成分、工藝、組織、性能、碳排放等生產系統中的數據。處理方法為利用歸集、清洗、靈敏度分析等方法開展大數據分析;對用戶需求、工藝缺陷改進需求分析整理,制定詳細的解決方案。保存形式為在課題空間內,以樹狀結構保存數據研發數據。目標輸出為產品穩定性、相比例組成偏差數據、產品生產穩定性等。
6)材料應用數據應包含根據材料應用服役性能測試的各項數據以及實現應用服役的各種數字化方案制定數據。處理方法為以中試或工業化樣品開展加工制造、防腐、疲勞等應用和服役研究,滿足用戶示范需求;利用數字化手段制定用戶使用方案數據。保存形式為在課題空間內,以結構化方式存儲應用服役評價結果,以序列化形式存儲數字化應用方案。目標輸出為形成應用推廣可行方案。
通過上述策略的有效實施,形成系統的DMG材料數字基因,從而形成從材料需求調研、材料設計研發、材料穩定制造、材料應用推廣及材料碳排放評估的全生命周期數據資產,有望實現鋼鐵產品價值的再造和行業的技術革新。
2 材料數字化研發系統(ECDC)
為應對經濟的快速發展,材料科研人員必須縮短新材料從發現到應用的研發周期,當前新材料研發主要依據科研人員的經驗和大量重復的“試錯”實驗。針對材料學科已經總結出的科學范式,有些試驗可以借助現有的計算工具進行,但在缺乏海量數據支撐的情況下,這種計算模擬的準確性依然很低。制約材料研發周期的另一因素是從發現、開發、性能優化、系統設計與集成到產品驗證及推廣過程中涉及的研究團隊彼此獨立,缺少數據的相互共享。為實現縮短材料研發周期、降低研發成本的目標,建立基于數據治理體系的數字化研發系統至關重要。鋼鐵材料數字化研發系統框架在研發數據治理體系提供數據支撐的基礎上,整合高通量試驗驅動模式、計算驅動模式、數據驅動模式和集成模式,充分利用各模式所長,解決具體問題,利用數據融合技術實現不同工藝階段數據傳遞,以實現基于研發關注的材料生產過程數字孿生。面對不同研發驅動模式,材料研發方式具有各自的特點。
2.1 高通量試驗驅動模式(試驗E)
在材料科學的研發過程中,高通量試驗技術的應用是推動材料研發效率飛躍的關鍵因素。該技術能夠在較短的時間內完成大量樣品的物性篩選,特別是在鋼鐵材料的研發中,能快速識別出最優的成分組合及關鍵制造參數。通過高通量試驗,研發團隊能在初期階段就排除掉大量潛在的非最優選擇,從而顯著減少資源和時間的消耗。具體來說,高通量試驗驅動模式包括樣品的快速合成、表征和高效數據處理3個環節。在樣品合成階段,利用自動化的試驗設備,同時制備數十到數百種不同成分的鋼鐵合金樣本。目前高通量制備技術相對比較成熟,可完成大量樣品的制備和加工工藝的制造。在表征階段,表征方式分為物理性能表征和微觀結構表征。物理性能表征包含拉伸性能、硬度性能、低溫沖擊性能等,均可實現高效快速表征;微觀結構表征包含X射線衍射(XRD)、掃描電鏡(SEM)、投射電鏡(TEM)和電子背散射衍射(EBSD)、X射線光電子能譜(XPS)等,受制于目前的檢測方法,同一時間都只能檢測一個樣品,這是當前制約高通量試驗驅動模式的主要瓶頸。在數據處理環節,通過先進的數據分析方法,如統計分析和模式識別,快速識別出最具潛力的樣本進行深入研究,如圖3和圖4所示。通過這種模式,不僅提升了研發效率,也為后續的計算驅動模式提供了試驗數據支持,形成了試驗與計算相互促進的良性循環。
2.2 計算驅動模式(計算C)
計算驅動模式通過前人總結的原理及經驗,從微觀、納觀、介觀、宏觀等不同的尺度,利用第一性原理分子動力學、Calphad相場理論、熱力學動力學、有限元法(FEM)及有限元分析(FEA)等手段,通過計算機模擬和冶金學原理計算來設計和優化鋼鐵材料,探索材料設計趨勢,模擬新材料、新工藝的適應性,預測材料的應用及服役性能。這一模式針對結構材料主要以相比例、析出物、固溶分布、組織細化及晶體缺陷作為設計目標,針對功能性材料主要以特定功能作為設計目標,運用正向設計方法來實現材料的晶體結構、電子結構和界面性質的設計。在這一過程中,計算機模擬不僅可以預測材料的微觀結構和性能,還能優化材料的成分和制造工藝參數。
鋼鐵材料作為結構材料的代表設計體系非常復雜,不能只強調某一特定的功能性指標,更需要加強材料自身的均衡性,通常情況下設計材料需滿足一系列性能指標,同時在某方面還需要滿足特定的個性化需求。因此,計算驅動模式下鋼鐵材料的開發不是單純的物理算法可以描述的。從凝固、相變到經典力學大量經驗模型結合相圖計算是計算驅動模式的鋼鐵材料設計核心。大量的經驗模型包括晶粒調控過程一直依賴的Arrheniusequation,馬氏體相變點計算常年使用的大量線性經驗公式,組織設計經常使用的CCE、PLE、NPLE模型,析出計算一直沿用的LSW理論,晶界強化設計過程中用到的Hall-Petch、Orowanbypass模型等。在相比例計算過程中,利用相圖計算軟件預測不同成分和熱處理條件下鋼鐵合金的相變行為,從而指導合金設計和工藝優化。計算驅動應用領域案例如圖5和圖6所示。此外,分子動力學模擬和有限元分析等方法也廣泛用于研究材料的力學性能和熱力學行為。這些經驗模型和計算工具的結合不僅加快了材料研發的步伐,還大大降低了試驗的成本和風險。計算驅動模式的意義在于其能夠在試驗之前提供指導,減少盲目試驗的次數,提高研發的精準度。同時,它也為數據驅動模式提供了理論和模型支持,使得數據分析更加準確和有效。
2.3 數據驅動模式(數據D)
鋼鐵材料已經擁有了近千年的發展歷史,經過近百年的工業化大生產,積累了龐大的研發和生產數據。在現代鋼鐵材料的研發中,對現有工業化生產數據和研發數據的挖掘技術起到了不可替代的作用。數據驅動模式利用機器學習等數據分析技術,處理和分析在材料制備、性能測試及生產過程中積累的大量數據。這些數據不僅包括物理化學性質,還涵蓋了生產工藝參數、性能測試結果等多維度信息。通過數據挖掘,可以繞開材料性能與成分、工藝參數之間的內在聯系,強行建立材料性能與成分工藝參數之間的數學關聯,實現快速的材料設計。例如,通過數據挖掘技術,可以建立不同成分和工藝條件下材料性能的變化規律,從而快速指導試驗設計和工藝優化。另外,還能幫助預測材料的使用壽命和可靠性,為材料的應用提供重要參考。數據驅動模式的關鍵在于高效地整合和分析各種數據,將數據轉化為對研發有價值的信息。這不僅提高了研發效率,還增強了材料設計的準確性和創新性。
2.4 集成模式(集成C)
數字化研發體系的集成策略是實現數字化材料研發體系建設的關鍵,其不是技術與工具的簡單堆疊,而是在研發模式不同計算尺度間,通過歸一化、深度學習等數據處理手段,進行有效的數據傳遞、鏈接與協同,實現技術的互補和有效融合,主要包括標準的統一、數據的共享和流程的協調。在集成策略中,首先需要確立統一的研發目標和標準,確保不同研發人員在同一框架、數據接口下工作。其次,數據共享至關重要,包括試驗數據、生產數據、計算結果和大數據分析的輸出和輸入,確保這些數據能夠在不同模式間實現無縫對接。最后,流程協調是另一關鍵點,它要求不同技術之間在研發流程上實現有效對接和協調。
綜上所述,ECDC模式通過高通量試驗、計算模擬、大數據分析和技術集成4個方面的協同,構建了一個高效、創新的鋼鐵數字化材料研發體系。在ECDC模式下,不同技術間的協同與優化是實現高效研發的重要環節。
3 材料數字化研發實踐
3.1 計算驅動模式:溫成形中錳鋼開發
與22MnB5鋼熱成形相比,中錳鋼的一個重要特點是奧氏體轉變溫度較低,在700~750℃溫度下可以實現完全奧氏體化;同時Mn元素的存在促使貝氏體等軟組織連續轉變C曲線右移,可提高鋼的淬透性;對成形模具的冷卻速度要求不敏感,可實現在700~750℃溫度下溫壓成形,得到完全淬火馬氏體組織,減少了傳統熱成形鋼裸板900~950℃加熱保溫出現的表面氧化脫碳風險,使傳統熱成形工藝簡化,降低了模具設計及加工難度,減少了加工成本和設備與模具投資。與此同時,大量的研究表明,與熱成形22MnB5鋼相比,溫成形中錳鋼在獲得同等強度的條件下,斷后伸長率能夠提高30%以上,從而獲得優異的綜合力學性能。
針對22MnB5的延展性差、造價高的缺點,本研究提出了一種新的解決方案,設計了一種具有高強度、高延展性和高溫抗氧化性的溫成形中錳鋼,其力學性能得以改善但不需要昂貴的鋁硅涂層。
采用熱動力學模擬計算探究了新型溫成形中錳鋼中組分Cr、Al、Si等元素對其組織性能以及高溫抗氧化熱動力學的影響規律,指導溫成形中錳鋼合金成分以及工藝設計,研發路線如圖7所示。采用熱力學軟件Thermo-Calc調用多組元氧化熱力學數據庫TCFE10模擬計算Cr、Al、Si等元素對不同氧化物生成驅動力的影響,結果如圖8所示。結果表明,添加Al元素超過0.2%(質量分數,后同)、Cr元素超過3%、Si元素超過0.6%能極大提升原型鋼的抗高溫氧化性能,這一點通過高通量試驗獲得了驗證。
成功開發出兼具高強、高塑、抗高溫氧化等綜合性能的溫成形中錳鋼原型鋼,其抗拉強度及樣品表面形貌如圖9所示。熱軋板最佳性能為抗拉強度1824 MPa,斷后伸長率13.2%;冷軋板抗拉強度1897 MPa,斷后伸長率10.0%,并且具備溫成形工藝窗口寬、力學性能穩定等特點。
3.2 高通量試驗驅動模式:吉帕級海工鋼開發
鋼鐵產品高強化是鋼鐵材料發展的一個重要方向,特別是在海洋用鋼領域,材料高強化是海洋裝備減重及提升安全特性的核心技術手段。為了提升材料強度,改變材料的合金元素種類和數量是新材料設計的首選方法。傳統篩選成分的方法為基于經驗的“試錯法”,不但篩選成本高、周期長,而且無法篩選出“最優方案”,即在滿足所需強度的前提下獲得最經濟的成分方案。然而,基于高通量計算的數字化研發技術可以有效解決該問題。
吉帕級海工鋼是中國由海洋大國轉變為海洋強國所需的海洋裝備關鍵材料。通過Thermocalc軟件計算成分方案的特征熱力學參量T0與w0(C)用于指導成分篩選,其中T0為該成分的鐵素體與奧氏體吉布斯自由能相等時的溫度,該數值的高低與材料強度存在負相關關系;w0(C)為T0溫度時奧氏體的碳質量分數,該數值的大小與材料強度存在正相關關系。基于對這2個特征參量的計算,依托Thermocalc軟件的批量運算功能,可以快速從幾萬個成分方案中(圖10)篩選出T0溫度低、w0(C)數值高的目標成分。針對目標成分進行高通量試驗驗證,進而篩選出滿足吉帕級強度指標要求的試驗鋼原型。通過高通量計算和試驗驗證,可以快速獲得最具性價比的成分方案。
能夠實際應用的吉帕級海工鋼還需要符合一定的低溫韌性要求,在高通量原型鋼的基礎上,可逐級將試驗鋼的尺寸放大,如公斤級試驗室原型鋼、百公斤級中試原型鋼直至噸級的工業原型鋼,從而完成最終的產品開發。基于計算的吉帕級海工鋼開發技術路線如圖11所示,該技術路線可將原本2~3年完成的新產品開發周期縮短到1年以內并且極大降低科研投入。
3.3 數據驅動模式:鋼板性能預測與優化
隨著鋼鐵企業數字化改革的推進,鋼鐵材料生產過程中各產線收集的數據越來越多、越來越全面,這為基于數據挖掘的鋼鐵材料性能優化及質量控制提供了非常好的數據基礎。以鞍鋼
5500 mm中厚板產線鋼板性能預測與優化為例,基于該產線于2018年到2020年間的鋼板成分、軋鋼實績、性能實績等數據,利用各種機器學習方法訓練模型來預測鋼板拉伸時的屈服強度、
抗拉強度和伸長率3項性能。最終發現,梯度提升樹(XG Boost)機器學習模型在該任務中獲得了較好的效果,該模型對于鋼板屈服強度、抗拉強度和斷后伸長率預測的具體指標如表1和圖12所示。
基于該梯度提升樹(XG Boost)機器學習模型,開發出了鞍鋼5500 mm中厚板產線鋼板性能預測與優化軟件,如圖13所示。該軟件目前包含了性能預測、單項優化和綜合優化3大模塊,可以實現對鋼板力學性能的預測和優化。其中,性能預測模塊基于機器學習模型,根據成分和工藝參數直接對某一力學性能進行預測;單項優化模塊設定某個力學性能的優化目標,基于機器學習模型和制定的成分工藝參數,針對某一參數在指定范圍內進行一系列預測,最終給出通過調控何種參數可以達到優化目標的方案;綜合優化模塊設定某個力學性能的優化目標,基于機器學習模型和制定的成分工藝參數進行一系列預測,最終給出綜合調控哪些參數可以達到優化目標的方案。
3.4 集成驅動模式:智能化性能預測與高通量設計
Qamp;P鋼是第3代先進高強鋼最具代表性的鋼種,強塑性好且成本低,具有廣闊的應用前景。傳統的先進高強鋼研發模式多為正交試驗的“試錯法”,而Qamp;P鋼復雜的成分、工藝-組織-性能關系意味著傳統研發模式的長周期和高資金成本,這難以滿足日益增加的車身高性能材料要求。
材料基因研發思想下,具有代表性的機器學習和數據挖掘技術廣泛應用于材料研發的各個領域。對于常規尺寸Qamp;P鋼性能如拉伸性能,往往只能建立包含數十組樣本的小樣本數據庫,其難以實現準確的性能預測及計算設計。而借助于高通量試驗,目前已經可以在較短時間內建立包含數百組樣本的高通量大樣本數據庫,并可獲得成分、顯微組織以及硬度等核心信息。另外研究表明,Qamp;P鋼的硬度與其常規性能如拉伸性能有著高度相關性,利用兩者之間的關聯性可以輔助實現常規性能的預測。
以上智能化性能預測與高通量設計的結合和遷移學習的思想不謀而合,基于遷移學習的屬性預測及研發思路目前已成功應用于晶體、聚合物、小分子等的小樣本問題,而在鋼鐵材料領域報道較少。
通過系統性成分工藝設計,利用高通量試驗及熱模擬試驗,進行批量化Qamp;P鋼小尺寸樣品制備,測試其成分、顯微組織與硬度等核心信息,形成Qamp;P鋼高通量大樣本數據庫。同時,在常規實驗室條件下,針對性建立常規尺寸Qamp;P鋼樣品的小樣本數據庫。基于物理冶金機理模型計算形成包含熱動力學信息、相變信息等的物理機理數據。進一步基于遷移學習、多模態數據分析等技術手段,建立Qamp;P鋼的性能預測系統,其以卷積神經網絡為基礎進行框架搭建,所搭建的框架如圖14所示,以成分、工藝參數及挖掘物理冶金信息為輸入量,實現了Qamp;P鋼屈服強度、抗拉強度、伸長率等力學性能的準確預測,預測有效率(誤差在10%以內)均達90%以上。有無遷移模型抗拉強度預測結果的對比如圖15所示。
4 材料數字化研發的挑戰與展望
1)數字化研發理念的樹立與普及。
數字化研發的關鍵在于由研究理念的變革帶來的思維與工作模式的轉換。傳統方法經由成百上千年發展形成,已在材料業界深入人心、根深蒂固。因此,新理念新文化的樹立與普及面臨重大考驗,成為推行數字化研發計劃的首要難題。
2)數據基礎薄弱造成數據研發進展緩慢。
與歐美地區及國家相比,中國在產線數據的采集和數據庫的積累方面存在較大差距。在計算模型、算法和軟件的知識產權方面受到了國外的制約,成體系的商業軟件幾乎全部來自于國外。雖然國內高校科研院所開發了大量的AI模型和物理計算方法,但還存在材料數據分析模型小而散亂的問題,在企業實際應用過程中沒有大規模的數據支撐,無法整合、訓練并利用散亂的模型和算法解決實際研發問題,限制了材料計算的實際應用,因此材料數字化研發距商業化大規模應用還有一段距離。
3)協同創新機制不健全。
數字化研發的內涵決定了試驗、計算、數據庫3個要素的融合與協同是加速材料研發的關鍵;數字化研發又要求材料“發現-研發-生產-應用”各個環節的融合與協同。也就是說,數字化研發既要求材料科學研究中多領域跨學科的協同創新,又要求新材料產業中全產業鏈的協同參與。數字化研發需要科學家和工程師們了解制造業的實際問題,也要求國家相關部門的領導和制造業的專家參與科學計劃的頂層設計,組織需求牽引的政、產、學、研、用交融的材料研發計劃,從根本上改變科研、開發與生產長期脫節的局面,使數字化材料研發充分發揮出“材料加速器”效能。
4)數據產權不明限制數據高效利用。
在材料學領域,使用機器學習方法,從數據出發,運用數據內部蘊含的統計規律建立模型,可以為材料學研究提供有價值的指導。然而,材料數據尤其是敏感的工藝參數非常寶貴,因此需要研究如何在保護數據隱私的情況下進行機器學習。只有考慮了數據和模型的版權及隱私保護問題,才能在很大程度上解決當下材料數據由于不規范而帶來的數據預處理繁瑣甚至數據不可用的問題,允許在不泄露原始材料數據的同時共享機器學習模型。
5)數字化研發的系統化整合度有待提升。
為轉變鋼鐵材料為代表的結構材料的“試錯”材料模式,實現基于數據的材料數字化研發設計,更應考慮如何真正把高通量試驗、物理模型、數據驅動3種方法深度集成,形成系統性的鋼鐵材料研發方法論、標準化流程,以實現數據標準化、算法系統化、設計流程模式化,避免工作盲目重復進行。在ECDC模式下,不同技術間的協同與優化是實現高效研發的重要環節。
5 結論
1)通過深入分析鋼鐵數字化材料研發體系的構建及其在數據治理體系中的應用,揭示了該領域的核心問題和發展趨勢。數字化鋼鐵材料研發不僅是技術,也是一種思維,更重要是日常工作習慣。
2)鞍鋼在這一領域通過多年的實踐與探討提出了數字化材料研發體系(ECDC)的建設與實施,其中包括高通量試驗驅動模式(E)、計算驅動模式(C)、數據驅動模式(D)和集成策略(C)。這些模式的融合和協同工作,不僅提高了研發效率,還增強了材料設計的準確性和創新性。
3)在實際操作中,也面臨著諸多挑戰,包括數字化研發理念的普及、基礎薄弱、協同創新機制的不健全以及數據產權問題。這些問題的解決不僅依賴于技術進步,也需要政策支持和跨部門、跨學科的合作。未來鋼鐵數字化材料研發應更加注重數據的集成與智能化應用,同時加強試驗與模型互動,以實現鋼鐵材料從研發到工業生產全鏈條的技術革新和產業升級。