王 卓 宋丹戎 許 斌 羅薛超 魏江林 魏學棟
(1.中南大學,湖南 長沙 410083; 2.成都材智科技有限公司,四川 成都 610041; 3.中國核動力研究設計院,四川 成都 610213; 4.核反應堆系統設計技術重點實驗室,四川 成都 610213)
傳統材料數據庫的主要功能是數據存儲和數據管理,同時還提供數據檢索服務,方便用戶快速獲取感興趣的數據信息。隨著計算機技術的普及和進步,材料數據庫趨于網絡化、商業化、標準化及智能化,材料數據庫功能得到快速發展。國外有名的材料數據庫有美國MatWeb和NIST在線數據庫、日本國立材料科學研究院NIMS材料數據庫、英國NPL、GrantaMI材料數據庫、MaterialCenter材料數據管理系統、德國Key to Steel數據庫和瑞士Total Material材料性能數據庫等[1]。這些數據庫既支持用戶對材料數據的查詢,也滿足數據的錄入和管理,還可以靈活地導入和導出數據以及與CAE、ANSYS等外部工具的集成[2]。隨著美國材料基因組理念的提出[3],材料數字化軟件已成為材料數據庫新的發展方向。在材料基因工程框架下的材料數字化平臺基于數據庫、材料信息學、大數據、機器學習等技術,對試驗數據、計算數據、系統數據、網絡數據及文獻數據進行高效集成,通過信息化技術對大規模、多源異構的材料數據進行處理分析,從而具備進行材料“基因組”整合、知識再發現、數據資源共享及跨平臺協同研究等方面的功能。本文詳述了結合核電領域典型應用場合的核電材料數字化平臺的建設方案及功能。
本核電材料數字化平臺包括網絡資源采集、文檔數據處理、數據庫管理、核電材料數據應用等4個系統,如圖1所示。

圖1 核電材料數字平臺架構示意圖Fig.1 Architecture of digital platform for nuclear power materials
要使材料數據應用全面進入科學探索的第四范式,必須先解決材料數據缺乏這一全球性難題[4]。因此,數據采集功能決定平臺對各類設備、計算軟件、系統、網站的連接能力,也決定數據庫的規模和活力。科學研究第四范式下的全新的材料科學研究方式,要求軟件能夠快速、準確地獲取各個來源的關鍵數據。
本文開發在線數據資源的采集技術,將網絡資源采集系統用于對材料領域重要的在線數據庫的數據實現定向采集。用戶可在系統中錄入在線數據庫的網址,以設置關鍵詞的方式實現數據篩選和定向采集。本文主要針對核電材料的在線數據以及相關網絡資源進行采集,從而構建參考數據庫。
文獻是科學與技術的載體,對海量文獻中有價值信息的提取將極大提高數據庫的質量和數量規模。文獻數據的采集分為4類,即文本數據、表格數據、圖表數據和圖片數據的采集。文獻數據的采集尚無普遍適用的技術,目前主要以機器學習、數據挖掘、深度學習等方法為主。Kim等[5]通過以機器學習方法構建的軟件,能夠自動閱讀材料科學期刊論文獲取金屬氧化物合成條件等相關信息,為文獻文本數據的自動采集提供了便利。Swain等[6]設計的表格解析軟件可以直接提取表格中的數據。曾德華等[7]針對各類標準對應的材料手冊開發出適應性廣泛的材料性能表格數據化工具,將手冊中的材料性能參數和試驗技術狀態數據解析成可以被軟件存儲、識別的數據化XML數據。對于圖片數據的采集,如金屬材料顯微組織的自動分類,研究者采用數據挖掘和深度學習的方法獲得非常準確的結果[8-9]。
文檔數據處理系統用于材料研究或對裝備設計中涉及到的重要文獻數據進行高效提取。平臺對文獻文檔利用OCR識別技術和差異化識別技術進行結構化數據(題錄、段落數據、表格)和非結構化數據(曲線、圖片)等的提取。本文主要對ASME BPVC第II卷D篇中的表格數據實現提取。
核電材料數據庫管理系統通過集成網絡資源采集系統、文獻數據處理系統中的數據以及錄入核電材料牌號性能數據,從而構建專業數據庫。各個來源匯聚的核電材料數據,包括化學成分、組織結構、物理性能、力學性能、服役性能、熱處理工藝、測試條件、分析結果和文獻等,數據的形式多種多樣,不僅包括常見的數據和文本字段,還有圖片、曲線、表格及文檔等的數據形式,需要對材料數據指標的描述進行統一,經過標準化和規范化處理后導入系統。這些材料數據的特點和應用需求對核電材料數據庫管理系統的實現提出了挑戰。因此,系統提供數據庫設計、數據管理、數據可視化、數據關聯、權限管理等功能,以較好的擴展性與靈活性的功能高效便捷實現核電材料數據管理的系統化、結構化、標準化、完整化。
數據庫設計功能根據特定材料領域數據體系特點進行系統化與結構化的無代碼設計。數據庫設計工具提供多級容器實現數據庫樹形結構的設計。如圖2所示,多級容器包括根系統(1級)、數據庫文件夾(2級)、數據庫(3級)、數據表分組(4級)、數據表(5級)、文件夾(6級),各級容器可添加多個下級容器,其中文件夾容器支持多個層級的子文件夾的添加。各級容器均可以提供專業數據庫的應用場景和數據內容進行自定義命名。

圖2 多級容器樹形結構示意圖Fig.2 Schematic diagram of the tree structure for multi-level containers
材料數據庫的結構和內容可隨著數據體系的發展進行擴展,從而保障數據庫內容的持續開發。系統提供的多級容器可以通過3種方式不同程度地實現數據庫的擴展,分別為:(1)新建根系統,根據新的專業數據庫建設需求,擴展新的數據庫體系;(2)新建數據庫文件夾、數據庫或數據表,根據原材料數據體系管理需求的擴展,在這三級容器上進行擴展,構建新的數據庫內容;(3)新增數據表中材料數據字段屬性,在原表單數據內容基礎上設計新的材料數據字段,進而逐步完善現有材料數據體系,而不影響原數據的管理。
數據管理功能用于多源異構數據管理表單的設計與標準化管理,實現數據指標的設計,用戶可以自定義設計指標名稱和指標代表符號。系統還提供單位管理,用戶可以自定義單位,單位之間可以實現自動轉化。當用戶錄入或導入數據時,只需進行數據的操作即可,數據將與已設計好的指標名稱、指標代表符號和單位進行組合,實現標準化與規范化處理。目前數據表單提供20種通用的數據類型屬性和多種材料專業數據類型屬性,可涵蓋核電材料的所有數據類型,確保數據跨庫查詢、對比以及數據應用分析結果的準確性。數據可視化功能支持對材料多維數據的可視化呈現。數據關聯功能用于材料數據之間建立聯系以提高數據的完整性,如成分-工藝-組織-性能數據關聯、測試表征數據與設備基本參數指標關聯、文獻數據與參考文獻關聯。
核電材料數據應用系統提供材料查詢、材料審核、牌號對照、選材用材、數據接口等功能,對專業數據庫中的數據進行應用。
核電材料數據庫(尤其是金屬結構材料)的設計、開發與集成應用是核電材料數字化平臺的重要組成部分。核電金屬結構材料服役數據、設計數據及標準中材料牌號性能數據的綜合利用將大大提高核電設計人員進行材料查詢、材料對比、選材用材的效率,以及為工程技術人員在反應堆運行中安全評估提供幫助。
在核電領域,歐洲的聚變材料數據庫(Fusion Materials Database)是一款集數據下載、瀏覽、檢索以及提交等多種功能于一體的在線數據庫,涵蓋原始試驗數據、專家組認證數據及相關電子報告[10];歐洲原子能共同體建設的MatDB數據庫,主要服務于第四代反應堆,可通過材料牌號、性能指標等條件進行數據篩選,數據內容涵蓋數據來源、材料尺寸、化學成分、材料工藝、測試條件及性能數據,部分數據以圖表展示;日本的核材料數據庫(Data-Free-Way)整合了大量材料輻照性能數據,并具有數據繪圖等拓展功能[11];我國的核反應堆材料數據庫(NRMD,nuclear reactor material database)具備材料性能數據查詢、比較分析及下載等功能[12]。
核電材料數字化平臺構建了3個核電結構材料數據庫,即參考數據庫、ASME數據庫和牌號數據庫,其中參考數據庫包含6 492條數據(圖3)、ASME數據庫包含10 718條數據(以ASME BPVC第II卷D篇中的數據為主)、牌號數據庫包括51個國內外常用金屬材料牌號。平臺后續建設可利用數據庫管理系統中數據庫設計功能擴展新的數據庫。用戶可按需設計數據庫結構,通過導入材料數據構建新的專業數據庫。

圖3 核電材料數字化平臺的參考數據庫Fig.3 Reference database of the material digitization platform in the field of nuclear power
為了滿足工程設計人員對材料性能數據的權威要求,所有入庫的數據必須經過嚴格的專家審核后才能通過管理員對數據進行發布。未發布的材料數據無法通過材料查詢、材料對照、選材用材、數據接口等進行使用。平臺管理員可通過權限管理的功能,賦予用戶不同的角色,如數據錄入人員、數據審核人員、數據查看人員。數據錄入人員完成數據錄入后,將新的數據記錄提交審核。如圖4所示,數據審核人員將收到審核提醒,提醒信息中包含數據記錄名稱、數據錄入人員姓名、創建時間、數據鏈接及流程信息。

圖4 數據審核提醒信息Fig.4 Reminder message for data audit
材料查詢是平臺的基本應用功能之一,用戶可根據關鍵詞或數據范圍快速篩選查找數據,能夠滿足比較復雜的檢索需求。核電設計人員通過材料信息的篩選,獲知滿足工程部件適用的材料及相關信息。
材料查詢應用支持自定義檢索字段、組合檢索、全文檢索等功能。如圖5所示,用戶可以按照材料、成分、性能分別進行搜索,也可將材料-成分-性能進行組合檢索,檢索項數可根據需求增加。對不同類型的字段提供不同檢索規則,實現數據的精準判定。材料查詢應用支持文本、數值、枚舉、表格、附件等類型的字段數據進行檢索。

圖5 材料-成分-性能組合檢索Fig.5 Searching by material-composition-property
國際上的核電運作建設包括ASME體系、俄羅斯體系、法國RCC-M體系、加拿大CANDU體系和德國KTA體系等,不同體系的壓水堆中所用關鍵材料有所不同但比較接近。我國核電材料標準體系正在建立中,目前主要采用了引進技術中的一些國外牌號材料。牌號對照功能對于金屬材料的工程應用研究具有非常重要的意義。牌號對照功能利用材料化學成分自動匹配技術,實現中國和美國、法國、俄羅斯等多個國家金屬材料牌號的快速對照和匹配檢索。如圖6所示,用戶對金屬材料牌號進行詳細信息查詢時,牌號對照功能將自動匹配多個國家相似牌號的信息,包括所屬國家、標準體系、標準編號等。用戶點擊相似牌號的名稱將跳轉到數據詳情頁面,從而查看化學成分、物理性能、室溫力學性能、高/低溫力學性能曲線、許用應力曲線等信息(圖7)。

圖6 材料牌號對照匹配結果Fig.6 Result of material grade matching

圖7 材料牌號數據詳情頁面Fig.7 Details of Material grade data
選材用材功能提供可視化分析工具對材料數據庫中的數據和性能曲線進行聯動分析,實現材料牌號性能的批量、多維度、高效分析,能夠幫助核電設計人員快速找到適合應用工況的材料牌號。
用戶批量選取數據列表中的數據記錄,加入到選材用材應用中進行分析。選材用材應用提供表格、散點圖和曲線圖等3種工具進行分析。用戶確定對比材料種類后,可自定義配置圖表的X/Y軸變量、數據擬合、坐標軸、標題、圖例等信息,其中數據擬合方式包括線性擬合、多項式擬合、指數擬合和對數擬合。在圖表繪制完成后,用戶對特定區域放大、縮小、懸停查看等功能進行數據的動態交互,通過不斷縮小滿足性能需求的數據范圍,鎖定預選的材料牌號(圖8)。

圖8 選材用材分析界面Fig.8 Analysis interface of material selection and application
核電材料數字化平臺還可為多種CAD/CAE/PLM系統開發數據訪問接口。在核電設計過程中,工程設計人員可以通過數據接口直接在外部軟件系統界面訪問材料數據庫, 從而查詢與應用數據。本平臺與Simens Teamcenter PLM系統實現了數據協同。基于Teamcenter PLM系統和開發環境,平臺中材料數據庫和Teamcenter PLM系統進行了無縫集成。用戶在Teamcenter PLM系統中,通過設計開發的材料數據庫使用界面,根據材料牌號索引選取對應的材料數據,并通過查詢接口進入材料數據庫數據記錄詳情界面進行信息的查詢和使用,從而快速地進行模型材料屬性的構建,輔助完成CAD建模和有限元分析。
隨著科技技術的高速發展,基于材料基因工程理念的材料數字化平臺融合了材料科學、 信息科學、軟件工程、先進試驗方法等學科,采用數據庫、計算模擬、數據挖掘、人工智能等技術實現了材料數據的高效采集、智能管理、多維分析及深度應用,推動了新材料研發及材料在裝備制造領域中研究應用方式。本文詳細介紹了核電材料數字化平臺的建設方案,并從材料審核、材料查詢、牌號對照、選材用材、數據接口等幾個方面詳述了該平臺的功能和應用,展示了平臺在核電材料數字化協同中的重要作用。核電材料數字化平臺將為技術人員在反應堆設計中提供高效工具和高價值的材料數據。