洪海波 鐘珂珂 劉驍佳 劉普林 王寧



摘 要:機器可讀標準是當前國內外標準數字化轉型的發展方向和研究重點。本文從機器可讀標準的基本概念出發,闡述機器可讀標準的基本定義和發展階段,提出機器可讀標準在航天智能制造中的應用方法,最后以運載火箭焊縫質量智能判讀為對象打通機器可讀標準的建模、轉化以及應用全鏈路,初步實現了焊縫缺陷判讀標準由單純的文本閱覽向知識驅動工業場景的模式轉變,為機器可讀標準在航天領域的應用提供指導。
關鍵詞:標準數字化,機器可讀標準,智能制造,知識圖譜,無損檢測
DOI編碼:10.3969/j.issn.1002-5944.2023.16.006
0 引言
近年來,航天產品裝備制造業持續推進數字化轉型,企業的制造成本、效率大幅改善,效益空前提升。標準是指導產品研制生產和企業運營管理等行為的依據和原則,在企業數字化轉型的背景下如何滿足航天事業發展對標準制定效率、使用方式等方面的需求,成為國內外標準化領域普遍關注的問題。標準數字化轉型是實現智能制造的必經之路,機器可讀標準是標準數字化的核心技術也是關鍵點,已經成為國內外研究數字化標準的重點戰略方向。
近年來,國內外很多機構積極部署研究機器可讀標準,發展標準數字化,取得了一定的研究成果和實踐經驗。國際標準化組織(ISO)成立了ISO機器可讀標準戰略顧問組(SAG-MRS),以機器可讀標準為方向推動標準數字化工作。2021年,中共中央、國務院印發了《國家標準化發展綱要》,明確提出發展機器可讀標準、開源標準,推動標準化工作向數字化、網絡化、智能化轉型[1]。2022年4月,市場監管總局(標準委)批準籌建全國標準數字化標準化工作組,圍繞標準數字化過程中的相關概念、原理、組織形式、制定程序、本體構建、應用和服務等方面的標準化需求開展工作,推動支撐標準數字化轉型的標準體系建設與應用。汪爍對57個數字領域相關全國標準化技術委員會調研,分析各技術領域對于新型數字化標準的應用需求,53.75%存在使用形式更加數字化的標準的需求[2]。唐爽等提出了通用標準知識庫的概念,通過綜合利用信息資源整合、元數據和知識圖譜等技術,構建標準知識庫[3]。張程等分析了標準數字化標識形態和內容對象的語義明晰化水平,提出了機器可讀標準的技術路徑和標準建模方法[4]。盡管如此,目前主要的工作仍集中于理論研究,對于如何將機器可讀標準落地,特別是與航天等高端裝備制造業結合應用,仍鮮有報道。
因此,本文從機器可讀標準的基本概念出發,闡述機器可讀標準的基本定義和發展階段,在此基礎上,提出機器可讀標準的應用方法,最后以運載火箭焊縫質量智能判讀對象介紹機器可讀標準在航天智能制造領域的應用實踐。期望通過本文介紹,為機器可讀標準在航天領域的應用提供指導,為航天標準的數字化轉型發展提供有力支撐。
1 機器可讀標準基本概念
1.1 機器可讀標準定義
相對于傳統的供人閱讀的紙質或電子文檔形式標準,ISO于 2019 年提出了SMART(StandardsMachine Applicable, Readable and Transferable)標準即機器可讀標準的概念,機器可讀標準是一種技術內容可直接由機器、軟件或其他自動化系統解析和使用,并以數字形式提供給應用程序或用戶自定義的方式,即在系統中無需人工操作即可實現機器可用、可讀、可解析的標準。機器可讀標準提供了一種標準新型表達方式和交付形式,具有標準文本模塊化、內容語義化、訪問交互智能化等特征,能夠有效支撐機器執行或解析標準內容,甚至自主應答詢問,實現“標準即數據”“標準即軟件”“標準即服務”等新型標準應用模式,使標準開發者(如技術委員會專家)、標準提供者(如ISO、IEC等)、標準使用者(如市場需求方)都能受益。
機器可讀標準的提出和發展將對標準研制流程、管理模式和應用方式帶來重大改變,一方面,通過建立數字化平臺,實現標準的協作研發、在線審查、數字發布、快速迭代和動態更新[5]。標準制定者們可以更加專注于標準的內容,而不必過多地關注標準的樣式、格式等。同時,標準制定者通過相關標準的自動關聯和比對,可以有效解決標準之間屬于定義、圖形和符號等技術內容協調一致的問題。另一方面,對于標準使用者來說,通過標準機器可讀、智能關聯和精準推送,實現標準段落、圖形和公式等的快速檢索和獲取,提升技術人員使用標準的效率。如果將標準與機器設備、軟件工具進行集成,可以實現“人-機”“機-機”的互操作,例如,將標準集成到智能化產線系統中,可以使得生產現場的裝備按照標準自動執行流程,自動應用標準中的指標、工時、模型等,提高產品的生產效率。
1.2 機器可讀標準發展階段
根據ISO提出的SMART標準概念,同時依據標準內容與機器的交互程度,ISO與IEC合作繪制了機器可讀標準的成熟度分類模型,如圖1所示[6]。該模型將機器可讀標準的發展階段劃分為“紙質文本”“開放數據格式”“機器可讀文檔”“機器可讀內容”和“機器可解析內容”5個階段。其中,第0到2級主要側重標準制定和呈現形式的結構化、數字化和初級語義化檢索,第3到4級側重語義解析、互相關聯的數據流。第2級至第4級通常被認為是具有高階數字化能力的SMART標準對應模型。機器可讀標準可以廣泛應用于產品的設計、制造和檢驗過程中,根據不同的場景,有兩種典型的應用方式。一是信息輔助,這個主要用在設計階段,即將產品或工藝設計需要參照的標準以一種快速、精準的方式推送給設計人員;二是自主決策,即根據場景已有信息,自動搜索定位到相應的標準條目,并自動“判定”其是否符合標準要求,這個主要用在制造過程的監控和產品質量檢驗環節。
2 機器可讀標準實現方法與路徑
2.1 總體框架
機器可讀標準的實現方法與路徑總體上遵循“結構化—知識化—集成化”的思路,如圖2所示。首先,將以PDF為代表的目標文本進行結構化建模,利用結構化工具將標準中的圖表或文字進行結構化,生成XML文件;其次,利用知識圖譜建模工具,將XML文件轉化為知識圖譜,將標準的結構化信息利用知識圖譜的數據庫進行管理;最后,將知識圖譜與具體的智能制造信息化系統結合,知識圖譜提供數據訪問接口,采用查詢方式獲得知識形式的標準內容,通過“人-機”“機-機”交互,實現典型制造場景中標準數據的傳遞、判定或決策,真正實現標準在數字世界中的解析、認知與流轉。
2.2 機器可讀標準建模
航天產品制造涉及標準眾多,包括結構焊接、鑄造等典型工藝標準,但標準間的結構層次和技術要素具有一定的相似性。從形式上看,通常一份典型的工藝標準包括前言、主體和附錄等結構,以及標準章節條、段落、列項、圖、表、公式、注等技術要素的標簽和屬性定義。通過梳理航天產品制造標準,提煉其中相似性,構建航天產品通用的標準標簽集,包括編碼、名稱、定義以及從屬關系等,形成描述不同技術內容的屬性集合,建立包含標準基本信息、內容信息和表述信息的結構化標準模型。在此基礎上,通過建立統一的描述模型對每個標準條目進行表征,為標準的統一結構化描述提供基礎。標準指標模型定義含6個基本元素,包括指標名、指標值、指標單位、指標級別、指標判定、指標細分類等,具體的指標模型定義如表1所示。
通過定義標準指標模型,每一個標準條目都可以描述為:[x x]的[x x]的[x x]的[x x]的[x x]指標,[x x] 單位,[x x] 級別下,[x x]的判定,[x x] 值。將以上每一個[x x]映射到表1的編號,即可得:⑥⑥⑥⑥①③④⑤②。以某運載火箭焊縫標準為例,標準指標模型描述為:在母材厚度δ≤3mm(指標細分類)的條件下,I級焊縫(級別)單個缺陷尺寸(指標細分類)≤(判定)0.5δ(值),II級焊縫(級別)單個缺陷尺寸(指標細分類)≤(判定)0.75δ(值)。
2.3 標準XML描述及生成
基于結構化標準模型和標準指標模型,對現有標準的結構層次和技術內容要素賦予相應的標簽,通過可擴展標記語言(Extensible MarkupLanguage,XML)結構化描述形成結構化標準。XML建模主要分為三個步驟:(1)基于預定義模版,確定待結構化文本的目標實體關鍵詞,預定義模版根據文本版面信息和實體信息確定,實體信息包括實體關鍵詞及實體關鍵詞對應實體值的格式信息;(2)根據實體依存關系模型與預定義模版,從候選實體值中確定目標實體關鍵詞的目標實體值;(3)基于預定義模版,對目標實體關鍵詞與目標實體值進行結構化,生成目標結構。
將PDF、WOR D、圖片等非結構化的標準文件轉化為可編輯的文檔形式,基于航天產品結構化標準模型,對標準文本進行識別、提取和交互式標引,分別對標準的結構層次和技術內容要素賦予相應的標簽,如標準名稱“< st a nd NA M E>鎂合金鑄件規范< /s t a n d NA M E >”、判斷指標“單個缺陷尺寸”、判斷符號“ ≤”等,通過結構化工具將非結構化標準文檔轉換成XML形式的結構化標準,如圖3所示。
2.4 知識圖譜創建
知識圖譜是一種用圖模型來描述知識和建模世界萬物之間關聯關系的技術方法。相對于傳統的結構化數據,知識圖譜可以構建事物關系的可計算模型,通過數據識別、發現和推斷事物與概念之間的復雜關系[7]。在知識圖譜的支撐下,搜索系統越來越智能化,搜索直達目標日益成為現實,集中體現在對搜索意圖準確理解及對搜索結果精準匹配上。
知識圖譜由節點和邊組成,節點是實體或抽象的概念,邊可以是實體的屬性或是實體之間的關系。XML形式的結構化數據不能直接作為知識圖譜使用,需要將結構化數據定義到本體模型之間的語義映射,再通過語義翻譯實現結構化數據到知識圖譜的轉化。具體的流程為:首先確定知識表示模型,并根據數據來源選擇知識獲取手段導入知識,接著利用知識推理、知識融合、知識挖掘等技術提升已構建知識圖譜的質量,最后根據場景需求設計不同的知識訪問與呈現方法,如語義搜索、問答交互、圖譜可視化分析等,如圖4所示。
2.5 系統集成應用
構建的知識圖譜通過與應用系統進行接口集成實現標準知識的搜索和利用,具體流程如圖5所示。將構建的知識圖譜集成到REST服務中,當待處理的信息、數據輸入到現場應用系統時,現場應用系統調用REST API,REST API將參數關鍵詞輸入給知識圖譜。知識圖譜通過搜索意圖理解、目標查找、結果沉陷和實體搜索,將相關的結果信息再通過REST API結構響應給現場應用系統,最后現場應用系統根據標準反饋信息,完成信息推送或者自主判定輸出最終的評定結果。
3 應用案例
運載火箭貯箱是由箱體、瓜瓣等焊接而成,焊縫質量是決定航天發射任務成敗的關鍵,標準在焊縫檢測質量判定中起到關鍵作用,因此,以運載火箭焊縫質量智能判讀為應用驗證。單位在數字射線檢測技術應用、裝備研發、缺陷圖像AI識別、云檢測等方面已開展深入研究,基于數十萬幅焊縫數字射線圖像積累,成功突破基于深度學習的缺陷圖像AI識別技術,研發了智能識別軟件系統,實現了運載火箭焊縫缺陷的準確識別、定位和分類。下一步,根據相應標準,判定缺陷是否在可控范圍內。
首先采用指標結構化模型,將依據的QJ2 698A-2 011《鋁及鋁合金熔焊技術要求》pd f格式標準中的缺陷判定關鍵信息和邏輯的轉化為XML格式,選取QJ 2698A-2011《鋁及鋁合金熔焊技術要求》中表9內部分散狀單個氣孔、夾雜物質量判定標準,該標準條目為表格形式,如圖6所示。將表格形式轉化為XML文件對標準進行描述,如圖7所示。在此基礎上,研發基于Python的知識提取工具,構建標準內容的知識圖譜,如圖8所示。
在無損檢測系統中我們將獲取到的缺陷的相關信息輸入到無損檢測系統缺陷評定界面,該系統調用REST API接口,然后REST API接口將缺陷參數輸入給知識圖譜,通過知識判讀、知識搜索、知識推理等找到輸入的缺陷參數所對應的知識庫的位置,并判斷出該參數是否符合該缺陷標準的要求,并將結果輸入給REST API接口。REST API接口得到知識圖譜傳遞的結果后響應給無損檢測缺陷評定系統,最終無損檢測缺陷評定系統數據超標/未超標的缺陷評定結果,如圖9所示。
4 總結和展望
本文從機器可讀標準的基本概念出發,闡述機器可讀標準的基本定義和發展階段,提出機器可讀標準的應用方法,同時以QJ 2698A標準為對象,打通了機器可讀標準的建模、轉化以及應用全鏈路,初步實現了焊縫缺陷判讀標準由單純的文本閱覽向知識驅動工業場景的模式轉變,實現了焊縫數字射線缺陷的自動精準評定,消除人工因素,大大提高評定效率和準確性。機器可讀標準作為標準數字化的發展方向,勢必成為航天數字化發展的重要基石,我們要從標準的設計、管理和應用上全面推進機器可讀標準,從需求出發,聚焦具體的應用場景,從亟需的、成熟度高的開始做。此外,要同時解決存量和增量的問題,特別是要解決現存的大量的pdf文本標準轉化問題,因此需要與自然語言理解、知識圖譜等人工智能手段相結合。機器可讀標準的應用,將進一步發揮標準在航天產品研制生產中的技術支撐作用,助推航天制造數字化轉型升級。
參考文獻
[1]劉曦澤,王益誼,杜曉燕,等.標準數字化發展現狀及趨勢研究[J].中國工程科學, 2021, 23(6):147-154.
[2]汪爍,段菲凡,林娟.標準化工作適應全球數字化發展的必然趨勢——標準數字化轉型[J].儀器儀表標準化與計量,2021(3):1-3+14.
[3]唐爽,韓義萍,張玉,等.標準知識庫構建研究[J].中國標準化,2020(S1):46-50.
[4]張程,龔慶,姚波,等.機器可讀標準實現方法研究[J].中國標準化,2022(21):56-61.
[5]于欣麗.對我國標準數字化工作的幾點思考[J].中國標準化,2022(5):7-13.
[6]汪爍,盧鐵林,尚羽佳.機器可讀標準——標準數字化轉型的核心[J].標準科學,2021(S1):6-16.
[7]郝文建,魏梅,張浩,等.標準知識圖譜的構建與應用[J].信息技術與標準化,2021(8):44-47.
作者簡介
洪海波,博士,主要從事智能制造、物聯網、數字孿生、智能傳感與檢測等方面的研究。
(責任編輯:張佩玉)