劉冰 惠泉 譚笑 曹燕 張栩赫 孫大微 樊建春



摘 要:闡述了油氣管道標準數字化應用研究工作以及機器可讀標準研究的重要意義,提出了制程一體的油氣管網標準機器可讀標準實現的總體思路和實施路徑,建立了油氣管道機器可讀標準標簽集,開展了機器可讀標準輔助工具設計與開發,研制了標準智能編寫與分析工具并進行了驗證與應用,同時結合國際和國內標準數字化技術發展趨勢對油氣管道機器標準的未來研究方向進行了展望。
關鍵詞:標準,數字化,油氣管道,機器可讀標準,人工智能
0 引 言
數字經濟已經成為全球經濟發展的主線,在推動數字經濟發展過程中,數字化轉型強力推進了各大行業實現顛覆性創新,需充分利用數字化技術,利用新流程和架構,研究以數據、模型、程序、軟件工具等為重點的新標準形態,從而促進數字經濟和傳統經濟深度融合。標準數字化不僅關乎各行業數字化轉型能力和效力,也決定數字經濟發展動力和潛力,更決定未來參與國際合作的實力、融入國際貿易體系的競爭力、引領國際發展的領導力。黨的十八大以來,以習近平同志為核心的黨中央高度重視數字化發展,明確提出“十四五”時期要加快數字經濟發展,以數字化轉型整體驅動生產方式、生活方式和治理方式變革。2018年,習近平總書記在中國科學院第十九次院士大會等會上的講話中提出,要把握數字化、網絡化、智能化融合發展的契機,推動互聯網、大數據、人工智能和實體經濟深度融合[1]。
2021年3月,《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》中將加快數字化發展建設數字中國作為獨立篇章提出,其中標準數字化是數字經濟、數字社會、數字政府建設的標準化基礎。2021年10月發布的《國家標準化發展綱要》中明確要求,發展機器可讀標準、開源標準,推動標準化工作向數字化、網絡化、智能化轉型[2]。為落實國家戰略和黨中央數字化戰略決策部署,滿足國家管網集團公司標準化管理和研究的迫切需要,有必要整合和升級原有標準信息化技術,并應用先進的數字化技術與智能化技術,逐漸形成油氣管網領域特色的標準數字化系列技術,為集團公司標準化業務高質量發展提供支撐。
1 研究意義
1.1 開展油氣管道標準數字化研究工作的意義
(1)落實國家戰略和黨中央數字化戰略決策部署的最重要舉措
國家管網集團堅決貫徹黨中央決策部署,把數字化戰略作為公司發展的“四大戰略”之一,把數字化轉型作為事關全局的系統性變革、事關長遠發展的關鍵舉措、事關員工福祉的重點任務來謀劃和推動,以數字化轉型,也包括充分發揮標準數字化基礎支撐作用,支撐國家管網集團建設中國特色世界一流能源基礎設施運營商。
(2) 集團公司標準化管理和研究的迫切需要
《國家管網集團標準化業務“十四五”發展規劃》提出的“123456”的總體思路明確指出“高質量開展標準數字化和標準管理工作”,要求實現標準全生命周期數字化研編、管理和應用,促進標準與業務的深度融合,全面提升標準數字化水平。在《國家管網集團標準化業務“十四五”發展規劃》的指引下,需要研究最新的標準數字化技術,實現集團公司標準管理和標準研究全過程數字化。
(3)原有標準信息化技術迭代更新的需要
自2009年以來,科技中心逐步研發形成了標準內容揭示技術、標準可視化技術、移動檢索技術等技術[3],這些技術為管網標準化領域的發展提供了重要支撐,特別是標準信息的快速查詢和標準內容與指標對比等檢索技術,處于國內標準化領域的領先地位。但隨著近年信息化、數字化技術的飛速發展,原有技術急需迭代升級、更新換代。
1.2 機器可讀標準是標準數字化轉型的核心內容和關鍵難點
機器可讀標準是標準數字化轉型的核心內容和關鍵難點,這種新型數字化標準以機器作為標準的直接使用對象,具有標準文本模塊化、內容語義化、互操作化、訪問交互智能化等特征,可實現“標準即軟件”“標準即數據”“標準即服務”等新型標準應用模式[4-6]。
《國家標準化發展綱要》中明確提出“發展機器可讀標準、開源標準,推動標準化工作向數字化、網絡化、智能化轉型”。《中國標準2035》《全國標準化工作要點》等我國標準化頂層規劃文件中均提出推進標準數字化轉型,油氣管網領域開展機器可讀標準研究和試點工作,探索國家、行業、團體、企業各級標準新形式和新模式[4-6]。
2 油氣管網標準機器可讀標準實現的總體思路和實施路徑
該項研究與實踐的最終目標就是用科技和數字化推動轉型發展,圍繞打造智慧生態管網,推進管道設計、建設、運維、服務、管理等與大數據、物聯網、云計算融合發展,實現服務方、資源方、客戶方、輸送方和消費者數據共享、生態共融、產業升級。在此基礎上應用先進的標準數字化技術,給整個行業帶來全新的模式和體驗,總體技術框架和思路如圖1所示。
總體技術路徑和思路是以實現制程融合“三位一體”為最終目標,統一規劃,分步實施(如圖2所示),具體包括制程“管理機制”一體、制程“管理文件”一體和制程“管理平臺”一體。
2.1 制程“管理機制”一體的實現
通過梳理制程管理的組織架構與職責分工詳細情況,將其整合為一套組織保障機制。全面梳理包括立項、起草、審核、審議與發布、實施、評價、監督與考核等環節在內的制程管理的運行機制,將其整合為一套運營管理機制。以制程管理為載體,并進一步明確與其他所有體系的關系。對全集團制程管理要求進行整合,形成一套工作規劃與實施路徑。
2.2 制程“管理文件”一體的實現
制程“管理文件”一體是對制程管理文件進行三方面的梳理和整合,即梳理制程架構,將其整合為一套文件架構;梳理授權要求,將其整合為一套授權機制;梳理制程成果,將其整合為一套管理文件。
2.3 制程“管理平臺”一體的實現
全面梳理整合制度流程管理的系統需求,將其統一到國家管網唯一的一個管理平臺上,同時將制度流程系統規劃路徑進行全面梳理、整合,實現集團制程系統規劃及實施路徑的統一。
制程融合過程可以分為4個階段:初步匹配階段、初級融合階段、中級融合階段以及高級融合階段,最終目標是要達到高級融合階段,實現制程融合一體。
3 機器可讀標準輔助工具設計與開發
標準機器可讀研究主要工作是為標準的數字化編輯和處理、標準信息單元的存儲和交換、標準文檔內容的重組構建本體庫,對標準架構和元素的數字化表達,便于機器讀取、解析和執行標準,為后續數字化應用奠定基礎。
3.1 油氣管道標準標簽集的建立
為了使機器能夠自主理解和處理標準,需對標準進行數字化表示,即標準的形式數字化。分析標準結構和內容要素,應用XML等標記語言定義標準結構層次、前文、主體和后文結構,以及標準章節條、段落、列項、圖、表、公式、注等標準要素的標簽及屬性定義,構建通用標準信息模型。在此基礎上,分析管道領域典型標準整體結構(各章節目錄)、主要技術內容、標準應用場景等特征,構建管道領域拓展標簽集。基于面向本體的建模與表達方法,面向特定標準化對象的類和關系,拓展通用標準標簽集及屬性定義,形成標準框架和主要元素的結構化表達。為標準的數字化編輯和處理、標準文檔內容的存儲和交換、標準文檔內容的重組構建本體庫,為整體標準數字化奠定基礎。
標準標簽集可分為兩大類,即通用標簽集和擴展標簽集。
3.1.1 通用標簽集
基于ISO STS標準標簽集、GB/T 37967-2019《基于X M L的國家標準結構化置標框架》、GB/ T42093.1-2022《標準文檔結構化 元模型 第1部分:全文》、GB/T 42093.2-2022《標準文檔結構化 元模型第2部分:技術指標》,構建通用標準標簽集。通用標簽集可分為全文結構化標簽和技術指標標簽。
全文結構化標簽:對標準結構進行拆解,基于標準結構元素進行標準信息單元劃分(例如:章、節、術語、縮略語、圖、表等),應用(如:檢索、重組等)可以根據標準結構信息單元執行。技術指標標簽:技術指標在結構化單元基礎上進行更細顆粒度的識別,標準信息單元細化到標準指標對象(如:指標屬性、屬性值、屬性類型等),應用(如:檢索、重組等)可以根據技術指標單元的語義執行。標簽集架構如圖3所示。
3.1.2 管網領域擴展標準標簽集
機器可讀標準拓展標簽集按對象和業務兩個維度構建,通過自上而下和自下而上相結合,采用4級標簽架構,具體對象和業務兩個維度層級數可不同,具體架構如圖4所示。
機器可讀標準的對象應結合油氣管道相關標準體系,并符合Q/GGW 01002-2022《油氣儲運工程項目結構(EPS)編碼規范》、Q/GGW 01006.2-2022《油氣儲運工程實體分解結構(PBS)編碼規范 第2部分:液化天然氣接收站》。
機器可讀標準的業務按設計施工、驗收、運營維護、安全健康、環保、數字化、綜合管理、其他進行劃分,據此細化進行業務標簽集的構建。
3.2 油氣管道機器可讀標準輔助工具設計與開發
3.2.1 軟件總體架構
圍繞油氣管道領域標準數字化轉型工作,面向國家管網集團相關設計、施工、科研等標準使用方,依據標準結構化、技術要素元模型設計,采用B/S體系架構,并基于Web應用開發主流的Java語言,形成了面向油氣管道領域的機器可讀標準輔助工具的設計方案,以實現機器可讀標準制修訂過程的數字化技術支撐和基于標準要素提取的智能化應用服務。
工具軟件系統包括標準結構化加工、數據管理等核心功能模塊,以及機器可讀標準數據庫,并支撐機器可讀標準服務的實現。其中,機器可讀標準服務支持標準內容結構和內容元素的起草、分解、編輯、維護,標準內容細顆粒度檢索、關鍵指標識別等功能,有效促進油氣管道領域標準數字化轉型工作的推進(如圖5所示)。
3.2.2 標準輔助工具軟件功能模塊
(1)標準結構化加工
標準結構化加工模塊用于實現標準原始資料管理、內容碎片化、內容校對、內容預覽等功能,將原始標準文本中的結構化、半結構化和部分非結構化內容映射至語義標簽集,為標準的機器可讀和進一步的智能應用奠定基礎。
原始資料管理:操作人員可通過原始資料管理功能進行標準原始資料的管理,相關操作包含:查看、搜索、上傳資源;原始資料列表可顯示文件名、備注、導入方式、文件格式、文件大小、版本號、創建者、創建時間等資料相關信息;支持通過文件名、日期等關鍵字進行原始資料的查詢檢索;在上傳資料時,選中需要上傳的文件,輸入需要的資源信息。若文件不存在完成上傳操作,若文件存在確認是否需要覆蓋,選擇確定覆蓋,更新相關數據并完成上傳操作,選擇不覆蓋則不進行任何操作。
標準內容碎片化:操作人員可通過標準內容碎片化功能,對標準進行碎片化生成、查看和預覽;碎片化生成可處理Word、PDF等格式的標準原始資料,依據預定義的標準文件結構與語義元模型標簽,生成標準相關的XML、圖片等文件,并提取數據,持久化到系統中;標準碎片化列表信息包含:文件名、標準號、標準名稱、發布日期、實施日期;相關操作包含:獲取碎片化文件、碎片化、重新提取、PDF閱讀、預覽;支持通過文件名+標簽名進行標準要素的查詢檢索;支持加載碎片化標準數據,查看標準文件的目錄、指標、圖片索引,并可以快速定位。
標準內容校對:操作人員可通過標準校對功能對標準信息進行校對與編輯修改;支持通過標準號、標準名稱等關鍵字獲取符合條件的標準信息;加載標準信息后,章條信息、圖片信息、引用信息、術語信息、技術要素信息等均可通過軟件在線進行校對與編輯,從而有效提高標準機構化數據庫的準確性。
標準內容預覽:軟件支持對結構化標準內容的在線預覽,并可通過標準文件的目錄、指標、圖片索引對標準內容進行快速定位,并支持標準間引用關系的可視化展示。
(2)標準數據管理
標準數據管理模塊用于實現標準標簽定義、標簽管理、XML轉換和流程管理等功能,在對標準通用結構與編寫特點,以及油氣管道領域標準內容的提煉抽象基礎上實現對語義標簽集的定義、標簽與流程管理,實現標準內容的知識化。
標簽定義:操作人員可通過標簽定義功能,對標準語義標簽進行定義、查看和檢索;加載標準相關數據后,可對油氣管道領域各類標準進行通用語義和領域語義標簽進行新增和編輯操作;標簽定義列表信息包含:標準號、標準名稱;支持通過關鍵字進行標簽的模糊查詢和組合查詢。
標簽管理:操作人員可通過標簽管理功能對標準語義標簽進行修改與刪除操作;支持在選中標準后加載相應的標簽信息,生成標簽信息列表,并對標簽信息進行修改與刪除;支持在選中標簽后顯示所有標記為該標簽的標準條款。
流程管理:流程管理信息包含:流程編號、流程節點名稱、備注;相關操作包含:搜索、詳細;支持通過流程名稱、流程編號等查詢項,獲取符合條件的流程樹信息。
4 標準智能編寫與分析工具研制、驗證與應用
智能編寫工具利用標準結構化技術及標準內容揭示技術,在標準編制過程中,同步完成元數據標引、碎片化處理、指標抽取等數字化工作,提取題錄、段落、表格、圖片、標準化對象、指標項等特征,完成標準內容和指標的揭示組織等相關加工工作,輸出結果為數字化文檔,機器可讀的標準庫,從源頭上實現機器可讀的標準知識庫動態更新。
標準編輯技術服務工具通過AI在線標準編寫的方式,幫助完成標準的編寫。標準編寫嚴格遵循文件表述的一致性原則、協調性原則、易用性原則,保證產出標準的智能性、便捷性、正確性、完整性。
4.1 油氣管道企業標準協同編寫的實現
在編寫過程中,自動提示補全引用標準信息、術語信息、單位信息,以及相關其他標準的指標內容,或者文字描述,有效避免在編標準與已有標準的交叉矛盾或不協調。
4.2 面向油氣管網標準科技前沿、發展趨勢分析的實現
標準及標準化應用場景分析輔助工具可量化分析標準起草單位對標準研制的貢獻,從多個維度進行現狀、趨勢、熱詞等分析,并以圖表等形式可視化顯示分析結果。基于重要網站、新聞、微信公眾號、知乎等來源的數據,顯示了標準被論文、新聞、知乎、微信、博客等引用情況。
4.3 標準查重分析的實現
油氣管網標準內容查重輔助工具借鑒科技論文查重技術,應用標準內容揭示技術和機器可讀關鍵技術,可進行標準段落的相似度計算,給出相似標準段落相識度分值。
5 油氣管道機器標準研究方向展望
標準機器可讀的技術發展迅速,雖然實現機器可執行挑戰依然存在。
(1)繼續扎實推進油氣管網領域標準機器可讀研究
在實現機器可讀標準文件的基礎上,繼續開展更高層級機器可讀標準:機器可讀可執行內容(3級)、完全機器可解析標準(4級)。
(2)強力推進標準機器可讀標準應用
通過示范工程加速推進標準機器可讀標準應用,提升油氣管道標準數字化應用水平。
(3)同步加快開展標準機器可讀標準化工作
總結標準數字化實踐,研制編寫油氣管網標準數字化系列技術標準,依托機器可讀標準國際合作組開展國際合作,積極參加國際標準化工作。
參考文獻
劉曦澤, 王益誼, 杜曉燕,等. 標準數字化發展現狀及趨勢研究[J]. 中國工程科學, 2021(8):023-006.
肖英萍, 劉悅, 何世新,等. 企業標準數字化實現路徑初探[J]. 中國標準化,2022:6-10.
馬曉寧.油氣管道標準信息化跨入“微時代”[J]. 中國標準化,2015(11):36-37 .
張程,龔慶,姚波,等.機器可讀標準實現方法研究[J].中國標準化, 2022(21):56-61.
汪爍,盧鐵林,尚羽佳.機器可讀標準——標準數字化轉型的核心[J].標準科學,2021(S1):6-16.
陳家賓, 趙鑫, 王琮, 等. 機器可讀標準表達方式探討[J].信息技術與標準化, 2022(10):43-46.