近些年來,中國電子技術標準化研究院一直在 研究標準數字化。我從三個方面進行說明,一是在 研究的過程中對標準數字化的理解;二是作為電子 信息領域標準化的比較權威的機構,在該領域進行 的標準數字化實踐;三是在這項工作中遇到的一些 困難和瓶頸。
首先是對標準數字化的理解。標準數字化本身是 標準化工作數字化轉型,這是一個不斷迭代的過程, 需要在工作中不斷地摸索。通過探索標準數字化如何 轉型、轉向什么程度、分幾個階段,大家的思路一直 在不斷地迭代。在研究標準數字化轉型的過程中,我 們發現標準數字化和機器可讀標準之間的關系還不能 完全地畫等號。有些標準可能天生就是可讀的,比如 接口標準、數據字典標準等。這些標準天然具有機器 可讀的屬性,比如在寫標準的時候就寫成偽代碼,或 是代碼的形式,通過現有的新技術的加持,就可以實 現機器可讀。但有些標準離機器可讀的目標還需要很 大的努力,實踐的可行性還需要探索,比如管理體系 的標準如何做到機器可讀仍需進行研究。
2023年年初,我院在工信部科技司的指導下也 開展了主題為“標準數字化,助推新型工業化”的系 列調研活動,走訪了中電標協等標準化協會,以及一 些工業集團和高技術企業,收集了關于標準數字化的 需求。通過調研發現,大家對標準數字化的理解及數 字化程度和共識方面還存在著一些差距,對標準數據 的價值挖掘還不夠充分。比如,大型工業企業所開展 的標準數字化方面的研究以及應用工作,由于技術、 數據資源上的限制,對數據價值的挖掘還不夠充分。另一方面是標準數字化應用模式多樣化,各方都在探 索,因此產生了各種各樣的應用模式。
因此,我們在基于標準數字化需求調研的基礎 上,把標準數字化實踐分成以下幾個方面來開展工 作。一是公共服務平臺的搭建。我們把4000多項國家 標準、3000多項電子行業標準做了全文結構化拆解, 并應用知識圖譜、大語言模型、自然語言處理、大數 據技術等,實現了智能檢索、智能問答和標準體系的 可視化。二是數據資源的積累。我們認為公共服務平 臺最大的價值,就是在收集的數據上,所以標準數字 化最核心的工作是數據資源的積累。
此外,我們與WPS合作開發了智能編寫工具,與 大數據公共服務平臺相結合,除了把國家標準、行業 標準、地方標準、團體標準的格式集成到WPS以外, 還把數據和編寫工具直接關聯起來。比如,在寫標準 的時候,編寫工具的右側欄可以顯示相關的標準及圖 片、表格、公式、術語和條款等;另外還有查新查重 工具,可以通過對比大數據平臺的數據資源,對這個 標準的原創性進行打分。這兩個工具很快會在工信領 域的標準化工作中進行推廣和應用。
在開展標準數字化工作中,我們也遇到了一些困 難。一是標準數字化理論方面的研究,這一領域的理 論研究非常困難,形成路線方面也尚不明確。現在的 國際標準對標準數字化0~4級的分級仍然存在爭議, 國內各個行業也未達成對標準數字化的共識。二是數 據資源的確權問題,包括知識產權問題如何解決。比 如是否可以免費向公眾提供碎片化的數據服務、會不 會侵權、數據資源如何確權等問題尚未形成較好的解 決方案。三是生成式人工智能在生成標準的過程中的 應用,我們認為標準數字化本身要緊緊跟上技術潮 流,并把新的技術應用在標準數字化的工作中。我們 希望和各位同仁一起,把標準數字化工作向前推進!