


對標準數(shù)字化頂層設計的理解與建議,我主要分 三個層面來說,一是標準數(shù)字化頂層設計的理解,二 是標準數(shù)字化的需求和存在問題,三是標準數(shù)字化的 建議。
第一、標準數(shù)字化頂層設計的理解
對 標 準 數(shù) 字 化 頂 層 設 計 的 理 解 離 不 開 I S O SMART的定義,ISO SMART(Standards M a c h i n e A p p l i c a b l e , R e a d a b l e a n d Transferable)為機器可應用、可識讀、可理解 的標準。第0層是傳統(tǒng)紙質(zhì)標準(PAPER)。第1 層是開放數(shù)字格式標準,“提供檢索和閱讀,比如 PDF格式”。第2層是機器可讀文檔,即“結構化標 準文檔,內(nèi)容可被軟件處理”,這是在“語法”層 面把標準進行拆解,拆成篇、章、節(jié)等段落,以及 表格、圖片等語法層面的內(nèi)容碎片,進而存成XML (Extensible Markup Language, 擴展標記語言) 或JSON(JavaScript Object Notation,一種輕量 級的數(shù)據(jù)交換格式)。目前,標準館用技術手段把所 有的標準進行了OCR識別,并自動生成機器可讀文 檔,該項工作在2013年已經(jīng)全部完成。第3層為機器 可讀內(nèi)容,即“語義增強內(nèi)容,為一個目的接受多個 標準的內(nèi)容”,這是在“語義”層面,把標準組織成 知識圖譜,也是我們常說的標準剪裁。舉個例子,喝 茶至少和三類標準有關,茶葉標準、飲用水標準、杯 子標準,可三類標準剪裁成專門針對喝茶的標準。盡 管其存儲形式也是XML或者JSON,但“機器可讀 內(nèi)容”與“機器可讀文檔”最大區(qū)別正是其語義的表 達。產(chǎn)品標準的語義,就是揭示標準化對象及其屬性 的關系。這也是標準館目前在做的工作。我們針對 26,000余項國家、行業(yè)、地方標準中的產(chǎn)品標準, 做了標準化對象和指標項的知識組織,形成了87萬 余條的指標數(shù)據(jù),初步具備了開展機器可讀內(nèi)容層面的標準知識服務能力。第4層為機器可解釋內(nèi)容,即 “具備信息建模能力以表達內(nèi)容關聯(lián)要素,具備自學 習的分析驗證閉環(huán)能力,使得內(nèi)容可達可推理,形成 不間斷的價值流,提供智能問答或預測內(nèi)容”。這是 在“語用”層面,描述標準文獻的智能應用,主要包 括:智能問答,基于標準知識圖譜,能夠去理解和回 答問題,在一些實踐應用場景,也能基于標準化對象 和屬性自動生成文檔;不間斷的價值流,就是展望從 標準研制到應用的全流程,全部是數(shù)據(jù)形式,機器識 讀,沒有人的參與,這就是價值流的不間斷;具備自 學習的分析驗證的閉環(huán)能力,使內(nèi)容可達可推理,即 基于標準構建流程模型,使得內(nèi)容可以進行推理,形 成作業(yè)流程指導或者根因分析等專家系統(tǒng),這也是我 們目前正在研究的方向。
我認為標準數(shù)字化是一個交叉學科,包括圖 書館學指導業(yè)務,標準化定義應用場景,計算機突 破技術瓶頸,最終共同實現(xiàn)價值體現(xiàn)。我們需要用 圖書館學、語義網(wǎng)和知識本體的理論去指導這個方 法,用標準化理論與方法的來定義各種場景的應用 需求。作為管理學科,在企業(yè)的應用場景中有沒有 數(shù)字化賦能標準化的需求,這種需求如何去提升, 如何去挖掘?這是標準化學科需要做的事情。計算 機學科做的是突破技術瓶頸,如高效計算、機器學 習和自然語言處理等,機器能解決的只是代替人的 重復性工作,解決的是從1到N的問題。從0到1的 過程,一定是標準化的研究人員去根據(jù)需求分析出 來,根據(jù)應用場景去設計。最后是價值體現(xiàn),數(shù)字化賦能標準化、提升標準的實施能力,這是我現(xiàn)在認 識的兩個價值。我認為標準化本身是一個管理學科, 在政府或企業(yè)的應用場景中,標準化還是應充分體現(xiàn) 出管理特性,不管是標準大數(shù)據(jù)、標準制修訂或者標 準編寫等軟件平臺,都是為政府或企業(yè)的標準化實施 應用服務的,目標是提升它的數(shù)字化實施能力,讓標 準能夠快速地應用到企業(yè)的具體工藝場景中,能夠快 速地讓政府做出正確的決策。
第二、標準數(shù)字化的需求和存在問題
在需求上,標準數(shù)字化的信息服務,主要包括情 報服務、檢索服務和行業(yè)應用。情報服務,主要包括 起草單位大數(shù)據(jù)分析,提出單位、歸口單位、起草人 和國別分析;檢索服務,主要包括擴展全文搜索,建 設指標數(shù)據(jù)庫,細化檢索體驗,也就是要做到查到、 查全、查準、關聯(lián);行業(yè)應用,包括標準制修訂、標 準編寫、標準管理、標準查新查重、標準對比等。
信息服務包括傳統(tǒng)服務和增值服務。傳統(tǒng)的服 務包括文獻檢索、文獻閱覽、信息咨詢、信息跟蹤、 信息培訓和信息推送,傳統(tǒng)服務盡管需求明確,但是 缺乏服務深化的潛力,而且供給飽和;增值服務主要 包括專題的數(shù)據(jù)服務、知識服務、情報服務和工具服 務,其主要問題為行業(yè)需求不明確,需要技術引領, 產(chǎn)品先行,更多地引導和挖掘。
第三、標準數(shù)字化的建議
現(xiàn)階段國家標準館的標準數(shù)字化主要發(fā)展方向, 一是定位需求痛點,用數(shù)字化賦能標準化,進而解決 政府和企業(yè)的標準化管理需求,需求痛點就是標準化 需要數(shù)字化賦能;二是補足短板,我們需要一個面向 各行業(yè)的全流程解決方案,我們現(xiàn)有的全流程解決方 案還存在著用戶體驗以及技術上的難題需要突破,需 要大量的需求磨合和軟件迭代升級;三是應用人工智 能技術,包括解放傳統(tǒng)工作和助力創(chuàng)新工作;四是延 伸產(chǎn)品線,把標準數(shù)字化集成到企業(yè)的流程、設計、 制造、管理、運維工具中。
點評:于欣麗
甘克勤介紹了ISO SMART的定義,介紹了標準館這幾年對標準數(shù)字化所做工作,以及取得的 成果。標準館在2013年已經(jīng)達到了SMART第2層,現(xiàn)在正在做第3層,取得了很好的成效。我們看 到,在頂層設計方面,我國已經(jīng)有了一個比較清晰的思路和框架,當然還需要不斷完善。