999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的標準知識管理研究

2024-01-12 14:28:45楊德相李劍鋒
標準科學 2023年4期
關鍵詞:標準

楊德相 李劍鋒

摘 要:行業標準化體系構建過程中,隨著標準的種類與數量不斷更新,人工加載以及查詢的方式已經難以滿足標準查新跟進,知識服務手段較為單一。知識圖譜技術為整合標準知識提供了一種全新的知識互聯思路,為完善標準化建設路徑、標準文件結構化查詢提供了全新的方向。本文分析了標準體系構建現存的問題,以食品安全國家標準為例搭建了以食品產品標準為中心的標準引用知識圖譜,基于該圖譜展示了其可視化檢索、標準重要性等應用,進一步分析知識圖譜這一知識管理形式在標準體系建設上的優勢,促進標準知識智能服務與發展。標準領域知識圖譜強調對標準知識管理,有效集成各類標準文本知識、梳理標準信息,同時結構化知識有益于精確標準查詢和關聯標準挖掘從而助力推動標準的數字化發展。

關鍵詞:標準,知識圖譜,知識管理

DOI編碼:10.3969/j.issn.1674-5698.2023.04.005

1 引 言

標準是在一定范圍內獲得最佳秩序,對活動或其結果規定共同的和重復使用的規則、導則或特性的文件。起到規范和約束行為的功能,在推動行業和社會穩定發展向前方面有著不可或缺的作用。隨著信息技術、人工智能以及大數據技術的持續發展和不斷變革,新興技術賦能更豐富的新應用使數據呈現規模式增長[1]。新興行業、新興技術需要新標準規范約束,原標準也需要順應發展技術等因素不斷更新完善,因而標準智能化知識管理更加需要與時俱進跟上行業飛速發展的步伐。知識圖譜提供了一種全新的知識互聯思路,為整合標準體系與完善標準化建設提供實現標準聯結、梳理標準框架和標準動態更新的新方向。

知識圖譜本質上是一種語義網絡知識庫,旨在描述客觀世界的概念、實體、事件及其間的關系,提供了一種讓用戶快速獲取相關知識及其邏輯關系的渠道。其核心要義是以圖形方式向用戶返回經過加工和推理的知識,揭示實體之間關系的語義網絡[2]。知識圖譜分為未聚焦于特定領域的開放知識圖譜和聚焦特定領域的垂直領域知識圖譜,前者追求知識廣泛度,深度較淺,后者則主要面向專業領域,追求知識深度與準確度。在垂直領域知識圖譜的研究中,知識圖譜通過表示領域內部的知識聯系用以輔助復雜的分析,在生物醫學領域的智能問診[3 - 4]與金融領域的風險評估[5]、防欺詐[6]以及電商領域[7 ]等有較多的研究發展。在數據時代,知識圖譜通過對數據的整合與規范,向人們提供有價值的結構化信息,已被廣泛應用于信息搜索、自動問答、決策分析等領域,是推動數據價值挖掘和支撐智能信息服務的重要基礎技術[8]。

隨著社會、行業的進步與發展,標準體系在不斷壯大,各種數字共享標準平臺層出不窮,但是檢索方式本質上仍是單條目人工檢索,最終呈現的是單一的標準,缺少標準之間的關聯和分析。使用知識圖譜技術管理標準知識,一方面可以整合標準知識,對于指定的信息給予精確查詢和關聯標準的鏈接呈現,提高檢索的準確性和效率,另一方面知識圖譜將文檔層次的粗粒度知識拆分為細粒度的切片化知識,更有益于針對行業標準體系的構建與完善。以標準知識圖譜作為知識庫為智能查詢等提供業務支持,為標準起草人員分析標準信息、檢索標準關聯、排查標準的重復等漏洞問題,也給各行業相關企業提供標準研讀與制定的信息參考。

本文分析了標準知識管理存在的問題,提出構建標準領域知識圖譜實現標準知識管理與智能應用。在食品安全國家標準上進行實證,構建了基于食品產品標準知識圖譜,實現了知識查詢和關聯分析。證明了知識圖譜這一知識管理形式在促進標準體系智能化建設與知識服務上的優勢。

2 標準知識管理現狀

2.1 標準制定存在信息差異

標準本身的分類中,國家標準、行業標準和企業標準涉及的標準制定方不同。我國標準化工作開展較晚,不同標準委員會的信息不完全共享等情況會導致對于標準術語的定義、量度等可能有所不同,進而導致在進行追責時出現負責部門權責模糊、推諉懶政的現象。以食品安全標準為例:肖有明等[11]提出食品安全標準因涉及制定部門較多而導致追責困難,于航宇等[10]指出食品安全標準中對于尚無權威定義的食品品類,后續的標準制定工作無法高效開展。標準制定中的信息差異阻礙了標準化進程與發展,不利于標準的知識整合與管理應用。

2.2 標準資源獲取效率低下

標準覆蓋范圍廣、分類依據多。每個行業中涉及的標準數量龐大,近幾年標準文本進入數字化管理時代,市面上已有較成熟完備的標準文本數據平臺,對標準進行存儲并實現簡單單條目的查詢和下載。但各級標準化管理部門在進行標準化工作時通過該方式獲取的標準相對分散,企業實際獲取標準過程中往往需要多渠道多次獲取,費時費力。部分標準詞匯并不局限于某一行業,因此當使用標準中的詞匯查詢時無法避免其他無關行業對于標準查詢的干擾,人工檢索的效率較低。

2.3 標準知識管理智能化受限

當前新興產業和新興技術發展迅速,對應的各級各類標準更新與維護會愈發頻繁。現實情況是標準的編制單位和各專業標準化技術委員會分布于多家企業,受到管理的局限性,往往不能做到實時更新,標準的發布相對滯后[12]。在標準的更新過程中,靠人工篩查重復或沖突的標準效率低、準確性也難以保證。并且在該過程中,標準制定部門主要采取的手段仍是人工上載,在數據信息爆炸增長的時代,面對大量的標準維護工作,非智能的信息維護手段給標準化建設和標準體系的構建造成了較大的阻力。

另一方面如今標準化行業發展呈現多行業、多維度的全新局面。由于各專業標準化技術委員會相對獨立,有的專業劃分界線并不十分明確,導致部分專業交叉、工作重復、標準多頭歸口、體系交叉重復、技術指標不一致等問題依然存在[13]。現有標準數據共享平臺建設過程中,其主要查詢方式缺陷在于無法獲得標準與標準的關聯,無法直接獲取關聯標準的相關信息。在標準體系中標準與標準之間并非獨立,其標準建立過程存在清晰的邏輯思路,標準文檔直接堆疊整理并不能體現出標準體系搭建過程中的整體邏輯,當前我國標準知識管理智能化有待深化。

3 標準知識圖譜架構

3.1 標準知識圖譜整體框架

通過標準知識圖譜實現標準文本知識管理,即按照一定的規則對標準進行知識重組和知識管理,以圖數據庫形式對標準進行結構化的整合與可視呈現,挖掘標準與標準之間的關聯性,以實現標準的深層次信息處理和挖掘。標準知識圖譜構建流程如圖1所示,從原始數據層逐步深入,本體概念層涉及知識的規則制定,實體數據層包含知識深加工與知識動態更新需求,最后以此作為知識庫實現各類與標準知識相關的智能應用。

標準知識圖譜的架構主要包括概念層與數據層兩部分。概念層存儲的是概念化的結構知識,又稱為本體,這一部分是知識圖譜的概念基礎框架,所有存儲的數據以該層面定義的知識結構來存儲。數據層則是根據概念層規則,在原始數據中提煉出的知識。知識應區別于原始文本,是對標準文本進行拆分細化后形成的“碎化”信息。高質量的數據知識對于標準知識圖譜以及后續的智能應用效果至關重要,因此原始數據的知識抽取與加工轉換為結構化的知識元是搭建標準知識圖譜的關鍵步驟。

3.2 本體概念層

概念層設計就是本體設計,是對最終呈現知識結構的整體把控。本體的構建應以具體的項目領域和任務作為起點,以便于進行本體功能的描述和知識的獲取。本體構建技術分為人工[14]、自動[15]和半自動[16 -17]3類,在自動構建本體方面,目前還極少有方法能夠得到覆蓋率和準確率都表現良好的本體,并且沒有專門針對中文文檔知識的成熟方法。大多構建本體過程都需要人工參與,考慮到標準的結構一致性等特征,采取人工構建本體中的七步法[18]作為標準領域知識圖譜本體構建的主要方法。七步法本體構建方法的流程包括:確定標準本體構建領域及范圍、獲取并分析領域信息、定義本體概念和概念層次、定義概念的屬性和屬性約束、本體更新評估、本體實例化、文檔化說明。該過程中充分結合標準起草人的起草邏輯等專家知識,參照標準編寫規則,對標準的內容結構以及特點進行分析,借助工具方法定義本體概念以及屬性約束,并對處理后的標準本體進行文檔化說明。

標準按照要素的類型和位置共分為4類:資料性概述要素、資料性補充要素、規范性一般要素和規范性技術要素。資料性概述要素包括標準封面、目次、引言以及前言中的內容;資料性補充要素包括標準資料性附錄、參考文獻以及索引中的內容;規范性一般要素包括標準的名稱、范圍和規范性引用文件中的內容;規范性技術要素包括術語和定義、符號、代號和縮略語以及規范性附錄等內容。結合標準編排要求,標準的一般內容組成如圖2所示。

參照標準的一般結構,標準實體的基本屬性來源于資料性概述要素、資料性補充要素,包含標準的類型、名稱、發行時間、起草單位等信息,可以以此直接定義其基本屬性概念。規范性一般要素和規范性技術要素中涉及與行業緊密相關的術語、適用范圍以及細化的行業技術要素,并不適合直接使用其屬性概念,故而參照同行業的標準文件中存在必要的共同元素,以共同元素作為參考進行本體設計。比如:在食品安全標準中,技術內容包含:理化指標要求、污染物限量等共同要素,則“污染物限量”可以作為一個關系概念用以指向該標準與引用標準之間的關系屬性。標準文件的專業特性與已有編著邏輯性,決定了其本體建模主要結合專業性知識,以語義判斷為根本原理施行[19]。

3.3 實體數據層

標準知識管理應注重標準的知識完整性、準確性,唐爽等[13]提出標準知識庫應具有信息時效性,趙丹[20]構建企業標準體系時強調系統需保證標準體系的動態更新確保標準體系對于企業的準確指導,均強調了對于標準知識的完整性與準確性要求。因此標準實體數據層的知識質量也決定了標準知識圖譜的整體質量以及采信度。標準實體數據層主要包括知識抽取、知識融合、知識存儲以及更新。其中知識抽取是將標準文本中的必要關鍵信息進行格式轉換后結合自然語言處理技術得到實體、關系屬性等信息,初步獲得結構化知識實現。從而實體間語義鏈接。知識融合需要對冗余的知識進一步處理簡化,對三元組在統一框架標準下進行整合、消歧,簡化知識體系,形成標準知識網絡。知識存儲環節采取開源Neo4j圖數據庫作為工具,導入精簡化后的結構化知識,通過標準節點之間的引用關聯將標準知識組合成可以系統查詢與更新的知識網絡。

4 食品標準知識圖譜實證

4.1 食品標準知識圖譜構建

食品安全標準是相關權威機構依照程序制定的規范性文件,對推動食品安全發展起到至關重要的作用。我國已有食品、食品添加劑、食品相關產品國家標準1,30 0 余項,行業標準2,90 0 余項,地方標準1,200余項,形成了相對完善的食品標準體系。但是食品安全標準種類多、層次豐富,一定程度上給標準系統知識管理造成了一定的困難。其配套法規政策不足,制定范圍、定位不明確 ,內容龐雜,并且相互引用形式多樣,在信息公開性上仍有欠缺,這些都對于消費者合理維權,企業有效生產經營產生不良影響。

食品安全標準是眾多的食品標準中唯一強制執行的標準,因此本文以現行食品安全國家標準作為研究對象。根據食品安全標準與監測評估司發布的食品安全國家標準目錄顯示,食品安全國家標準分為通用標準、食品產品標準、特殊膳食食品標準、食品添加劑質量規格及相關標準等共計12類。由于食品安全標準制定底層邏輯是圍繞食品的生產制造過程進行的,故而選擇食品產品和特殊膳食食品標準共計8 0 份標準文件用作實證,以下將上述國家安全標準統稱為食品產品標準。

對食品產品文件分析,以標準作為實體,對其主要共有元素進行分析設計本體。其封面中包含的標準名稱、編號以及發行時間作為標準的基礎屬性。以食品產品標準GB 5420為例,標準名稱為《干酪》,標準編號為GB 5420,發行時間為“2021”。食品產品標準的內容屬性包括適用范圍、相關術語以及術語定義,位于文件正文部分“1 范圍”以及“2 術語和定義”。參照“3 技術要求”部分定義食品產品標準與其他標準的關系屬性,食品產品技術要求包含原料要求、感官要求、理化指標、污染物限量和真菌毒素限量、微生物限量、食品添加劑和食品營養強化劑,其中微生物限量常細分為致病菌限量和微生物限量。文件“4 其他”包含食品外包裝等其他相關要求,綜合上述內容結合食品安全國家標準的12個大類別,定義食品產品標準同其他標準的關系屬性見表1,食品產品標準知識圖譜本體模型如圖3所示。根據本體設計邏輯,基于規則對標準原始數據的進行知識抽取與加工,并將簡化后的結構化三元組進行存儲。

4.2 食品產品標準知識圖譜可視化

食品產品知識圖譜可視化通過Neo4j圖數據庫實現,Neo4j圖數據庫可以清晰地展示出節點之間的依賴關系以及顯性關系屬性。對食品產品標準以其本體模型進行知識抽取與知識融合后,形成食品產品標準與其他食品安全標準的關聯數據資源導入圖數據庫中,實現食品產品標準資源的可視化存儲與訪問。通過py2neo工具包可通過Python應用程序內部和命令行直接使用Neo4j,實現批量結構化知識導入。數據導入后在Neo4j圖數據庫中可使用Cypher查詢語言檢索食品產品標準知識圖譜中節點及其關聯關系,相關Cypher語句示例見表2。

圖譜示例如圖4所示,實體節點共計212個,關系數量789。通過進一步點擊訪問可以查詢各節點具體情況基本屬性以及關聯標準情況。

4.3 食品產品標準關聯查詢

食品產品標準知識圖譜的主要優勢在于以知識網絡直觀呈現了食品產品標準與其他標準之間的引用關系,為標準的查找和分析提供便捷的知識管理可視化工具。標準關聯查詢的首要作用,對于食品生產過程中需要參照標準針對性地進行匯總,對產品涉及的各技術要素以及檢驗方法實現“一圖直達”。標準“GB 25570 輔食營養補充品”的關聯圖譜,以該產品標準為中心的網狀結構直觀地整理了該標準存在有28項關聯,主要的19項標準關聯產生在理化指標檢驗方法上,對于食品添加劑、營養劑以及外包裝均有相關的標準要求(如圖5所示)。

其次,關聯查詢給標準的修訂提供了重要性數據參考。食品生產與人民群眾生命安全息息相關,知識圖譜可以通過節點出度、入度,從數據層面標記標準重要性以及關聯程度。以“微生物檢驗方法標準”為例,在Neo4j中直接查詢“MATCH (a)-[r:`微生物檢驗方法`]->(b)RETURN b, COUNT(r) ORDERBY COUNT(r) DESC”,圖譜如圖6所示,數據結果見表3。結果顯示與食品產品直接關聯的微生物檢驗方法標準重要性前三分別為GB 4789.3、GB 4789.2、GB 4789.4,關聯數目分別為50項、40項以及21項,因此在修訂相關標準時對于關聯程度較廣的標準應更加謹慎、多方考慮。

5 結 語

我國標準的領域知識深度廣,有效的知識管理對于提高標準文件信息管理水平、促進標準化工作成果具有重要意義。標準知識圖譜的核心在于標準知識單元的重組與細化,對標準文檔邏輯化的拆分的知識管理優勢在于,對于實體不僅囊括其涉及屬性的長文本,還能夠基于標準的制定邏輯對標準之間引用關系進行存儲,對于標準文檔做到了知識概括性、引用關聯性同時把握。知識圖譜的語義網絡特性在描述標準的語義關系上充分發揮效能,做到更深層、更高細粒度的知識管理,并為以此作為底層知識庫開展的智能應用打下基礎。

知識圖譜的組織模式提供了標準管理的框架和底層邏輯,后續研究方向聚焦于構建圖譜的效率。探索具有通用性的標準本體構建方法、提高標準知識抽取加工過程精確度以及如何深度利用標準知識圖譜實現智能應用,例如:精準問答等擴展。

參考文獻

楊波,楊美芳. 知識圖譜研究綜述及其在風險管理領域應用[J]. 小型微型計算機系統, 2021,42(08):1610-1618.

劉嶠,李楊,段宏,等. 知識圖譜構建技術綜述[J]. 計算機研究與發展, 2016,53(03):582-600.

Cheng B, Zhang J, Liu H, et al. Research on medical knowledgegraph for stroke[J]. Journal of Healthcare Engineering, 2021,2021.

Zhang D, Jia Q, Yang S, et al. Traditional Chinese MedicineAutomated Diagnosis Based on Knowledge Graph Reasoning[J].CMC-COMPUTERS MATERIALS & CONTINUA, 2022,71(1): 159-170.

Yang B, Liao Y. Research on enterprise risk knowledge graphbased on multi-source data fusion[J]. Neural Computing andApplications, 2022, 34(4): 2569-2582.

袁俊,劉國柱,梁宏濤,等. 知識圖譜在商業銀行風控領域的研究與應用綜述[J/OL]. 計算機工程與應用: 1-16[2022-08-11].

王思宇,邱江濤,洪川洋,等. 基于知識圖譜的在線商品問答研究[J]. 中文信息學報, 2020,34(11):104-112.

孫佳琛,王金龍,丁國如,等. 頻譜知識圖譜:面向未來頻譜管理的智能引擎[J].通信學報,2021,42(05):1-12.

胡琳,楊建軍,韋莎,等. 工業互聯網標準體系構建與實施路徑[J]. 中國工程科學, 2021,23(02):88-94.

黃持偉,吳學科,陽如坤,等. 鋰電池智能制造裝備標準體系研究[J]. 中國標準化, 2021(07):57-62+93.

肖有明,賴森森. 我國的食品安全標準體系建設[J]. 現代食品, 2020(17):145-147.

于航宇,樊永祥,王家祺. 我國現行食品安全地方標準分析[J]. 中國食品衛生雜志, 2019,31(05):485-489.

唐爽,韓義萍,張玉,等. 標準知識庫構建研究[J]. 中國標準化, 2020(S1):46-50.

趙雪芹,李天娥. 面向數字人文的檔案領域本體構建研究——以萬里茶道檔案資料為例[J/OL].情報理論與實踐:1-9[2022-08-09].

熊勵,王成文,王錕. 基于事件本體的疫情知識庫構建策略[J]. 圖書情報工作, 2021,65(14):138-148.DOI:10.13266/j.issn.0252-3116.2021.14.016.

劉博,張佳慧,李建強,等. 大氣污染領域本體的半自動構建及語義推理[J]. 北京工業大學學報, 2021,47(03):246-259.

唐琳,郭崇慧,陳靜鋒,等. 基于中文學術文獻的領域本體概念層次關系抽取研究[J].情報學報,2020,39(04):387-398.

Wang P, Mao Y, Song W, et al. A Comprehensive and ScientificallyAccurate Pharmaceutical Knowledge Ontology based on MultisourceData[C]//BIOINFORMATICS. 2022: 168-175.

劉慧琳,牛力. 標準文件的知識圖譜組織模式探究[J]. 檔案學通訊, 2021(05):58-65.

趙丹. 大慶油田標準體系動態管理系統的研究[J]. 中國標準化, 2017(17):114-118.

猜你喜歡
標準
2022 年3 月實施的工程建設標準
忠誠的標準
當代陜西(2019年8期)2019-05-09 02:22:48
標準匯編
上海建材(2019年1期)2019-04-25 06:30:48
美還是丑?
你可能還在被不靠譜的對比度標準忽悠
一家之言:新標準將解決快遞業“成長中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
2015年9月新到標準清單
標準觀察
標準觀察
標準觀察
主站蜘蛛池模板: 国产香蕉国产精品偷在线观看| 欧美日韩午夜视频在线观看 | 久久国产高清视频| 亚洲欧洲美色一区二区三区| 美女亚洲一区| 久久这里只有精品8| 一本一道波多野结衣一区二区 | 亚洲成av人无码综合在线观看| 日韩欧美一区在线观看| 亚洲青涩在线| 性欧美在线| 久久精品中文字幕免费| 91福利在线观看视频| 国模粉嫩小泬视频在线观看| 国产成人乱无码视频| 啦啦啦网站在线观看a毛片| 好吊妞欧美视频免费| 成人午夜天| 欧美在线三级| 67194亚洲无码| 亚洲va在线观看| 国产一区二区丝袜高跟鞋| 在线免费a视频| 国产成人精品一区二区不卡| 国产JIZzJIzz视频全部免费| av一区二区三区在线观看| 精品国产www| 91精品啪在线观看国产91九色| 亚洲欧美成人| 日韩精品一区二区三区视频免费看| 99久久国产综合精品2020| 无码aaa视频| 国产成人禁片在线观看| 欧美日韩国产综合视频在线观看| 久草中文网| 亚洲无码91视频| 白浆免费视频国产精品视频| 人与鲁专区| 亚洲αv毛片| 亚洲色图综合在线| 国产精品亚洲va在线观看| 日韩在线2020专区| 国产一区二区三区精品久久呦| 久久久久人妻精品一区三寸蜜桃| 亚洲精品午夜天堂网页| 97av视频在线观看| 91av国产在线| 精品国产Ⅴ无码大片在线观看81| 中文字幕久久波多野结衣| 欧美五月婷婷| 中文字幕 日韩 欧美| www欧美在线观看| 九九九久久国产精品| 国产成人精品一区二区| 免费人成网站在线高清| 黄色污网站在线观看| 依依成人精品无v国产| 伊人久久福利中文字幕| 黄色网在线| 亚洲天堂精品视频| 色婷婷色丁香| 国产精品太粉嫩高中在线观看| 日韩中文精品亚洲第三区| 一本久道热中字伊人| 亚洲IV视频免费在线光看| 国产尤物视频在线| 日日拍夜夜操| 国产99热| 日韩第九页| 中文字幕无码中文字幕有码在线| 制服丝袜一区二区三区在线| 国产免费羞羞视频| 青青草国产在线视频| 国产18在线播放| 国产成人亚洲精品无码电影| 国产男女免费视频| 视频一区亚洲| 国产成人精品午夜视频'| 亚洲精品免费网站| 色综合中文字幕| 国产成人无码AV在线播放动漫| 永久免费精品视频|