





摘 要:以構建《建設工程質量檢測員國家職業技能標準》的知識圖譜為主要研究內容,文章介紹了《建設工程質量檢測員國家職業技能標準》對于教育和檢測行業發展的重要性,討論了在當前數字化轉型過程中底層知識的必要性,說明知識圖譜在實際工作中的作用。在此基礎上,采用專家自頂向下的方法構建了知識圖譜,并根據標準內容確定了概念之間的關系和屬性類型。以“建設工程質量檢測員”為核心概念,擴展了標準中的相關概念。最后,將知識圖譜載入第三方平臺進行測試,通過SPARQL查詢獲得了相應的結果,同時也驗證了不同領域知識圖譜的關聯性。
關鍵詞:國家標準;知識圖譜;資源描述框架;三元組
中圖分類號:TP391.1 文獻標識碼:A 文章編號:2096-4706(2025)02-0079-05
Construction and Application of Knowledge Graph of National Vocational Skill Standard for Construction Engineering Quality Inspectors
WANG Haiyuan1,2, LI Jianmin1,2, ZHANG Feng1,2, FENG Zelong1,2, ZHANG Shen1,2
(1.China Academy of Building Research Co., Ltd., Beijing 100013, China;
2.CABR Testing Center Co., Ltd., Beijing 100013, China)
Abstract: Taking the construction of the Knowledge Graph of National Vocational Skill Standard for Construction Engineering Quality Inspectors as the main research content, this paper introduces the importance of National Vocational Skill Standard for Construction Engineering Quality Inspectors for the development of the education and inspection industries, discusses the importance of underlying knowledge in the current digital transformation process, and illustrates the role of the Knowledge Graph in practical work. On this basis, the Knowledge Graph is constructed using the expert top-down method, and the relationship between concepts and attribute types are determined according to the standard content. With “construction engineering quality inspector” as the core concept, it expands the related concepts in the standard. Finally, the Knowledge Graph is loaded into the third-party platform for testing, and corresponding results are obtained through SPARQL queries. Meanwhile, the relevance of Knowledge Graphs in different fields is also verified.
Keywords: national standard; Knowledge Graph; resource description framework; triple
DOI:10.19850/j.cnki.2096-4706.2025.02.014
0 引 言
建設工程質量檢測員是建設工程檢測的執行者,是確保建筑工程質量的關鍵一環,人員素質的提高對于促進行業的發展至關重要。2023年3月31日,住房和城鄉建設部發布了《建設工程質量檢測機構資質標準》中,對建設工程檢測機構中的主要人員提出了明確技術要求[1]。為貫徹落實《國務院關于推行終身職業技能培訓制度的意見》提出的“緊跟新技術、新職業發展變化,建立職業分類動態調整機制,加快職業標準開發工作”要求,人力資源社會保障部于2022年7月11日向社會發布《中華人民共和國職業分類大典》公示稿,其中,新增“建設工程質量檢測員”新職業,明確了行業中從業人員定位[2]。2023年9月1日,人力資源社會保障部面向社會公開征求66個國家職業標準意見,其中包括《建設工程質量檢測員國家職業標準》(征求意見稿)(以下簡稱:《標準》)[3]。該職業標準規定了建設工程質量檢測員應具備的基本職業技能要求、基礎理論知識、專業知識、安全環保知識、質量管理知識和法律法規知識等,并對相關的從業人員制定了4級的技能等級,建議了相應的學習時長和學習內容。然而作為指導專業技術人員的水平鑒定標準,《標準》涉及建設工程相關行業基礎知識、檢測行業相關規范、儀器儀表使用以及現場規定,等等。而且《標準》中涉及的概念相互引用形式多樣,對于參考《標準》的人員來說難以理解其中的關系。同時,隨著各行業的數字化轉型,各行業都在建設相應的數字化平臺和開發應用程序,領域知識間的互相交叉應用成為一種新的趨勢。不同領域的知識在數字化平臺上得以匯聚和融合,為各行業帶來了更廣闊的創新空間。各種數字化應用底層的知識共享也成為一個難題。由于各領域的知識體系和結構不盡相同,如何有效地整合和共享這些知識成為一個挑戰。知識圖譜(Knowledge Graph)技術是解決知識共享的技術手段之一。本研究針對《標準》涉及內容龐雜、覆蓋范圍等特點,提出《建設工程質量檢測員國家職業技能標準》知識圖譜(簡稱:檢測員知識圖譜)的構建方法,將標準文件轉換化為以資源描述框架(Resource Description Framework, RDF)為表達形式的知識圖譜,實現《標準》中涉及相關領域知識的相互關聯,幫助用戶更全面的理解該職業標準,使得對人員的培訓更全面、考核更加規范[4],也為行業應用程序的開發提供知識支撐,提高行業數字化、智能化水平。
1 標準數字化與知識圖譜
當前各種數據和知識爆炸式增長,各行各業源源不斷地產生各種場景、應用以及由此產生的數據。標準作為國家、行業或區域內針對特定領域的指導性文件,在對數據的分析、歸類、優化方面起到關鍵作用,也在不同應用系統中起到底層知識邏輯和認知基礎的作用。加快推動標準的數字化、網絡化、智能化和知識化轉型已逐漸成為標準領域的共識[5]。然而國家標準覆蓋內容廣泛、涉及環節多樣,并且會與其他標準相互引用,普通人難以理清其中的關系,閱讀起來非常困難[6]。在對標準進行應用過程中,開發人員往往需要額外的工作對標準進行數字化,形成結構化的文檔。大數據背景下,越來越多的具體場景要求將應用涉及的多專業知識標準進行融合,融合成人類可理解、機器可表征與可推理的知識庫[7]。知識圖譜技術就是采用語義技術形式化表達的系統化、結構化、集成化的特定領域知識[8],是當前人工智能領域研究的熱點,其核心包括實體、關系、屬性等。實體是知識圖譜中的基本單元,表示現實世界中的事物或概念;關系描述了實體之間的聯系;屬性則是對關系的進一步描述和補充。知識圖譜在知識組織方面具有極大優勢,主要用于從類型不同的龐雜數據中抽取實體、實體間的關系以及實體的屬性,然后將三者通過圖結構的數據模型或拓撲進行整合,從而將抽象零散的知識進行清晰的可視化展示[9]。采用知識圖譜技術對標準構建領域知識圖譜,可以整合多源標準知識,對于指定的信息給予精確查詢和關聯標準的鏈接呈現,提高檢索的準確性和效率。同時,知識圖譜將文檔層次的粗粒度知識拆分為細粒度的切片化知識,更有益于針對行業標準體系的構建與完善[10]。
標準文件作為針對特定內容進行標準化說明的文字,內容涉及的知識領域性強,專業術語多,而且行文結構較規范、標題層級清晰[11]。《標準》為指導建設工程質量檢測員業務能力考核認定的技能標準,涉及多個關聯領域知識,具體領域知識如表1所示。《標準》中僅對職業和技能相關的專業術語進行了定義或說明,應用過程中涉及的大量的建設工程檢測術語就需要人工解讀。而進行數字化的過程中,就可以通過知識圖譜中實體鏈接擴展其他領域知識圖譜,實現跨行業的知識融合。
2 知識圖譜構建
知識圖譜的構建目前主要有自動化、專家構建和半自動化三種方法。自動化的方法是指采用基于機器學習和自然語言處理等人工智能的方法,在提供的語料數據中進行實體(概念)識別、屬性識別和關系抽取等操作,將非結構化的數據轉換為結構化的數據,形成三元組的表達形式,多用于海量數據、內容繁雜且架構不清晰的公共領域通用知識圖譜,一般表現為自底向上的構建方法。專家構建主要是依托領域專家人工構建知識體系,逐步補充概念、屬性,建立實體間的聯系,多用于數據相對集中、知識結構相對確定的垂直領域行業知識圖譜,一般表現為自頂向下的構建方法。半自動化的方法介于以上二者之間,前期專家人工搭建概念框架,建立基本關系鏈接,之后在利用人工智能的方法進行實體識別、關系抽取和屬性提取,自動化填充知識圖譜內容。本文中,由于《標準》文本相較于其他文本有較為規范的文本格式,且文本量相對較少,同時也需要對《標準》條款有專業、準確的理解,因此采用領域專家構建的方法[12]。
2.1 《標準》的內容結構
《標準》作為建設工程質量檢測領域中第一部評價相關從業人員的技能等級標準,其內容涵蓋了職業概況、基本要求、工作要求、鑒定要求等多個領域知識,內容結構如圖1所示。
從圖1中可以看出,《標準》作為指導專業領域內從業人員的技能評定的標準,其具有領域范圍廣、專業術語多、內容關聯復雜等特點。而知識圖譜作為多領域知識進行融合的技術手段,在實現該技能標準的數字化過程中具有得天獨厚的優勢,可以有效地將標準中分散的知識點進行整合和關聯,使標準更易于被機器理解和嵌入到各種應用程序、平臺的場景當中。
2.2 知識圖譜的構建方法
本研究中檢測員知識圖譜構建方法采用專家自頂向下的方法構建,如圖2所示,主要步驟如下:
1)首先是要確定知識圖譜的領域范圍,限定概念、屬性涉及的知識范圍。
2)專家羅列出《標準》中涉及的主要專業術語以及含義。
3)組織概念形成層級結構,建立分類體系。
4)為每個類別建立描述概念特征的屬性。
5)通過屬性關聯各個不同的概念,建立實體間相互鏈接的關系。
6)專家對知識圖譜進行評價,不滿足要求回到步驟1)進行迭代、更新。
7)在應用中對知識圖譜進行更新。
2.3 知識圖譜結構
本研究構建的知識圖譜結構中的部分概念和關系如圖3所示,圖中用橢圓表示知識圖譜中的一個實體,有向箭頭表示屬性,方框表示數值或文本型的屬性值,采用vs來表示當前知識圖譜的命名空間。由于目前各知識圖譜工具對于中文支持會出現各種問題,如亂碼和無法正常簡析等,在RDF中實體和屬性的url仍然采用英文,實體通過屬性rdfs:label表明具體的中文含義。圖3中,以“建設工程質量檢測員”為核心概念定義了知識圖譜的主要實體,依據《標準》的章節內容,擴展了名稱、定義、鑒定要求等多個實體[13]。《標準》作為《國家職業技能標準》中的一個職業標準,屬于《國家職業技能標準》的一個子類,采用屬性rdfs:subClassof關聯兩個概念。實體與實體間通過對象屬性(object property)關聯,實體與數值或文本通過數據屬性(data property)關聯。如用對象屬性vs:hasRequirement建立實體“建設工程質量檢測員”和“鑒定要求”兩者間的關系,實體“建設工程質量檢測員”又通過數據屬性vs:hasCode和rdfs:label明確了職業代碼和中文名稱。
《標準》中有不少概念和關系都是前后相互引用或者與其他標準相互引用,這就需要將來自不同知識圖譜中不同表達形式的概念進行對齊、消歧,保證相同的概念指向的是同一實體。其中有一些外延概念,如學科、專業、儀器設備等,在《標準》中沒有明確的定義或解釋,在本研究中,將這些概念與其他知識圖譜中的概念進行關聯[14],起到概念解釋和說明的作用。當前版本中,檢測員知識圖譜關聯有三類外部知識圖譜,分別為:儀器設備知識圖譜、檢測技術規范知識圖譜和學科專業知識圖譜。例如:通過vs:hasRelatedMajor屬性將學科專業本體中“土建工程”專業的概念鏈接到本檢測員知識圖譜中,這樣就建立了專業與其外部擴展解釋間的鏈接關系[15]。
3 測試及結果
構建完成的知識圖譜結構化三元組RDF采用N-Triples的形式進行存儲,數據片段如圖4所示。在將知識圖譜應用于到具體項目前,可以將其載入到GraphDb中進行測試,一方面可以檢測知識圖譜的語法、格式是否有錯誤;另一方面也可以在脫離應用場景下測試,做到數據和應用邏輯的分離。GraphDB是一個開源的企業圖形數據存儲引擎,對于非商業目的可以免費下載,但如果用于商業目的則需要購買商業許可。
數據載入GraphDb后,既可以通過數據端口進行數據管理和查詢操作,也可以利用GraphDb自帶的圖形化界面進行操作。GraphDb啟動后,在默寫設置下使用瀏覽器輸入http://localhost:7200就可以進入GraphDb的圖形化操作界面。
為了測試知識圖譜是否構建完整、準確,需要對相應的知識內容進行測試。
應用舉例:成為鑒定場所至少需要幾臺低應變動測儀?
這個問題涉及《標準》1.9.5鑒定場所設備章節,內容涉及儀器和模型的5個分類。將該問句轉換為Sparql語義查詢語句及查詢結果如圖5所示。查詢結果顯示至少需要5臺低應變動測儀,而且這些設備屬于巖土類檢測儀器設備。
由于在構建《標準》的知識圖譜時,本檢測員知識圖譜中“低應變動測儀”通過owl:equivalentClass與儀器設備知識圖譜中“低應變基樁動測儀”建立了等價類的關聯。“低應變基樁動測儀”在儀器設備本體是“巖土類檢測儀器設備”的一個子類,而“巖土類檢測儀器設備”是“檢測儀器設備”的一個子類,所以通過邏輯推理就可以從關聯的知識模型中獲取相關的知識。
在這樣的多學科交叉應用的項目中,各個領域的知識圖譜往往都有相應的專業團隊負責。各個領域知識的更新和維護都不會同步,因此,采用知識圖譜進行領域間知識的融合就提供了相對方便的數據維護方法。儀器設備本體進行相應的更新,在“巖土類檢測儀器設備”和“低應變基樁動測儀”中新加一級“基樁動測儀”,檢測員知識圖譜中只需重新進行一次數字載入和推理操作即可,相應程序代碼及檢測員標準本體不需要進行改變。檢測員知識圖譜在應用中也并非一成不變。隨著時間的推移,新的知識和信息不斷涌現、職業標準版本的更新,而舊的知識可能會過時或被修正。為了保持應用的有效性和用戶滿意度,就必須不斷地對知識圖譜進行迭代更新。這需要定期檢查和更新圖譜中的數據、信息和鏈接,以確保其準確性和完整性。通過持續的迭代更新,確保知識圖譜始終與現實世界保持同步,為用戶提供最新、最準確的信息和服務。
國務院印發的《新一代人工智能發展規劃》中指出“形成涵蓋數十億實體規模的多源、多學科和多數據類型的跨媒體知識圖譜”[16],從而實現對知識持續增量的自動獲取。知識圖譜作為融合各學科、各行業知識的技術手段之一,在越來越多的行業數字化轉型的底層起到支持作用。《標準》作為跨越教育和建設工程檢測行業的人員業務水平認定標準,存在多學科、多行業相互融合的問題,本研究構建的檢測員知識圖譜,可以作為職業教育、人員考核以及技術培訓等應用的基礎知識模型,為職業教育數字化轉型及應用平臺的智能化提供支撐[17]。未來將實現更多元化的數據,實現多領域數據融合,推動行業從業人員的教育、培訓和考核等相關應用和平臺的數字化和智能化發展[18]。
4 結 論
本文深入探討了《建設工程質量檢測員國家職業技能標準》知識圖譜的構建及其應用,強調了其在教育和檢測行業中的核心地位。在數字化轉型的背景下,本文采用專家自頂向下的方法,成功構建了以“建設工程質量檢測員”為核心的知識圖譜,精確定義了概念間的關系和屬性,實現了這些概念與其他領域知識圖譜中概念的關聯,并通過第三方平臺測試驗證了其有效性和跨領域關聯性,能夠為專業應用平臺和軟件提供有力支持。本研究不僅促進了相關領域的知識整合與共享,也為相關行業的知識管理與應用提供了新的思路與工具。
參考文獻:
[1] 住房和城鄉建設部.住房和城鄉建設部關于印發《建設工程質量檢測機構資質標準》的通知 [EB/OL].[2024-06-09].https://www.gov.cn/zhengce/zhengceku/2023-04/20/content_5752347.htm?ivk_sa=1023197a.
[2] 人力資源社會保障部,市場監管總局,統計局.人力資源社會保障部 市場監管總局 統計局關于頒布《中華人民共和國職業分類大典(2022年版)》的通知 [EB/OL].[2024-06-09].http://www.mohrss.gov.cn/SYrlzyhshbzb/rencairenshi/zcwj/RCDWJSzonghe/202211/t20221103_489285.html?eqid=ab8e1c280003b4a000000006642bd965amp;wd=amp;eqid=d6b0803800034a4b00000004645b564c.
[3] 人力資源社會保障部.人力資源社會保障部面向社會公開征求66個國家職業標準意見 [EB/OL].[2024-06-09].http://www.mohrss.gov.cn/wap/xw/rsxw/202309/t20230901_505566.html.
[4] 李東海,劉星,王鵬.人工智能賦能職業教育高質量發展的價值、挑戰與創新路徑[J].教育與職業,2023(4):13-20.
[5] 方思怡.標準知識圖譜的技術路徑與應用場景探討 [J].中國標準化,2023(11):49-55.
[6] 秦麗,郝志剛,李國亮.國家食品安全標準圖譜的構建及關聯性分析 [J].計算機應用,2021,41(4):1005-1011.
[7] 鄭慶華,劉歡,龔鐵梁,等.大數據知識工程發展現狀及展望 [J].中國工程科學,2023,25(2):208-220.
[8] 黃智生,繆崇,胡青,等.川崎病知識圖譜構建研究 [J].中國數字醫學,2018,13(9):28-31.
[9] 趙宇博,張麗萍,閆盛,等.個性化學習中學科知識圖譜構建與應用綜述 [J].計算機工程與應用,2023,59(10):1-21.
[10] 楊德相,李劍鋒.基于知識圖譜的標準知識管理研究 [J].標準科學,2023(4):39-45.
[11] 劉慧琳,牛力.標準文件的知識圖譜組織模式探究 [J].檔案學通訊,2021(5):58-65.
[12] 劉明鵬,王忠明,馬文君.基于本體的造林樹種知識圖譜構建與應用 [J].北京林業大學學報,2023,45(8):109-122.
[13] 劉廣宇,安芃,伍震,等.基于本體的公路工程安全領域知識建模和應用 [J].清華大學學報:自然科學版,2024,64(2):224-234.
[14] 李薇,肖仰華,汪衛.基于中文知識圖譜的人物實體識別 [J].計算機工程,2017,43(3):225-231+240.
[15] 劉俊楠,劉海硯,陳曉慧,等.面向多源地理空間數據的知識圖譜構建 [J].地球信息科學學報,2020,22(7):1476-1486.
[16] 國務院.國務院關于印發新一代人工智能發展規劃的通知 [EB/OL].[2024-06-09].https://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
[17] 金波,鄭永進.高質量發展背景下職業教育數字化轉型實現路徑研究 [J].中國高教研究,2023(7):97-102.
[18] 廖帥,鄧茜,黃海聰.我國教育信息化的研究熱點與前沿趨勢——基于CiteSpace的可視化知識圖譜分析 [J].現代信息科技,2023,7(18):142-149.
作者簡介:王海淵(1981—),男,漢族,山西朔州人,副研究員,博士,研究方向:人工智能、知識圖譜、智能檢測技術。
收稿日期:2024-06-08