









摘要: 針對獲取碎片化紡紗工藝信息導致的生產效率低下、資源浪費及決策失誤等問題,文章提出了一種基于雙向長短期記憶網絡的紡紗工藝重用知識圖譜構建方法。首先,自上而下定義紡紗工藝相關概念、術語和關系,完成對知識圖譜模式層的構建;其次,根據模式層規則來構建數據層,采用雙向長短期記憶網絡(Bi-directional Long Short-Term Memory,BiLSTM)模型捕捉輸入序列的上下文信息作為條件隨機場(Conditional Random Fields,CRF)的輸入,對標簽序列進行建模標注以提取關鍵知識信息,并通過詞向量模型(Word2Vec)來計算紡紗相關的文本數據之間的相似度來實現知識融合,從而提升分詞準確率;最后通過Neo4j圖數據庫存儲抽取到的紡紗工藝知識,并可視化展示原料、工藝等復雜關系網絡,可幫助紡織企業優化生產、提升決策效率。實例分析結果表明,該知識抽取方法具有較高的召回率(88.7%)、準確率(89.9%)和F1值(89.3%),優于BiLSTM-CRF和LSTM-CRF模型,抽取效果有了顯著提升。
關鍵詞: 知識圖譜;紡紗工藝知識;雙向長短期記憶網絡;知識抽取;知識融合;實體關系
中圖分類號: TS111.9; TH165.4
文獻標志碼: A
文章編號: 10017003(2024)12期數0052起始頁碼09篇頁數
DOI: 10.3969/j.issn.1001-7003.2024.12期數.005(篇序)
在紡織工藝領域,隨著輕工業數據信息化的快速發展,紡紗智能生產系統積累了大量數據,但數據冗余且知識關聯性弱,限制了其有效應用[1-3]。當前系統雖重視數據檢索,卻缺乏對工藝知識深層關聯、理解和推理的充分挖掘[4],導致在面對復雜工藝問題時難以快速提煉有價值信息,進而影響決策效率和準確性。因此,構建一種能夠深度挖掘紡織工藝知識、強化知識關聯并實現高效管理的方法顯得尤為重要。
強化知識關聯對于提升各行業工藝水平及生產效率而言,具有至關重要的作用[5]。當前,研究正聚焦于如何高效地將企業內部的零散工藝信息整合為標準化的結構化知識,并積極探索其便捷的應用方式[6]。而知識圖譜作為一種新興的知識表示與管理技術,正展現出其在促進知識復用與共享方面的巨大潛力,其涵蓋了金融風險預測[7]、醫療人員管理[8]、社會科學[9]等多個領域。知識圖譜在生產及其制造領域也進行了拓展,Cai等[10]針對旋轉機械故障診斷精度受特征條件限制問題,提出知識圖譜驅動的診斷新方法。李秀玲等[11]針對復雜、多樣的工藝知識,將語義分析技術引入到知識圖譜中。吳秀麗等[12]利用知識圖譜技術構建退役機電產品全生命周期統一數據模型,優化多源數據管理,增強逆向物流信息追溯力。段陽等[13]針對離散的金屬刀削加工數據問題,采用了基于等價實體判別的數據融合算法,建立了金屬切削加工知識圖譜。周彬[14]提出圖匹配卷積網絡模型,構建航天薄壁件加工質量知識圖譜,整合資源,提升加工效率和精度。路松峰等[15]針對數控設備數據問題,構建基于知識圖譜的信息模型,抽取并融合數據,生成加工知識圖譜以提升效率。Li等[16]提出級聯模型,結合隨機森林分類與知識推理,構建電力故障診斷知識圖譜,克服傳統方法局限。Ko等[17]提出結合機器學習與知識圖譜的增材制造法,利用新數據生成共享設計規則知識。Zhou等[18]針對給定的訂單插入任務無法快速做出資源分配問題,提出了車間資源知識圖譜模型來集成加工車間的工程語義信息。聶同攀等[19]針對飛機電源故障應對難題,提出構建電源系統故障診斷知識圖譜,實現智慧搜索、推薦與智能問答,提升故障應對效率。Wen等[20]針對制
造過程知識重用難,提出構建過程知識圖譜方法,整合并優化知識共享與復用。Pu等[21]針對鐵路線形優化復雜,知識非結構化且應用碎片化,提出了首個鐵路線形優化知識圖譜建模方法,以整合知識并促進更新。Sarazin等[22]構建飛機運維知識圖譜專家系統,整合多源異構信息,提升異常檢測與故障診斷效率。
綜上可以看出,知識圖譜作為現代知識管理的利器,擅長構建復雜知識體系的結構化表達,已跨足多個行業。然而,在紡織行業特別是紡紗工藝領域,知識圖譜的應用仍處于探索階段。面對紡紗工藝知識的碎片化、高冗余度和弱關聯性,亟須一種新型的技術手段來整合這些數據信息,以實現知識的重用和高效管理。因此,本文提出了一種基于雙向長短期記憶網絡的紡紗工藝重用知識圖譜構建方法,旨在通過深度學習技術提取關鍵工藝知識,實現紡紗工藝知識的系統化、結構化和智能化管理。具體方法為:首先,定義紡紗過程的核心概
念與術語關系,構建知識圖譜模式層。隨后,利用BiLSTM-CRF模型精準標注紡紗工藝標簽,借助Word2Vec和余弦相似度算法整合知識。最后,將整合數據存儲在關系型數據庫中,形成知識圖譜數據層,以增強知識的可重用性。
1 紡紗過程知識圖譜建模框架
本文所提出的基于雙向長短期記憶網絡的紡紗工藝重用知識圖譜構建框架如圖1所示,具體內容如下:1) 模式層構建。該階段主要任務是定義紡織領域知識體系,確定工藝相關概念、術語和關系,良好的模式層可指導構建數據層。2) 數據層構建。該階段主要任務是填充概念的實例和對應屬性,本文通過構建的BiLSTM-CRF模型對文本標簽序列進行標注以抽取關鍵知識信息,采用Word2Vec模型計算紡紗工藝知識屬性的相似度,以實現知識融合并將融合后的知識數據有序地存儲到關系型數據庫來構建數據層。
2 紡紗工藝知識圖譜模式層構建
知識圖譜的模式層構成了其概念框架和邏輯基石,為數據層設定了明確的規范和約束。在構建過程中,通常采用自上而下的方法,首先確定高層次的抽象概念,然后逐步細化至具體的實體、屬性和它們之間的關系。這一層次化的構建方式確保了知識圖譜的完整性和邏輯一致性。本文在紡織領域專家的幫助下對紡紗方面的文本內容進行詳細分析,提煉出紡織領域里有意義的概念類型與相關的屬性,以及概念之間關系,從而形成領域知識體系。紡紗領域文本之間的關系,本文采用頭實體、尾實體、關系進行串聯。
頭實體:指的是在關系中的起始實體。頭實體是紡紗工藝中涉及的某個具體步驟、概念或實體。如在“紡紗過程中需要進行牽伸”這個三元組中,“紡紗過程”就是頭實體。
關系:描述頭實體和尾實體之間的聯系或屬性。關系是紡紗工藝中不同步驟之間的順序關系、操作關系,或者是實體之間的屬性關系等。以“牽伸”為例,它描述了紡紗過程中纖維被拉伸以改善其結構和性質的操作。
尾實體:指在關系中的結束實體,通常是頭實體通過關系所指向的目標。尾實體是一個結果、狀態或者另一個相關步驟。如在“紡紗過程中需要進行牽伸以得到優質的紗線”這個三元組中,“優質的紗線”就是尾實體,它是牽伸操作所期望達到的結果。實際上,工藝知識圖譜的構建涉及集成來自多個數據來源的信息,不同數據源的信息被映射成圖的節點,構建了一個豐富的關聯網絡。紡紗工藝知識本體與知識圖譜映射原理如圖2所示,其映射關系可能包括各種連接、依賴、影響等關系。
由圖2可知,構建紡紗工藝知識的模式層時,首先確立了“紡紗”作為核心頂層概念,它是整個知識體系的基礎和出發點。隨后,圍繞這一頂層概念,構建“紡紗工藝知識本體”,這一層次詳細描述了紡紗工藝中涉及的多個關鍵領域,包括纖維類型、原料、工序等,以及它們之間的相互作用和關系。通過這樣的構建,能夠系統地表示紡紗工藝中的知識結構和內在聯系。進一步地,利用映射關系將“紡紗工藝知識本體”與“紡紗工藝知識庫”相連,實現了知識本體與知識庫之間的有效關聯。在模式層中,“紡紗、纖維類型、工序”等頭實體通過“包括、特征”等關系與“原料、聚酯纖維、聚酯纖維紗線”等尾實體緊密相連,這些具體的實體和關系共同體現了紡紗工藝知識的復雜性和專業性,為后續的知識圖譜構建和應用提供了堅實的基礎。
3 工藝知識圖譜數據層構建
紡紗工藝知識圖譜數據層構建主要在模式層概念的基礎上進行知識抽取和知識融合。知識抽取從紡紗工藝數據源中提取實體、屬性和關系,為數據層提供基礎;知識融合通過詞向量處理識別文本語義相似度,確保數據層的一致性和完整性。首先對紡紗工藝知識文本進行數據標注構成訓練數據集,接著使用深度學習算法對紡紗工藝文本進行實體及關系抽取,構建出三元組并存入圖數據庫中,從而完成知識圖譜數據層的構建。
3.1 基于BiLSTM-CRF的紡紗工藝知識抽取
紡紗數據龐大且碎片化,難以直接從海量的信息庫中快速獲取有價值的信息。因此采用知識抽取技術,將原始的、非結構化的紡紗數據轉化為結構化、可理解的知識單元。這些知識單元包括實體(如紗線類型、紡紗設備等)、屬性(如紗線強度、纖維長度等),以及它們之間的關系。通過這一過程,構建出一個全面反映紡紗工藝全貌和細節的知識圖譜。同時,紡紗工藝知識文本富含專業術語和復雜流程,具有時序和上下文依賴性。BiLSTM是RNN的擴展,能同時處理序列的前向與后向信息。通過雙向RNN層,它結合前后文信息,增強了對紡紗工藝等復雜序列數據的理解能力。BiLSTM特征在于其雙向性,捕捉全局上下文;以及長期依賴性,通過LSTM的“門”機制解決長序列問題,提升紡紗數據預測準確性。此外,CRF作為強大的序列標注模型,可以在給定觀察序列的條件下預測最可能的標簽序列。在紡紗工藝知識抽取中,CRF能夠識別實體及其關系,優化整個句子的標簽序列預測,減少錯誤傳播,提高準確性。因此,本文采用BiLSTM-CRF算法對紡紗工藝進行知識抽取。
紡紗工藝知識抽取可劃分為三大環節:首先,文本被轉化為蘊含上下文信息的字向量,這些向量捕捉語句中每個字的語義和上下文關聯。接著,這些字向量被輸入到BiLSTM模塊中,該模塊通過雙向編碼方式,考慮文本的前后文信息,為每個可能的標簽輸出預測分數值。最后,CRF模塊對這些預測分數進行解碼,通過訓練過程學習得到標簽之間的轉移概率和相應的約束條件,從而得出最終的預測標注序列?;贐iLSTM-CRF紡紗工藝知識抽取模型框架如圖3所示。
圖3中,W1,W2,…,Wn為詞向量,輸入語句都被轉換為可編碼的詞向量形式;w1,w2,w3,…為詞向量經過CRF層的標簽序列概率;B表示實體的首字符,O表示不屬于任何已定義的實體,I表示實體的內部字符。
由圖3可知,原始輸入語句,如“紡紗工藝中的工藝特征有:開清棉”,首先這些語句會被轉換為向量W1,W2,…,Wn,隨后這些向量會被送入BiLSTM的3、4層進行上下文特征的學習。通過這種方式,模型能夠充分捕捉語句中的上下文信息,為后續的任務提供有力的特征表示。隨后,將向量傳遞給BiLSTM層進行上下文特征的學習,確保模型能夠深入捕獲語句中的上下文信息。BiLSTM結合了前向LSTM和后向LSTM,將原本順序輸入的序列轉化為兩個方向的輸入,可以使得網絡能夠同時獲得前向和后向的信息,從而更精準地捕捉長距離的雙向語義依賴。CRF層會接收BiLSTM層輸出的每個時間步長的隱藏狀態,并計算所有可能的標簽序列的概率。它通過學習標簽之間的轉移概率,來確定最可能的標簽序列。最終,CRF層會輸出一個最優的標簽序列,即BIO標注結果。最終輸出的信息為:工序、特征、開清棉。
3.2 基于Word2Vec的紡紗工藝知識融合
在紡紗工藝知識圖譜的構建過程中,抽取到的文本信息往往包含大量相同或語義相似的數據。這些信息可能來自不同的數據源,或者是在處理過程中產生的重復或冗余內容,因此需要對這些相同或語義相似的文本信息進行知識融合。即采用知識融合技術整合來自不同來源的相同或相似信息,形成一個統一且無冗余的知識表示。而Word2Vec算法能夠將紡紗工藝知識文本中的詞匯轉化為稠密的向量表示,這些向量能夠捕捉到詞匯之間的語義關系。相比于傳統的基于詞袋模型的表示方法,Word2Vec算法生成的詞向量包含了豐富的語義信息,有助于更準確地表示和理解紡紗工藝知識中的專業術語和復雜流程。因此,本文采用Word2Vec算法,對紡紗工藝進行知識融合。
通過BiLSTM-CRF模型抽取到紡紗工藝知識后,利用Word2Vec算法將詞匯映射到向量空間,以捕捉語義關系。這些詞向量用于分析紡紗工藝中的實體相似性和差異性,以發現潛在關系?;赪ord2Vec算法實體知識融合過程如圖4所示。
基于Word2Vec模型的實體知識融合過程步驟如下:
1) 首先逐個取出BiLSTM-CRF模型得到的實體抽取結果:實體1、實體2、實體3。對于每個實體,檢查其是否為首個遇到的獨立實體。如果是,則新建一個聚類,并將該實體作為該聚類的首個成員。如果不是首個聚類,則進入相似度處理的步驟。
2) 對于不是首個聚類的實體,進行分詞處理,將其拆分為單獨的詞或子詞單元。隨后,利用Word2Vec模型為每個詞獲取一個向量表示。這些向量用來捕捉詞的語義信息,PfleXNZ+Q9mqJez9PTUik22xmLJXcprmturWWLoZnCA=使得語義上相近的詞在向量空間中的位置也相近。根據得到的詞向量創建兩個矩陣。第一個矩陣是句子長度(即詞的個數)乘以詞匯表長度的零矩陣,記錄每個詞是否出現在句子中。第二個矩陣是詞匯表長度乘以詞向量維度的矩陣,其中每一行是詞匯表中對應詞的Word2Vec向量。通過第一個矩陣和第二個矩陣的乘法運算,得到一個句子長度乘以詞向量維度的矩陣。這個矩陣的每一行就對應句子中每個詞的Word2Vec向量表示,即實現了將句子中的每個單詞映射到Word2Vec向量空間中。
3) 接下來通過得到的屬性的向量,使用余弦相似度來比較不同實體之間的相似程度。如果兩個實體的相似度大于設定的閾值,則將它們歸入已有的聚類中;否則,保持它們作為獨立的實體或考慮創建新的聚類。其中,余弦相似度是通過計算兩個向量的夾角來衡量它們之間的相似程度。余弦相似度的公式如下:
S(A1,B2)=a1·b2a1b2(1)
式中:S表示余弦相似度,A1和B1分別是兩個屬性的向量表示,·表示向量的點積,·表示向量的范數。
相似度的取值范圍在-1~1,值越接近1表示兩個屬性越相似,值越接近-1表示兩個屬性越不相似。
3.3 模型評價指標
為了測試模型性能的優劣,本文采用精確率P、召回率R和F1分數值這三項評價指標來評估模型性能。其中,準確率越高,模型識別非目標實體越準確;召回率越高,模型捕捉目標實體越高效;F1值提升,則模型在平衡準確與召回上的穩健性增強。計算方法如下:
P/%=TPTP+FP×100(2)
R/%=TPTP+FN×100(3)
F1/%=2P×RP+R×100(4)
式中:TP表示模型正確預測目標實體的數量,FP表示模型錯誤預測非目標實體的數量,FN表示模型未能識別實體的數量。
4 案例分析
為了驗證所提基于知識圖譜的紡紗工藝知識重用的有效性,本文選取《紡紗技術》和《紡紗工藝學》著作為實驗數據的核心來源。該紡紗工藝知識涉及工序、纖維類型、紡紗質量控制、紗線應用四方面的知識。紡紗工藝知識選取的訓練數據為789,對紡紗工藝知識文本數據的定義以句子的最大長度為80個字符進行BIO標注,將標注后的數據劃分為67%的訓練集和33%的測試集,并對模型進行訓練與測試。
4.1 模式層構建
本文紡紗工藝知識包括工序、纖維類型、紡紗質量控制、紗線應用等四個方面的知識,對各個數據信息進行實體關系間抽取,可獲得對應的本體規則,用來構建知識圖譜的模式層,如圖5所示。
由圖5可知,紡紗工藝的知識體系被劃分為幾個核心領域:纖維類型(如聚酯纖維、腈綸等)、紡紗工序(包含開清棉、梳棉、井條等工序)、紡紗質量控制,以及紗線應用(涵蓋醫療器械、建筑材料、服裝等領域)。這些領域通過特征、工序、工藝參數等節點相互連接,形成完整的紡紗工藝知識網絡,為后續構建數據層提供了知識框架。
4.2 數據層構建
本文的實驗主要運行環境為:Windows10操作系統,處理器AMD Ryzen 5 2500U,64位操作系統,Python 3.6,編程平臺Pycharm 2021.2,基于Keras、TensorFlow神經網絡框架搭建模型,部分BiLSTM-CRF-Word2Vec模型參數如表1所示。
通過BiLSTM-CRF-Word2Vec模型,采用BIO標注法將紡紗工藝文本序列中的每個字標注為B、I或O標簽,以此明確界定和分類實體的起始、內部和非實體部分,確保頭部、中間和尾部標簽的一致性和準確性。
根據BiLSTM-CRF模型得到的標注結果,隨后采用Word2Vec模型,對此進行聚類相似度計算。其初始化的主要參數有:vector_size=150,window=5,min_count=1。其中,vector_siz為詞向量的維度,window為訓練詞向量時考慮的上下文窗口大小,min_count為在構建詞匯表時忽略詞頻低于1的單詞。
根據紡紗工藝知識中不同詞語在語義上的相似性和差異性,由式(1)得出粗紗與細紗的相似度為0.018 540 392,并條與并合的相似度為0.932 756 781。由此可知,相似的詞語在向量空間中會聚集在一起,形成聚類;而差異較大的詞語則會分布在不同的區域。這種空間分布直觀地展示了紡紗工藝知識中詞語之間的內在聯系。在數據層構建中,需要將原始的紡紗工藝知識文本轉換為計算機能夠理解和處理的數值形式。通過詞向量的轉換將詞語轉換為高維空間中的向量,進而構建出包含豐富語義信息的紡紗工藝知識數據集。為評估本文構建的BiLSTM-CRF-Word2Vec模型在紡紗工藝領域實體抽取任務上的效能,分別與LSTM-CRF及BiLSTM-CRF模型進行對比實驗,結果如圖6所示。其中P、R、F1數值來源均由式(2~4)得到。
由圖6可知,相對于LSTM-CRF和BiLSTM-CRF,BiLSTM-CRF-Word2Vec的準確率分別提高了0.8%~3.4%,召回率提高了2.4%~7.8%,F1得分值提高了1.6%~5.6%。這主要源于LSTM-CRF和BiLSTM-CRF模型在捕捉文本深層語義信息及處理標簽依賴關系和實體邊界識別時的局限性。具體來說,LSTM-CRF模型在處理長序列時可能難捕捉長期的依賴關系,而BiLSTM-CRF模型雖然通過雙向LSTM結構解決了這個問題,但在語義信息的捕捉方面仍有不足。相比之下,BiLSTM-CRF-Word2Vec模型通過結合Word2Vec技術、BiLSTM結構和CRF層,在多個方面表現出顯著優勢。Word2Vec技術能夠將文本中的每個詞轉換為固定維度的向量表示,這些向量富含語義信息,使得模型能夠更深入地理解文本內容。BiLSTM結構允許模型同時考慮輸入序列的前后上下文信息,從而更準確地捕捉實體邊界和判斷實體類型。而CRF層則進一步優化了序列標注過程,提高了模型在處理標簽依賴關系時的準確性。因此,BiLSTM-CRF-Word2Vec模型通過引入Word2Vec技術,有效彌補了LSTM-CRF和BiLSTM-CRF模型在語義信息捕捉和標簽依賴關系處理方面的不足,從而顯著提升了模型在實體抽取等NLP任務中的性能。
4.3 紡紗工藝知識圖譜可視化
在完成數據驗證后,解析并提取數據中的關鍵實體及其之間的關系。鑒于數據量適中,本文選擇利用Neo4j圖數據庫的Cypher語言結合LOAD CSV功能來高效存儲這些數據。在數據準備階段,首先將紡紗領域的知識圖譜模式層(包括實體類型和關系類型)定義清晰,并將這些定義映射到實際的數據層上,如圖5所示。隨后,解析得到的實體節點和它們之間的關系數據分別整理成CSV文件格式,并存放在Neo4j圖數據庫的import文件夾內。接下來,利用Cypher的LOAD CSV功能,編寫相應的Cypher語句來批量導入節點(Node)和關系(Relationship)。這些Cypher語句會根據CSV文件中的數據內容,在Neo4j圖數據庫中創建相應的節點和邊,從而構建起紡紗領域的知識圖譜。通過Neo4j的可視化功能,能夠直觀地展示紡紗工藝知識圖譜,如圖7所示,其中藍色節點代表紡紗工藝的各類實體,而邊則用于表示這些實體之間的不同關系類型。
由圖7可見,知識圖譜可視化能夠清晰地展示紡紗工藝中各個環節之間的關系,將原料、設備、操作過程、質量控制等要素之間的相互作用和影響以直觀、圖形化的方式呈現在工藝人員面前。這種方式使得工藝人員能夠更快速地理解和把握紡紗工藝的整體框架和細節,從而有助于提升對工藝的全面認識。并通過對知識圖譜的深入分析,工藝人員能夠更好地把握工藝流程中的關鍵節點和潛在風險,為工藝優化和改進提供有力的支持。因此,知識圖譜可視化不僅增強了工藝人員對紡紗工藝的理解,還為他們提供了有效的決策依據,從而推動紡紗工藝的持續優化和發展。
5 結 論
針對加工工藝的選擇往往依賴人工經驗,而人工經驗是一種主觀經驗,具有精確性不足、難以復用等問題,本文提出了一種基于知識圖譜的紡紗工藝知識重用方法,并得出以下結論。
1) 本文通過構建BiLSTM-CRF模型對紡紗文本序列信息進行序列標注,顯著提升了識別和標注文本中關鍵信息的準確性。這一模型的引入,不僅解決了傳統方法在處理復雜文本結構時的不足,而且為深入理解紡紗文本內容提供了強有力的工具。通過BiLSTM-CRF模型,能夠更精準地捕捉文本中的上下文信息和序列特征,從而更準確地標注出紡紗文本中的術語、概念和關鍵信息。
2) 接著利用Word2Vec模型計算標注后的紡紗文本數據的相似度,實現了對不同紡紗術語和概念之間關聯性的量化評估。這iGvCUeTvzmz6JLELpfQbvjoVPsz2wJMTvhcjt1zVktA=一方法不僅簡化了知識關聯性的分析過程,而且通過具體的數值度量,使得紡紗知識之間的關聯性變得更為直觀和易于理解。通過Word2Vec模型,能夠快速發現紡紗術語之間的潛在聯系,揭示不同概念之間的內在關聯,從而有助于全面地理解和把握紡紗領域的知識體系。
在后續研究中,將進一步深化對紡紗工藝知識圖譜重用方法的研究,重點探索更加靈活且通用的實體與關系標注方法及訓練模型。特別是針對語料中存在的復雜多重疊關系提取難題,將開發更為精準高效的解決方案。同時,鑒于網絡數據的日新月異,知識圖譜的實時更新與補充顯得尤為重要。為此,需充分利用知識融合與知識推理等先進技術,推動知識圖譜的自動化更新與升級,確保其始終與最新的紡紗工藝知識保持同步。
參考文獻:
[1]潘王蕾, 何瑛. 基于個性化推薦的服裝知識圖譜構建[J]. 服裝學報, 2022, 7(3): 275-282.
PAN W L, HE Y. Construction of clothing knowledge graph based on personalized recommendation[J]. Journal of Clothing Research, 2022, 7(3): 275-282.
[2]HU S, ZHANG G, ZHAO X H, et al. A method for yarn quality fluctuation prediction based on multi-correlation parameter feature subspace mechanism in spinning process[J]. Journal of Engineered Fibers and Fabrics, 2022, 10(3): 176.
[3]胡勝, 李文, 趙小惠, 等. 基于特征空間變換的紡紗過程多關聯參數質量波動異常檢測[J]. 計算機集成制造系統, 2023, 29(7): 2224-2232.
HU S, LI W, ZHAO X H, et al. Quality fluctuation abnormal detection og multi related parameters in spining process based on feature space transformation[J]. Computer Integrated Manufacturing Systems, 2023, 29(7): 2224-2232.
[4]XIAO Y Z, ZHENG S, SHI J C, et al.Knowledge graph-based manufacturing process planning: A state-of-the-art review[J]. Journal of Manufacturing Systems, 2023(70): 417-435.
[5]CHHIM P, CHINNAM R B, SADAWI N. Product design and manufacturing process based ontology for manufacturing knowledge reuse[J]. Journal of Intelligent Manufacturing, 2019, 30: 905-916.
[6]ZHENG P, XIA L Q, LI C X, et al. Towards Self-X cognitive manufacturing network: An industrial knowledge graph-based multi-agent reinforcement learning approach[J]. Journal of Manufacturing Systems, 2021(61): 16-26.
[7]RONY M, AYUSH D, PIYUSH D, et al. Knowledge graph driven credit risk assessment for micro, small and medium-sized enterprises[J]. International Journal of Production Research, 2024, 62(12): 4273-4289.
[8]KHALID M M, MADAN K, MAZE A, et al. Automated domainn-specific healthcare knowledge graph curation framework: Subarachnoid hemorrhage as phenotype[J]. Expert Systems with Applications, 2020(145): 113120.
[9]ABU S B, ALSAWALQAH H, ELSHQEIRAT B, et al. Toward a knowledge-based personalised recommender system for mobile app development[J]. Journal of Universal Computer Science, 2021, 27(2): 208-229.
[10]CAI T, JIANG Z Y, WU H, et al. Research on knowledge graph-driven equipment fault diagnosis method for intelligent manufacturing[J]. The International Journal of Advanced Manufacturing Technology, 2024, 130(9/10): 4649-4662.
[11]李秀玲, 張樹生, 黃瑞, 等. 面向工藝重用的工藝知識圖譜構建方法[J]. 西北工業大學學報, 2019, 37(6): 1174-1183.
LI X L, ZHANG S S, HUANG R, et al. Process knowledge graph construction method for process reuse[J]. Journal of Northwestern Polytechnical University, 2019, 37(6): 1174-1183.
[12]吳秀麗, 馬隆洲, 向東, 等. 面向退役機電產品全生命周期的知識圖譜統一建模方法研究[J]. 機械工程學報, 2023, 59(7): 52-67.
WU X L, MA L Z, XIANG D, et al. Research on unified modeling method of knowledge graph for the whole life cycle of retired mechanical and electrical products[J]. Journal of Mechanical Engineering, 2023, 59(7): 52-67.
[13]段陽, 侯力, 冷松. 金屬切削加工知識圖譜構建及應用[J]. 吉林大學學報(工學版), 2021, 51(1): 122-133.
DUAN Y, HOU L, LENG S. Construction and application of knowledge graph for metal cutting processing[J]. Journal of Jilin University (Engineering and Technology Edition), 2021, 51(1): 122-133.
[14]周彬. 航天薄壁件加工質量的知識圖譜建模與因果推理研究[D]. 上海: 東華大學, 2022.
ZHOU B. Knowledge Graph Modeling and Causal Reasoning for Machining Quality of Aerospace Thin-Walled Parts[D]. Shanghai: Donghua University, 2022.
[15]路松峰, 李祎明, 屠向陽, 等. 基于知識圖譜的數控裝備信息模型建模方法[J]. 華中科技大學學報(自然科學版), 2022, 50(6): 39-47.
LU S F, LI Y M, TU X Y, et al. Modeling method of numerical control equipment information model based on knowledge graph[J]. Journal of Huazhong University of Science and Technology (Natural Science Edition), 2022, 50(6): 39-47.
[16]LI C, WANG B. A knowledge graph method towards power system fault diagnosis and classification[J]. Electronics, 2023, 12(23): 4808-4822.
[17]KO H, WITHERELL P, LU Y, et al. Machine learning and knowledge graph based design rule construction for additive manufacturing[J]. Additive Manufacturing, 2020(37): 101620.
[18]ZHOU B, BAO J S, LI J, et al. A novel knowledge graph based optimization approach for resource allocation in discrete manufacturing workshops[J]. Robotics and Computer-Integrated Manufacturing, 2021, 71: 102160-102179.
[19]聶同攀, 曾繼炎, 程玉杰, 等. 面向飛機電源系統故障診斷的知識圖譜構建技術及應用[J]. 航空學報, 2022, 43(8): 46-62.
NIE T P, ZENG J Y, CHENG Y J, et al. Knowledge graph construction technology and its application in aircraft power system fault diagnosis[J]. Acta Aeronautica et Astronautica Sinica, 2022, 43(8): 46-62.
[20]WEN P H, MA Y, WANG R Q. Systematic knowledge modeling and extraction methods for manufacturing process planning based on knowledge graph[J]. Advanced Engineering Informatics, 2023(58): 102172.
[21]PU H, HU T, SONG T R, et al. Modeling and application of a customized knowledge graph for railway alignment optimization[J]. Expert Systems with Applications, 2024(244): 122999.
[22]SARAZIN A, BASCANS J, SCIAU J B, et al. Expert system dedicated to condition-based maintenance based on a knowledge graph approach: Application to an aeronautic system[J]. Expert Systems with Applications, 2021(186): 115767.
Construction of a knowledge graph for reusable spinning processes based onbidirectional long short-term memory networks
ZHANG Chi, WANG Xiangrong
HU Sheng, ZHANG Xi, LIU Dengji, GAO Bingbing, ZHAO Xiaohui
(School of Mechanical and Electrical Engineering, Xi’an Polytechnic University, Xi’an 710048, China)
Abstract: Textile spinning process knowledge is a vital technical heritage in the textile industry, and its systematic organization and efficient reuse are crucial for driving industrial technological innovation and preserving cultural diversity. However, spinning process knowledge is often scattered across various documents, practical experiences, and master-apprentice transmissions, exhibiting a high degree of fragmentation and unstructuredness, and posing significant challenges to knowledge integration, retrieval, and application. With the rapid development of the textile industry, the updating and iteration of spinning process knowledge have accelerated, rendering traditional manual recording and inheritance methods inadequate for meeting the demands of modern industries for efficient and precise knowledge management. Particularly when dealing with complex and varied spinning processes, traditional methods often fail to fully capture process details, leading to information loss or distortion during transmission, thereby affecting the integrity and accuracy of spinning process knowledge. To address this challenge, research on the reuse of spinning process knowledge based on knowledge graphs has emerged. As a structured knowledge representation method, knowledge graphs can formally describe entities, attributes, and relationships within spinning process knowledge, forming an interconnected knowledge network. By constructing a spinning process knowledge graph, systematic organization, standardized expression, and intelligent management of spinning process knowledge can be achieved, so as to provide textile practitioners with a comprehensive, accurate, and easily understandable knowledge resource platform.
To address issues such as low production efficiency, resource waste, and decision-making errors caused by fragmented spinning process information, a method for constructing a spinning process reuse knowledge graph based on a bidirectional long short-term memory network (BiLSTM) was proposed. Firstly, spinning process-related concepts, terminologies, and relationships were defined top-down to complete the construction of the knowledge graph’s schema layer. Secondly, the data layer was constructed according to the schema layer rules. The BiLSTM model was employed to capture contextual information from the input sequence, which serves as input for the Conditional Random Fields (CRF) model to model and annotate tag sequences for extracting key knowledge information. Furthermore, the Word2Vec model was utilized to calculate the similarity between textile-related text data, facilitating knowledge fusion and enhancing tokenization accuracy. Finally, the extracted spinning process knowledge was stored in a Neo4j graph database and visually presented, showcasing complex relationships among raw materials, processes, etc., aiding textile enterprises in optimizing production and enhancing decision-making efficiency. This paper integrates the BiLSTM and CRF models, leveraging BiLSTM’s contextual capture capabilities and CRF’s sequence labeling advantages to achieve precise extraction of key knowledge information from spinning process texts. Additionally, the introduction of a word embedding model for knowledge fusion and the utilization of Word2Vec to calculate text similarity promote the effective knowledge integration and improve the accuracy of tokenization and entity recognition. The results of case studies indicate that the proposed knowledge extraction method achieves high recall (88.7%), precision (89.9%), and F1 score (89.3%), significantly outperforming the BiLSTM-CRF and LSTM-CRF models. This demonstrates the method’s remarkable effectiveness in spinning process knowledge extraction, effectively enhancing production and decision-making efficiency in textile enterprises.
In the future, further optimization and refinement of this method will be undertaken, and more advanced natural language processing and knowledge graph construction technologies will be explored to further enhance the accuracy and efficiency of spinning process knowledge extraction. Additionally, strengthened cooperation with textile enterprises will facilitate the application of this method in actual production, so as to generate greater economic and social benefits for enterprises.
Key words: knowledge graph; spinning process knowledge; bidirectional long short-term memory networks; knowledge extraction; knowledge fusion; entity relationship