王佳 李媛智 續飛飛 高慧芳
(1.中國軟件評測中心,北京 100048;2.北京北科億力科技有限公司,北京 100102)
流程工業在國民經濟中占有基礎性的戰略地位,石油、化工、鋼鐵、建材等都是典型的流程工業。經過幾十年的發展,我國已成為世界上門類最齊全、規模最龐大的流程工業大國,流程工業的生產工藝、生產裝備和生產自動化水平都達到世界領先水平。目前,流程工業生產中普遍應用了分布式控制系統(Distributed Control System,DCS),該系統可以實時采樣流程工業生產過程中各個環節的生產狀態,特別是傳感器技術以及數據庫技術的快速發展,DCS系統對流程工業生產狀態的監控越來越多。流程工業控制系統采樣得到的數據經過長時間的積累形成規模龐大的歷史數據庫,在這些數據中包含了可用于生產和管理的大量有價值的信息和知識。除了隱含在直接來自生產現場具有多維度、多尺度、異構的海量數據中的知識之外,在流程工業中的知識還包括:(1)具有隱蔽性、非量化的經驗知識;(2)能夠反映生產過程的氣液固多相變化機理的機理知識[1-3]。知識資源已經成為支撐流程行業企業生存與發展的重要力量,流程行業對知識資源的高效應用具有非常迫切的需求。
以面向業務的工業應用軟件的開發與應用為實現路徑,工業技術、工藝經驗、制造知識和方法等通過軟件實現顯性化、數字化和系統化。目前工業知識的研究在流程行業中應用已經研究很久,主要是通過貝葉斯網絡[4]、模糊系統[5]、以及專家系統[6]等完成在流程工業對知識的自動推理以及實現自主決策。但是隨著實際系統的復雜性不斷增加,上述方法的復雜性會大大增加,使得大多數理論應用都是停留在研究層面,實際應用場景非常少。知識發現主要是從專家人員、文件或其他系統等提取知識并向知識型系統轉移的過程。常用的方法包括事件關聯規則挖掘[7]、人工神經網絡[8]、數據統計分析方法[9]、遺傳算法[10]、決策樹[11]等。由于工業數據數量大并且質量難以保證,工業過程中知識的提取仍然是主要難點。
知識分類和管理是企業發展的重要的組成部分,但如何來做仍然是一道難題,目前大部分企業都進行過知識相關研究工作。但是多數企業仍然存在無知識、弱知識、死知識的問題,并且未對相應知識進行分類,也沒有正在將知識融入產品研制和生產過程。因此,本文對流程工業企業知識自動化的相關的研究現狀進行了分析和介紹,詳細闡述流程行業企業知識建模框架和不同類型的知識分類,并以知識發現為流程,構建了根據不同知識分類的模型,擴展了知識發現和構建研究的理論體系。
伴隨工業4.0、工業互聯網、智能制造等政策的發布,知識將成為推動企業發展的重要資源。企業制造過程包括3個重要環節:一是研制過程;二是生產過程;三是運營過程。知識作為重要的生產要素,不僅要考慮產品生產周期全過程如何智慧化,同時還要考慮產品運維過程對研制和生產的反向影響。
對于不同的生產過程和知識有不同的結合點,知識跟企業產品研制過程關系最緊密,研制是知識的歸宿。普通制造過程的知識密度比較低,但是工藝設計指南、產品使用手冊、作業指導書等知識如果能夠得到很好的整理,將對制造過程產生很大的價值。生產過程的知識大多來源于大數據分析結果,通過制造過程的異常數據可以判斷設備、生產線以及產品運營過程的健康程度,利用大數據技術科研對制造過程、產品運營進行預測、改進甚至自動決策。產品運維過程也會產生大量的數據,這些數據都可以被知識化,能夠指導企業優化研制和生產過程,及時修改產品的設計和生產。
流程行業是知識技術非常集中的產業,對知識資源的應用有非常迫切的需求。當前,知識分類和知識獲取是知識資源應用的基礎和關鍵,對知識資源的獲取、組織和利用知識創造價值的速度是支撐制造企業生存與發展的核心資源。從知識發現的本質來看,它集成規律、策略和技術知識生產過程。對于國內知識發現研究而言,在大數據驅動下,國內知識發現研究已經從決策樹、遺傳算法、機器學習、文本挖掘等具體的理論方法轉變為如何應用知識發現的技術方法解決各行各業遇到的問題,并且逐漸面向行業領域和服務的綜合應用研究轉變,存在的問題主要有以下3個方面。
業務場景的數據挖掘具有重要意義,在當前流程工業環境下,具備高水平業務知識和數據挖掘能力的人員非常短缺,使得將實際工業場景抽象成對應數據挖掘問題成為工業知識提取和增值過程的一個重大門檻。
在實際生產過程中,采集的數據質量非常差強人意,企業對采集的數據并不會進行數據處理,導致數據的完整性、一致性、唯一性和有效性無法保證,嚴重影響數據挖掘的效率、準確性等方面。
結合流程工業知識的特點,工業知識、經驗、機理沉淀和應用難,我國制造業工藝軟件化基礎薄弱,導致我國制造行業的機理模型缺失較為嚴重,無任何機理模型,目前只有知識型工作者才能完成工業現場復雜分析、精確判斷和決策等工作。
在制造企業中,數據、信息和知識是一個彼此關聯和不斷重用、提煉的過程。數據在反復關聯與使用中提升為信息,信息在反復關聯和使用中轉化為知識。數據類資源通過標準化技術,可以使其獲得有序化特征,但仍然屬于低層次的知識形態。信息類資源對數據知識進行分析整理,通過結構化加工強化共享特征,經過分類、聚類、語義分析等手段結構化后,信息類資源形成各種分類知識庫供參考查閱。
知識建模框架如圖1所示,知識采集針對設計數據、工藝數據、業務數據等類型,是資源數據的基礎層;數據加工和數據治理存儲計算對采集到的數據進行分類、加工、治理、存儲和計算;知識聚集是針對不同的知識形態,設計不同的知識模型和組件庫,將知識模塊和知識載體管理入庫,最終形成各種類型的知識庫,包括通用算法組件、行業機理模型、通用管理組件等;最后通過知識加工對知識庫中不同類型的知識進行數字化、標準化、結構化、模型化等技術進行加工處理,提升知識層級,實現知識增值。

圖1 知識建??蚣?/p>
合理的知識分類是有效獲取、管理與利用知識的基礎。為深入了解和掌握流程行業企業復雜知識資源的特征及對知識資源的需求情況,完成對知識資源的梳理,對石油、石化、鋼鐵等典型流程行業企業進行了多次的現場調研。結合圖2所示的企業知識資源產生過程知識,為了便于制造企業知識資源有效管理與應用的角度,從產生生命周期和知識表現形式對流程行業知識資源進行分類。將企業的知識資源劃分為數據類知識、文檔類知識、過程類知識和經驗類知識4種類型,方便復雜知識資源的存儲管理。
(1)數據類知識:支撐研制過程、進行產品設計的參考數據以及生產過程、管理營銷過程中的數據資源,包括工程實例數據、基礎支撐數據、設備運行數據、操作數據以及各種參考庫等數據資源。
(2)文檔類知識:為純文檔、圖形文檔、圖像文檔或混合文檔的形式,主要包括各類技術報告,如安裝報告、工況分析報告、診斷報告、工具使用手冊、使用案例和使用方法等;工業活動過程中需要遵循的標準和約束條件,如相關國家標準、行業標準、企業標準、規范作業等。
(3)過程類知識:包括科研、生產管理、營銷活動外圍的流程知識及內部的過程知識??蒲小⑸a管理及營銷活動外圍的流程知識為科研、生產管理、營銷活動和相關科研活動的邏輯關系,以數據流圖的形式表示,還包括對科研活動的輸入輸出的選取原則、要求等進一步描述,一般以文字描述的形式表示??蒲?、生產管理及營銷活動內部的流程知識,主要描述執行上述相關活動的設計子流程、執行步驟的說明,以工作流圖或文字描述的形式表示。
(4)經驗類知識:經驗類知識主要指企業研發人員、研究人員等為工業生產、管理過程人員在處理同類問題時,提供成功經驗、心得和失敗教訓。包括但不限于各種經驗、教訓、最佳實踐、解決方法、應用技巧、使用心得等。
知識分類中包含顯性知識和隱形知識,通常以文字、圖表、公式、流程和模型等表述的知識稱為為顯性知識;通過自動知識挖掘工具,發現、收集知識庫以外以及游離于管理制度之外的知識獲取各類知識稱為把隱性知識。區別于以往的單一知識的提取流程,根據企業中存在的各類知識表現形式,面向工業過程決策、優化、控制、故障診斷等實際應用需求,系統性和全面的提出了不同類型的資源信息采用不同的建模手段,提升其知識特征,滿足企業的發展需求。
2.3.1 數據類知識建模
采集企業各業務環節中產生數據,基于工業大數據、工業區塊鏈、人工智能等技術,通過數據挖掘、數據分析、數據處理等方法建立數據與業務的關聯模型,實現以數據支撐業務管理的決策優化。主要提取過程包括:數據處理、數據分析、特征提取、算法選擇、建立模型、參數調優,模型驗證等。數據建模過程可用如圖3所示。

圖3 數據知識建模流程
(1)數據采集:收集生產管理運營過程中與模型相關的業務數據、操作數據、設備數據、監測數據、管理數據等。
(2)數據處理和分析:在建立模型數據集的基礎上,對數據進行預處理,包括:缺省值、異常值處理,以及數據的標準化等。通過初步數據探索,發現數據特征和規律,常用的數據分析方法有數據特征描述、相關性分析、主成分分析等。
(3)特征提?。和ㄟ^過濾法、包裹法、嵌入法等方法選擇或者構建與模型相關性較大的一部分特征,作為模型的輸入,以減少數據噪聲對模型結果的影響。
(4)算法選擇:根據業務的任務類型(監督學習、非監督學習、強化學習)以及涉及的問題(回歸、分類、聚類)進行算法選擇。
(5)建立模型:將數據集分為訓練數據集、驗證數據集及測試數據集,使用訓練數據集中的數據對模型進行訓練。
(6)參數調優:使用驗證集對訓練集學習得到的模型進行評估和參數調優,檢查模型是否得到有效的訓練或是否可以完成任務。并使用網絡搜索、隨機搜索或貝葉斯優化等方法對為達到效果的模型進行參數調優。
(7)模型校驗:建立初始模型后,使用測試數據集對模型預測能力進行測試驗證,同時不斷應用特征優化、算法改進和參數調優等方法進行模型優化迭代,直至滿足功能業務需求。
2.3.2 過程類知識建模
面向企業各實際業務場景,將業務管理規范、業務流程管控、業務信息流轉等業務以工業組態、圖形化建模等方式提煉為數據管理流程模型、工藝生產流程模型、業務管理流程模型等的過程,最終實現各項業務活動的信息化管理。過程類知識建模過程可用如圖4所示。

圖4 過程知識建模流程
(1)業務調研:通過業務調研發方式完全理解業務流程,明確業務流程類別(營銷流程、采購供應流程、計劃排產流程、儲運流程以及企業管理流程),流程涉及的組成以及相關操作規范、管理章程、規章制度、行業標準等文件及數據。
(2)業務流程分析:針對具體業務流程,開展業務流程的開始及終止節點、過程活動節點及步驟,模型涉及的相關崗位及部門分析,以及活動流程中的控制流。
(3)繪制業務流程圖:根據業務流程分析,使用跨職能流程圖、UML活動圖等方法繪制。
(4)數據流分析:梳理完成業務流程的數據輸入項以及輸出項,進而逐漸細化為最細粒度數據,一般包含數據的輸入,加工、傳遞存儲等功能。
(5)數據流程圖:依據數據流圖的基本規則:外部實體、數據處理、數據流和數據存儲,建立描述數據流動、存儲、處理的邏輯關系圖,即:將業務流程抽象化。
(6)建立業務邏輯模型:將業務流程抽象化,建立業務邏輯模型。
(7)模型驗證:驗證模型產生的結果是否實現其業務目標。
2.3.3 經驗文檔類知識建模
經驗文檔類知識建模將相關領域的經驗知識以顯性化的方式展現出來,如將經驗知識提煉為預警報警標準、操作流程、應急預案、安全規程等。經驗文檔知識類建模過程可用如圖5所示。

圖5 經驗知識建模流程
(1)信息收集:匯集與經驗類知識(相關經驗、教訓、應用技巧、使用心得等)梳理相關的數據、文件、圖片等數據。
(2)知識庫匯總提煉:建立相關問題的知識庫,通過簡單的數據分析、數據對標、業務對標、流程分析的方式,提煉與目標問題相關的新的結論。
(3)應用驗證:以顯性化的方式,如定量化的控制標準、邏輯化的控制管理流程等。將經驗類知識在實際場景的應用并驗證?;蜃鳛槠渌P徒5幕A數據。
在流程行業企業中實施知識梳理和建模,涉及企業文化,管理和技術3個層次的內容,從企業運轉環節看,知識運行本身有其自身的特點和規律。從知識沉淀—知識共享—知識學習—知識應用—知識創新,在完成知識創新后又可以繼續沉淀,螺旋上升,這樣才能發揮知識的無窮作用。
(1)技術上:不同類型知識模型構建后,首先具備了能夠使用和有效積累的知識IT系統,然后再到能夠有效共享、支持員工學習的更深一層IT系統功能,最后發展到具備獲取知識以及協同工作、支持員工創新的IT系統。
(2)管理上:不同類型知識模型構建后,首先具備相應的知識管理機制和模式來保障有效知識的積累,然后具備保證企業員工采用一定方式共享經驗、建立導師、傳幫帶等機制,最后發展到具有相應的流程和制度來保證積累的知識得到充分應用和知識創新。
(3)文化上:不同類型知識模型構建后,首先從員工養成及時總結工作經驗和教訓的習慣,然后到企業員工愿意將經驗給其他同事分析,并付諸行動,最后發展到員工在工作中具備了充分利用過去經驗和知識的意識,并能積極提出創新方案解決工作中的難題。
流程行業知識的分類和模型構建的目的在于為企業進行知識工程體系建設提供高效的路徑和方法,該研究通過描述企業知識工程體系建設規劃藍圖,從企業現狀出發,對知識體系的建設和計劃提供合理規劃,對人才發展、資產保值,創新能力提升和研制模式變革都有明顯的價值。
(1)驅動企業研發創新。實現企業知識的產生、應用、創新的良性循環,幫助企業提升知識的共享程度,由此帶來產品和機制的創新。
(2)改變企業研制生產模式。知識體系以科學的方法論為依據,通過先進的技術手段在企業中的組織、流程和IT系統上進行建設,形成以業務為中心的,以知識流和信息流為支撐的研制生產模式。
(3)促進企業資產的保值和增值。企業知識屬于軟實力,知識體系能夠幫助企業管理外部知識、內部知識、專家經驗知識等,實現企業智力資產的持續積累和增值。
(4)加速人才培養、補充企業技術人員斷層。實現對流程企業知識的系統梳理和科學規劃,避免因人才流動造成的知識損失,為企業的知識傳承奠定基礎。
不同的知識有不同的知識分類理論,不同的目的有不同的知識分類標準,工業知識體系是一個多維度矩陣結構。針對流程行業企業內容復雜、格式異構、數量龐大的知識資源,以企業調研為基礎,從企業知識資源管理的實際需求出發,提出了一般性和通用性的知識分類方法。在此基礎上研究了知識建模技術,為制造企業復雜異構的知識資源提供了統一的知識獲取方式。文中提出的知識分類方法和復雜知識資源獲取模板,通過標準化的知識資源獲取界面,結合人工獲取和半自動化獲取技術,實現了對制造企業復雜知識資源的高效獲取,對企業未來較長時間內知識資源的建設給予指導。
加大對知識技術的研究和運用,優化數字技術路線。工業知識是構建工業APP的重要組成部分,工業APP作為工業互聯網平臺的業務應用是軟件技術和工業技術深度融合的產物,將人的經驗、知識提取出來,通過軟件運行。全面采集工業數據,讓生產線與數字孿生系統高度融合,不斷提升生產與制造流程;通過知識圖譜,將不同類別的制造業基礎數據進行知識分類和建模,加強知識提取、關系挖掘、多領域融合,搭建知識服務平臺,提高企業流程中各類問題的預見和解決能力。