付高財,夏杰,金超
(武漢理工大學機電工程學院,武漢430070)
近年來,隨著流程管理概念的提出,企業的管理模式正逐漸向流程導向型轉變,流程管理成為企業發展的重要驅動力之一。其本質是構建出高效且符合業務邏輯的流程,來提高組織業務效率[1]。
在實現流程快速準確推薦的方法上,國內外已有不少研究成果。文獻[2]建立了JTangaWFR工作流推薦系統,提出一種基于圖距離計算方法的流程推薦方法,該方法通過尋找參考流程和流程模式上游子圖的最大公共子圖和最小公共超圖的圖距離進行相似度計算。文獻[3]提出一種基于流程規整矩陣的流程推薦方法,該方法通過計算流程規整路徑距離獲得滿足流程匹配度要求的候選流程最終通過候選流程的匹配層次分解產生推薦路徑。文獻[4]提出了一種互聯網環境下面向最終用戶編程的計算業務與結構相似度的方法,用來解決業務流程推薦的準確性。
上述文獻對于流程推薦技術的研究的重點在于為流程建模人員提供一個合理有效的流程,然而流程的管理、運作,其核心是以人為本。針對的特定對象不僅是制定流程規則的企業高層管理人員,還包括廣大中層管理人員和基層普通員工。從普通員工的角度來說,在選擇流程模板時,會遇到如下問題:①普通員工需要從公司制定的繁多流程模板中選出合適的流程;②對于新員工進行人工選擇流程時,由于業務邏輯的不熟悉,存在選錯流程模板和選擇困難等問題。這些問題都造成了流程的不確定性和精準度不高,并且耗時長。面對業務流程繁多且復雜的公司而言,對于基層的普通員工或新入職員工來說,在選擇流程模板時,若工作流系統可以自動根據文檔特征推送出合適流程,可以減少人工的出錯率。從工程項目的方面來說,一個工程項目有眾多的文件,并且這些文件對應著不同的工作流。當項目文檔進入PDM的工作流系統時,就不需要人工去選擇不同的流程模板,系統會自動推薦與工作文檔相對應的流程,提高工作效率。
因此,為了提高業務流程的工作效率和準確性,針對企業的業務復雜度和新員工不熟悉業務的情況下,在工作流管理理論的基礎上,分別對業務流程所涉及的特征和工作文檔的特征進行結構建模與提取,提出一種基于特征信息的相似度算法,在工作流的管理中進行流程推薦,來實現業務流程的智能選擇功能。
工作流是為了完成某項任務,按照一定順序動態完成一系列工作的過程,能夠有效地反映該項任務的業務邏輯。文獻[5]指出,每一項工作都有一個過程,在其工作過程中可以分解為各個工作步驟,每個工作步驟完成若干個操作。各個工作步驟之間,根據所要完成的任務性質,有一定的先后順序,并指明工作步驟的啟動和終止條件、所要完成的工作任務、完成任務的人員以及完成任務的先后順序。
工作流管理系統(Workflow Management System,WMS)是指在計算機環境下,運行在工作流引擎上用戶定義、執行和控制管理工作流運行的一套系統,與工作流執行者進行交互,推進工作流實例的執行,監控工作流的運行狀態,并進行有效管理[6]。
工作流管理系統不僅要提供工作流程定義工具,把企業的業務流程轉化為計算機可以識別的格式,還需要對工作流程運行的狀態進行監控,對流程運行中的活動進行管理和調度。將應用邏輯與過程邏輯分離,在不修改具體功能的情況下,通過修改過程模型改變系統功能,完成對生產運作部分過程或是全過程的集成管理,可有效地把人、信息和應用工具合理組織在一起,發揮系統的最大功效。
一般情況下,活動是指流程執行過程中可被工作調度的最小工作單元,要求有人或機器參與[7]。活動節點的基本特征屬性有很多,如名稱、描述、用戶、期限、啟動條件,等等。在研究某鐵路電氣有限公司的業務流程的基礎上,以公司流程庫為數據集,使用特征提取的方式,將整個數據集所具有的特征提取并呈現,構建所需的特征結構模型,如圖1所示。
定義:工作流程由若干個節點構成,節點由若干特征組成,形式化定義為:WF=
其中:Name(名稱):表示流程在該節點所要執行的任務類別,如設計、校驗、審核等。
User(用戶):指訪問或操作計算機信息系統中數據、界面、客戶端頁面菜單等資源實體的主體。
Condition(條件):為了對工作流活動執行情況以及活動路徑進行控制,在工作流過程模型設計中為節點和連接弧增加相應的控制條件。
Deadline(限制):限制是個時間段,表示流程開始后,這個節點的活動必須在這個時間段內完成。
Description(描述):對業務流程內容的表達,如:企業的NPAINO20180604流程是用于公司申請外購件物料代碼,QJDNO20180608流程是用于公司員工請假。

圖1 業務流程特征結構模型
流程特征模型主要提取節點對象的特征屬性,具有以下幾個特點:
(1)與傳統工作流模型不同,不考慮活動間的控制順序,主要對流程節點進行細分,更能清晰表明各流程需要完成的活動項;
(2)特征結構層次清晰。業務流程庫中存在大量的數據屬性,節點的特征項較多,主要提取活動的名稱,完成活動的用戶角色、限制條件(或是需要完成的作業)等重要項。以實際應用的企業流程為主,在此模型基礎上,可以擴充節點的特征屬性。
特征結構模型建立后,將結構模型用XML(Exten?sible Markup Language,可擴展的標記語言)來表示。XML即是運用標記的方式來描述結構化數據的純文本格式語言,其優勢有:①使結構模型存儲方式多樣化,查詢與搜索的效率顯著提高;②無論何種工作流系統,都可以通過通用的交換格式進行轉換。考慮到XML文件的特殊性,從活動的特征屬性對模型文檔進行量化[8]。
將XML文檔中的每個節點的結構單元看作一個向量b={b1,b2,...,bm}(bm示流程節點的特征),這樣整個XML文檔則被量化為一組向量,以一個矩陣來表示即B={B1,B2,...,Bn}(其中Bn為工作流程中的各活動節點)。
工作文檔是指即將進入到PDM系統中需要工作流進行管理的文檔。文檔的表示模型由特征詞來建立,常用的表示文檔特征的模型有:布爾邏輯模型(Boolean Model,BM),向量空間模型(Vector Space Mod?el,VSM)[9]。由于文檔的多異性,采用向量空間模型對文檔的特征建立模型,從文檔中提取的特征詞(特征項)組成余弦空間的一個向量,每一個特征項對應一個特征權重,以此表示特征詞在文檔中的重要程度。形式化定義為:d={d1,d2,...,dk} ,其中 dk(k=1,2,3,…)分別表示文檔的特征屬性。
構建文檔特征模型的步驟:
(1)基于頻繁項的特征屬性的提取:工作文檔特征項遵循文本聚類的方法,文本聚類是分析未知類別的文本文檔,提取出能表現出主題特征的標志,例如特征詞集等,利用頻繁項算法,把符合算法的頻繁項呈現給用戶[10]。在基于頻繁項的Apriori算法的基礎上,采用逐步頻繁特征詞語集,同時壓縮尋找范圍[11]來提取工作文檔的特征屬性。采用Apriori算法的原因:①針對中小企業的工作文檔,需要考慮的項集數不多,數據集小,遍歷搜索空間小;②算法可靠,信息檢索目的性明確,更為精準達到用戶的目標。具體做法是:首先找出頻繁1-項集,記為L1;然后利用L1來產生候選項集C2,對C2中的項進行判定挖掘出L2,即頻繁2-項集;不斷如此循環下去直到無法發現更多的頻繁k-項集為止[12]。
根據步驟(1),對某鐵路電氣公司的大量項目文檔的各特征屬性和組織結構進行研究,根據頻繁項算法,為了方便計算,選取前5項的工作文檔特征屬性與流程關聯,即工作文檔的特征屬性=<類別,文檔名稱,文檔所屬部門,持續時間,文檔描述>。
(2)屬性映射:建立工作文檔信息與流程活動的特征屬性映射關系。按照屬性映射關系[13],映射關系如圖2。將所提取的工作文檔特征信息傳遞給流程庫,同時在工作文檔和流程活動對象間創建鏈接對象,并將信息存入到工作流管理數據庫中,在工作流管理系統中注冊信息文件。

圖2 工作文檔與業務流程文檔特征屬性映射關系
特征項之間的相似程度與它們所包含的信息有關:如果兩個特征所共同擁有的信息越多,它們越相似;反之,它們的相似度就越小。本文將特征項集都表示成了向量空間的形式,因此基于特征的相似度計算實質就是計算每兩個特征向量間夾角的余弦值。
定義:假設工作文檔特征集合d={d1,d2,...,dk}和業務流程的節點特征集合為b={b1,b2,...,bm} ,其中bk和dm代表特征項,為了方便配比,選取特征項的時候,應使得m=k,選擇m個屬性作為比較條件,wbi和wdi為第i個特征項在流程文檔和工作文檔的權重系數,記文檔和節點間的特征相似度為Sim(b ,d ),即:

同時,若要計算文檔與文檔間的特征相似度:

則業務流程與工作文檔間的相似度為各節點與文檔特征相似度的加權和:

文檔間進行相似度量時,所選擇的各特征屬性所起的作用是不同的,在計算兩個產品相似度時使用重要的特征屬性對結果影響較大,而次要的特征屬性對結果影響較小,得出的結果才能更加客觀地反映特征信息的相似程度。
權重計算的方法有很多,如層次分析法、DelPhi法、墑權法、標準差法等。層次分析法[14]就是在建立有序遞階的屬性系統基礎上,通過對特征屬性之間的相互配對比較,得到特征中各指標的優劣評判,并利用這種評判結果來綜合計算各特征屬性的權重系數。確定步驟如下:
(1)抽取部分特征屬性樣本,根據矩陣標度及其定度表,得到特征屬性的判斷矩陣;
(2)計算判斷矩陣的最大特征向量跟特征矩陣,進行一致性檢驗,若通過,進入下一步;反之,調整矩陣重新計算;
(3)通過的矩陣進行歸一化處理,即可得到權重指標系數。
根據對公司業務邏輯和業務實際情況進行分析,提出以下流程智能推送模式:
(1)通過對業務流程中各活動和工作文檔進行預處理,提取特征項并建立結構化模型;然后以關聯的特征項進行相似度匹配分析,即計算Sim(B ,d),將相似度超過某閾值的業務流程推送給用戶。
(2)以待流轉的工作文檔作為參照對象,分別與某流程中已存在的項目文檔的特征屬性進行匹配,即計算Sim(d ,d'),若在該流程中相似度高的文檔較少,則提示用戶在推送的流程范圍內是否選擇正確。
具體實現流程推薦技術的框圖如圖3:

圖3 流程推薦技術流程圖
以某鐵路電氣公司的工作流管理系統為研究對象,重點研究了工作文檔在進入系統時選擇流程模板的功能。在對工作流管理系統的研究過程中,引入業務流程管理的思想,即在保證流程定義、流程實例化與流程監控等功能實現的前提下,通過對系統進行二次開發,如圖4所示,為普通員工自動選擇流程模板。

圖4 工作流管理模塊
對工作文檔的特征進行了提取時,為了保證推薦出最佳的流程,合理利用有效資源,提取5個重要的特征屬性項,如圖5所示。普通員工不熟悉公司的相關流程,但是熟悉負責的技術文檔。我們針對這一現象,進行了工作文檔的特征提取,系統會自動識別到創建者和文檔名稱,普通員工只需要選擇所屬部門、文檔類型和持續時間,對文檔進行相應的描述即可。
在運行工作流程實例前時,系統會根據之前的工作文檔,自動識別到該工作文檔所對應的工作流程模板,如圖6所示。在新建流程實例時,我們可以在節點列表中查看流程的節點,也能查看到流程圖和具體的任務列表。
本文在分析業務流程和項目文檔的屬性基礎上,提出了一種基于特征屬性的流程推薦方法。該方法是對業務流程以及工作文檔的特征屬性進行提取與分析,建立相應的矩陣空間模型,通過計算特征向量間的余弦,進而得到特征屬性相匹配的流程。同時在PDM系統的基礎上,運用流程推送技術開發業務流程推薦模塊,當工作文檔進入到系統中,可以自動匹配特征屬性相似性較高的流程,提高流程選擇的準確性和效率性。該技術對于業務流程復雜且繁多的企業來說,有很大的實用價值。未來工作將圍繞如何提高該方法的效率以及完善特征模型展開研究。

圖5 工作文檔特征提取

圖6 新建流程實例