999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于結構化工作流網的隱含任務挖掘方法

2012-04-29 13:36:15瞿華
中國管理信息化 2012年7期
關鍵詞:改進

瞿華

[摘要] 過程挖掘是一種客觀、自動化的過程分析技術,它通過挖掘過程日志來得到業務過程的結構模型,是傳統過程分析手段的重要補充。如何正確挖掘包含隱含任務的不完整過程日志,是過程挖掘需要解決的難題之一。現有的一些算法如基因算法、α#算法等解決了部分類型隱含任務的挖掘問題,但仍有許多類型的隱含任務無法被正確挖掘。針對這一問題,本文在α#算法的基礎上提出了一種基于結構化工作流網的挖掘算法,該算法能夠較為完整地挖掘各類包含隱含任務的結構化工作流網模型。通過理論分析和實驗驗證,該算法的正確性和有效性得到了證明。

[關鍵詞] 過程挖掘;結構化工作流網;隱含任務;改進α算法

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 07. 025

[中圖分類號]TP391[文獻標識碼]A[文章編號]1673 - 0194(2012)07- 0048- 04

0引言

面對激烈的市場競爭和市場環境的快速變化,現代企業必須能夠隨時對核心業務過程做出適當的調整以適應新的需要。這不但需要管理者能夠掌握外部環境的變化,也需要管理者能夠對企業業務過程的實際情況有清晰的了解。傳統的過程分析手段,如調查、訪談、建模分析和模擬等,費時費力,而且受用戶的主觀性影響很大,容易出現偏差,因此越來越難以滿足用戶的需要。

過程挖掘是一種自動化的過程分析技術,通過對業務過程日志的挖掘,自動生成業務過程的執行流模型,從而幫助用戶更好地理解業務過程的內在執行邏輯[1]。由于其分析的依據——業務過程日志是企業在實際業務運行過程中生成的客觀記錄,因此該技術客觀性強、費用低、速度快,有效地彌補了傳統過程分析手段的各種缺陷,并已經在政府公共工程、醫院和供應鏈管理等實際領域中取得了一定的成功應用[2-4]。

對包含錯誤、隱含任務[5]等的不完整日志的挖掘是過程挖掘面臨的難題之一。因為實際中用于挖掘的日志主要來源于企業的信息系統的自動生成,因此日志中包含錯誤的情況并不常見,不完整日志問題基本上都是由于包含隱含任務造成的。現有的大多數過程挖掘算法在處理包含隱含任務的日志時都無法得到正確的結果。少數幾種能夠處理隱含任務的算法,如基因算法[6]、α#算法[7]等,但只能挖掘部分類型的隱含任務,未能完全解決隱含任務的挖掘問題。

針對這一問題,本文嘗試提出一種基于α算法[8]和結構化工作流網[9]的過程挖掘算法,該算法能夠比較全面地挖掘結構化工作流網模型中的各類隱含任務。通過理論分析和實驗驗證,該算法的正確性得到了證明。

1問題說明

過程挖掘通過對日志信息的分析來構造過程模型。為了保證挖掘算法能夠最大限度地適用于各種形式的日志,絕大多數挖掘算法僅要求日志中包含下列3項內容:①事件所屬的工作實例;②執行事件的業務單元(任務標識);③事件發生的順序(處理時間)。因此,在分析過程挖掘算法時,為了簡便起見,通常直接將日志寫成諸如ABCDE,ABCDF,ACBDE,ACBDF的形式,其中每個字母代表一個任務,每個逗號隔開的字母序列代表一條日志實例。對該日志實例用算法進行過程挖掘,就可以得到如圖1(a)所示的結構化工作流網過程模型。

在現實中,由于很多信息系統只對進行實際業務操作的業務單元活動進行記錄,以及系統采用的過程建模工具本身的特性等各種原因,一些過程任務往往沒有被記錄在日志中。這種過程任務就是所謂的“隱含任務”。現有的大多數算法無法正確處理包含隱含任務的日志。例如,假設圖1(a)中過程的任務D是一個隱含任務,則得到的日志是ABCE,ABCF,ACBE,ACBF。用α算法挖掘將得到如圖1(b)所示的模型,它不是一個合法的結構化工作流網模型,而且相比原始模型,其結構復雜,不容易為用戶所理解。

現有少數算法能夠挖掘部分類型的隱含任務,但都無法完全挖掘所有類型的隱含任務。例如,圖2給出了α #算法能夠挖掘的幾種隱含任務,其中黑色方塊表示隱含任務。但它無法挖掘圖1(a)類型的隱含任務。

因此,本文在綜合現有各種隱含任務挖掘方法的基礎上,結合結構化工作流網本身的特性,提出了一種基于算法和結構化工作流網的過程挖掘算法,該算法能夠比較全面地挖掘結構化工作流網模型中的各類隱含任務。

2 結構化工作流網中的隱含任務

2.1 結構化工作流網

過程挖掘通過深入分析過程日志來構造出過程模型。顯然,算法所使用的建模語言決定了算法能夠成功挖掘的過程及其日志的特性。目前,絕大多數過程挖掘算法都采用工作流網[10]或者其子集作為建模語言,它是Petri網的一個子集,具體定義如下:

定義1(工作流網) 工作流網N為五元組(P,T,F,i,o)。其中,P為全體庫所集合,T為全體變遷集合,F為全體邊集合,i為輸入庫所,o為輸出庫所。Mo ={i}為工作流網的初始配置。

結構化工作流網是工作流網的各類子集中研究最多最深入的一種,其特點是不包含非自由選擇結構,結構相對簡單,但仍能滿足大多數實際應用的需要。其定義如下:

定義2(結構化工作流網) 工作流網N=(P,T,F,i,o)是一個結構化工作流網,當且僅當:

(1)對任意滿足(p,t)∈F的p和t,有:|p·|>1→|·t|=1;

(2)對任意滿足(p,t)∈F的p和t,有:|·t|>1→|p·|=1;

(3)P中不存在隱含庫所[9]。

2.2 隱含任務定義

隱含任務就是在過程中存在并且被執行,但是始終不會被記錄在過程日志中的任務。

定義3(隱含任務) 已知結構化工作流網N=(P,T,F,i,o),W=T*是其對應的日志。則稱t∈T是隱含任務,當且僅當不存在日志實例L∈W,使t∈L。N的全部隱含任務的集合記為H。

隱含任務問題的本質是日志中的信息缺失。顯然,只有那些導致模型結構出現缺陷的隱含任務才有可能被發現,其他隱含任務在不引入其他知識的條件下是無法通過日志分析的方法來發現的。例如,圖4中的幾種隱含任務都不會導致挖掘模型出現結構缺陷,都是無法被發現的。因此,本文只討論會導致結構化工作流網的結構出現缺陷的那些隱含任務。

2.3 隱含任務分類

按照在模型中的位置及其特點,可以將結構化工作流網中的隱含任務分成起始/結束點型、隱含路徑型、結構轉換點型和子分支點型四大類。

起始/結束點型對應于α #算法中的SIDE類型[7],是由出現在模型起始位置的與-分支點和出現在模型結束位置的與-匯合點形成的隱含任務,如圖2(a)和(b)所示。其定義如下:

定義4(起始/結束點型隱含任務) 已知結構化工作流網N=(P,T,F,i,o)。當隱含任務t∈H滿足下列條件之一時,稱其為起始/結束點型隱含任務:

隱含路徑型對應于α #算法中的SKIP和REDO類型,是單獨組成過程中的某條執行路徑分支的隱藏任務,如圖2(c)和(d)所示。其定義如下:

定義5(隱含路徑型隱含任務) 已知結構化工作流網N=(P,T,F,i,o)。稱隱含任務t∈H為隱含路徑型隱含任務,當?堝a,b∈T-H,a·?勱·t,t·?奐·b。

結構轉換點型是由選擇結構和并行結構之間的轉換點形成的隱含任務。圖5是結構轉換點型隱含任務的幾種情況,其中左邊是原始過程,右邊是用α算法挖掘對應的日志得到的模型。其定義如下:

定義6(結構轉換點型隱含任務) 已知結構化工作流網N=(P,T,F,i,o)。當隱含任務t∈H滿足下列條件之一時,稱其為結構轉換點型隱含任務:

子分支點型是由選擇分支里的并行分支點形成的隱含任務。圖6是結構轉換點的幾種情況,其中左邊是原始過程,右邊是用α算法挖掘對應的日志得到的模型。其定義如下:

定義7(子分支點型隱含任務)已知結構化工作流網N=(P,T,F,i,o)。稱隱含任務t∈H為子分支點型隱含任務,當其滿足下列條件之一:

3隱含任務的發現

在上一節中定義了幾種隱含任務,它們的共同特點是會導致結構化工作流網的結構出現缺陷。因此,通過檢測挖掘模型中的結構缺陷,就能夠發現這些隱含任務的存在,并加以彌補。本文采用α+[9]算法中次序關系作為檢測模型結構缺陷的工具,其定義如下:

定義8(次序關系)N=(P,T,F,i,o)是合理工作流網,W是N的一個日志,即W∈T*,a,b∈T,則有:

-a>Wb當且僅當?堝σ=t1t2…tn,i∈{1,…,n-1}:σ∈W∧ti=a∧ti+1=b;

-aΔWb當且僅當?堝σ=t1t2…tn,i∈{1,…,n-2}:σ∈W∧ti=ti+2a=a∧ti+1=b;;

-a◇Wb當且僅當aΔWb∨bΔWa;

-a→Wb 當且僅當a>Wb∧(b≯Wa∨a◇Wb);

-a#Wb當且僅當aW≯b∧b≮Wa;

根據次序關系,就可以針對各類隱含任務的不同特點,分別找出它們的發現方法。因為α #算法中已經給出了起始/結束型和隱含路徑型的隱含任務的檢測方法,因此本文只討論結構轉換點型和子分支點型隱含任務的發現方法。

3.1 結構轉換點型隱含任務的發現

結構化工作流網中的結構轉換點型隱含任務可以根據下面的定理發現:

定理1已知結構化工作流網N=(P,T,F,i,o),W是其滿足→W和ΔW關系完備性的日志。則N中存在結構轉換點型隱含任務,當且僅當下列條件之一被滿足:

(1)?堝a,b,c,d∈T,a#W b,d||W c,a→W c,a→W d,b→W c,a→W d;

(2)?堝a,b,c,d∈T,a#W b,d||W c,a→W c,a→W d,b→W c,a→W d;

(3)?堝a,b,c,d∈T,a#W b,d||W c,a→W c,a→W d,b→W c,a→W d。

根據結構化工作流網的定義和圖5,很容易證明該定理的正確性。詳細證明從略。

3.2 子分支點型隱含任務的發現

結構化工作流網中的子分支點型隱含任務可以根據下面的定理發現:

定理2已知結構化工作流網N=(P,T,F,i,o),W是其滿足→W 和ΔW 關系完備性的日志。則N中存在子分支點型隱含任務,當且僅當下列條件之一被滿足:

(1)?堝a,b,c,d∈T,a→W b,a→W c,a→W b,b#W d,c#W d,b||Wc;

(2)?堝a,b,c,d∈T,a→W d,b→W d,c→W d,a#W c,b#W c,a||W b。

根據結構化工作流網的定義和圖6,很容易證明該定理的正確性。詳細證明從略。

3.3 隱含任務的檢測順序

由于過程可能同時存在多種類型的隱含任務,一種隱含任務的存在可能會對另一種隱含的發現造成影響。因此各隱含任務的檢測必須符合一定的順序。

由于起始/結束點型隱含任務存在于模型的兩端,其他類型隱含任務的發現可能會依賴于它的正確發現,因此應該先進行起始/結束點型隱含任務的檢測。

結構轉換點型的隱含任務本身是選擇結構或者并行結構的起始點或者結束點,而子分支點型隱含任務的檢測依賴于選擇結構的起始點或結束點的存在。因此,結構轉換點型隱含任務的檢測必須先于子分支點型隱含任務。

隱含路徑型隱含任務的正確檢測依賴于選擇結構或者并行結構的正確結束,因此應該最后進行。

4基于結構化工作流網的挖掘算法

4.1 子分支點型隱含任務發現算法

根據前面的討論,子分支點型隱含任務的發現算法Find Sub Branch IT如下:

定義9(Find Sub Branch IT算法)已知結構化工作流網N=(P,T,F,i,o),W是其滿足→W和ΔW關系完備性的日志,RW是從W得到的所有次序關系集合。則子分支點型隱含任務的發現算法是:

(1)TW={t|?堝σ∈W,t∈σ}

(2)X1={({a},B)|a∈TW∧B?奐TW∧(?坌b∈B∶a→Wb)∧(?坌b1,b2∈B∶b1||W b2)∧(?堝c∈TW∶a→Wc∧(?坌b∈B∶c#Wb))}

(3)X2={(A,{b}|A?奐TW∧b∈TW∧(?坌a∈A∶ c#Wa)∧(?坌a1,a2∈A∶a1||W a2)∧(?堝c∈TW∶c→Wb∧(?坌a∈A∶ c#Wa))}

(4)X=X1∪X2

(6)TY={ty|?堝y∈Y}

(7)R1={a→Wty|?堝y∈Y,y=(A,B),a∈A}

(8)R2={ty→Wb|?堝y∈Y,y=(A,B),b∈B}

(9)RY=R1∪R2

(10)TW=TW∪TY

(11)RW=RW∪RY

4.2 結構轉換點型隱含任務發現算法

根據前面的討論,結構轉換點型隱含任務的發現算法Find Branch Connector IT如下:

定義9(Find Branch Connector IT算法)已知結構化工作流網N = (P,T,F,i,0),W是其滿足和關系完備性的日志,RW是從得到的所有次序關系集合。則結構轉換點型隱含任務的發現算法是:

(1)TW={t|?堝σ∈W,t∈σ}

(2)X1={(A,B)|A∈TW∧B?奐TW∧(?坌a∈A,b∈B∶a→Wb)∧(?坌a1,a2∈A∶a1||W a2)∧(?坌b1,b2∈B∶b1||Wb2)}

(3)X2={(A,B)|A?奐TW∧B∈TW∧(?坌a∈A,b∈B∶a→Wb)∧(?坌a1,a2∈A∶a1||W a2)∧(?坌b1,b2∈B∶b1#Wb2)}

(4)X3={(A,B)|A?奐TW∧B∈TW∧(?坌a∈A,b∈B∶a→Wb)∧(?坌a1,a2∈A∶a1||W a2)∧(?坌b1,b2∈B∶b1#Wb2)}

(5)X=X1∪X2∪X3

(7)TY={ty|?堝y∈Y}

(8)R1={a→Wty|?堝y∈Y,y=(A,B),a∈A}

(9)R2={ty→Wb|?堝y∈Y,y=(A,B),b∈B}

(10)RY=R1∪R2

(11)TW=TW∪TY

(12)RW=RW∪RY

4.3 基于結構化工作流網的隱含任務挖掘算法

最終得到的基于結構化工作流網的隱含任務發現算法如下:

定義10(基于結構化工作流網的隱含任務發現算法)已知結構化工作流網N=(P,T,F,i,o),W是其滿足→W和ΔW關系完備性的日志。則基于結構化工作流網的隱含任務發現算法是:

(1)TW={t|?堝σ∈W,t∈σ}

(2)構造RW

(3)(TW,RW)=ConSideIT(TW,RW)

(4)(TW,RW)=FindSubBranchIT(TW,RW)

(5)(TW,RW)=FindBranchConnectorIT(TW,RW)

(6)(TW,RW)=ConIT(TW,RW)

(7)N=α(TW,RW)

其中,Find Sub Branch IT和Find Branch Connector IT分別是前面定義的子分支點型和結構轉換點型隱含任務發現算法,ConSideIT和ConIT分別是α#算法中定義的起始/結束點型和隱含路徑型隱含任務發現算法,α(TW,RW)是使用α算法構造過程模型。

5 實驗評估

本文使用Java語言在ProM平臺[11]上實現了提出的基于結構化工作流網的隱含任務發現算法,并對其進行了實驗驗證。實驗使用了18個手工構造的過程實例進行。圖7顯示了實驗中所使用的一個實例,其中,圖7(a)是原始模型,圖7(b)是使用α#算法挖掘的結果。使用本文提出的算法,挖掘出的模型與圖7(a)中的模型完全相同。對其他實例的實驗也得到了類似的結果,從而證明了算法的正確性。

6結論

現有的過程挖掘算法大多無法正確挖掘包含隱含任務的過程日志,少數幾種能夠挖掘隱含任務的算法也不夠完善,往往導致挖掘出來的過程模型過分復雜,難以分析和理解。針對這一缺陷,本文通過深入分析研究結構化工作流網過程模型中可能出現的各類隱含任務及其特點,提出了一種基于結構化工作流網的挖掘算法,可以較好地挖掘包含隱含任務的結構化工作流網過程日志,因此能夠更好地幫助用戶分析和理解過程執行流結構。作為一種自動化的建模工具,該算法適用于需要應用過程分析和建模的各類場合。本文通過實驗評估驗證了算法的可行性和有效性。接下來的研究方向是在現有算法的基礎上繼續深入擴展其適用的建模語言范圍,從而進一步提高算法的實用性。

主要參考文獻

[1]B F van Dongen,A K Alves de Medeiros,etc. Process Mining: Overview and Outlook of Petri Net Discovery Algorithms[M]//K Jensen, W M P van der Aalst(Eds). Transactions on Petri Nets and Other Models of Concurrency II,Springer-Verlag,Berlin Heidelberg,2009:225-242.

[2]W M P van der Aalst,Reijers H A, etc. Business Process Mining: An Industrial Application[J]. Information Systems, 2007, 32(5): 713-732.

[3]T Blum,N Padoy,etc. Workflow Mining for Visualization and Analysis of Surgeries[J]. International Journal of Computer Assisted Radiology and Surgery, 2008, 3(5): 379-386.

[4]H C W Lau,G T SHo, etc. Development of a Process Mining System for Supporting Knowledge Discovery in a Supply Chain Network[J]. International Journal of Production Economics, 2009, 122(1): 176-187.

[5] W M P van der Aalst,B F van Dongen,etc. Workflow Mining: A Survey of Issues and Approaches[J]. Data & Knowledge Engineering, 2003, 47(2): 237-267.

[6]A de Medeiros, A Weijters,etc. Genetic Process Mining: An Experimental Evaluation[J]. Data Mining and Knowledge Discovery, 2007, 14(2): 245-304.

[7]Wen L,Wang J, etc. Mining Invisible Tasks from Event Logs[M]//G Dong,et al (Eds). APWeb/WAIM 2007. Springer-Verlag,Berlin Heidelberg, 2007:358-365.

[8]W M P van der Aalst,A J M M Weijters,etc. Workflow Mining: Discovering Process Models from Event Logs[J]. IEEE Transactions on Knowledge and Data Engineering, 2004, 16(9): 1128-1142.

[9]A K A de Medeiros,B F van Dongen,etc. Process Mining for Ubiquitous Mobile Systems: An Overview and a Concrete Algorithm[M]//L Baresi, SDustdar, H C Gall, and M Matera(Eds). UMICS 2004. Springer-Verlag, Berlin Heidelberg, 2004:151-165.

[10]W M P van der Aalst. The Application of Petri Nets to Workflow Management[J]. Journal of Circuits,Systems and Computers,1998,8(1):21-66.

[11]B F van Dongen,A K A de Medeiros,etc. The ProM Framework: A New Era in Process Mining Tool Support[M]// G Ciardo,P Darondeau(Eds). ICATPN 2005. Springer-Verlag,Berlin Heidelberg,2005:444-454.

猜你喜歡
改進
蝙蝠算法的研究進展
現代化教學手段在語文教學中的運用
文理導航(2016年30期)2016-11-12 15:19:07
淺析國有企業思想政治工作的改進與創新
經營者(2016年12期)2016-10-21 09:36:17
督查工作改進策略研究
淺析加強和改進消防產品的監督管理
論離婚損害賠償制度的不足與完善
商(2016年27期)2016-10-17 06:57:20
高校安全隱患與安全設施改進研究
商(2016年27期)2016-10-17 05:02:12
“慕課”教學的“八年之癢”
大學教育(2016年9期)2016-10-09 08:09:53
淺析秦二廠設計基準洪水位提升對聯合泵房的影響
科技視界(2016年20期)2016-09-29 13:36:14
某型飛機靜止變頻器干擾電臺通話故障分析及改進措施
企業導報(2016年8期)2016-05-31 18:48:53
主站蜘蛛池模板: 青青操视频在线| 欧美亚洲国产一区| 91区国产福利在线观看午夜| 亚洲婷婷六月| 日韩中文精品亚洲第三区| 亚洲大尺度在线| 亚洲黄色激情网站| 免费午夜无码18禁无码影院| 亚洲人妖在线| 91精品国产福利| 日本三区视频| 天天综合天天综合| 99视频全部免费| 毛片久久久| 国产精品无码影视久久久久久久 | 熟妇丰满人妻| 亚洲人成在线免费观看| 91国内外精品自在线播放| 伦精品一区二区三区视频| 欧美一级夜夜爽www| 亚洲三级a| 亚洲成网站| 国产18页| 日本影院一区| 亚洲精品午夜无码电影网| 久久精品国产精品青草app| 亚洲 欧美 偷自乱 图片| 国产成人91精品| 伊在人亚洲香蕉精品播放| www.亚洲一区二区三区| 国产拍在线| 伊人久久大线影院首页| 亚洲人在线| 2020久久国产综合精品swag| 国产激情无码一区二区APP | 欧美一区二区精品久久久| 国内精自视频品线一二区| 久草热视频在线| 欧美精品导航| 亚洲三级成人| 网友自拍视频精品区| 成年av福利永久免费观看| 日本道中文字幕久久一区| 亚洲国产午夜精华无码福利| 99精品福利视频| 国产小视频免费观看| 国产免费羞羞视频| 国产精品欧美日本韩免费一区二区三区不卡 | a亚洲天堂| Aⅴ无码专区在线观看| 欧美日韩国产在线观看一区二区三区 | 国产成人综合日韩精品无码不卡| 精品99在线观看| 国产va免费精品观看| av午夜福利一片免费看| 一级毛片在线免费看| 中文无码日韩精品| 日韩视频福利| 爽爽影院十八禁在线观看| 国产亚洲欧美日韩在线一区二区三区| 精品91视频| a天堂视频在线| 亚洲第一区在线| 日本伊人色综合网| 无码区日韩专区免费系列| 欧美激情成人网| 三级视频中文字幕| 十八禁美女裸体网站| 九九香蕉视频| 国产极品美女在线| 91色在线视频| 国产主播喷水| 福利国产在线| 91色在线视频| 精品久久高清| 国产午夜精品一区二区三区软件| 日本成人福利视频| 亚州AV秘 一区二区三区| 丰满人妻久久中文字幕| 亚卅精品无码久久毛片乌克兰| 伊人蕉久影院| a级毛片免费网站|