999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于行為輪廓矩陣增強的業務流程結果預測方法

2024-07-31 00:00:00劉恒方賢文盧可
計算機應用研究 2024年6期

摘 要:預測性過程監控依賴于預測效果,針對如何增強預測性過程監控預測效果的問題,提出了一種基于行為輪廓矩陣增強的業務流程結果預測方法。首先,通過分析活動間的行為關系提取行為輪廓矩陣,并將其與事件序列一同輸入到模型中。隨后,結合卷積神經網絡(CNN)和長短期記憶網絡(LSTM)分別學習矩陣圖像特征和序列特征。最后,引入注意力機制以整合圖像特征和序列特征進行預測。通過真實事件日志進行驗證,在預測事件日志結果方面,提出的增強方法對比基準的LSTM預測方法提高了預測效果,驗證了方法的可行性。該方法結合行為輪廓矩陣增強了預測模型對事件日志中行為之間關系的理解,進而提升了預測效果。

關鍵詞:行為輪廓; 預測性過程監控; 業務流程; 結果預測

中圖分類號:TP311 文獻標志碼:A

文章編號:1001-3695(2024)06-023-1762-07

doi:10.19734/j.issn.1001-3695.2023.11.0524

Method for business process outcome prediction based onbehavior profile matrix enhancement

Abstract:Predictive process monitoring(PPM) relies on predictive effectiveness, and to address the challenge of improving predictive performance in PPM, this paper proposed a novel approach called behavior profile matrix enhanced business process outcome prediction. Initially, this approach extracted the behavior profile matrix by analyzing the interactions among activities and incorporated it into the model along with event sequences. Then, it used convolutional neural networks(CNN) and long short-term memory networks(LSTM) to independently capture image features from the matrix and sequence features. Finally, this approach integrated an attention mechanism to seamlessly combine both image and sequence features for predictive purposes. Validation using real event logs demonstrates that the proposed enhancement method significantly enhances predictive performance compared to the baseline LSTM prediction methods when forecasting event log outcomes, confirming the feasibility of this approach. This approach combines the behavior profile matrix to enhance the predictive model’s understanding of relationships between behaviors in event logs, consequently leading to an improvement in predictive performance.

Key words:behavior profile; predictive process monitoring; business process; outcome prediction

0 引言

預測性過程監控[1]是過程挖掘的一個重要分支,其主要目標是對正在進行但尚未完成的過程執行進行未來狀態的預測。這些預測可能涉及到過程執行的結果、剩余時間以及未來活動的順序。在許多領域和場景中,提前預測過程執行的結果[2~9]、案例的剩余時間[10,11]以及下一步活動[2,7,12,13],對于機構與個體都具有極高的價值。例如,在生產流程中,預測性過程監控可以幫助組織預防不良結果、問題和延遲的發生[14~16]。與傳統的反映式業務流程監控[17]不同,預測性過程監控[18]的目標是在問題發生之前就能夠預測違規或問題的發生,并采取相應的預防措施。這種預測性的方法可以幫助用戶和組織更好地預防潛在的問題,并提高整體的工作效率。在數據科學、預測性分析和數據驅動的人工智能技術的推動下,預測性過程監控技術在過程挖掘領域迅速發展,并成為創新組織環境和過程挖掘工具中的重要功能。

在實際的業務生產中,往往會通過記錄事件日志來跟蹤和監控不同業務流程的執行情況。比如,在一個企業的生產過程中,可能會存在需要從第三方供應商采購原材料、制造產品、運輸產品等多個環節,每個環節都會涉及到各種業務活動和交互。如果能夠對這些事件日志進行預測性過程監控,就能更好地了解和優化整個生產流程的效率和質量。例如,可以通過預測未來事件序列的發展趨勢,及時發現潛在的問題并作出相應的調整。同時,也可以通過分析事件之間的關系和活動之間的交互,挖掘生產過程中的瓶頸環節和優化點,以提高生產效率和減少成本。

在預測性過程監控的許多領域和場景中,本文主要討論預測過程執行的結果,該任務是典型的多分類預測任務。已有學者嘗試使用不同的方法進行結果預測,并取得了不錯的效果。Teinemaa等人[2]定義了PBPM結果預測任務的時間穩定性概念,評估了現有方法的時間穩定性和準確性,實驗證明,對比基于跡索引的XGBoost和LSTM方法具有最高的時間穩定性。受可解釋人工智能(XAI)領域的啟發,Galanti等人[4]提出了一個完全可解釋的結果預測模型,以平衡預測性能和可解釋性。Pasquadibisceglie等人[5]使用的前綴跡的圖像增強表示擴展了文獻[7]中的方法,利用圖像中相鄰像素標識前綴跡的順序特征,從而能夠準確地預測病例結果。上述方法采用深度學習技術進行實驗,通過使用事件的獨熱(one-hot)編碼和長短期記憶網絡(LSTM)來執行多個業務流程預測任務,包括案例過程執行的結果、下一個活動,以及案例的剩余時間,形成了一個黑盒模型,這使得預測結果難以解釋文獻[7]的FOX模型。此外,Wickramanayake等人[9]利用不同的特征向量連接模式,提出了兩種不同的預測模型,即基于共享注意的模型和專門的基于注意的模型,這兩種模型通過事件注意和屬性注意,將可解釋性直接應用于預測模型來解釋預測結果。文獻[8]基于使用BERT(來自Transformers的雙向編碼器表示)對許多未標記的跡執行自我監督的預訓練任務的掩蓋預測活動模型(MAM),利用Transformers中的注意機制獲得了活動之間的長期依賴關系,并使用遷移訓練實現多任務預測。

在特征增強方法上,文獻[12]嘗試使用行為向量編碼,將行為信息進行詞向量編碼輸入到深度神經網絡模型中,使預測下一個活動的效果獲得了顯著提升。文獻[19]提出了一種基于批量跡與過程模型多視角對齊方法,結合了數據與資源視角實現對齊方法。

傳統的行為輪廓的目的在于捕獲活動之間的序列關系,并提取過程模型中的基本行為約束。然而,現有的過程模型挖掘方法對于生成復雜事件日志的模型可讀性較低,不利于使用過程模型生成行為輪廓。同時,目前應用機器學習方法進行結果預測時較少考慮結合活動之間的復雜行為關系來增強預測效果。

為了解決上述問題,提出了一種基于行為輪廓矩陣增強的業務流程結果預測方法。該方法通過直接從日志中提取行為輪廓矩陣來表示活動之間的復雜行為關系,將復雜的過程模型簡化為行為輪廓矩陣,從而增加了行為關系的可讀性。與此同時,行為輪廓矩陣的數據結構便于機器學習的應用,結合行為輪廓矩陣將序列信息輸入到結果預測任務的模型的訓練和預測中,增強模型對活動之間的序列關系信息的學習,從而提高預測效果。

相較于前人工作,本文的主要貢獻為:

a)提出了一種基于行為輪廓矩陣增強的業務流程結果預測方法。通過提取日志行為輪廓矩陣進行特征學習,結合原有的序列預測模型進行結果預測。即通過跡序列中活動之間的行為特征學習以增強預測效果。

b)使用真實案例的數據進行仿真實驗,實驗結果與現有的結果預測研究實驗進行對比,預測效果達到領先水平。

1 基本概念

1.1 事件日志

事件日志是一組跡的集合,每一條跡代表一次業務流程的執行。每條跡包含一系列事件,每個事件表示一個活動的執行。每個活動代表業務流程中的一個步驟。

定義1 事件event。假設事件空間E為所有事件標識符的合集,事件e∈E通常指活動a∈A的一次執行,可以由各種屬性attr來表征,可以記作e=attr1,attr2,…,attrn。例如,事件可以具有時間戳time: timestamp、與活動相對應的名稱concept:name、事件所屬流程實例名稱case:concept:name和生命周期lifecycle:transition等屬性。

1.2 行為輪廓

為了獲取過程模型的基本行為約束信息,本節引入模型行為輪廓的概念(簡稱行為輪廓)。

2 基于行為輪廓矩陣增強的業務流程結果預測方法

2.1 行為輪廓矩陣的識別

鑒于傳統行為輪廓的不足,在傳統行為輪廓的基礎上重新定義一組行為輪廓關系概念,以更準確地描述事件之間的關系。為了識別事件之間的行為輪廓關系,本文需要借助事件之間的順序關系進行提取,即直接通過控制流信息提取行為輪廓。

定義4 順序關系。設S為一組序列,每個序列由事件組成。所有可能的事件集合為E,包含n個獨特的事件,記作e1,e2,…,en。

對于S中的每個序列s和其中的任意事件ei和ej(其中i,j∈{1,2,…,n}),定義順序關系SR如下:

定義5 順序關系矩陣。設序列順序關系矩陣SRMatrix為一個n×n的矩陣,其中每個元素SRMatrix(i,j)表示ei和ej在S中所有序列的順序關系的累積結果。具體來說:

其中:∨表示邏輯或操作。若ei在任何序列s中直接位于ej之前,或ei是s的最后一個事件且ej是s的第一個事件,則結果為1,否則為0。

定義6 行為輪廓矩陣。設S為一組序列,每個序列由事件組成。所有可能的事件集合為E ,包含 n個獨特的事件,記作(e1,e2,…,en)。其基于已經定義的順序關系SR。

為了描述兩個事件間的行為關系,定義行為輪廓矩陣BPM為一個n×n的矩陣。其中,對于矩陣的任意元素BPM(i,j),根據以下規則從序列關系矩陣SRMatrix計算而來:

嚴格序關系(strictly succession):如果事件ei在所有序列中總是出現在事件ej之前,并且事件ej從不出現在事件ei之前,則稱ei對ej存在嚴格序關系。

嚴格逆序關系(strictly precedence):如果事件ej在所有序列中總是出現在事件ei之前,并且事件ei從不出現在事件ej之前,則稱ei對ej存在嚴格逆序關系。

交叉序關系(interleaving):如果事件ei在某些序列中出現在事件ej之前,而在其他序列中出現在之后,則稱ei對ej之間存在交叉序關系。

排他序關系(exclusively succession):如果事件ei和ej在所有序列中都無順序關系,則稱它們之間存在排他序關系。

依據以上定義,行為輪廓矩陣BPM可以完整地反映序列集合S中各事件間的行為關系。基于行為輪廓矩陣增強的業務流程結果預測方法過程如圖1所示。

2.2 基于行為輪廓增強的事件日志結果預測

基于行為輪廓增強的事件日志結果預測方法BPME主要包括三個階段:數據處理階段,包括劃分數據集以及提取前綴跡和結果兩個步驟;訓練模型階段,主要通過嘗試不同參數提升模型效果;模型評估階段,主要進行模型預測效果的評估。

a)數據處理階段。通過算法1對事件日志的行為輪廓進行提取。并將數據分割為訓練集、測試集、驗證集,對應比例為0.5∶0.2∶0.3。對事件日志進行處理,首先將事件日志的跡提取出來,再將跡切割或填充為指定固定長度的事件序列,同時將每一條跡的結果進行提取作為預測標簽。將獲得的事件序列和結果標簽用統一的one-hot編解碼器進行編碼。

b)訓練模型階段。通過將處理好的指定長度one-hot編碼的事件序列輸入到LSTM子模型以提取序列信息,將行為輪廓矩陣輸入到CNN子模型中以提取圖像信息。同時模型的分類特征編碼為one-hot編碼。神經網絡構建預測模型的超參數設置如下:優化算法選用Adam,針對不同的事件日志設置調整學習率{0.01,0.001,0.0001}、批處理大小{256,128,64,32}、模型迭代次數{50,100,200}。

c)模型評估階段。通過將訓練好的模型用測試集數據進行預測,對比真實值和預測值,并計算AUC和F-score。

2.3 行為輪廓矩陣的生成

算法1提出了一種推導事件日志中的行為關系并生成行為輪廓矩陣的方法。該算法的目標是從事件序列中捕獲事件之間的順序關系,并將這些關系表示為一個行為輪廓矩陣。

算法1 推導事件日志行為關系生成行為輪廓矩陣

輸入:事件序列組sequence_group。

輸出:行為輪廓矩陣BPM。

為了得到在窗口內每個事件日志活動的行為輪廓矩陣,對不同行為輪廓類比給出不同的值。BP={→,←-1,‖,+}中的各個關系,將行為輪廓矩陣中的值設置為{1,2,3,4}。

為了驗證行為輪廓矩陣,給出序列組數據[′A′, ′B′, ′C′, ′D′,′A′],[′A′, ′D′, ′C′, ′B′], [′C′, ′D′, ′A′, ′B′],[′D′, ′A′, ′C′, ′B′],通過對上述人工數據運行算法1中的代碼,先得到如圖2所示的順序關系矩陣,然后得到如圖3所示的行為輪廓矩陣。

2.3.1 順序關系矩陣

首先,算法1接受一個事件序列組作為輸入。第1行通過遍歷所有的事件序列,將其中出現的事件名稱收集起來,形成一個事件名稱的集合。這個集合的大小即為事件的種類數目,記為N。

然后,算法1第2~5行創建一個大小為N×N的順序關系矩陣SRMatrix和行為輪廓矩陣BPM,初始值都設為0。順序關系矩陣SRMatrix用于記錄臨近事件之間的行為關系,行為輪廓矩陣BPM則用于表示行為輪廓。

接下來,算法1第6行對于每個事件序列進行處理。對于序列中的每個事件,分別記錄當前事件和下一個事件,并根據它們在事件名稱集合中的索引,更新順序關系矩陣中相應位置的值為1,表示存在行為關系。

以活動C為例:在順序矩陣中活動C總是發生在活動A后面且不會重復出現;但是活動B和D均可能在活動C前后發生。因此,活動C的順序矩陣行的值為[0,1,0,1],列的值為[1,1,0,1]。

2.3.2 行為輪廓矩陣

生成順序關系矩陣SRMatrix后,算法1第7行,根據以下規則將順序關系矩陣轉換為行為輪廓矩陣的值:

如果順序關系矩陣SRMatrix中的某個位置(i,j)為1且位置(j,i)為0,則將行為輪廓矩陣中對應位置的值設為1,表示嚴格序列行為輪廓(strict sequence events)。

如果順序關系矩陣SRMatrix中的某個位置(i,j)為0且位置(j,i)為1,則將行為輪廓矩陣中對應位置的值設為2,表示嚴格逆序列行為輪廓關系。

如果順序關系矩陣SRMatrix中的某個位置(i,j)為1且位置(j,i)也為1,則將行為輪廓矩陣BPM中對應位置的值設為3,表示排他序列行為輪廓關系。

如果順序關系矩陣SRMatrix中的某個位置(i,j)為0且位置(j,i)也為0,則將行為輪廓矩陣BPM中對應位置的值設為4,表示交叉序列行為輪廓關系。

以活動C為例:更進一步,可以分析出活動A、B、C、D之間的行為輪廓關系,例如,BP(A,C)=→, BP(C,A)=←-1, BP(C,B)=‖,BP(C,C)=+,BP(A,A)=‖,對應到行為輪廓矩陣中的值為BPM(A,C)=1,BPM(C,A)=2,BPM(C,B)=3,BPM(C,C)=4,BPM(A,A)=3。

在行為輪廓矩陣中,由于行為輪廓中的嚴格序和嚴格逆序是互逆的,值1(嚴格序→)和2(嚴格逆序←-1)的關系在矩陣中成對角線對稱。對于對角線中的值,如果同樣的活動在同一跡中重復發生則將賦值為3(交叉序‖),相反活動在同一跡中只發生唯一一次則將被賦值為4(排他序+)。

最后,算法返回生成的行為輪廓矩陣BPM作為輸出結果。這個行為輪廓矩陣可以幫助理解事件日志中不同事件之間的行為關系,并根據行為輪廓來分析和挖掘事件序列中的行為模式。通過這種方式,可以獲得對事件行為更深入的認識,并從中發現隱藏的規律和趨勢。

2.4 BPMEM模型

行為輪廓矩陣增強模型(behavioral profile matrix enhancement model,BPMEM)是一個基于深度學習的模型,其中結合了LSTM、CNN以及多頭注意力機制(multi-head attention)。通過將日志生成行為輪廓矩陣信息和事件序列信息作為輸入,用于預測事件日志事件執行的結果。BPMEM模型結構如圖4所示。

1)模型輸入

輸入1:編碼后的序列X,其形狀為(length,num_events),其中length是序列長度,num_ events是事件數量,該張量表示一個長度為length、one-hot編碼長度為num_events的序列。

輸入2:行為配置矩陣(behavior_profile_matrix),形狀為(num_events,num_events)。

2)LSTM子模型

在輸入X上使用一個LSTM層,其中有512個單元,并返回序列。

LSTM的輸出傳遞給一個多頭注意力層,此處使用8個頭,并設置key_dim為512。

注意力機制的輸出被扁平化。

3)CNN子模型

輸入行為配置矩陣經過一個reshape層,增加一個維度以適應Conv2D。

使用Conv2D層,其中有32個過濾器,大小為(3,3),激活函數為ReLU。

Conv2D的輸出傳遞給一個多頭注意力層,此處使用8個頭,并設置key_dim為32。

注意力機制的輸出傳遞給一個MaxPooling2D層。

最后,pooling的輸出被扁平化。

4)dropout與dense層

在CNN與LSTM的輸出后都添加了dropout層,減少過擬合風險,其中dropout的比例為0.5。

使用dense層調整CNN與LSTM的輸出形狀。

5)拼接與注意力

LSTM與CNN的輸出進行拼接。

拼接后的輸出經過reshape層調整形狀,然后傳遞給一個多頭注意力層,此處使用8個頭,并設置key_dim為1 088。

扁平化注意力機制的輸出。

6)輸出

使用一個dense層調整拼接后的輸出形狀,其中有1 024個單元,激活函數為ReLU。

最后的輸出形狀為(num_events),使用softmax激活函數,得到對應結果的one-hot編碼。

3 行為輪廓矩陣增強方法BPME實例分析

Sepsis是一份記錄荷蘭某醫院中患有敗血癥的患者病例過程的事件日志。每個病例記錄了從患者在急診室登記到出院的事件過程。

在這個案例中,一條完整的事件序列是包含了一系列的治療事件的過程。為了保護患者隱私,治療事件過程的結果被處理為Release A,Release B,…。通過對事件日志數據的提取,一條患者病例的完整過程實例如下所示:ER Registration,Leucocytes,CRP,LacticAcid,ER Triage,ER Sepsis Triage,IV Liquid,IV Antibiotics,Admission NC,CRP,Leucocytes,Leucocytes,CRP,Leucocytes,CRP,CRP,Leucocytes,Leucocytes,CRP,CRP,Leucocytes,Release A。

通過對上述患有敗血癥的患者病例過程的事件日志進行過程挖掘,得到如圖5所示的Sepsis直接后繼圖過程模型。可以看到,過程模型可以將事件間的行為關系進行展示,例如:治療過程通常開始于ER Registration、Leucocytes、CRP等事件;結束于Release A、Release B等結果事件;所有結果事件發生前的序列可能通過Admission NC或者Admission IC進入循環,即重新診療。

但是由于事件之間的關系復雜,較難從過程模型直接推斷出當前治療過程的后續事件的發生順序,更不要說預測結果。同時,過程模型的數據結構較難轉換為機器學習方法常見的張量形式。

通過對上述患有敗血癥的患者病例過程的事件日志,應用推導事件日志行為關系生成行為輪廓矩陣的方法,生成對應的行為輪廓矩陣,如圖6所示。

通過行為輪廓矩陣,對事件日志中的15種事件的行為關系進行了描述,如:Release A,Release B,…,other等結果事件,它們之間對應的行為輪廓矩陣值被賦值為4,屬于排他序+,表明這些結果事件在一條病例過程中不會同時出現。

應用這些行為關系進行約束,甚至可以對后繼活動的發生給出候選集。例如:對于BPM(LacticAcid,*)的賦值中,Release A,Release B,other對應的值為1(嚴格序→),而Release C,Release D為4(排他序+),所以診療過程中LacticAcid事件發生后,對應的案例的結果事件候選集只能是{Release A,Release B,other}。

通過應用行為輪廓矩陣,可以將復雜的過程模型轉換為矩陣形式,能直接讀取出事件間的行為關系。同時,矩陣形式的數據結構便于轉換為張量,輸入到神經網絡模型中,通過行為輪廓矩陣提供的行為信息增強提高預測效果。通過結果預測模型,可以將患者診療過程作為輸入,從而輸出預測結果,如病人的疾病類型或者治療方案。

在患者病例過程中進行結果預測,可以協助醫生在診療過程中進行決策。當醫生完成診斷,預測得到的患者病例的結果,可以協助醫生進行診斷的核對和確認,減少誤診率。

4 實驗與評估

本文基于上述BPME方法,使用Python實現對應的方法。使用開源的過程挖掘庫pm4py對XES格式的事件日志進行讀取,然后使用讀取后的事件日志來進行方法的實驗與驗證。

本章針對所提出的基于行為輪廓的結果預測方法進行評估。第一部分為生成行為輪廓的驗證,第二部分完成了對應的結果預測效果評估,通過對比未結合行為輪廓矩陣的預測結果來說明行為輪廓對預測結果的效果。

4.1 實驗數據和設置

本文采用真實數據集進行實驗。包括BPIC2012(https://doi.org/10.4121/uuid:3926db30-f712-4394-aebc-75976070e91f)和Sepsis(https://doi.org/10.4121/uuid:915d2bfb-7e84-49ad-a286-dc35f063a460)數據集,其數據特征如表2所示。

BPIC2012是一個數據集,最早于2012年在業務流程智能挑戰賽(BPIC)中發布。該數據集包含了荷蘭金融機構貸款申請流程的執行歷史記錄。每個案例都詳細記錄了與特定貸款申請相關的事件。為了進行分類研究,本文根據案例的結果確定了一些標簽,即申請是否被接受、拒絕或取消。從直觀上來說,這可以被視為一個多類別離散問題。然而,為了與之前關于結果導向預測過程監測的研究保持一致,本文將其作為三個獨立的二進制分類任務,分別記作BPIC2012_1、BPIC2012_2和BPIC2012_3。

Sepsis是一份記錄荷蘭某醫院中患有敗血癥的患者病例過程的事件日志。每個病例記錄了從患者在急診室登記到出院的事件過程。本文以Sepsis作為數據集,研究結果預測任務,本文還參考了文獻[5],其中定義了該日志中的三個不同的病例,標記為Sepsis_1、Sepsis_2和Sepsis_3。

為了驗證本文方法對于事件日志結果預測的有效性和性能,對比了部分傳統的神經網絡結果預測方法,如SVM[3]、LR[3]、RF[3]、XGB[3]、LSTM[2],也選取了結合其他方式增強模型效果的結果預測方法,如ORANGE[5]、FOX[7]、BERT[8]。其中ORANGE應用了基于前綴跡的圖像增強方法增強預測效果,BERT基于Transform模型應用了預訓練、掩蓋訓練方法增強預測效果。通過對比傳統的神經網絡預測方法,研究對于事件日志結果預測的有效性和提升效果。通過對比結合其他方式增強模型效果的方法,研究對于事件日志結果預測性能的提升是否較其他增強方法有優勢。

在預測結果方法的對比上,由于準確度效果對比不夠明顯,多采用AUC(area under the curve)和F-score進行對比。

AUC是一種用于評估二分類模型性能的指標。AUC值為0.5~1,其中0.5表示模型預測性能等同于隨機猜測,而1表示模型完全準確地預測了正負樣本。AUC通過繪制ROC曲線(receiver operating characteristic curve)來計算得出。ROC曲線是以真陽性率(true positive rate,也稱為召回率或靈敏度)為縱軸,假陽性率(false positive rate)為橫軸繪制的,反映了在不同分類閾值下模型的性能。

對于多分類問題,通常會將每個類別作為正例,其他類別作為負例,計算每個類別的AUC值,并對這些AUC值進行平均得到平均AUC。它可以衡量模型在區分各個類別之間的性能。

F-score是一種用于評估分類模型性能的指標,主要用于非平衡數據集中的二分類問題。F-score結合了準確度(precision)和召回率(rec1sxZtwoIzPvsxmAycMMEug==all),既考慮了模型的準確性,也考慮了模型找到所有正例的能力。

精確率定義為真陽性數除以真陽性數加假陽性數,召回率定義為真陽性數除以真陽性數加假陰性數,對于每個類別,可以計算其精確率和召回率,計算每個類別的F-score值,最后對這些類別的F-score值進行平均,得到這個數據集的F-score。F-score能夠評估模型在多個類別上的整體性能。

4.2 預測跡的結果

通過實驗比較了上述機器學習算法和深度學習模型在事件日志數據集上的性能,結果如表3、4所示。

為了方便對比,本文將結果最優值進行加粗顯示。實驗結果表明,在AUC值的比較中,本文方法在多個數據集上表現良好,尤其在Sepsis_2數據集上取得了顯著的性能提升,AUC值達到了0.97。

表4表明,在F_score值的比較中,本文方法在多個數據集上表現出良好的性能,尤其在BPIC2012_1和Sepsis_2數據集上取得了較高的F-score。

為了對各個方法的效果分布進行研究,通過設置箱體范圍為25%~75%,得到AUC和F-score箱線圖。如圖7所示,本文方法的AUC分數綜合效果最好,且預測效果最穩定,F-score分數綜合效果排名第二且預測效果比大多數方法穩定。

綜上所述,BPME在多個數據集上優于對比方法。如圖8所示,在AUC值和F-score上,BPME在所有數據集中優于絕大部分方法,在絕大多數數據集上的F-score僅次于ORANGE和BERT方法。

4.3 行為輪廓矩陣增強方法BPME消融實驗

為了驗證行為輪廓對于實驗結果的增強程度,進行了消融實驗。實驗將在框架和模型中的行為輪廓矩陣增強模塊刪去作為基線模型。從基于對真實數據集的實驗得到的表5可知,結合行為輪廓矩陣增強的模型效果優于基線模型和LSTM模型,AUC分數較基線模型持平,F-score分數較基線模型提升12%。同時,本文提出的增強模型的AUC和F-score比基準的LSTM預測模型平均提升了21%和36.5%。AUC提升表示模型分類能力提高,F-score提升表示分類模型性能更好了。

相較于其他增強方法,本文中基于行為輪廓矩陣增強方法BPME比ORANGE應用的圖像增強方法和BERT中的預訓練、掩蓋訓練方法對AUC提升效果要好。而對于F-score的提升優于ORANGE中應用的圖像增強方法,略次于BERT中的預訓練、掩蓋訓練方法。

5 結束語

本文從事件日志提取生成行為輪廓矩陣,并與事件日志中的事件序列信息一起通過CNN和LSTM子模型進行特征學習,將結合的特征用于增強預測模型對事件日志中行為之間關系的理解,優化預測效果。通過對比實驗,結合行為輪廓矩陣增強的預測模型預測效果優于傳統的預測模型。

本文BPME方法僅考慮了最基礎的one-hot編碼方法,未采用更復雜的編碼方法。同時,本文中的行為輪廓增強模塊僅應用在LSTM模型增強結果預測效果,未嘗試更復雜的神經網絡模型以及其他的預測任務。這導致本文方法在實際應用推廣中缺少對事件附加屬性信息的考慮,而導致預測效果在某些情況下可能出現偏差,并且由于本文方法僅提供結果預測,導致可用于輔助決策的信息有限。

在未來工作中,可以考慮結合多視角的編碼方法和更復雜的神經網絡模型以提升效果,或嘗試應用到其他預測任務。通過提升預測效果,可以提高相關行業應用本文方法進行預測性過程監控的可行性和可靠性。同時,通過拓展其他預測任務,可以提供更多預測性信息應用于輔助決策。

參考文獻:

[1]Maggi F M, Di Francescomarino C, Dumas M, et al. Predictive monitoring of business processes[C]//Proc of Advanced Information Systems Engineering. Cham: Springer, 2014: 457-472.

[2]Teinemaa I, Dumas M, Leontjeva A, et al. Temporal stability in predictive process monitoring[J]. Data Mining and Knowledge Discovery, 2018,32(5): 1306-1338.

[3]Teinemaa I, Dumas M, Rosa M L, et al. Outcome-oriented predictive process monitoring: review and benchmark[J]. ACM Trans on Knowledge Discovery from Data, 2019,13(2): 1-57.

[4]Galanti R, Coma-Puig B, Leoni M D, et al. Explainable predictive process monitoring[C]//Proc of the 2nd International Conference on Process Mining. Piscataway, NJ: IEEE Press, 2020: 1-8.

[5]Pasquadibisceglie V, Appice A, Castellano G, et al. ORANGE: outcome-oriented predictive process monitoring based on image encoding and CNNs[J]. IEEE Access, 2020,8: 184073-184086.

[6]Aringhieri R, Boella G, Brunetti E, et al. Leveraging structured data in predictive process monitoring: the case of the ICD-9-CM in the scenario of the home hospitalization service[C]//Proc of SMARTERCARE Workshop.[S.l.]: CEUR-WS Press, 2021: 48-60.

[7]Pasquadibisceglie V, Castellano G, Appice A, et al. FOX: a neuro-fuzzy model for process outcome prediction and explanation[C]//Proc of the 3rd International Conference on Process Mining. Piscataway, NJ: IEEE Press, 2021: 112-119.

[8]Chen Hang, Fang Xianwen, Fang Huan. Multi-task prediction me-thod of business process based on BERT and transfer learning[J]. Knowledge-Based Systems, 2022,254: 109603.

[9]Wickramanayake B, He Zhipeng, Ouyang Chun, et al. Building interpretable models for business process prediction using shared and specialised attention mechanisms[J]. Knowledge-Based Systems, 2022, 248: 108773.

[10]郭娜, 劉聰, 李彩虹, 等. 支持增量日志的業務流程剩余時間預測方法[J/OL]. 計算機集成制造系統. (2023-03-23)[2023-11-08]. https://kns.cnki.net/kcms/detail/11.5946.TP.20230322.1638.008.html. (Guo Na, Liu Cong, Li Caihong, et al. Process remaining time prediction approach supporting incremental logs[J/OL]. Computer Integrated Manufacturing Systems. (2023-03-23)[2023-11-08]. https://kns.cnki.net/kcms/detail/11.5946.TP.20230322.1638.008.html.)

[11]Van Der Aalst W M P, Schonenberg M H, Song M. Time prediction based on process mining[J]. Information Systems, 2011,36(2): 450-475.

[12]盧可, 方賢文, 方娜. 基于行為向量的在線事件流預測[J]. 計算機集成制造系統, 2022, 28(10): 3052-3063. (Lu Ke, Fang Xianwen, Fang Na. Online event stream prediction based on behavior vectors[J]. Computer Integrated Manufacturing Systems, 2022, 28(10): 3052-3063.)

[13]宮子優, 方賢文. 基于時間卷積網絡的業務流程預測監控[J]. 安徽理工大學學報 :自然科學版, 2021, 41(5): 64-70. (Gong Ziyou, Fang Xianwen. Predictive business process monitoring using temporal convolutional networks[J]. Journal of Anhui University of Science and Technology: Natural Science, 2021,41(5): 64-70.)

[14]Sarno R, Sinaga F, Sungkono K R. Anomaly detection in business processes using process mining and fuzzy association rule learning[J]. Journal of Big Data, 2020,7(1): 5.

[15]Nolle T, Luettgen S, Seeliger A, et al. BINet: multi-perspective business process anomaly classification[J]. Information Systems, 2022,103: 101458.

[16]Gyunam P, Minseok S. Predicting performances in business processes using deep neural networks[J]. Decision Support Systems, 2020,129: 113191.

[17]Ly L T, Maggi F M, Montali M, et al. Compliance monitoring in business processes: functionalities, application, and tool-support[J]. Information Systems, 2015,54: 209-234.

[18]Pasquadibisceglie V, Appice A, Castellano G, et al. A multi-view deep learning approach for predictive business process monitoring[J]. IEEE Trans on Services Computing, 2022,15(4): 2382-2395.

[19]孫晉永, 鄧文偉, 許乾, 等. 事件日志的批量跡與過程模型的多視角對齊方法[J]. 計算機應用研究, 2023,40(7): 2045-2052,2059. (Sun Jinyong, Deng Wenwei, Xu Qian, et al. Multi-perspective alignment between batch traces of event log and process model[J]. Application Research of Computers, 2023,40(7): 2045-2052,2059.)

主站蜘蛛池模板: 一区二区三区四区精品视频 | 美女扒开下面流白浆在线试听| 国内精品久久久久久久久久影视| 久久人人爽人人爽人人片aV东京热 | 日韩无码白| 国产区人妖精品人妖精品视频| 亚洲AV成人一区国产精品| 99re在线观看视频| 国产福利一区二区在线观看| 亚洲精品午夜无码电影网| 国产欧美日韩精品综合在线| 亚洲无码精品在线播放| 啪啪永久免费av| 国产在线欧美| 国产乱子伦手机在线| 亚洲VA中文字幕| 91午夜福利在线观看精品| 波多野结衣中文字幕一区二区| 精品国产99久久| 青草视频在线观看国产| 国产福利不卡视频| 9999在线视频| 熟妇丰满人妻av无码区| 欧美人与牲动交a欧美精品| 国产91蝌蚪窝| 丰满人妻被猛烈进入无码| 四虎在线观看视频高清无码| 成人综合在线观看| 大陆精大陆国产国语精品1024| 91精品伊人久久大香线蕉| 永久在线精品免费视频观看| 国产乱子伦精品视频| 一级毛片高清| 最新国语自产精品视频在| 日韩第九页| 欧洲av毛片| 熟妇丰满人妻| 伊人丁香五月天久久综合| 99人妻碰碰碰久久久久禁片| 欧美精品三级在线| 久久毛片免费基地| 国产又黄又硬又粗| 精品三级网站| 久久综合亚洲鲁鲁九月天| 在线播放精品一区二区啪视频| 国产精品短篇二区| 99热在线只有精品| 99久久亚洲综合精品TS| 国产亚洲现在一区二区中文| 中文无码日韩精品| 欧美亚洲国产一区| 亚洲色无码专线精品观看| 毛片三级在线观看| 天天摸夜夜操| 日韩在线第三页| 黄色福利在线| 制服丝袜无码每日更新| 亚洲视频欧美不卡| 国内精品免费| 日韩av无码精品专区| 亚洲a级毛片| 免费在线成人网| 国产成人做受免费视频| 中文字幕乱码二三区免费| 色欲不卡无码一区二区| 亚洲欧美自拍一区| 国产乱论视频| 亚洲视频二| 国产乱人乱偷精品视频a人人澡| 国产精品人人做人人爽人人添| 亚洲AV无码乱码在线观看裸奔 | 亚洲有无码中文网| 国产自在线播放| 午夜国产在线观看| 很黄的网站在线观看| 国产乱子伦视频三区| 国产精品第5页| 亚洲综合久久成人AV| 一级全黄毛片| 亚洲国产综合自在线另类| 91精品专区国产盗摄| 国产91在线免费视频|