
















摘 要:
港口物流是一種高度以人為中心、復雜靈活的業務流程?,F有研究對其進行流程挖掘時,存在自動發現流程模型質量低的問題,同時缺少對于流程偏差進行系統化根因分析的支持,這造成港口流程偏差分析能力較弱。針對這一問題,提出一種面向流程偏差根因分析的港口物流流程挖掘方法。該方法基于事件日志進行港口物流活動統計實現流程績效分析,使用Split Miner和Inductive Miner發現實際流程模型,并使用對齊方法識別流程偏差,接著結合分類決策樹和?;鶊D對流程偏差進行根因分析。通過在某大型港口物流提貨流程進行實際應用,結果表明,應用該方法能發現實際執行流程的更多細節來為流程偏差根因分析提供支持,并可以對流程偏差進行系統化的根因分析。該方法強化了港口物流流程偏差分析能力,進而降低了港口物流管理風險。
關鍵詞:流程挖掘;流程發現;一致性檢查;根因分析;港口物流
中圖分類號:TP399 文獻標志碼:A 文章編號:1001-3695(2024)09-018-2690-09
doi:10.19734/j.issn.1001-3695.2023.12.0622
Port logistics process mining method and application towards root cause analytics of process deviations
Cai Min1, Wang Xuetao1, Song Rongjia1, Liu Cong2, Luo Xinggang1, Huang Lei3
(1.Experimental Center of Data Science & Intelligent Decision Making, School of Management, Hangzhou Dianzi University, Hangzhou 310018, China; 2.School of Computer Science & Technology, Shandong University of Technology, Zibo Shandong 255000, China; 3.School of Economics & Management, Beijing Jiaotong University, Beijing 100044, China)
Abstract:
Port logistics is a highly human-centered, complex and flexible business process. Existing research on process mining has the problem of automatically discovering low quality process models, and lacks support for systematic root cause analysis of process deviations, which results in a weak ability to analyze process deviations in ports. To address this issue, this paper proposed a process mining method framework for root cause analysis of process deviation in port logistics. The method was based on event logs for port logistics activity statistics, used Split Miner and Inductive Miner to discover the actual process model, used the alignment method to identify the process deviation, combined the classification decision tree and Sankey diagram to conduct root cause analysis on process deviations. Through the practical application in a large port logistics pick-up process, the results show that the method can discover more details of the actual execution process to provide support for the root cause analysis of process deviation, and carry out a systematic root cause analysis of process deviation. The method strengthens the capability of analyzing process deviations in port logistics, which in turn reduces the risk of port logistics management.
Key words:process mining; process discovery; conformance checking; root cause analysis; port logistics
0 引言
港口物流是經濟全球化的重要組成部分,這對物流流程的高效、安全運行提出了更高要求[1]。隨著信息技術的快速發展,港口企業根據業務需求,依靠港口業務中的一線員工、管理者和領域專家,開發出了對應的港口物流信息管理系統,用于支持港口物流的運營[2]。雖然港口物流通常有著一套標準的執行流程,但實際港口物流面臨著業務流程靈活、業務類型繁多和客戶需求多樣等問題[3],這使得港口物流信息系統需要具備一定的靈活性來應對各種情況,然而信息系統中的標準流程往往和實際執行流程之間存在偏差,這些偏差會帶來一系列管理風險[4]。例如,據中華人民共和國海事局發布的事故案例顯示,2021年1月4日,出港船O輪與進港船A輪在航行時因違反信息系統中的出入港標準流程而發生碰撞,事故造成直接經濟損失355萬人民幣,而引航員違規下達操作指令是造成這一流程偏差的原因之一[5]。目前,港口物流中流程偏差發生的原因很難人工發現并進行分析,如何有效地分析港口流程偏差發生的原因以降低港口的管理風險已經成為從業者關注的焦點[6,7]。
流程挖掘技術可以從事件日志中獲取流程知識,能夠發現實際執行流程、識別流程中的瓶頸和偏差、預測和檢查一致性問題,為發現和改進各種應用領域中的流程提供了新的手段[8]。
近年來,一些研究將流程挖掘技術應用在港口物流領域,這些研究主要涉及對港口物流流程進行流程發現、績效分析和一致性檢查。例如:Veenstra等人[9]使用Heuristic Miner算法發現船舶實際到港流程,并選擇績效指標進行績效分析,改進了到港流程中的績效瓶頸;Zerbino等人[10]使用Fuzzy Miner算法發現港口實際貨運出口流程,分析影響港口貨運出口時間性能的因素;Wang等人[11]考慮到港口物流的復雜性和靈活性會導致流程存在各種問題,提出了一種典型的港口物流流程挖掘方法。該方法分四個階段:第一階段從物流信息系統中進行事件日志提取和預處理;第二階段從事件日志中自動發現流程模型來分析實際物流流程,該階段使用Fuzzy Miner、Heuristic Miner算法;第三階段對事件日志進行物流流程績效分析來揭示流程瓶頸及其影響因素;第四階段使用基于軌跡重放的一致性檢查方法來詳細診斷出實際物流流程和標準流程之間的偏差。
以上研究表明流程挖掘對港口物流流程優化有很好的適用性,但已有研究在港口物流流程偏差根因分析方面仍然存在顯著不足。一方面,港口物流結構松散和動態的性質使得港口物流流程數據具有高復雜性,已有研究在挖掘流程模型時,使用的Fuzzy Miner、Heuristic Miner算法會將低頻但關鍵的路徑作為噪聲過濾掉,發現低質量的流程模型[12],而這些低頻路徑會影響人們對實際流程問題的發現和根因分析[13]。因此有必要在不丟失關鍵細節的情況下發現高質量的流程模型,能夠更準確地分析港口物流流程中存在的問題。另一方面,港口物流活動受多種因素影響,對流程中的異常需要根據其原因采取對應的處理方式[14]。已有方法雖然能夠檢測出港口物流中實際流程和標準流程之間的偏差,但并不能系統化地分析出復雜流程偏差發生的原因。因此有必要對港口物流中的偏差流程進行系統化的根因分析,根據原因制定能有效降低流程風險的優化方案。
雖然目前的港口物流信息系統無法反映實際港口物流流程的多樣性、復雜性和靈活性,但信息系統中海量的數據積累,為本文基于數據層面分析港口物流流程提供了研究基礎。因此,為了解決上述問題,本文提出一套數據驅動的面向流程偏差根因分析的港口物流流程挖掘方法,實現對港口物流流程偏差進行系統化的根因分析,以支持港方企業可以根據流程偏差原因制定能夠有效降低流程風險的優化方案。
本文主要貢獻為:
a)提出了一套面向流程偏差根因分析的港口物流流程挖掘方法。該方法可以通過港口物流流程績效分析和港口物流流程模型自動發現,為流程偏差根因分析提供支持,并在港口物流流程一致性分析診斷出流程偏差后,通過港口物流流程偏差根因分析對具體流程偏差進行系統化的根因分析,進而提出改進港口物流流程的建議。
b)在港口物流流程模型自動發現階段,為了更準確地支持港口物流實際流程問題的發現和根因分析,提出使用Split Miner[13]和Inductive Miner[15]算法以挖掘出高質量的港口物流流程模型,便于分析實際流程執行細節。
c)在港口物流流程偏差根因分析階段,綜合考慮分類決策樹和?;鶊D分析的特點,提出使用分類決策樹分析港口物流流程中部分屬性值和流程偏差的關系,并使用?;鶊D分析港口物流流程在任意屬性值間的轉換趨勢,用于獲得使用決策樹進行分析的隱藏見解,進行流程偏差根因分析。
d)將本文方法應用到國內某大型港口,并與現有方法進行對比,驗證了本文方法的有效性和科學性。
1 相關研究
1.1 流程挖掘相關算法研究
流程挖掘已有大量研究,并且產生了許多算法,當前針對流程挖掘算法的研究主要分為流程模型發現、流程模型改進和流程知識挖掘。本文主要關注其中的流程模型發現算法和流程模型改進算法。
流程模型發現是指在沒有任何先驗信息的情況下,從記錄流程行為的事件日志中生成實際的流程模型[16]。已有研究提出了多種用于流程發現的算法,如Split Miner、 Inductive Miner、 Heuristic Miner[17]和Fuzzy Miner[18]。當事件日志記錄的流程行為結構簡單時,Heuristic Miner 和Fuzzy Miner能夠輸出簡單且準確的流程模型;然而隨著數據復雜性的增加,這些算法生成的模型質量會迅速惡化[19,20]。為了避免丟失信息,同時保留可解釋的結構,改進的流程發現算法Split Miner和Inductive Miner可以更好地處理蘊涵復雜流程的事件日志,能夠發現低復雜度、高擬合度和高精確度的流程模型[12,20]。
流程模型改進需要輸入事件日志和標準流程模型,目標是指出事件日志和標準模型不一致的地方并進行模型優化[8,21]。Rozinat等人[22]提出基于軌跡重放的一致性檢查方法,流程模型表示為Petri網,事件日志中的軌跡在模型上重放,根據重放過程中缺失和剩余的token計算一致性,但沒考慮最優對齊。文獻[23]提出基于對齊的一致性檢查方法,日志中的每個軌跡都映射到盡可能接近觀察到的模型行為,檢查結果顯示了跳過和插入的事件,可以在事件級別觀察流程偏差,這種方式比缺失和剩余的token更容易解釋。對齊通常被視為標準的一致性檢查技術,但在大型事件日志上計算對齊是比較耗時的[8],現有研究已經提出了更高效的一致性檢查方法,如沈曉林等人[24]將流程模型轉換為流程樹模型并將流程樹分解為子樹,利用分布式平臺Spark計算最優對齊。
1.2 流程問題根因分析方法研究
在流程挖掘領域已有許多研究致力于尋找流程問題的根本原因。Suriadi等人[25]將事件日志轉換為適合分類分析形式的數據,然后使用數據挖掘中的決策樹方法來發現影響流程實例類別的關鍵屬性;Ferreira等人[26]將事件日志轉換為邏輯表示,然后根據流程時間對流程實例進行分類并用決策樹提取規則,產生的規則用于解釋流程實例延遲的原因;Bozorgi等人[27]使用動作規則挖掘技術來識別在某些條件下與結果同時出現的處理,然后使用提升樹來發現在調整混雜變量后處理對結果的影響;Qafari等人[28]通過尋找對問題貢獻最大的一組特征和特征值對來確定有因果影響的特征,然后建立結構方程模型,并在模型上對特征集進行因果推理。
在以上根因分析方法中,分類決策樹能夠從事件日志中提取知識并以決策規則(if-then)的形式來匹配流程部分屬性和類別之間的關系,是一種可解釋性較強的分析工具[29]。經典的決策樹算法包括ID3、CART、C4.5和C5.0,其中C5.0具有更高的識別關鍵分類變量能力和預測準確性,并呈現適當的決策規則。使用決策樹分析具體有以下優點:a)決策樹易于理解和解釋,通過解釋后人們有能力理解決策所表達的意義,同時,可以進行可視化分析,容易提取規則;b)決策樹對于數據的準備比較簡單,并可同時處理連續型和離散型的數據;c)運算速度相對比較快,在相對短的時間內能對大型數據源作出可行且效果良好的結果;d)可以對有許多屬性的數據集構造決策樹,且冗余的屬性不會影響決策樹的準確性。
機器學習技術通過描述性特征來解釋目標特征,無論模型的準確性如何,總會有不精確分析的風險[30]。而且僅根據分類器的發現來判斷特征之間的因果關系,可能會陷入將相關性視為因果關系的陷阱[28]。
綜上所述,本文通過對流程挖掘相關算法(流程發現、一致性檢查)和流程問題根因分析方法的比較分析發現,考慮到港口物流流程數據的復雜性,改進的流程發現算法(Split Miner、Inductive Miner)可用于挖掘高質量的港口物流流程模型,發現更多流程細節來支持流程偏差根因分析;分類決策樹具有可解釋性強等優點,可用于進行流程偏差根因分析,但該方法仍存在一些缺陷。這些發現進一步明確了相關方法對解決本文研究問題的適用性與缺陷,為后續構建面向流程偏差根因分析的港口物流流程挖掘方法提供了理論基礎。
2 面向流程偏差根因分析的港口物流流程挖掘方法
本章針對引言部分提到的已有研究在港口物流流程偏差根因分析方面的不足,基于相關方法,為解決本文研究問題的適用性與缺陷提出了一種面向流程偏差根因分析的港口物流流程挖掘方法(圖1)。該方法分為數據提取和預處理、港口物流流程績效分析、港口物流流程模型自動發現、港口物流流程一致性分析和港口物流流程偏差根因分析五個階段,其步驟將在2.1~2.5節中進行介紹。
2.1 數據提取和預處理
由于大多數港口物流信息系統的關注點往往在于實現物流流程的自動化,不是標準的工作流系統,通常沒有現成的事件日志。本階段進行以下操作獲取有效的事件日志:
a)物流活動識別。信息系統中,一個完整流程中多個物流活動的實際執行信息會保存在多個表中,可以根據表之間的字段依賴關系將流程中的物流活動識別出來。
b)物流屬性選擇。除了基本的活動名稱、時間戳等信息外,也可以根據分析目的選取其他流程屬性,如貨物類型、活動執行人等,為進行流程偏差根因分析提供支持。
c)數據清洗。提取數據并處理成事件日志后,需要清洗事件日志以滿足挖掘算法要求,例如,剔除不完整的流程實例,填補和修改缺失值和異常值,剔除明顯錯誤的記錄等。
2.2 港口物流流程績效分析
本階段的主要目的是發現實際港口物流流程中影響物流績效的因素,并在后續流程偏差根因分析中考慮將這些因素轉換為實例屬性,并探究其對流程偏差的影響。
績效分析包括流程瓶頸識別和性能比較等,進行績效分析有助于分析物流流程的流程偏差等異常和持續優化業務流程[31]。港口物流的動態性會導致物流績效受多種因素影響,物流活動分析可以找出各種因素對物流績效的實際影響[11,32]。本階段通過以下步驟對物流流程進行績效分析:
a)根據應用場景中的問題背景選擇物流績效指標;
b)統計事件日志中的相關物流活動進行績效指標計算,分析影響物流績效的因素,并討論這些因素對流程偏差可能產生的影響。
2.3 港口物流流程模型自動發現
本階段的主要目的是發現事件日志中蘊涵的港口物流流程,通過獲得不同抽象級別的流程模型,分析實際港口流程中物流活動的執行細節,為流程偏差根因分析提供支持。
流程發現經常從事件日志中生成控制流模型,可用于分析實際流程中物流活動的執行順序。港口物流流程數據具有高復雜性,已有研究使用的流程發現算法會挖掘出低質量的流程模型,從而影響實際港口物流流程問題的發現和根因分析。為了解決這一問題,本文通過對流程發現算法的對比分析,提出可以結合Split Miner和Inductive Miner來挖掘出高質量的港口物流流程模型。因為,Split Miner能夠:a)處理根據事件日志生成的直接跟隨圖中相鄰節點之間的并發性、沖突和因果關系,保證發現無死鎖的流程模型;b)從復雜事件日志中過濾掉無效路徑,快速發現復雜性低的控制流模型,同時最大化地平衡流程模型的擬合度和精確度。Inductive Miner能夠處理復雜的事件日志,對事件日志中的不完全性、噪聲和低頻路徑具有魯棒性,生成的直接跟隨圖模型具有高可解釋性。港口物流流程模型自動發現具體步驟如下:
a)先用Split Miner從整個事件日志中發現簡單可靠的流程模型,初步分析實際港口物流流程主要路徑的結構特點;
b)針對上一步發現的流程模型中的復雜子流程,用Inductive Miner從事件日志中發現直接跟隨圖,詳細分析實際港口物流流程的路徑信息。
2.4 港口物流流程一致性分析
本階段的主要目的是分析實際港口物流流程和標準流程之間的業務一致性和具體流程偏差,并對主要流程偏差進行討論。
流程一致性分析旨在全面檢測出實際流程和標準流程之間不一致的地方。一致性分析需要輸入事件日志和標準流程模型,選擇度量指標(例如擬合度)來量化二者之間的業務一致性,并分析存在的流程偏差。本階段使用基于對齊的一致性檢查方法[23]分析實際港口物流流程和標準流程之間的業務一致性。對齊將事件日志與標準模型的執行流程連接起來(表1),表1第一行表示事件日志中某一實例中事件的執行流程或>>,第二行表示標準模型執行流程或>>,表中的每一列就是對齊的一個移動,分為以下三種:
a)同步移動,實例軌跡中的事件和模型流程中的事件一致,如(a, a),表示實例和模型流程以相同的方式執行。
b)日志移動,實例軌跡的一個事件表明一個活動應該被執行,但依據模型該活動不能被執行,如(b, >>),表示實例和模型之間存在偏差。
c)模型移動,一個活動依據模型應該被執行,但實例軌跡中沒有相應的事件,如(>>, c),也表示實例和模型之間存在偏差,模型中的活動被跳過。
表1所示只是一種可能的對齊,對于相同的實例軌跡和模型流程,可能存在很多對齊。一致性檢查是基于最優對齊,即盡可能以最少的偏差將實例軌跡和模型流程連接起來的對齊。該方法可以針對每個實例提供詳細的診斷,指出某個特定的活動經常被跳過,能在事件級別分析具體流程偏差。
2.5 港口物流流程偏差根因分析
本階段的主要目的是分析港口物流流程發生某偏差的根本原因,為相關部門根據原因制定針對性的優化方案提供支持。
一些流程偏差的發生可能是多種因素的結果,需要對其進行系統化的根因分析。港口物流活動受多種因素影響,已有研究并不能系統化地分析出復雜流程偏差發生的根本原因。為了解決這一問題,本文通過對根因分析方法的對比分析,提出分類決策樹可以用于港口物流流程偏差根因分析,因為決策樹具有可解釋性強等優點,已被廣泛應用于從事件日志中提取部分屬性值和類別的組合規則來分析異常流程的原因。但僅發現部分屬性值和類別的關系進行根因分析存在不精確分析的風險[30]。而?;鶊D可用于分析復雜的多步驟流程,因為?;鶊D能夠可視化流程在任意屬性值上的數據流向,顯示流程從一種屬性值轉換到另一種屬性值的可能性和可變性[33]。在進行港口物流流程偏差根因分析時,為了確保根因分析結果的可靠性和完整性,提出用桑基圖進一步分析流程實例在任意屬性值間的轉換趨勢,用于獲得使用決策樹進行分析的隱藏見解。港口物流流程偏差根因分析的具體步驟如下:
a)流程偏差數據準備。確定所要分析的流程偏差,從事件日志中根據對應流程活動發生的時間戳大小對流程實例進行分類(正常/偏差),并提取可能影響這一流程偏差的屬性,整合類別數據和屬性數據形成流程偏差數據。
b)用C5.0算法挖掘流程偏差數據的分類決策樹模型,用于提取流程實例部分屬性值和類別之間的規則。
c)繪制流程偏差數據的?;鶊D,用于分析流程實例在任意屬性值間的轉換趨勢。
d)結合步驟b)c)的分析結果,確定流程偏差的影響屬性及影響機制,在此基礎上與港口物流管理人員進行探討,系統化地分析流程偏差發生的根本原因。
3 案例分析
本文以國內某大型港口為例進行方法驗證和案例分析。該港口的物流信息系統自2009上線以來,保持24 h不間斷運行,記錄了港口進出口業務流程中各物流活動的發生時間、貨物屬性等豐富數據,平均每秒鐘都會產生一條新數據。這些累積的海量數據,是應用本文方法進行流程偏差根因分析的重要基礎。
在該港口的整個物流流程中,貨物裝卸服務是其核心業務,主要是指貨物通過大船卸到港口和客戶通過車、卡、駁的方式進行提貨,將貨物運出港口,其中實際提貨流程涉及到的人員廣、活動多、憑證單據復雜,流程具有復雜靈活的特點。相關研究指出,該港口的實際提貨流程和港口物流信息系統中的標準流程經常出現偏差。例如,部分流程實例在沒有確保所有單據計費流程終止的條件下,就進行出庫單完單,這存在管理風險[2,6]。因此,本文以該港口的提貨流程進行方法驗證和案例分析。
表2提供了該港口提貨流程涉及到的活動(從簽訂長期/單船合開始,到出庫單完單結束),圖2是提貨流程的標準模型。
3.1 提貨流程數據提取和預處理
提貨流程中涉及到的物流活動信息存在于該港口物流信息系統的各種物流單據中(如出庫單、地磅單等),這些單據中都有出庫單號這一字段,可以根據出庫單號從這些單據中識別出流程活動,并以出庫單號作為流程的實例編號。在這一階段,選擇的活動屬性除了活動標識和時間戳外,還包括貨物類型、貨名、貿易方式、執行人、支付方式和客戶。由于港口數據保密,對部分活動屬性值進行匿名化。為了分析的可靠性,需要剔除不完整流程實例和填補缺失值,最終事件日志有1 622個流程實例。表3展示了事件日志片段。
3.2 提貨流程績效分析
在這一階段,使用Disco對提貨流程進行績效分析。港口物流作為一項勞動密集型任務,港口資源的預測不佳或規劃不當會對港口物流流程造成影響[34]?;诖耍疚陌咐x擇提貨流程中不同時間的事件發生個數、不同貨類的流程實例持續時間作為績效指標進行分析。
1)不同時間的事件發生個數
提貨流程具有靈活性,不同時間事件發生個數可能會有所不同,分析事件發生個數隨時間的變化規律有助于幫助港口提前進行相應的資源調整。圖3展示了不同時間的事件發生個數。
圖3表明在日志時間線(橫軸)同事件數量(縱軸)建立的空間矩陣中會規律性地出現頂峰,例如有幾處頂峰分別發生在2022-10-25、2022-11-28、2022-12-27,由此可推測每月月末是流程事件發生的高峰期??紤]到整個提貨流程需要人工確認各種文件以保障流程的有序進行,在每月月末,業務量的加大會增加執行人的作業壓力,可能出現因辦單不及時造成流程擁擠和流程偏差等問題。
2)不同貨類的流程實例持續時間
實際提貨流程中不同流程實例的持續時間有較大差異,且由于簽訂合同或付費活動的持續時間不太具有參考價值,所以選擇T2~T14這一子流程的持續時間進行分析。該子流程所有實例的平均持續時間為64天,由于貨類對貨物的存儲期和裝卸效率有很大影響,研究了該指標超過64天的實例的主要貨類分布,結果如表4所示。
表4表明貨類1和4的實例持續時間超過平均時間的相對比率較低,說明這些貨類的實例持續時間普遍較短,而貨類2和3的實例在港口停留時間較長。這一現象也可能與流程偏差有關,需要后續進行流程偏差根因分析才能進一步洞察。
3.3 提貨流程模型自動發現
在這一階段,分別對實際提貨流程的主要模型和復雜子流程的詳細模型進行自動發現,分析實際提貨流程中的物流活動執行細節,為后續流程偏差根因分析提供支持。
a) 首先用ProM中的Discover BPMN model with Split Miner插件發現主要的控制流模型(圖4說明:為了顯示的緊湊性,對模型布局進行了調整)??梢园l現,實際提貨流程中的物流活動執行路徑基本符合標準模型,但T1~T14的子流程存在分支和自循環路徑。這些路徑增加了流程的復雜性。
b) 進一步用ProM中的Mine with Directly Follows visual Miner插件詳細分析T1~T14的子流程,圖5是發現的直接跟隨圖(設置顯示80%的路徑),其中,綠色和紅色圓圈分別代表流程開始和結束(參見電子版),每個節點代表流程中的一種活動,邊代表活動間的路徑關系,數字代表活動或路徑的發生次數。可以發現,不同活動及活動之間的路徑執行次數存在差異,也存在一些低頻路徑不符合標準模型的情況。這些信息反映了實際提貨流程的靈活性,對其進行分析有助于更好地了解實際流程執行情況。
結合圖4、5,本文對實際提貨流程中的物流活動執行情況進行以下分析:
a)實際提貨流程主要起始于“T1→T2”這一分支。圖4表明實際流程主要起始于“T1簽訂長期合同”或“T2錄入理貨手冊”,且后續整個提貨流程基本符合標準模型;圖5進一步表明有1 474個實例起始于T1,只有27個實例起始于“T1-1簽訂單船合同”。對于共享同一長期合同的實例,會在開始時直接使用已有的合同,否則需要到港后重新簽訂,簽訂合同是流程起始環節,不及時簽訂合同可能會影響后續提貨流程,造成流程擁擠。
b)“T3理貨手冊綁定合同”未能正常進行。圖4表明流程實例存在跳過T3的情況;圖5進一步表明只有122個實例進行T3。結合提貨流程實際場景得知,進行該活動是為了“T7核發出單”時使用合同信息,不進行T3不影響T4~T6,港口為了方便通常允許在T7前綁定合同到出庫單,這反映了實際提貨流程的靈活性。
c)實際提貨流程主要執行“T13→T14→T15”這一分支。圖4表明“T8辦理地磅單”至“T14補全理貨單”之間的活動會多次有序執行;圖5進一步表明一個流程實例平均需要8次過地磅活動,其主要執行順序為“T8→T9→T10→T11→T12→T13→T14”,同時也存在分支和自循環的情況。與港口物流管理人員討論得知,出庫單經過核發后,一般會分單為多個地磅單通過車、卡、駁的方式同時進行提貨作業,但每個地磅單的作業順序是固定的,這期間生成的多個理貨單需要多次進行T14。
上述分析了實際提貨流程在符合標準流程模型下的物流活動執行情況。此外,實際提貨流程模型(圖5)中的一些其他路徑,如“T4→T8”“T5→T8”“T6→T1-1→T7”等,表明實際流程存在偏離標準模型的情況,后續需要進行全面的流程一致性分析。
3.4 提貨流程一致性分析
在這一階段,使用ProM中的Replay a Log on Petri Net for Conformance Analysis插件分析實際提貨流程和標準流程之間的業務一致性和具體流程偏差,該插件需要輸入提貨流程事件日志和標準模型(圖2),結果顯示二者間的擬合度為0.808 5(圖6),這表明大部分流程實例與標準模型還是匹配的,但仍有小部分偏差。
根據一致性分析的結果,對存在的主要流程偏差進行分析。由于3.3節已經分析了活動T3的相關偏差,本節不再對其進行探討。提貨流程中的主要流程偏差如圖7所示,圖7(a)~(c)分別代表三處流程偏差,每張圖中,活動編號代表流程偏差發生的位置,左邊的數字代表發生日志移動(提貨流程實例表明活動被執行,但依據標準模型該活動不能被執行)的數量,右邊的數字代表發生模型移動(提貨活動依據標準模型應該被執行,但提貨流程實例中沒有相應的事件)的數量。這些信息可以針對每個提貨流程實例提供詳細的流程診斷,能夠分析具體提貨活動的流程偏差,具體分析如下:
a)圖7(a)表明T1-1發生113次模型移動,即提貨流程事件日志的軌跡中“T1-1簽訂單船合同”被跳過113次。通過調研得知,單船合同需要每次到港后簽訂且需要很長時間,導致合同不能及時簽訂,實例在等待簽訂合同期間會選擇執行后續與合同無關的活動。
b)圖7(b)表明T17發生297次模型移動,即提貨流程事件日志的軌跡中“T17出庫單完單”被跳過297次。T17是流程結束環節,不進行該活動會影響信息系統中流程實例執行的完整性。通過檢查港口物流信息系統得知,T17雖然作為流程規定的結束,但是不影響客戶進行實際提貨作業,而且系統也沒有控制必須去執行這個活動。
c)圖7(c)表明T6、T7分別發生278、250次模型移動,即提貨流程事件日志的軌跡中“T6財務確認”被跳過278次,“T7核發出庫單”被跳過250次。與港口管理人員探討后得知,這可能與流程實例先執行“T8辦理地磅單”,后執行“T7核發出庫單”有關,而地磅單是通過對出庫單的結存進行消減才能辦理的,出庫單未經核發不能作為憑證辦理地磅單,否則會加大后面的工作量,從而降低流程的效率并增加流程的管理風險??紤]到會有多種因素造成這一現象,本案例將在3.5節中對這一偏差進行系統化的根因分析。
3.5 提貨流程偏差根因分析
3.4節c)中反映出實際提貨流程中有相當一部分流程實例存在先辦理地磅單后核發出庫單這一流程偏差,本階段對該流程偏差進行系統化的根因分析。
1)流程偏差數據準備
首先,在事件日志中根據核發出庫單和辦理地磅單的時間戳大小對流程實例進行分類(正常/偏差)。其次,通過與港口物流管理人員進行探討,選擇可能影響這一流程偏差的屬性,如表3中已有的屬性:貨物類型、貿易方式、地磅單執行人。另外結合3.2節a)中發現每月月末是流程事件的高峰期和3.4節a)中發現部分流程實例未能及時簽訂合同,這兩個因素也可能造成本節所要分析的流程偏差。因此,從事件日志中生成兩個新屬性:辦理地磅時期(上旬:每月1~10日、中旬:每月11~20日、下旬:每月21~31日)和流程實例在核發出庫單時是否已經簽訂合同(已簽訂、未簽訂)。最后,整合類別數據和屬性數據,得到流程實例偏差數據(表5)。
2)分類決策樹分析
使用IBM SPSS Modeler 18.0的C5.0算法挖掘流程偏差數據的決策樹模型,用于提取實例部分屬性和類別之間的規則??紤]到數據中類別為“偏差”和“正?!睂嵗龜迪嗖钶^大會影響決策樹分類,本文案例選擇了所有的449個類別為“偏差”實例,隨機抽取了600個類別為“正?!睂嵗?,最終決策樹模型(圖8)具有較高的精確度(79.89%),表明流程的屬性值組合與類別有關。其描述的屬性值和類別之間的關系可以轉換為一系列規則(表6)。
3)桑基圖分析
使用可視化工具RAW Graphs 2.0繪制流程偏差數據的桑基圖,用于分析提貨流程實例在任意屬性值間的轉換趨勢。本文案例分析了流程實例在貨物類型、是否簽訂合同、地磅單執行人、實例類別間的?;鶊D(圖9)。其中桑基圖由節點和路徑組成,數據由左邊節點流向右邊節點,每個節點和路徑的寬度分別表示經過節點和路徑流量的大小。
圖9(a)左部路徑的寬度表明相比于其他貨物類型的實例,貨類1和4的實例有更大比例在核發出庫單時尚未簽訂合同;中間節點的寬度及右部路徑的寬度表明大部分實例在核發出庫單時已經簽訂合同,未簽訂合同的實例比已簽訂合同的實例有更大比例出現流程偏差。
圖9(b)左部路徑的寬度表明相比于其他貨物類型的實例,貨類1和4的實例有更大比例經由執行人2和4辦理地磅單;右部路徑的寬度表明經由執行人2和4的實例比其他執行人的實例有更大比例出現流程偏差。
4)確定原因
決策樹發現辦理地磅單時期、貨物類型和地磅單執行人的部分屬性值組合與實例發生偏差有關系,但并不清楚這些屬性值間的轉換關系。結合?;鶊D的結果作進一步分析,桑基圖表明流程實例在“貨物類型→是否簽訂合同→實例類別”和“貨物類型→地磅單執行人→實例類別”的轉換過程中,不同屬性值間的轉換趨勢有所不同。
因此,可以確定辦理地磅單時期、貨物類型、地磅單執行人和是否簽訂合同這些屬性及影響機制會造成流程實例出現“T7核發出庫單”和“T8辦理地磅單”執行順序的偏差。結合決策樹和桑基圖的結果,通過和港口物流管理人員探討,進一步明確該流程偏差發生受以下因素的疊加影響:
a)每月下旬是各種流程事件的高峰期,核發出庫單需要一定時間,業務量的加大會造成不能及時核發出庫單,并產生流程擁擠;而貨物類型為貨類1和4的實例需要更短的物流周期,客戶想通過一次到崗就辦理所有業務;并且地磅單執行人2和4更容易在辦理地磅單時沒有嚴格審核是否已經核發出庫單。大部分實例在以上情況下更容易出現T7和T8執行順序的偏差。圖4和5也表明這種偏差主要發生在流程執行T4或T5之后,就執行T8。
b)簽訂單船合同需要每次到港后進行且需要一定時間,而核發出庫單需要合同內容,辦理地磅單則不需要,圖4和5也表明T1-1通常發生在T7之前,只有少量實例執行“T1-1→T2”這一路徑。這導致有快速辦單需求(貨類1和4)的實例更可能出現未簽訂合同的情況,而實例未簽訂合同通常會造成T7和T8執行順序的偏差。
c)有快速辦單需求(貨類1和4)的客戶和部分地磅單執行人(執行人2和4)業務往來比較頻繁,這部分執行人更容易出現審核不嚴的情況,造成實例出現T7和T8執行順序的偏差。
4 討論
4.1 案例討論
案例分析表明,本文方法能夠準確發現港口物流提貨流程存在的問題,并能分析出發生流程偏差的根本原因。本章對從案例中獲得的見解進行以下討論。
4.1.1 港口物流的擁擠問題
港口物流存在擁擠問題,一方面是由于港口資源配置不合理,無法滿足高峰需求,這符合已有研究[11,34];另一方面,通過自動發現能夠還原更多流程行為的控制流模型,本文發現部分提貨流程設計不合理也會造成擁擠。
a)提貨流程績效分析發現每月下旬是各種流程活動發生的高峰期,業務量加大會增加執行人的作業壓力,導致因辦單不及時而產生提貨流程擁擠。為此,港口物流管理人員可以加強對港口業務量的實時監控,在每月下旬的時候增加執行人數量,減輕執行人的作業壓力。
b)自動發現的實際提貨流程模型表明有較少實例需要簽訂單船合同,且該活動通常發生在“T7核發出庫單”之前,這是因為重新簽訂合同需要到港后進行,不及時簽訂合同通常無法進行T7及后續流程,導致提貨流程擁擠。本文通過調研發現大部分合同都是根據模板生成的,可以通過智能手段提前傳遞合同信息,縮短到港后的合同簽訂時間。
通過進行提貨流程偏差根因分析,本文發現以上造成流程擁擠的因素,也是部分實例先違規辦理地磅單,后核發出庫單的原因。
4.1.2 港口物流標準流程模型不能充分滿足客戶需求
港口物流高度以人為中心,客戶的需求和操作是多樣化的,單一的港口物流執行順序不能滿足客戶的多樣化需求,會增加流程偏差的風險。如:
提貨流程偏差根因分析表明貨物類型為貨類1和4的實例需要快速通過港口,客戶通常會一次辦理所有業務,這增加了辦單順序的不確定性。為此,港口業務部門可以對有快速辦單需求的貨類設立快速辦單通道,以滿足客戶的需求并實現對辦單順序的控制。
4.1.3 執行人的違規操作問題
港口物流由多個物流活動構成,需要人工確認各種文件以保障流程的有序進行[34]。提貨流程偏差根因分析結果表明,執行人的違規操作是提貨流程發生某些偏差的原因。如:
辦理地磅單執行人存在沒有嚴格審核是否核發出庫單就辦理地磅單的違規操作,特別是部分執行人(執行人2和4)長期違規辦理某些貨物類型(貨類1和4)的地磅單。為此,管理部門應加強對執行人的規范操作培訓和檢查,并針對違規行為制定相應的懲罰措施。
4.2 方法框架討論
為了強化港口物流流程中的流程偏差根因分析能力,本文從數據提取和預處理、績效分析、模型自動發現、一致性分析和偏差根因分析五個階段進行了面向流程偏差根因分析的港口物流流程挖掘方法框架研究。本文方法與現有方法的對比結果如下。
4.2.1 與現有方法發現的港口物流流程模型對比
Fuzzy Miner和Heuristic Miner是現有港口物流流程挖掘中常用的流程模型自動發現方法。其中,Fuzzy Miner用于研究港口物流的主要流程,Heuristic Miner用于研究港口物流的詳細流程信息。但這兩種分法都可能會將低頻但關鍵的路徑作為噪聲過濾掉,或產生不合理的模型。本文在港口物流流程模型自動發現階段,首先使用Split Miner挖掘主要流程,然后使用Inductive Miner來挖掘復雜子流程的詳細流程信息。
1)Split Miner與Fuzzy Miner發現的模型對比
在挖掘本文案例提貨流程日志數據的主要流程模型時,圖4是使用Split Miner的挖掘結果,圖10是使用Fuzzy Miner的挖掘結果。比較圖4和10可以發現,圖4能夠快速、準確地反映實際提貨流程的結構特點,并且在保持模型低復雜性的同時保留了流程中的相關活動及路徑;圖10顯示的提貨流程比較混亂,不能快速分析出流程的結構特點,而且會把流程中的低頻活動(活動T1-1、T3、T4、T5、T6、T7和T15)及路徑聚合成新的活動(在圖10用紅色圓圈標出),從而無法使人們分析這些活動的執行信息。
2)Inductive Miner與Heuristic Miner發現的模型對比
在挖掘本文案例提貨流程中復雜子流程日志數據的詳細流程模型時,圖5是使用Inductive Miner的挖掘結果。圖11是使用Heuristic Miner的挖掘結果,圖11中的每個方框代表提貨流程中的一種活動,邊代表活動間的路徑關系,數字代表活動或路徑的發生次數,圖11中的信息雖然能在一定程度上顯示實際提貨流程的執行細節,但不能有效地表達低頻路徑和復雜流程部分。比較圖5和11可以發現,圖5顯示了詳細的路徑信息,能夠很好地處理復雜流程部分,也能夠發現流程中的低頻路徑;圖11“T8→T9→T10→T11→T12→T13→T14”這一部分比較不合理(在圖11用紅色方框標出),沒有像圖5那樣顯示出這些活動的主要順序關系,而且圖11過濾掉了一些低頻路徑,例如“T4→T8”“T1-1→T2”和“T3→T4”(在圖11用紅色箭頭標出)。案例分析表明,圖5中的這些低頻路徑為提貨流程中的偏差分析提供了支持。
以上對比顯示,在港口物流流程模型自動發現階段,使用Split Miner和Inductive Miner算法從不同抽象級別來發現簡潔、合理、還原更多流程行為的流程模型,能夠更準確地發現實際流程執行細節,為后續流程偏差根因分析提供支持。
4.2.2 對比兩種方法進行港口物流流程偏差根因分析的結果
Wang等人[11]提出了一套由流程發現、績效分析和一致性檢查相關技術構成的方法,以獲得港口物流流程知識,但該方法不能對港口物流流程偏差進行根因分析,造成港口物流流程偏差分析能力較弱。本文對該方法進行了延伸,加入港口物流流程偏差根因分析階段。首先,使用分類決策樹提取流程實例部分屬性值和類別之間的規則;考慮到僅使用決策樹存在不精確分析的風險,使用桑基圖進一步分析流程實例在任意屬性值間的轉換趨勢。案例分析結果表明,這兩種方法成功發現了港口物流流程偏差的影響屬性及影響機制。以下是使用兩種方法的分析結果對比。
在對港口物流流程偏差進行根因分析時,圖8是使用分類決策樹分析的結果,圖9是使用?;鶊D分析的結果??梢园l現:圖8顯示了流程實例類別與辦理地磅單時期、貨物類型和地磅單執行人之間的規則,這些規則在一定程度上解釋了港口物流流程偏差的影響屬性及影響機制,但并不清楚流程實例在這些屬性值間的轉換關系;圖9則顯示了流程實例在貨物類型、是否簽訂合同、地磅單執行人和流程實例類別間的轉換趨勢有所不同,進一步明確了港口物流流程偏差的影響屬性及影響機制。
以上對比顯示,本文在港口物流流程偏差根因分析階段,結合決策樹和桑基圖進行分析,這兩種方法的結果既有相同之處也有各自的發現,在最后確定原因時結合二者的結果進行分析,確保根因分析結果的可靠性和完整性。
綜上,與現有方法作對比,本文方法能發現實際執行流程的更多細節,為流程偏差根因分析提供支持,并可以對流程偏差進行系統化的根因分析,強化了港口物流流程偏差分析能力,從而驗證了本文方法的有效性和科學性。
5 結束語
本文提出了面向流程偏差根因分析的港口物流流程挖掘方法。該方法從港口物流信息系統中進行事件日志提取和預處理,接著對事件日志進行以下分析:首先,對事件日志中的港口物流活動進行流程績效分析,發現影響流程績效的因素并將其作為可能造成流程偏差的屬性;其次,使用Split Miner、Inductive Miner自動發現實際流程模型,分析實際港口流程執行細節,為后續流程偏差根因分析提供支持;然后,通過基于對齊的一致性檢查方法,分析實際港口物流流程和標準流程之間的業務一致性和具體流程偏差;最后,基于分類決策樹和桑基圖這兩種方法,對具體港口流程偏差進行系統化的根因分析。通過在國內某大型港口物流提貨流程上的實際應用,發現了港口物流擁擠、港口物流標準流程模型不能充分滿足客戶需求和執行人違規操作有關方面的問題是提貨流程發生流程偏差的根本原因,并提出了針對性的管理洞察,驗證了本文方法的適應性。
未來的工作可以從以下兩個方面進行改進:首先,在數據提取和預處理階段,本文僅考慮了港口物流信息系統中與流程活動相關的屬性,未來研究可以與其他來源的數據結合起來;其次,在港口物流流程一致性分析階段,由于研究數據規模并不是很大,本文所使用的基于對齊的一致性檢查方法未考慮在大型事件日志上的耗時問題,未來應引進更高效的一致性檢查方法。
參考文獻:
[1]Hsu C T,Chou M T,Ding J F. Key factors for the success of smart ports during the post-pandemic era[J]. Ocean & Coastal Management,2023,233: 106455.
[2]王英. 港口物流中的流程知識挖掘研究和智能優化設計[D]. 北京: 北京交通大學,2014. (Wang Ying. Research on process mining in port logistics andintelligent design for the process improvement[D]. Beijing: Beijing Jiaotong University,2014.)
[3]Irannezhad E,Prato C G,Hickman M. An intelligent decision support system prototype for hinterland port logistics[J]. Decision Support Systems,2020,130: 113227.
[4]Zerbino P,Aloini D,Dulmin R,et al. Process-mining-enabled audit of information systems: methodology and an application[J]. Expert Systems with Applications,2018,110: 80-92.
[5]中華人民共和國海事局. 以案為鑒|引航安全不容忽視[EB/OL]. (2022-02-14) [2023-12-12]. https://www.msa.gov.cn/page/article.do?articleId=7812C350-4F25-4B18-8449-72A7EBD-57586. (Maritime Safety Administration of the People’s Republic of China. Learn from cases safety cannot be overlooked[EB/OL]. (2022-02-14) [2023-12-12]. https://www.msa.gov.cn/page/article.do?articleId=7812C350-4F25-4B18-8449-72A7EBD-57586.)
[6]孫迪. 散雜貨港口商務管理流程挖掘研究[D]. 北京: 北京交通大學,2018. (Sun Di. Research on process mining in bulk and groceries port business management[D]. Beijing: Beijing Jiaotong University,2018.)
[7]Jia Xiaohui,Zhang Donghui. Prediction of maritime logistics service risks applying soft set based association rule: an early warning model[J]. Reliability Engineering & System Safety,2021,207: 107339.
[8]Van der Aalst W M P. Process mining: a 360 degree overview[M]. Berlin: Springer-Verlag,2022: 3-34.
[9]Veenstra A W,Harmelink R L A. Process mining ship arrivals in port: the case of the port of antwerp[J]. Maritime Economics & Logistics,2022,24(3): 584-601.
[10]Zerbino P,Aloini D,Dulmin R,et al. Towards analytics-enabled efficiency improvements in maritime transportation: a case study in a mediterranean port[J]. Sustainability,2019,11(16): 4473.
[11]Wang Ying,Caron F,Vanthienen J,et al. Acquiring logistics process intelligence: methodology and an application for a Chinese bulk port[J]. Expert Systems with Applications,Elsevier,2014,41(1): 195-209.
[12]Li Keyi,Marsic I,Sarcevic A,et al. Discovering interpretable medical process models: a case study in trauma resuscitation[J]. Journal of Biomedical Informatics,2023,140: 104344.
[13]Augusto A,Conforti R,Dumas M,et al. Split miner: automated discovery of accurate and simple business process models from event logs[J]. Knowledge and Information Systems,2019,59(2): 251-284.
[14]Sarkar B D,Shankar R,Kar A K. Severity analysis and risk profiling of port logistics barriers in the industry 4.0 era[J]. Benchmarking: An International Journal,2023,30(9): 3253-3280.
[15]Leemans S J,Fahland D,van der Aalst W M P. Scalable process discovery and conformance checking[J]. Software & Systems Modeling,2018,17: 599-631.
[16]劉聰,程龍. 流程挖掘: 技術與應用概述[J]. 中國科技產業,2021(7): 50-51. (Liu Cong,Cheng Long. Process mining: techno-logy and application overview[J]. Science & Technology Industry of China,2021(7): 50-51.)
[17]Weijters A,Van der Aalst W M P,De Medeiros A. Process mining with the heuristics miner-algorithm[J]. Technische Universiteit Eindhoven,2006,166: 1-34.
[18]Gyunther C W,Van der Aalst W M P. Fuzzy mining-adaptive process simplification based on multi-perspective metrics[C]// Proc of the 5th International Conference on Business Process Management. Berlin: Springer,2007: 328-343.
[19]朱銳,張志幸,莫啟,等. 支持復雜結構的混成過程挖掘方法[J]. 計算機集成制造系統,2018,24(7): 1653-1670. (Zhu Rui,Zhang Zhixing,Mo Qi,et al. Hybrid process mining method supporting complex structures[J]. Computer Integrated Manufacturing Systems,2018,24(7): 1653-1670.)
[20]Augusto A,Carmona J,Verbeek E. Advanced process discovery techniques[M]. Berlin: Springer,2022: 76-107.
[21]白少康,方賢文,錢陳婧. 基于數據影響的業務流程一致性檢查方法[J]. 計算機應用研究,2024,41(2): 540-547. (Bai Shaokang,Fang Xianwen,Qian Chenjing. Business process conformance checking method based on data impact[J]. Application Research of Computers,2024,41(2): 540-547.)
[22]Rozinat A,Van der Aalst W M P. Conformance checking of processes based on monitoring real behavior[J]. Information Systems,2008,33(1): 64-95.
[23]van der Aalst W M P,Adriansyah A,van Dongen B. Replaying history on process models for conformance checking and performance analy-sis[J]. WIREs Data Mining and Knowledge Discovery,2012,2(2): 182-192.
[24]沈曉林,劉聰,李會玲,等. 基于流程模型分解的分布式合規性檢查方法[J/OL]. 計算機集成制造系統. (2023-03-30). https://kns.cnki.net/kcms/detail/11.5946.TP.20230329.1714.003.html. (Shen Xiaolin,Liu Cong,Li Huiling,et al. Distributed conformance checking method based on process model decomposition[J/OL]. Computer Integrated Manufacturing Systems. (2023-03-30). https://kns.cnki.net/kcms/detail/11.5946.TP.20230329.1714.003.html.)
[25]Suriadi S,Ouyang Chun,Van der Aalst W M P,et al. Root cause analysis with enriched process logs[M]// La Rosa M,Soffer P. Business Process Management Workshops.Berlin:Springer,2013:174-186.
[26]Ferreira D R,Vasilyev E. Using logical decision trees to discover the cause of process delays from event logs[J]. Computers in Industry,2015,70: 194-207.
[27]Bozorgi Z D,Teinemaa I,Dumas M,et al. Process mining meets cau-sal machine learning: discovering causal rules from event logs[C]// Proc of the 2nd International Conference on Process Mining. Pisca-taway,NJ: IEEE Press,2020: 129-136.
[28]Qafari M S,van der Aalst W M P. Feature recommendation for structural equation model discovery in process mining[J/OL]. Progress in Artificial Intelligence. (2022-06-25). https://doi.org/10.1007/s13748-022-00282-6.
[29]Cai Min,Wu Miaohuan,Luo Xinggang,et al. Integrated framework of kansei engineering and kano model applied to service design[J]. International Journal of Human-Computer Interaction,2023,39(5): 1096-1110.
[30]Qafari M S,van der Aalst W M P. Case level counterfactual reasoning in process mining[M]// Nurcan S,Korthaus A. Intelligent Information Systems. Berlin: Springer,2021: 55-63.
[31]Mahabir R J,Pun K F. Revitalising project management office operations in an engineering-service contractor organisation: a key perfor-mance indicator based performance management approach[J]. Business Process Management Journal,2022,28(4): 936-959.
[32]Berberoglu Y,Kazancoglu Y,Sagnak M. Circularity assessment of logistics activities for green business performance management[J]. Business Strategy and the Environment,2023,32(7): 4734-4749.
[33]Otto E,Culakova E,Meng Sixu,et al. Overview of sankey flow diagrams: focusing on symptom trajectories in older adults with advanced cancer[J]. Journal of Geriatric Oncology,2022,13(5): 742-746.
[34]Sarkar B D,Shankar R,Kar A K. Port logistic issues and challenges in the industry 4.0 era for emerging economies: an India perspective[J]. Benchmarking: An International Journal,2023,30(1): 50-74.
收稿日期:2023-12-09;修回日期:2024-03-06 基金項目:國家自然科學基金資助項目(72371086,72171064,61902222);山東省泰山學者工程專項基金資助項目(tsqn201909109);山東省自然科學基金優秀青年基金項目(ZR2021YQ45);山東省高等學校青創科技計劃創新團隊項目(2021KJ031)
作者簡介:蔡敏(1973—),女,浙江溫州人,副教授,博士,主要研究方向為人因與工效學、數字化工程與管理;王學濤(1998—),男,河南周口人,碩士,主要研究方向為流程挖掘;宋容嘉(1992—),女(通信作者),遼寧沈陽人,講師,博士,主要研究方向為業務流程管理、數字/智化(rongjia.song@hdu.edu.cn);劉聰(1990—),男,山東淄博人,教授,博士,主要研究方向為流程挖掘、業務流程管理;雒興剛(1971—),男,新疆奇臺人,教授,博士,主要研究方向為產品/服務開發、運作管理、質量管理;黃磊(1965—),男,北京人,教授,博士,主要研究方向為企業數字化、信息系統.