程文靜
摘 要:業務流程管理和業務智能化是近年來備受關注的領域。這些技術的應用可以提高業務處理的效率,并且節省了可觀的成本?;趫D的概念(如對象、數據等)表示也被應用于業務領域,作為對上述技術的支持。圖挖掘方法已被成功應用于發現新關系、新知識和可視化等許多領域。本文探討了已成功應用圖形挖掘技術的領域,同時也討論了在業務流程中應用此項技術的優勢和面臨的一些問題。
關鍵詞:圖挖掘;業務流程;圖挖掘應用程序;業務流程分析
中圖分類號:TB ? ? 文獻標識碼:A ? ? ?doi:10.19311/j.cnki.1672-3198.2020.26.078
0 引言
業務流程是企業成功和一個機構正常運轉的重要因素,因此所有的企業總是致力于研究更有效和高效的方式來處理和開展業務。多種不同的技術已被成功地用于實現和管理業務流程。在IT技術中,可以使用工作流管理系統來定義、管理、執行和監控業務,由此工作流程可以被定義為全部或部分業務流程的自動化。在這個自動化處理過程中,在這個過程中,文檔、信息和其他元素會依據步驟規則依次通過各類資源。為了了解業務流程的執行情況和規則,研究者在這個領域做出了大量的研究,并且提出了一些建模語言與分析方法以便于更好地理解和改進業務流程。
基于圖形的概念(對象、數據)表示已被成功應用于許多領域,如化學結構分析、生物信息學、電影票房的預測和流程的成功中止。在這些領域中,實體和其屬性之間的關系信息非常重要,因為它們有助于人們發現新知識。在業務流程管理中,這些新知識可以幫助人們解決與業務流程改進有關的各種問題。問題的種類很多,我們列舉一些常見的。比如,哪些活動會經常執行?已定義好的任務通常通過哪條路徑完成?各個活動、業務對象及它們之間的流和關系具有哪些常見特征和聯系?我們可以在執行成功和失敗的不同情況下發現哪些共同特征?對一個特定的業務流程,預測其是否會達到一個期望的狀態或者執行失敗。我們能在不同用戶業務應用程序的執行中發現哪些共同點?應該如何建構一個組織,來使員工的工作產生最大效益(進行社交網絡分析)?在業務流程的執行過程中,用戶對系統的下一個信息請求會是什么?
上述問題有些已經得到了解決,有些還有待于研究。本文對針對業務流程中元素(對象、數據)的圖形化表示研究提出了進一步的要求。對業務流程中關系知識的挖掘工作來說,用圖形化的方式來表達數據不僅能保留關系信息,還能有效地開展挖掘任務。
本文的結構如下:在第1節中簡要地介紹業務流程和圖形挖掘的基礎知識;在第2節中討論在業務流程管理領域中應用圖形挖掘的優勢;在第3節中我們討論一些關于圖挖掘的其他問題;第4節總結了全文,并展望了未來的工作。
1 圖形挖掘與業務流程
圖由節點和連接節點的邊組成。圖形經常用于概念的可視化表示,它提供了一種簡便的方法來表示實體間的聯系和各自的數據。在圖挖掘中,我們利用關系信息來提取模式和發現新知識。新知識可以是一個子圖模式,一個尚未被發現的和其他元素的聯系,或者是對數據趨勢在更抽象的層次上的表達。
基于圖的表示和圖挖掘技術已經被應用于各種領域,這樣的可視化技術有助于更好地理解和管理任務。例如,在通信網絡中,它可以用于監視和管理復雜網絡,定義連接策略,捕獲流量中的重復模式,檢測路由的不穩定性和網絡外推(設計下一代生成協議等)。它也可用于社交網絡分析,在這一領域已經開發了各種應用程序來分析不同個體之間的關系,如國土安全(犯罪和毒品販運鏈)、生物學計算和網絡搜索。
業務流程是一組相互關聯的活動集合,這些活動按特定順序執行以完成給定的任務。它可以像填寫訂單一樣簡單,或者像執行從選擇供應商到支付賬單的整個訂購過程一樣復雜。業務流程管理要求有效地定義、設計、執行和評估業務活動,并能有效地利用其涉及的各類資源,從而使企業或組織的目標得以實現。為了理解這種復雜性,可以通過對業務流程建模來實現。即針對整個業務流程管理生命周期中的通信、分析和理解問題,以各種語言進行圖形化建模來解決。
除了業務流程數據的不同表示方法之外,我們還要討論兩種工作流程分析的表示方法。在其中一種方法中,活動被表示為節點,其他符號,比如粗線和虛線用于區分AND和XOR結構。第二種方法使用了一種叫作Petri網的二分圖,在這種結構中活動被表示為庫所,行為被表示為變遷。在本文中,我們建議使用后一種符號進行圖形挖掘。Petri網是二分的有向圖,它包括庫所(用圓圈表示)、變遷(用矩形表示),以及用于連接它們的圓弧。庫所表示緩沖區,是評估的條件和制定的決策的存儲位置;變遷表示任務/事件/行為。庫所可以包含特定的標記,用來描述系統在某個特定階段的狀態和相關屬性值。
2 圖挖掘在業務流程中的應用
圖的應用有助于保持元素之間的結構關系,如在化合物結構分析和生物信息學中,圖是表示信息的必要手段。相比較而言,在傳統的方法中,元素之間的關系信息可能會有丟失。在業務流程中,采用基于圖的表示方法的最大的好處之一是有助于發現多個活動間的新關系、它們的屬性和對活動的總體影響。在圖中表示業務流程及其屬性可以保存數據對象和活動之間的聯系,這種聯系對發現關系知識至關重要。媒體行業的研究人員已經利用圖挖掘方法來發掘關系知識。圖挖掘在媒體行業中的應用實例還包括IMDB(互聯網電影數據庫)網站,此網站是一個資源網站,包含大量電影和電視節目的相關信息。用戶可通過在線查詢獲取電影和電視節目的細節信息。在IMDB電影數據庫中使用了圖挖掘技術,其中用圖節點表示電影屬性(演員、導演、制片人等),然后運用圖挖掘方法來發現新的關系和知識。這些知識用于預測某部電影在某一時間段內會有多少票房,以及是否會被某個獎項提名。在該文中作者討論了將圖挖掘技術應用于IMDB系統和一些其他領域得到的結果。