皮爾達偉斯·巴吐爾,劉 捷,2*
(1.西南交通大學計算機與人工智能學院,成都 611756;2.可持續城市交通智能化教育部工程研究中心,成都 611756)
網絡信息內容治理已成為國家戰略的重要部分,“網絡信息內容生態治理規定”明確了網絡信息內容治理在治理目標、主體、客體、過程、工具5 個方面的核心要義[1]。近年來,在國鐵企業信息化治理過程中,借助人工智能的AI+內容安全技術能夠高效發現問題,但在發現違規和風險問題之后,如何及時識別事件類別、判斷風險級別、定位響應部門、決策應急預案仍然缺乏研究。劉鐵民[2]指出突發事件情景構建是當前公共安全領域最前沿科學問題之一,采用“情景-應對”的理論與方法,是國內外公共安全領域近年來提出的一種行之有效的科學手段。本文基于“情景-應對”模型和知識圖譜,提出了一種面向鐵路領域在線客服內容違規和風險的應急管理系統和方法。
朱世強等[3]指出知識圖譜等技術的發展,能夠加速將內容安全治理向自動化、智能化、高效化、精準化方向推進,并建議建立健全合法有效的監管機制和人工智能內容安全標準體系。王建亞等[4]對網絡信息內容安全風險進行研判和特征分析,將網絡信息內容安全分為9類,分析了每種風險的內涵和表現,并對各類型風險進行了場景化解構。白文琳等[1]按照戴明環PDCA 循環思路,同時將治理目標、主體、客體、過程、工具等政策要素全部納入,設計了“PDCA-五維要素”治理行動邏輯。范維澄等[5]提出了公共安全體系的三角形模型,突發事件及其應對中存在三個主體:突發事件、承災載體、應急管理。張輝等[6]在面向國家應急平臺體系的基礎科學問題和集成平臺研究中突出了“情景-應對”型決策的重要性。郭世剛等[7]研究了突發事件應急決策方法等演變,將現有決策模型分為經驗直覺法、“預測-應對”模型、“情景-應對”模式三類。仲秋雁等[8]基于知識元構建了非常規突發事件情景模型。王寧等[9]提出了一種基于應急案例的情景決策支持方法。吳艷華等[10?11]研究了“情景-應對”模型在鐵路領域的應用。
在本文創建鐵路領域在線客服違規和風險管理知識圖譜過程中,在客服平臺和相關網站和公眾號采集近年來在客服違規方面發生過的案例,再通過網上檢索到的案例對各個實體的屬性進行保存,通過整合來構建鐵路在線客服違規的事件庫。本文創建的情景模型如圖1所示。

圖1 情景模型
其中,事件(Event)實體是用來存儲所有事件的實體,在識別出鐵路在線客服內容違規和風險后,都存儲在這里,是整個情景模型的主體。用此實體來創建情景表的主體,通過各種屬性來充實事件實體的各個知識內容,此實體的實體父類為情景,與形式為不相交的類,并且沒有添加其他的公理等描述。事件的實例是整個事件的承載者。
將鐵路客服過程中產生的事件實例采集到Protégé 中,如圖2 所示。通過對事件的屬性:事件id、事件類型名稱、事件發生原因、對象、事件發生時間來對應一個唯一的事件,如圖3所示。

圖2 Protégé中的事件實例

圖3 Protégé中事件的對象屬性和數據屬性示例
形式(Form)實體是鐵路在線客服違規的形式,鐵路客服違規通常有多個形式,比如一個事件是文章中所采用的圖片是其他公司所注冊的,此事件的形式就被定義為圖片侵權。事件和形式實體是構建情景表的主體成分,形式實體與事件實體同屬于情景實體父類。此實體的不相交實體為事件。此實體包含的實例包括公眾號文章錯誤,公告消息違規等形式的實例,這些實例構成了事件的形式的集合,將具有相同形式性質的事件打包成一個形式,方便應對措施采取的統一性。
在應急事件發生的過程中,將事件中的相似類型抽象歸納于一起,形成客服違規事件對應的形式,例如,圖片侵權相關、公告消息違規、隱私信息采集告知、公眾號文章錯誤、外部網站發布、客服無法聯系、投訴無門、無法線上退票、字體侵權、客服態度惡劣、非實名購票、app崩潰、客服誤導乘客等。在Protégé中創建形式的實例如圖4所示,圖5展現了主要的數據屬性(形式id、形式名稱)和對象屬性(形式_措施、形式_風險識別)。

圖4 Protégé中的形式實例

圖5 Protégé中形式的對象屬性和數據屬性示例
將唯一的事件id 和形式id 以事件_形式的關系形成聯系,將事件歸合為一個形式,通過形式再來確定所應該采取的應急解決方案。
風險識別(Risk Identification)實體是鐵路在線客服違規后,通過識別風險的等級來確定事件所帶來的影響,根據影響的程度來劃分事件的風險優先級,再根據事件的優先級來確定事件的處理順序。此方法能夠讓事件處理更加有序,通過風險識別來大大縮小事件的影響程度。風險識別的屬性包含:風險類別名稱、風險類別id、優先級、響應速度、影響程度,如圖6所示。風險識別實體是應對計劃中的重要一環,確定事件的等級,其父類為情景,與事件、形式實體為不相交的類。沒有添加其他的公理等內容。此實體包含的實例包括了風險級別1、風險級別2、風險級別3。這些實例中保存了事件的解決順序和帶來影響的數據信息,對事件出現時,能快速、準確、有序地解決事件起到關鍵作用。

圖6 Protégé中風險識別實例的數據屬性示例
在鐵路領域客服違規事件發生的初期,能充分地掌握事件(E)、形式(F)、風險識別(R)等信息,一個事件(E1)通過各個屬性來判斷事件形式(F1),通過事件的事件id(E1)屬性對應一個事件的形式id(F1),以記為(E1?F1)的事件_形式關系來表示具體事件E1的對應形式F1。
通過得到的事件所屬形式,來確定事件所歸屬的形式,進而確定一個形式所對應的風險識別中的風險等級,通過確定的形式id(F1)對應風險類別id(R1),從而從關系形式_風險識別來對應,記為(F1?R1)。通過事件、形式、風險識別的對應關系可得知事件的明確信息為(E1?F1?R1),某事件的詳細情景通過這些關系構建出來。
事件的事件集合表示為(事件、形式、風險識別),也可以將事件集對應事件的情景集合,再通過各個實體的數據屬性來使知識的表示更加詳細。將事件的應對策略創建為事件的應對集,即為(措施、方案),并以這些應對策略中的數據屬性將措施的具體行使方式和措施完成后對后續存在的問題進行精化的解決方式。本文創建的應對模型如圖7所示。
措施(Measure)是與事件、形式、風險識別所構成的情景相對應的應對過程的主體內容,措施擁有措施名稱、措施id、部門等數據屬性。能夠明確采取措施的響應部門,確定了措施在行使的過程是由什么部門來進行,使得分工明確且能夠通過對事件的處理來評定部門的績效。此實體包含的實例包括了取消票的效益并要求乘客實名購票、告知隱私信息采集風險等實例,這些實例集合成了事件應對集的快速響應的解決措施,是直接解決事件的第一步的手段集合。

圖8 Protégé中措施的對象屬性和數據屬性示例
確定事件的具體情景模型的詳細信息后,對情景模型創建應對的模型,通過形式與措施的關系屬性形式_措施來確定事件的應對策略,從措施的數據屬性措施id來確定形式(F1)的對應的措施(M1),將形式和措施形成的關系形式_措施關系記為(F1?M1),以此關系來確定形式為F1的事件所應采取的措施為M1,反向的推理可以推理出事件的完整關系,事件E1 的形式為F1.形式名稱,此形式風險等級為R1.風險類別名稱,所應采取的措施為M1.措施名稱的應對策略。針對每一個不同事件、形式、風險識別的過程有不同的應對策略進行匹配。
方案(Scheme)是指對事件措施的后續補充,方案包括:方案名稱、方案id、方案內容、完成速度,如圖9 所示。方案內容是對事件采取的措施的后續補充,措施完成后,對后續相關的部門進行補救,完整地將事件完成,對后續的影響進一步進行完整的措施;方案中的完成速度是指方案在實行的過程中應該采取的執行速度,執行的速度應不低于方案中規定完成速度。此實體包含的實例包括外部網站發文方案、客服違規方案等一系列方案的實例,這些實例可以用來做措施完成后的后續安排,讓事件的影響逐步消除,直到影響完全消除為止。

圖9 Protégé中的方案實例
在情景-應對模型構建基礎完成后,對措施進行進一步的擴張,因為單純的措施無法完成對事件的后續處置的完善,通過擴展的方案可以完善對事件措施的支援,然后通過措施和方案的關系,將措施M1 和方案S1 聯系起來,將兩者之間的聯系記為M1?S1。所以事件的整體聯系為E1?F1?R1和F1?M1?S1。
通過對事件、形式、風險識別、措施和方案的詳細分析,充分明確了事件的形式和風險級別,通過這些明確的信息來確定采取措施,和措施完成后的后續方案的響應主體。這為進一步深入分析事件的應急事件處理打下了基礎。
本文的主題是鐵路客服違規和風險管理知識圖譜,而且要運用到情景應對模型,所以在此基礎上創建知識圖譜的實體,需根據知識圖譜一般構建方法,先構建并識別出鐵路風險管理知識圖譜中的實體,再確定各個實體之間的聯系,定義實體之間的屬性,然后根據實體之間的聯系再進行鐵路領域知識圖譜數據的抽取、融合和存儲。
本文構建鐵路領域在線客服和風險管理知識圖譜采用了Protégé 軟件來進行設計,知識來自于鐵路在線客服平臺的案例抽取,抽取案例的平臺如圖10所示。

圖10 案例平臺示例
本文創建的鐵路領域在線客服違規內容和風險管理知識圖譜中一個完整的關系實例如圖11所示。

圖11 知識圖譜中完整的實例
Protégé 還提供了圖顯示的功能,此功能可將Protégé 所構建的知識圖譜本體所有的內容通過圖的形式顯示出來,如圖12所示。

圖12 知識圖譜可視化
將Protégé 里所創建的鐵路領域客服違規與應急風險管理的知識圖譜本體存儲到Neo4j,就要用到Neo4j 的擴展性包neosemantics。在經過Neo4j 內置操作語句的修改后,將其顯示為最后的實體名稱。導入結果如圖13所示。

圖13 Neo4j圖數據展示內容
Neo4j 中采用了基于路徑的圖索引,基于這種索引所創建的GraphGrep 是一種典型的圖索引。例如:match(n:‘ns0__事件’)return n。此語句可以輸出所有事件的實例,如圖14所示。

圖14 事件查詢
在圖數據庫中還可以利用復雜語句,通過各個實例間所形成的關系來對擁有關系的數據進行查詢,如圖15所示。

圖15 查詢示例
match data=(n:‘ns0__事件’{‘ns0__事件類型名稱’:‘app 異?!?[r:‘ns0__事件_形式’]-(m:‘ns0__形式’)return data。所表示的實際含義為事件類別名稱為app異常的事件所屬的形式是哪個,從圖中可看出事件app 異常的形式為app崩潰的形式。
為驗證本文所提出的基于案例的應急事件處理辦法,對事件客服平臺圖片侵權的案例進行情景-應對模型的驗證。首先是此事件集(事件id:1,形式id:1,風險類型id:1),應對集(形式id:1,措施id:1,方案id:1)。此事件的基本表述為E(客服平臺圖片侵權),事件所對應的形式為F(形式名稱:圖片侵權相關),此類形式F所對應的風險識別R1(風險類別名稱:風險等級1),R1 的優先集為低,影響程度為有損信譽,應該盡快解決,所采取的措施M(措施名稱:撤回信息),措施M所對應的方案為S(方案名稱:侵權方案),此方案所采取的方式為對侵權的圖片、字體等進行整改,對侵權的機構進行道歉,此方案要求的完成速度為不多于1天。
國鐵企業信息化治理過程中,如何借助知識圖譜等人工智能技術將內容安全治理向自動化、智能化、高效化、精準化方向推進,具有重要的意義。本文結合知識圖譜和“情景-應對”模型,提出了一種面向鐵路領域在線客服內容違規和風險的應急管理方法。并采用Protégé和Neo4j進行了知識抽取、知識存儲、和知識應用。并最終以客服平臺圖片侵權的案例對該方法進行了驗證,該方法能夠較好地輔助鐵路領域在線客服內容違規和風險的應急管理。