陶春華?張鵬程



合同作為所有經濟活動的起點,是企業遵循市場經濟規律的重要體現。合同簽訂流程涉及到大量的審核工作,需要豐富的法律經驗。為了實現對合同全生命周期的管控,利用自然語言處理技術(NLP)進行合同文本分析,通過建立判示模型,對合同文件中的問題進行自動判別,能更加精準地把握合同簽訂全流程中存在的風險,有助于建立健全風險信息預警機制,提高企業合同風險管理工作水平和效率。
一、引言
國企經濟活動具有項目繁多、資金量大、周期長和關系技術革新、生產發展等特點,在采購交易市場中占有重要位置。以國家能源集團大渡河流域水電開發有限公司(簡稱:大渡河公司)為例,當前大渡河公司合同風險審查工作主要依靠人工完成,審核過程可能存在缺乏客觀性,難以避免好人思想、偏好思維,同時,審核工作具有大量重復性、體力性的日常工作。此外,合同流程涉及業務部分的交叉較多,但是前期卻難以直接深入了解,導致前期風險排查不及時,后期容易產生糾紛或不利后果。因此,企業十分有必要加強對合同的合規風險管理,以不斷提高企業經營管理水平和風險把控能力,提升企業的協同作戰水平。
二、研究目標
合同風險診斷系統以智慧企業建設為依托,借助內外部的大數據匯集,利用智能化規則引擎,實現固化業務的智慧化解決方案,提升業務前期的參與度,有利于架構新型的企業合同風險智慧管控模式。
(一)將審核人員從重復性工作中解放,投入風險判示數據庫建設
目前大渡河公司合同風險管控工作基本都依靠人、依賴人,大量重復性、體力性的日常工作也都由人完成,通過實現固化業務的智能化診斷,將審核人員從重復性工作中解放出來投入到風險判示數據庫的建設。
(二)將審核人員個人經驗轉變為企業合同風險管控知識沉淀
將審核人員個人的合同風險判斷經驗,通過合同風險判示模型庫的建立,形成企業在合同風險管控方面的知識沉淀。
(三)杜絕重復性出現的頑疾,降低合同風險造成糾紛的概率和損失
通過總結合同風險審核過程中重復性出現的頑疾,將其形成風險判示模型,通過智能化的風險管控機制,降低合同風險造成糾紛的概率和風險。
(四)杜絕合同審核中人為因素造成風險遺漏
合同審核過程中完全依賴人工審核,存在缺乏客觀性,難以避免好人思想、偏好思維的問題,通過自動的風險判示模型提高合同審核的客觀性,降低人為因素造成的風險遺漏。
三、核心業務模型
合同風險診斷系統的業務模型由數據的匯聚、處理、判示、預警四部分組成,各部分具體內容為:
(一)數據匯聚
平臺的數據匯聚主要由供應商信息、法規制度、項目基礎信息、合同文本文檔組成。供應商信息通過內部的國家能源招標網和國能E購以數據導入的形式獲取,通過外部的企查查等以數據接口形式獲取,將兩者獲取的數據進行數據清洗后生成完整的供應商數據庫;法規制度通過人工上傳電子文檔并利用智能文本解析算法自動分解章節條目,生成法規制度數據庫;項目基礎信息是通過對接集團ERP等系統獲取,在ERP等系統創建新項目時,平臺自動獲取相關項目基礎信息,如果存在部分信息獲取不全的情況,支持人工補錄,錄入的方式以下拉菜單選擇為主,以保證數據的規范性;合同文本文檔是在項目進入合同審核流程時人工上傳,支持Word文件格式,上傳后系統自動對合同文本進行結構化解析。
(二)模型配置
平臺的數據處理是通過風險判示模型進行的,由于項目各流程判示需求不同,平臺提供建模工具進行判示模型的配置,模型分為事實傾向型(文本比對型)和數值比較型,根據不同判示類型,建模工具提供不同配置界面;對于事實傾向型(文本比對型),需要選擇參照對象和目標對象,比如:配置資質不匹配的判示模型時,參照對象需要選擇項目基礎信息中的資質要求,目標對象需要選擇供應商信息中的資質信息,在進行風險判示時,平臺按照配置的對象獲取相關信息進行文本比對。對于數值比較型,除了要選擇判示的參照對象和目標對象外,還需要選擇需要進行的數值比較方式,即大于、小于,或等于,比如:配置合同金額超過預算風險的判示模型時,參照對象就是項目進出信息中的項目預算,目標對象就是合同文本文檔中的合同金額,同時設置數值比較方式為大于,在進行風險判示時,平臺按照配置的對象獲取相關信息進行數值比較。
(三)模型引擎
判示模型創建界面提供可視化的組態工具,通過拖拉拽形式的工作流編輯方式,可快速生成風險判示模型。通過構建風險判示模型,實現風險判示模型定義及可視化管理。
判示對象清單:展示系統預設的所有可能作為判示對象的各類信息,包括項目基礎信息、供應商數據、合同文本信息、采購文件文本信息、投標文件文本信息等;
判示依據清單;展示可作為判示依據的所有法規制度信息,支持基于分詞的模糊搜索,可快速查找需要的法規制度依據;
判示方式清單:展示所有系統預設的判示方式,選擇該判示方式后,模型會按照該判示方式的預設操作進行相應的判示;
判示流程繪制區域:可將判示對象清單、判示依據清單、判示方式清單中的任意信息組件拖動到判示流程繪制區域,根據該信息組件的類型決定其顯示方式;拖動連接線到判示流程繪制區域,連接不同信息組件,即可實現組件間的流程關系。
圖 2 模型引擎
(四)供應商數據庫
供應商基礎信息模塊展示通過企查查獲取并進行數據清洗后的所有供應商基礎信息記錄。以列表形式展示所有采集到的供應商基礎信息,提供按供應商名稱快速搜索。
(五)法規制度知識庫
以目錄形式展示所有上傳的業務相關法規制度,支持法規制度名稱-章節-條目三級目錄選擇以查看具體法規制度條例,利用正則表達式實現法規制度的模糊搜索。提供法規制度上傳工具,支持上傳Word格式電子文檔,上傳后系統會自動利用智能文檔解析框架實現法規制度文本文檔的結構化解析工作,生成對應法規制度結構化數據。
(六)風險判示
在風險判示過程中,引入NLP智能輔助提高判示的準確性和高效性,比如:在合同關鍵要素不齊全的判示時,利用詞法分析技術對合同文本如客戶名稱、金額、簽約時間、產權主體等信息結構化抽取,同時,在未找到某項關鍵要素時,利用詞義相似度技術查找類似的信息并給出相似度評價,提高后續人工審查的效率。對于簡單的關鍵要素,使用文本檢索工具對關鍵詞或正則表達式進行全文查找;對于復雜的關系抽取/時間提取,需要使用最新的自然語言理解算法進行智能檢索識別;對于復雜的關鍵要素,在檢索前需要將關鍵要素與解析出來的合同文本目錄進行綁定,縮小關鍵元素的檢索范圍,提高檢索效率,降低服務器性能開銷;對于找到的復雜的關鍵要素,支持人工復核,保障平臺穩定運行。
(七)風險預警
平臺利用風險判示模型將供應商信息和項目基礎信息及合同文本進行風險判示后,輸出風險判示報告。建立風險自動識別、風險提示預警的風險處理流程,通過消息推送、統一待辦等手段實現相應功能。
四、系統實現
根據上述系統流程設計,我們對合同條款構建判示模型,通過對比采購文件合同模板與合同文件,實現差異章節的高亮顯示,如下圖所示,左側為采購文件中合同模板文件章節,右側部分為實際合同內容章節,可以看出,利用NLP技術的實現合同文件比對判式,能夠有效提示合同審核人員合同問題及風險點。
五、結語
本文依托大渡河公司智慧企業建設,設計開發了基于NLP技術的合同風險診斷系統,通過實現內外部數據集成,利用大數據技術、NLP自然語言理解、智能規則引擎技術,實現合同簽約風險診斷風險預警,隨著系統判示模型的不斷豐富和完善,系統實現切實、可行、經濟合理、可實施性強的交易型合同合規風險智慧管控流程,將合同風險管理從業務員單一經驗判斷轉變到與知識庫融合解決的形式,把業務人員從重復性的業務工作中解放出來,投入到風險數據庫建設中,杜絕已出現的合同風險重復性出現的頑疾,真正實現合同風險從事后處理向事前防范和事中控制轉變。本項目的實施有效支持大渡河公司合同風險管控工作的開展,提高合同風險管控工作效率,降低相關風險造成糾紛的概率及損失,合同風險診斷系統也必將為大渡河公司帶來更大的價值。
(作者單位:四川大匯大數據服務有限公司)