廖莎莎





摘要:隨著通信運營商市場規模的不斷擴大,在其內部逐漸建立起針對各類業務相關業務風險稽核管控體系,這種風險體系主要是通過在業務稽核系統中配置相關稽核點,實現對已發生的業務風險進行事后的稽核和整改。為保障支撐企業高質量發展,業務風險管理工作急需數據化轉型,通過風險智慧化自動挖掘能力以及構建體系化的數據指標開展預警派單,實現系統自動化的稽核運營。本次社會實踐開展了對省內某通信運營商在企業內部大數據風險控制方面的工作調研,并全程參與了項目實施過程,希望能通過調研了解通信行業風險管控的現狀及存在的問題,從校企合作的角度為企業在大數據風險控制方面提供相關的意見或建議,同時也為企業思考如何數字化轉型提供幫助。
關鍵詞:風險稽核;大數據;風控
中圖分類號:TP311? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)36-0043-03
開放科學(資源服務)標識碼(OSID):
1概述
隨著通信運營商市場規模的不斷擴大,在其內部逐漸建立起針對各類業務發展相關業務風險稽核管控體系,這種風險體系主要是通過在業務稽核系統中配置相關稽核點,實現對已發生的業務風險進行事后的稽核和整改。我們可以簡單理解成初級階段的數字化,即:將原來線下數據管理遷移到IT系統進行管理。
國資委“十四五”推進數字經濟,頒布了《關于加快推進國有企業數字化轉型工作的通知》,此文件中要求國有企業要加快數字化轉型工作,其中重點涉及基礎數字技術平臺打造、系統化管理體系構建和數字化轉型閉環管理機制建立。“實現作業現場全要素、全過程自動感知、實時分析和自適應優化決策,提升生產質量、效率和資產運營水平,賦能企業提質增效”。“增強基于數字孿生體的設計制造水平,加快形成動態感知、預測預警、自主決策和精準執行能力,全面提升企業研發、設計和生產的智能化水平”[1]。
目前運營商基本實現業務風險管理數據導入系統階段,或者說是數字化1.0階段,隨著運營商如云、智能組網、物聯網、智慧家庭、DICT等各類新興業務的拓展以及5G移動互聯網的快速發展,越來越多的用戶、代理渠道、合作商等將享受到因線上業務發展而帶來的便捷體驗,但是由于各種業務變得越來越錯綜復雜,在開放式的互聯網環境中,運營商將面對來自各個方面的惡劣影響,如藹羊毛、營銷欺詐、惡意訂單、系統漏洞等各類風險,從而給企業風險管理工作帶來了前所未有的考驗。
傳統的基于“專家經驗”的業務管理模式,在復雜的業務、市場環境中,某些場景下存在不適應性,已經不能完全滿足復雜場景的業務風險預防、發現和應對。為保障支撐企業高質量發展,業務風險管理工作急需數據化轉型,通過風險智慧化自動挖掘能力以及構建體系化的數據指標開展預警派單,實現系統自動化的稽核運營。
結合在科大國創社會實踐鍛煉的機會,開展了對省內某通信運營商在企業內部大數據風險控制方面的工作調研,并全程參與了項目實施過程,希望能通過調研了解通信行業風險管控的現狀及存在的問題,從校企合作的角度為企業在大數據風險控制方面提供相關的意見或建議,同時也為企業思考如何數字化轉型提供幫助。
2調查結果和分析
2.1 基于收入、成本、受理、資金等維度,構建業務風險稽核模塊
2.1.1 收入方面
合同項目列收規范性稽核:通過對ICT項目合同的解析,實現對相應收入列賬科目的規范性、及時性、真實性的稽核,確保收入真實性。
數據一致性稽核:通過對CRM(客戶關系管理系統)系統受理的業務或功能與后端網元側開通的功能數據一致性的對比,防止因CRM無資料,后端開通導致收入流失,確保前后端數據一致性。
2.1.2 成本方面
代理商傭金稽核:通過系統對CRM受理工單的采集實現代理商傭金的計算、固定稽核點的稽核、發放、清算全流程的線上閉環管控。
2.1.3 受理方面
業務受理合規性稽核:通過接口方式自動采集CRM系統工單,實現CRM業務訂單的100%采集;工單采集后,根據配置好的稽核流程及稽核規則自動稽核;對于稽核出來的異常工單,系統固化派單流程,根據受理工號自動對異常工單進行派發;受理人員進行整改后,系統會觸發再稽核,整改通過的會自動歸檔,減輕各環節稽核人員壓力。
2.1.4 資金方面
營收資金稽核:通過資金稽核模塊實現應繳、實繳、實收稽核,重點圍繞營業尾款;退費合規性稽核,稽核范圍涵蓋全量資金營收資金:現金繳款單、POS票據、支票、銀行托收單、電信卡、省撥資金、互抵資金等業務。
業財差異稽核:通過對用戶在CRM系統與財務賬戶上的欠費和預存款差異分析,防止業財差異導致收入流失。
2.2 借助大數據建模針對企業風險管控相關領域數字化轉型的初探
本次參與科大國創的項目,對運營商代理商傭金領域利用大數據建模進行了初步的研究,通過逐步建設實踐,打造傭金領域的業務風險防護體系。
本次研究主要通過大數據聚類或分類等機器學習算法,建立針對復雜場景的社會渠道套取傭金的風險發現能力。利用Python進行機器學習算法開發,使用Scikit-learn和Tensorflow等機器學習庫,通過K-Means、密度聚類(DBSCAN)等無監督機器學習算法,發現異常風險點,對風險數據打上風險標簽后,通過決策樹和隨機森林等有監督算法,對新發展的客戶業務數據進行風險預測和預警,提高風險處理時效性[2]。
2.2.1 數據準備階段
通過大數據平臺匯聚CRM系統、計費銷賬系統、渠道傭金系統、稽核系統等業務系統生產數據,經過數據清洗、整合,建立客戶和渠道代理商的數據模型,數據模型主要包括以下數據特征:
客戶身份特征:年齡、類型(家庭、個人、商客、政企等)、證件類型等;
客戶區域特征:市、縣、區域、四級單元、五級包區;
客戶產品結構特征:電話數量、手機數量、寬帶數量、ITV數量等;
客戶使用行為特征:通話時長、流量、短信數量、活躍度、開機信息、客戶交往圈、 終端類型、終端串碼等 ;
客戶價值屬性特征:月賬單、套餐類型、價值量、在網時長、繳費金額,客戶發展渠道和代理商、發展成本(傭金、手續費、渠道積分等);
客戶信用歷史特征:最小欠費賬期、最大欠費賬期、欠費金額、停機、拆機歷史;
代理商特征:類型、區域、加入時間、歷史傭金、當月業務量、當月傭金和激勵等。
2.2.2 研究實施階段
通過無監督機器學習發現異常數據,挖掘潛在風險,由于數據特征比較多,先通過主成分分析(PCA)進行降維,降維后的數據可以通過圖形更直觀地進行展示,選取最大似然估計自選超參數,即n_components="mle",輸出結果發現mle自動降成了兩個主成分,且二維主成分累積可解釋方差貢獻率達到96%,故保留兩個主成分,即n_components=2。
但是在聚類算法下,我們實際并不關心某一類具體是什么,最終目的是將這些相似的樣本歸類放在一起。所以,此聚類算法只要知道如何計算樣本之間的相似度,同時將相似的樣本進行歸類即可,聚類算法通常是不需要通過數據訓練學習的,這在機器學習中稱之為“無監督學習”。K-means算法就是這種用于統計的無監督聚類技術。
KMEANS算法需要先確定K值,通過誤方差曲線圖確定K=4為最佳分類,進行聚類后,再對每一類數據特征進行分析,挖掘出傭金和收入拉升比例較低的業務、代理商和客戶,存在套取傭金風險。
選擇客戶收入、客戶產生的傭金,傭金/收入比三個特征,進行密度聚類(DBSCAN),進一步挖掘出傭金高、收入低、收入/傭金比低的客戶和對應發展代理商。
2.2.3 成果形成階段
對異常數據進行核查,確認為風險后,對數據打上風險標簽類型,如疑似代理商養卡套傭等。對于新增業務發展數據,通過有監督機器學習,自動識別出有風險的數據,進行風險預警,及時進行處置,避免發生套傭損失。
應用成果案例——通過隨機森林算法對疑似養卡用戶進行預測預警:
隨機森林指的是利用多棵樹對樣本進行訓練并預測的一種分類器,其輸出的類別是由個別樹輸出類別的眾數而定。隨機森林算法被廣泛使用,對于不平衡的分類資料集來說,它可以平衡誤差,即便沒有超參數調優,在大多數情況下也能得到很好的結果,并且學習過程快速,是一種靈活且易于使用的機器學習算法[3]。通過隨機森林算法對疑似養卡用戶進行預測,使用召回率、精確率和ROC曲線對模型結果進行評估:
精確率是指預測的正例中真實的正例所占的比例。
召回率是指真實的正例中預測為正例所占的比例。
AUC指的是ROC曲線下的面積大小,可通過沿著ROC橫軸做積分計算得到,該值能夠量化地反映基于ROC曲線衡量出的模型性能。AUC取值一般在0.5~1之間,AUC值越大,模型性能越好。
此模型召回率達到83.6%,精確率達到80.3%,AUC值為0.92,模型性能較好。
2.2.4 初步成效
本項目在某運營商進行實施以來,基于傭金領域建立了多個風險控制模型,挖掘了多個風險場景,應用效果良好,通過挖掘潛在風險金對已發放的傭金行清算,或對復雜的風險實現了提前預警攔截,從項目開始至2020年底,給該公司挽回和避免成本損失600多萬元。
2.3 存在問題
目前,該運營商已經展開有關業務稽核方面的工作領域有:業務合規性領域、渠道傭金領域、SP/CP合作分成類領域、移動固網終端領域、營收資金等[4],并嘗試通過大數據構建系統模型發現和挖掘復雜場景的風險,傳統運營商從基于經驗的風險挖掘到智慧化風險挖掘已經邁出了一大步,但還有一定的不足,主要體現在三方面:
第一,尚未系統地構建完善的基于大數據體系下的風險控制體系。
第二,尚未構建統一管理的流程、標準框架和規范策略。
第三,大數據風險管控覆蓋范圍有待進一步提升。目前還是依賴傳統經驗的風險管控思維,欠缺數字化思維和全流程視角的風險管理思路,特別是針對復雜的風險場景,風險預防能力還急需提升。
3 思考和建議
目前此企業已經在風險管控數字化轉型進行了初探,取得了一定的成果,但是還處于數字化轉型的初級階段,最終要實現整體風險管控的數字化轉型,有以下三方面的建議:
(1)事前智慧化發掘:業務管理工作由事件驅動型(收集風險信息、風險案例等)向數據驅動型轉變。要充分借助大數據技術,通過用戶發展質量、代理商傭金、業務質態變化、收入貢獻等維度分析和整合,挖掘成本、收入、資金等領域風險,輸出業務管理、風險管控等業務規則,提升風險前置識別能力[5]。
(2)事中數據化管理:基于業務規則流程、風險監控預警規則完善優化等,由人工監控向體系化數據指標預警派單轉變。對事前智慧化發掘的源頭問題,通過事中數據化管理完善業務規則和優化業務流程,提高風險事前、事中前置預警能力,構建電路、云、物聯網等新型業務過程監控指標體系,實現對風險體系化數據監控、預警、派單、預防機制。
(3)事后自動化運營:通過已有稽核系統能力優化和整合,減少簡單人工稽核的操作,逐步向自動化稽核運營轉變。通過基礎資源共享,對于事前智慧化發掘的問題開展體系化的掃描,筑牢風險最后一道防火墻,實現風險自動派單,線上接單、核查、整改、反饋,形成閉環管控。
結合此次社會實踐,系統地對企業數字化轉型的知識進行了學習,并結合本次項目對運營商企業數字化轉型進行了思考,提出了一些建議,一個企業如果要真正實現全面數字化轉型,需要從內部培養全員數據思維、深入學習數據、善于運用數據,成為用數、賦能、注智的主體,才能真正實現企業數字化轉型。
一是培養數據思維。數據思維可以極大提升生產效率,為一線注智賦能做好指引,帶來企業的長效增長。企業全員需要具備數據思維,具備挖掘研判內外部數據的能力,才能匹配精準策略。
二是深入學習數據。要學習研究數據怎么入庫、數據如何建模、數據應用場景,通過學習數據來培養數據意識,做到人人心中有數,從對用數有感覺到用數據做貢獻。
三是善于運用數據。要積極使用新技術、新方法、新工具,通過數據建模驗證自己的觀點,通過數據應用形成工作正循環,實現“人人皆可用數”。
參考文獻:
[1] 牛成釗.大數據時代背景下的網絡信息安全與輿情應對分析研究[J].信息通信,2020(4):130-131.
[2] 周志華.機器學習[M].北京:清華大學出版社,2016.
[3] 董師師,黃哲學.隨機森林理論淺析[J].集成技術,2013,2(1):1-7.
[4] 鄭倩倩.大數據背景下智能網絡信息管理系統優化設計[J].信息通信,2020,205(1):180-182.
[5] 宋煜,劉艷超.大數據背景下的計算機網絡安全現狀及優化策略[J].通訊世界,2019,26(8):78-79.
【通聯編輯:光文玲】