摘 要:供應商管理作為購買者實行信用風險管理的重要前提,高質量的風險管理信息系統得到廣泛實踐。目前,供應商信用風險管理較為零散,供應商信息不全面,這些問題一直阻礙我國電力企業的持續發展。因此,建立供應商信用風險管理方案,采用科學的方法收集和統計實現供應商信用風險管理成為了電力企業工作人員的首要工作。本文簡要地分析了國內外數據挖掘技術的研究現狀,提出了基于大數據分析的電力企業供應商信用風險管理方案。
關鍵詞:數據挖掘;供應商畫像;信用風險
中圖分類號:TP311.13 文獻標識碼:A 文章編號:2096-4706(2019)02-0191-03
Abstract:Supplier management is an important prerequisite for purchasers to implement credit risk management,and high-quality risk management information system has been widely practiced. At present,supplier credit risk management is scattered and supplier information is not comprehensive. These problems have been hindering the sustainable development of China’s power enterprises. Therefore,the establishment of supplier credit risk management program,the use of scientific methods to collect and statistics to achieve supplier credit risk management has become the primary work of power enterprise staff. In this paper,the research status of data mining technology at home and abroad is briefly analyzed,and the supplier credit risk management scheme of power enterprises based on large data analysis is proposed.
Keywords:data mining;supplier portrait;credit risk
0 引 言
在供應商信用風險管理過程中,充分利用好大數據是企業占領市場、獲取利潤的捷徑。將供應商數據化,即構建供應商畫像是企業對供應商信用進行有效管理的重要手段,其目的是供應商信用的全數據描述,根據價值細分供應商,了解供應商信用情況,制定精準的供應商管理方案,為供應商信用管理提供支持。
本文基于對供應商的評價分析管理,通過對供應商信息風險管理中大數據的挖掘、分析,提出供應商畫像的概念,并以此為依據實現不同供應商信用分級管理,同時提出業務和系統的改進策略,以優化供應商之間及供應商與電網企業之間的關系。在保證服務質量的前提下,降低供應鏈運行成本,幫助電網企業建立競爭優勢,獲得更多的客戶滿意度。
1 國內外數據挖掘技術的研究現狀
數據挖掘技術是一種對電力企業信用管理決策提供支持的技術,它主要是基于機器學習、人工智能、統計學等技術對大量的數據進行處理,從而做出歸納性的推理,挖掘出數據中的潛在模式,并對供應商的信用風險進行預測,從而幫助企業的決策者們及時調整市場策略以減少可能存在的風險,做出盡可能少的錯誤決策。
從商業層面上來說,數據挖掘還可以描述為:按照企業既定的業務目標,對海量的業務數據進行探索和分析,從而揭示隱藏的、未知的或者驗證已知的數據的規律性,并進一步將其模型化,用戶興趣模型也就應運而生。根據已有的數據對用戶信用風險進行建模,并進行規則抽取與提煉,得到用戶的畫像。
國內將數據挖掘的技術應用在電信領域的成果案例也不少。比如李軍利用數據挖掘的算法對電信行業的客戶流失模型進行建立與分析,針對不同種類的客戶分別進行了不同模型的流失分析;段云峰、吳唯寧、李劍威等在數據倉庫及電信領域的應用中,運用數據倉庫的方法對電信行業的服務客戶進行存儲管理;吳愛華在數據挖掘在客戶關系管理中的應用研究中,應用了數據挖掘的相關知識來研究數據挖掘算法在用戶關系管理中的應用;葉松云在我國電信行業客戶流失管理的建模分析及應用研究中,通過對電信行業的流失客戶進行模型建構,通過管理這個流失模型來有效控制客戶的流失。
目前南方電網企業和供應商的信息交換處在一種繁雜的狀態,電網企業可以對單個供應商信用情況進行信息的查詢,反饋,但很難通過獲得的信息對多個供應商信用進行有序、有效的管理。供應商的管理缺乏直觀、可視化的手段和方法。通過建立供應商模型可以將紛亂的數據進行清洗和建模,提供進一步的分析決策。
2 基于大數據分析的電力企業供應商信用風險管理
根據以上分析,在電力企業供應商信用風險管理過程中,需要對收集到的供應商數據進行處理,進行行為建模,以抽象出供應商的標簽,這個階段注重的是大概率事件,通過數學算法模型來排除供應商的偶然行為,故需要運用機器對供應商的行為、偏好進行猜測,根據供應商的關注點或投標意向、投標歷史、中標情況等因素來判斷供應商的忠誠度、履約能力、信用等級等,并對供應商行為進行建模。簡單來說,供應商畫像就是通過算法計算等方式,用統一的標準衡量供應商的表現,并對未來發展進行預測,這是一種把單個分析集成化,把平面分析立體化的過程。
可見,在供應商信用風險管理過程中,應結合供應商屬性、行為、評價標簽體系,充分研究數學算法模型,并應用Python、R等工具建模推演,構建供應商評價模型,全面刻畫供應商畫像。
2.1 畫像構建與數據分析
供應商畫像模型旨在幫助管理供應商、優化投標決策,因此畫像構建的關鍵過程在于結合實際業務情況定性地選取投標決策關心的供應商評價指標,定量化評價指標,最后選取合適的評價維度給供應商貼上標簽,通過不同維度的標簽還原供應商的“畫像”。因此,數據處理和分析建模的過程應該基于上述關鍵過程的指標數據特征以及業務分析邏輯。現在針對供應商畫像的研究還不算特別多,我們以流行的“用戶畫像”分析進行對比,從而可以發現供應商畫像和用戶畫像有何異同,從用戶畫像當中又能尋找到什么可行的分析思路。
圖1是用戶畫像的一般流程。可以發現供應商畫像與用戶畫像的建模過程本質上都是數據收集-建模-畫像成型的過程,區別只是在于:首先,畫像構建的目的不同,用戶畫像的目的是進行精準營銷,而精準營銷的建模工作是要對用戶分類后對不同類別用戶的消費行為進行預測。而供應商畫像的目的是為了精準管理、精準招標,建模工作是要對供應商分類后對不同類別的供應商進行評級。其次,畫像的標簽維度不同,標簽維度的構建同樣是從畫像構建的目的出發,用戶畫像關心的是用戶的購買能力、行為特征、社交網絡等,供應商畫像關心的是供應商的商務狀況、產品質量、信用狀況。具體分析數據的思路如下所示。
(1)數據收集。通過訪談和調研搜集數據,確定供應商指標的打分邏輯和統計口徑。
(2)數據預處理。對收集到的數據進行清洗,目前收集到的數據量非常小,且需要進行整合、預處理,包括缺失值和異常值的處理、數據數量級的統一、后續分析所要進行的標準化處理。在構建供應商畫像的現有數據中,資格評審涉及的商務與技術兩大維度的數據已經根據權重進行了打分,分數的數量級為10以內,因此部分數據只需要剔除不滿足資格評審的數據(表現為所有維度都為0值)以及數值超出權重的分值。履約評價的數據有物資合同簽訂及時率(0-100%)、一次性試驗通過率(0-100%)、到貨及時率(0-100%)和不良行為記錄(分值范圍0.1-12)。對于這部分數據需要根據權值進行標準化,由于權值需要根據評價標準進一步確定,因此目前只需要將不良行為記錄的量化數值壓縮到與0-100%相同的范圍。
(3)數據降維。目前的供應商信用風險評級指標過多,不能滿足供應商畫像的特征提取與分類要求,需要進行降維處理。擬采用關聯性分析和主成分分析降低指標維度,同時最大化保留原有數據的信息。在資格評審中,商務基本面信息的數據涉及15個指標,技術能力更是高達10余個,這些指標反映的意義具有較強的關聯性(共線性)且在有限的數據量的情況下變量過多將會大大降低模型的自由度從而影響精確度,因此為了滿足后續的分類和擬合要求,必須要剔除冗余變量,對指標進行降維處理。
(4)特征分類。結合業務理解初步確定分類個數(供應商不同特征維度的級別個數),利用聚類分析算法對供應商不同特征維度進行分類,后續根據分類情況和數據特征適當調整分類個數。在構建標簽之前,需要對供應商進行分類,由于目前的數據是不具有分類結果標簽(y值),因此這是一個無監督的分類問題,無法采用決策樹、神經網絡等學習類模型;又因為目前數據集的數據量非常少,需要大量訓練數據的無監督深度學習模型也不適用,因此,針對無監督和小樣本的特點,選用聚類分析解決分類問題。
聚類試圖將數據集中的樣本劃分為若干個通常是不相交的子集,每個子集稱為一個“簇”。通過這樣的劃分,每個簇可能對應一些潛在的概念(類別),如“財務狀況良好”、“技術能力強”等。不過,這些概念對于聚類算法而言事先是未知的,聚類過程僅僅能自動形成簇結構,簇對應的概念語義需要結合業務來把握和命名。常用的聚類算法有K均值算法、層次聚類算法等非常多,而針對現有的數據,K-means算法適用的情景是:簇數確定(同維度標簽評級個數確定)且較少、數據量較大;而Hierarchical clustering適用簇數不確定(可能有一定范圍)、數據量相對大的情況。具體采用哪一種分類算法要根據數據情況以及業務分類要求和可視化要求而定。
(5)分類結果檢驗。通過計算該特征維度不同類別的供應商的加權總分對分類后不同簇的供應商的總分進行統計上的顯著性檢驗。
(6)構建畫像標簽。結合對供應商管理評級的業務理解,從數據層面分析該特征維度下不同簇的供應商的區別,并增加語義內容。
2.2 設計供應商畫像
根據行業經驗及領先實踐,通過對南網供應商各類行為數據及外部數據進行數據采集、數據挖掘,結合公司戰略、未來發展愿景還有指標構建的一般原則,將供應商的綜合畫像構建為六大一級指標,分別為供應商資質評價、供應商履約運行評價、企業風險信用評價、社會行為與責任、供應商生態與供應商創新。其中最重要的企業風險信用評價指標包括企業基本風險(如企業人員變更頻率)、司法風險(開庭公告次數、法律訴訟次數)、經營風險(稅務評級等級、股權質押比率、動產抵押比率、司法拍賣事件次數、欠稅信息次數、行政處罰次數、抽檢檢查合格比率),具體結構如圖2所示。
3 結 論
本文通過對我國市場經濟環境下大數據挖掘技術的現狀分析,研究了基于大數據分析的電力企業供應商信用風險評價指標體系。通過數據挖掘等技術定制供應商行為標簽及評價指標,構建供應商畫像。通過稅務信息、司法信息、抵押信息、違法信息、質檢抽檢信息等數據對供應商潛在風險及信用進行評估,將供應商管理體系納入風險管控原則。同時,對供應商畫像相關業務進行優化,針對群體的分析,進行供應商畫像的可視化展示,根據供應商信用風險細分指標及原則,可用來評估供應商資格準入條件,輔助項目評標,同時也可以細分出優質供應商、評估某一群體供應商的潛在價值空間,提出針對性的運營和管理策略。
參考文獻:
[1] 郭秀紅.大數據時代物流信息平臺構建與建設對策研究 [J].現代信息科技,2018,2(9):149-150+153.
[2] 莊希瑞.基于電網大數據的電力需求側管理 [J].現代信息科技,2017,1(3):125-126.
[3] 陳紅,蘇運東,付婷,等.試論電力大數據在電網規劃中的運用 [J].現代信息科技,2018,2(9):101-102.
作者簡介:吳奭登(1981.07-),男,漢族,廣東湛江人,畢業于哈爾濱工業大學,高級工程師,碩士研究生,研究方向:電網應該跟電力研究、電網工作建設管理。