鄭建華,黃灝然,李曉龍
(1.仲愷農業工程學院信息科學與技術學院,廣東 廣州 510225;2.肇慶學院經濟與管理學院,廣東 肇慶 526061;3.暨南大學經濟學院,廣東 廣州 510632)
小微企業是我國企業的重要組成部分,當前我國小微企業數量占企業總數量九成以上,小微企業的產值占我國GDP 六成以上,小微企業在保障就業、活躍市場、推動創新、穩定社會等方面發揮巨大作用。長期以來由于信息不對稱的原因,加上小微企業缺乏擔保物,企業治理和財務體系不規范,金融機構難以了解小微企業真實的狀況,怕承擔極大的違約風險,使得小微企業難以獲得金融機構支持,成為制約小微企業發展的瓶頸。信用評級是對信用價值的一種判斷,金融機構以此價值判斷為基礎,決定授予信用主體某種機會、某筆商業交易或具體的融資金額。傳統信用評級主要基于企業財務狀況或者銀行信貸數據實現,但現實中并不是所有金融機構都能獲取到企業的真實財務數據,同時影響企業信用的不僅僅是財務數據,企業一些不合規行為也會影響其信用,因此傳統信用評級方式難以直接適用于小微企業。隨著大數據時代來臨,可獲取的企業數據豐富且多樣,處理技術更加先進,使得從多維度評估企業信用成為可能,比如吳育輝等以中國A 股上市公司作為樣本,研究了企業信息披露質量與企業的信用評級的關系,研究表明企業信息披露質量越高,則企業管理層的能力越高,企業的信用評級也越高。2015 年我國發布的《十三個五年規劃的建議》將大數據提升到國家戰略高度,因此在大數據背景下,如何科學、合理地構建小微企業信用評級模型,既能讓小微企業獲得急需的信貸,又能減少金融機構的風險,成為當前我國征信體系中亟須解決的問題。
根據麥肯錫全球數據分析研究所的定義,大數據是指大小超出了典型數據庫軟件工具收集、存儲、管理和分析能力的數據集。大數據不僅僅是數量大(Volume),其還具其他4V 特征,分別是:Variety(多樣性)、Velocity(時效性)、Veracity(準確性)、Value(高價值) 等。由于大數據5V 特征的存在,不僅僅使數據的存儲、計算方式帶來了巨大變革,更加重要的是使傳統業務模式發生了天翻地覆的變化。
傳統小微企業信用評級主要以銀行信貸和財務數據為主,由于當前我國小微企業財務制度普遍不夠規范,財務造假的情況時有發生,加上主觀評價導致的誤差,使得信用評級可信度不高。同時,企業的銀行信貸數據都存于銀行內部,數據的封閉性導致很難為外部機構獲取,因此以銀行信貸數據為主的評級模型難以滿足互聯網金融機構的信用評估需求。
在大數據時代,企業公開發布的數據更多,因此可以利用大數據技術全面收集、高效處理企業多維度數據,打破以財務信息為核心的傳統信用評級模式,利用多維度、多類型數據對企業信用展開動態評級。基于大數據的小微企業信用評級具有以下優勢:
利用大數據技術可以獲取企業工商、行政處罰、稅務、知識產權、網絡電商交易、股東信用、股東社交關系、企業安全事故等多維度豐富而真實的海量數據,這種些數據都是企業信用的外在反映,在利用大數據技術對這些數據合理處理后更能全面體現企業的信用狀況。
數據源是信用評級的基礎,獲取來自工商、稅務、知識產權、法院等各部門公布的權威數據,這樣能夠提供給模型計算的特征變量個數往往多達幾千甚至上萬個,這樣提升了評級結果的可信度。同時隨著人工智能技術的飛速發展,采用深度學習、隨機森林、決策樹、XGBoost 等理論基礎更為復雜的機器學習算法實現信用評級成為可能,通過執行一段計算機程序即可實現信用自動評級,這種過程有效避免了專家評級的主觀性,進一步提升評級的可信度。
在大數據時代,利用爬蟲技術將散布在互聯網各個角落的各種信息匯聚在一起,隨后采用數據挖掘算法對這些海量數據進行處理、挖掘,形成小微企業征信體系中的各種量化指標。應用大數據、人工智能等技術快速計算這些指標,形成企業信用評級結果,實現數據實時處理,效率優勢明顯。以上過程一直持續進行,實現企業信用評級結果的動態優化。
傳統的信用評級需要評級機構專人對企業進行各種調查,耗費大量的人力成本、時間成本和資金成本,而基于大數據信用評級,通過執行計算機程序即可快速得到企業信用評級,顯著減少了成本。
鑒于大數據的企業信用評級的優勢,近年來已經涌現出許多研究成果。
國外的益百利融合企業基本信息、信用信息、支付信息、貿易支付信息、金融交易信息等超過140 項數據來展示企業信用。鄧白氏采用了類似的信息,此外還包含了用于財務能力評價和商業信用評價的鄧白氏指標。艾可飛的特色在于整合了企業信息和個人信息,形成一份完整信用報告。
國內學者溫妮則從企業的歷史和未來,定量分析和判斷等方面,構建了一個包括企業財務狀況、互聯網輿情導向、發展環境、市場競爭力和商務行為五個因素的指標體系。馮文芳從產業分布、發展需求、市場現狀等更多領域提取數據來反映企業的信用信息。
針對小微企業信用評級方面,陸萍采用文獻閱讀、專家問卷調查確定了企業外部環境、企業信息、企業主信息和企業財務指標4 個一級指標的工業類小微企業征信指標,構建了定性指標和定量指標的評估模型。呂秀梅采用專家評分加權方法挑選出財務信息、發展信息、信用信息和網絡信息4 大類共24 個對中小微企業信用評估形成顯著影響的因素。朱兆迪認為小微企業經營者和企業自身狀況兩方面是評價小微企業信用的主要因素,其中企業經營者的信用水平影響最大。
在企業界,京東金融依托京東電商平臺和物流平臺,通過對商家的銷售、采購、財務、物流數據進行分析,為京東的金融產品提供決策分析。網商銀行與淘寶、天貓、阿里巴巴等平臺合作,獲取這些平臺的企業交易、訂單、評價等數據,從而構建了各種預測模型和風控模型。
除了企業,大數據征信也可被用于個人信用評級,楊亞仙等認為大數據征信是傳統征信業務強有力的補充,能夠適用的業務場景也更加多元化,例如風控決策系統。蔡金鑫等通過改進“5C 信用評估法”,構建了基于大數據的個人信用評估指標體,并應用模糊數層次分析法計算相關指標的權重。
上述現狀表明,采用大數據技術進行信用評級已經獲得學者和企業界的認可,但是實際上市場上真正投入使用的信用評級模型并不多見。投入使用的模型都依賴于完備的自身領域內數據,比如阿里電商數據、京東電商數據、騰訊社交數據。
造成這種現狀的主要原因有:
(1) 數據獲取困難。比如有些模型要求融入企業的互聯網訂單、用戶評價等數據,但是電商平臺不愿意公開這些數據,導致數據難獲取,評級無法完成。
(2) 數據涉及隱私。比如有些模型建議融入小微企業經營者的支付寶、微信支付等社交消費數據,但是這些數據涉及隱私,不可能直接被應用。
(3) 數據缺乏權威且難以被量化。比如有些模型提出要融合自媒體、新媒體、傳統媒體的評價信息,但是這種評價散布在互聯網的各個角落,發布者水平參差不齊,而且還有可能有大量的水軍,因此基本沒有權威性,也難以被量化。
由于以上原因導致當前小微企業的信用評級模型使用困難很大。而僅僅針對自身領域內數據進行信用評級的模型缺乏對企業信息全面展示,導致其使用范圍有限,故目前急需構建一個基于公開權威數據的具有可操作性的小微企業信用評級模型。
對于指標體系的設置,張紅玲提出了全面性、針對性、可比較性、集約性和可操作性5 大原則。張永丹類似地提出了全面性、可續性、公正性、可操作性幾大原則。張維等則認為應該遵從全面性與重要性相結合原則、減少對企業財務報表依賴性原則、定量分析與定性分析相結合原則、關聯性原則、可操作性原則。鑒于當前信用評估模型存在的問題,研究認為建立實際可行的大數據信用評級指標體系尤為重要。
建立面向公開數據的小微企業信用評級模型,需要重點考慮數據的可獲取性、數據可用性,這樣既能便于充分反映一個企業的真實情況,又能便于采用大數據技術、人工智能的方法實時、便捷的計算信用等級。數據可獲取性指的是能夠通過公開途徑獲取企業該項指標的信息。數據可用性指的是獲取到的數據具有一定的權威性和能夠用于計算,且這些數據的相互合作能夠形成互補和支撐,能夠全面地評價一個企業信用狀況。比如張虹等從企業創新產出(具體包括知識產權類能力、標準成果、科研類成果) 和企業信用風險的量化數據評價企業活力指數,為企業融資評估提供支撐數據,實證分析表明通過以上可量化指標計算得到的企業活力值與企業融資情況基本契合。
考慮到當前中國小微企業的財務制度尚不健全,提供的財務數據有所失真,而且當前銀行已有的征信體系主要采用財務和信貸數據,因此文章僅考慮非財務指標體系,在財務指標方面不再重新贅述。對于財務指標設計及權重也可以參考文獻所列。實際上當前企業違約風險有相當多是由于非財務問題引發,企業管理層能力的提升,有助于提升企業信用評級。類似的,傅鈺等研究表明除了傳統征信要素即財務企業財務指標外,包括創新能力、企業家特質、企業聲譽等與有形資產無關的非傳統征信要素對企業信用的評估具有重要影響。同樣,岳愛東等研究發現企業運營與管理水平、制度環境對小微企業融資的影響最為明顯,抵質押擔保、銀行信用與資信的影響相對并不顯著。總結以上研究成果表明,非財務因素同樣可以對企業的信用評級產生重大影響,故可以作為企業信用評級的主要指標因素。
根據研究設定的原則,在考慮數據的可獲取性和數據可用性前提下,以非財務指標為主,綜合應用信用平臺、工商、法院、稅務、知識產權等各機構公開的權威數據,并結合百度信用、天眼查、企查查等商業平臺數據,構建了一個基于公開數據的小微企業信用評級指標體系,并能采用大數據技術實現評級自動化。
本指標體系把企業發展潛力、企業發展環境、企業經營者信息、企業行為合規度四個維度作為一級指標。每個一級指標由2-3 個二級指標構成,例如衡量企業發展潛力的二級指標有企業信息完整性、企業發展階段、企業市場競爭能力;衡量企業發展環境的二級指標有所在區域經濟指數、所屬行業景氣指數;企業經營者信息的二級指標有主要股東信用記錄、股東主要社會關系和企業資本組成情況。企業行為合規度的二級指標有法律訴訟、行政處罰和稅務處罰或等級。各維度的二級指標數據獲取方式以及指標解釋如表1 所列。

表1 小微企業信用評級指標體系
層次分析法(AHP)是美國T.L.Satty 教授提出的一種將定性問題進行定量分析的多目標決策方法,該方法通過采用數學方法計算每一層指標的重要性權重,然后再計算出在各層次之間的權重,從而實現對目標的定量描述。其中的權重數學計算方法可以是特征值法、算術平均法、幾何平均法。
采用特征值法計算某一層指標的權重計算流程如下:
第一,構建指標兩兩比較判斷矩陣A。
第二,求解矩陣A 的最大特征值λmax和特征向量。
第四,對特征向量進行歸一化處理,得到每個指標的權重。
以一級指標為例演示以上算法過程,構件如下兩兩比較判斷矩陣如表2 所示。

表2 一級指標判斷矩陣
計算此矩陣得到最大特征值為4.04。
并計算:

這表明該矩陣通過檢驗,繼而對特征向量歸一化得到權重向量:
W=[0.302 0.076 0.152 0.47]T
從以上權重可以發現,研究設計的信用評級指標體系比較偏重對企業行為合規度的懲罰,企業經營合規度越高則信用越好。
采用類似的方法可以得到企業發展潛力、企業發展環境、企業經營者信息,企業行為合規度下二級指標的權重向量分別為:
W1=[0.143 0.285 0.572]T
W2=[0.5 0.5]T
W3=[0.557 0.170 0.273]T
W4=[0.164 0.539 0.297]T

表3 二級指標權重
據此可以設計出每個二級指標的綜合權重。
根據以上可以得到小微企業量化的信用評分,如下公式所示:

注:在使用上式時,本文約定對于企業行為合規度的取值均為負值,因此總分會出現負數情況,為了保證總分值在0~100之間,需要在計算結果后面加上43。
當前我國企業征信采用依據GB/T 22116-2008《企業信用等級表示方法》,為了保持與國家標準一致,文章仍基于以上標準,將小微信用等級分為10 個等級,分別為AAA,AA,A,BBB,BB,B,CCC,CC,C,D。具體分值如表4 所示。:
為了查看信用模型中二級指標的企業統計分布情況,研究抓取了超過10 萬家廣州市企業,對二級指標進行統計?!捌髽I市場競爭力”對企業信用評分影響起正向積極作用,表5 是對企業的專利和軟著申請進行統計分析。同時,處罰對一個企業信用的影響非常大,表明了企業經營的合規度,表6 是對抓取企業的行政處罰情況進行統計。

表5 企業市場競爭力情況統計
從以上兩個表可以發現,97.62%的企業沒有申請專利或者軟著,但是只有90.82%的企業沒有接收到任何行政處罰,這說明至少有6.8%的企業沒有申請一項專利或者軟著,但是至少一項行政處罰的企業卻接受了,這并不有利于企業的發展。
依據本文設計的信用評級模型,表7 列出來部分代表企業評級情況,可以發現評分較高的企業在市場競爭力這一塊都較強,通過分數較好的反映了一個企業的各方面信息。

表6 企業接受行政處罰情況統計
以銀行信貸和財務數據為主的傳統的企業信用評級模式難以適應時代需求。大數據時代帶來了多維、多類型數據,以及數據處理方式的變革,這給解決傳統信用評級模式難以適用小微企業問題帶來思路。文章以大數據技術為基礎,針對小微企業信用評級難題,研究了大數據時代的企業信用評級問題,設計了面向小微企業的信用評級體系,并取得以下研究成果:

表7 部分典型信用評級
第一,基于大數據的小微企業信用評級具有全面、可信、高效、低成本的優勢,有助于打破以財務信息為主的傳統小微企業信用評級模式,可為我國未來的征信模式提供重要補充。
第二,針對大數據信用評級的現狀,文章總結出制約當前大數據信用評級被廣泛使用的三點主要原因:數據獲取困難、數據涉及隱私、數據缺乏權威且難以被量化。這為行業制定相關規范和政府制定相關政策提供了參考和依據。
第三,研究在重點考慮數據的可獲取性、數據可用性基礎上,構建了以企業發展潛力、企業發展環境、企業經營者信息、企業行為合規度四個維度作為一級指標的小微企業信用評級體系,并采用層次分析法量化二級指標權重,構建了小微企業信用評級量化模型。
第四,以廣州市企業為研究對象,實證分析了不同企業的信用評級情況,結果表明該模型能較好反映企業綜合能力,對不同的企業具有較好的區分能力,這為企業融資提供了有力依據。
以上成果表明研究所設計的小微企業信用評級模型能為小微企業提供一種客觀的評價,能成為當前我國信用評級體系的有益補充。
在大數據時代,可以采集的數據越來越多,因此也可以從更多的維度評價一個企業,能夠從更細微的角度衡量一個企業,如果后續有更多的私有數據開放(比如支付寶和微信支付信息、京東和蘇寧等采購信息),可以將更多的私有信息融入到模型,實現不同的數據互補。同時在后續研究中,可以探索將各種數據都保存在區塊鏈系統上,利用區塊鏈的去中心化、防偽溯源、信任機制等技術特征保障已有數據的不可篡改性,進一步提升企業信用評級的可信度。在此基礎上,提出以下建議:
黨的十九大報告指出“要建設數字中國、智慧社會,發展數字經濟、共享經濟”。顯然豐富的數據有助于更精準的評估企業信用。建議國家出臺相關政策,在數字中國建設背景下,規范數據采集方式,同時實現電商、社交、交通等企業數據共享,實現工商、稅務、法院、知識產權等部門的相關數據共享。這樣有助于研究者專注于技術開發,提高評級模型的精度。
當前大數據、云計算、機器學習、深度學習、區塊鏈技術在交通、政務、醫療、教育等行業都取得大量研究成果。未來,在數據開放的基礎上,建議將大數據、云計算和區塊鏈技術引入到小微企業信用信息數據的存儲上,將深度學習和機器學習技術引入到小微企業信用評級模型計算上,實現更大規模的數據存儲、更先進數據計算,從而達成更穩定的評估預測結果。這對推動小微企業信用評級,進一步推動我國個人、企業信用體系建設非常有益。