□ 王和勇,盧淑霞
(華南理工大學 經濟與貿易學院,廣東 廣州 510006)
由于跨境電商平臺的迅猛發展以及政府對跨境電商的宣傳與重視,許多制造業企業除了使用線下宣傳、代理商介紹等營銷方式外,還利用第三方B2B跨境平臺進行跨境交易。利用第三方B2B跨境平臺使得制造業企業與國外交易商直接連接和雙向互動,大幅減少交易和協作成本,提高了交易的效率。與此同時,由于跨境交易的交易雙方在語言、文化以及交易方式存在較大的差異,加之跨境交易中存在信息不對稱,使得在進行初次跨境交易中無法對雙方的信用做出準確的判斷,形成較大的交易障礙。同時,制造業企業在交易過程中存在交易金額與規模較大、資金回轉周期長的特點,使得制造業企業一旦發生問題,其損失較為嚴重甚至導致企業因此而倒閉。針對制造業企業進行跨境交易的現狀以及困境,通過對企業建立信用評估,從多方面去展示企業的信用情況,對于利用第三方B2B跨境平臺的制造業企業進行信用評估具有重要意義。
信用評估體系的建立包括評估指標以及評估模型的選擇,因此,本文將從評估指標和評估模型兩方面對相關文獻進行整理與分析。
冷沙沙等[1](2010)等將企業注冊信息、企業證書榮譽、運輸情況、支付情況、歷史交易情況納入指標體系當中,通過實證研究發現支付情況以及產品的權重最高,而企業注冊信息,歷史交易情況影響較小。沈琳等[2](2010)、趙冬梅等[3](2015)在構建指標體系時考慮了財務指標,并且細分為盈利、償債、資產營運、成長這四個方面。劉晉飛[4](2018)在構建制造業跨境電商企業競爭力的指標體系時考慮了通關支付能力這一指標,得出通關支付指標在評估企業競爭力里中排名第五。劉章發[5](2016)將財務情況、產品納入指標體系當中。黃興等[6](2016)構建信用評估時考慮了企業素質、歷史交易情況、服務情況這三個一級指標,二級指標則選擇了成立時間、員工人數、貨品滿意評分、到貨速度評分、產品數量這幾個指標。王小會[7](2017)在分析中小企業信用評價時考慮了財務指標,企業未來發展潛力這兩個一級指標,其中,他將財務指標劃分為盈利、償債、資產營運、成長這四個方面的指標,企業未來發展潛力則由研發人員比重這一指標所體現。榮飛瓊等[8](2018)的信用評估體系包含了產品質量這一指標。王珊珊[9](2018)則從產品、服務情況兩個方面去構建信用評估體系。整理結果如表1所示:
表1 指標對應提及的文獻
國內學者在模型的選擇上主要是層次分析法和因子分析法,或者是在這兩種模型的基礎上進行改進的模型如拉開檔次法,或者是與其他模型結合來使用的模型,如層次分析法和灰色關聯相結合、因子分析法與聚類分析相結合。而近兩年才逐漸有學者使用機器學習的模型進行研究,如BP神經網絡和XGBoost模型。
冷沙沙等(2010)、劉章發(2016)在進行信用評估時使用了層次分析法作為評估模型。劉晉飛(2018)、王小會(2017)黃興等選擇的模型為因子分析法。沈琳等(2010)改變了傳統的AHP指標權重的確定方法,采用拉開檔次法來確定定量指標權重。黃興等(2016)利用AHP和灰色關聯相結合的方法,對利用電商平臺進行交易的傳統企業繼續信用評估。趙冬梅等(2015)使用因子分析與聚類分析相結合的模型對評估體系進行驗證。榮飛瓊等(2018)使用BP神經網絡作為評估模型,其預測結果和真實評估結果的吻合率達到了90%。王珊珊等(2018)使用XGBoost模型,其評估的準確率達到80%。
由于層次分析法評價方法較為主觀,定量數據較少,定性成分多,不易令人信服;而因子分析法則是將原始變量濃縮為幾個因子變量,無法對線性不相關的變量進行重要程度的排序,從而找出最要主要的影響因素;BP神經網絡其擬合效果較好但是解讀性較低。基于上述分析,本文使用的是決策樹這一機器學習的模型,減少了主觀判斷,更聚焦于數據本身,同時解讀性強,學習速度快。
本文選取的第三方跨境B2B平臺是阿里巴巴國際站,研究對象選取了家具、衣服、運動這三個大類中的制造業企業。本次實驗一共選取了597個樣本。其中,家具行業為197個(33%),衣服行業為177個(30%),運動行業為223個(37%)。
本文從第三方數據以及第三方B2B跨境平臺數據兩方面建立信用評估體系。其中,第三方數據包括企業注冊信息、企業素質、財務情況、企業證書榮譽、企業未來發展潛力這五個一級指標。而第三方B2B跨境平臺數據下則包括運輸情況、支付情況、服務情況以及歷史交易情況及產品這五個一級指標。如下表2所示:
表2 利用第三方B2B跨境平臺的制造業企業信用評估體系
2.2.1 企業注冊信息及企業素質
①公司成立年限:企業經政府工商部門的批準頒發營業資格證的時間;
②生產設備和設施:企業用于生產商品的生產設備和設施;
③生產能力:反映在一段時間內企業的生產可能性;
④員工總數:企業所有員工的數量;
⑤生產線數量:生產線是用于生產特定種類的產品所需要的機器、人員的一個組合的數量;
⑥廠房面積:用于生產或為生產配套的各種房屋的面積;
⑦貿易部門人數:專門負責對外貿易的部門的人數。
2.2.2 財務情況
①年平均交易額:指自開業以來,每年的營業額之和除以年數的數值,衡量一個企業從開業到現今的平均交易水平;
②年度總收入:指最近一年整年的收入總和;
③年產值:一年所有產品的總值。
2.2.3 企業證書榮譽
①證書總數:指的是從過去到現在所擁有的證書、產品資格證、商標與專利的總和;
②已驗證證書總數:指的是官方認證的證書、產品資格證、商標與專利的總和;
③會員年數:指的是企業加入平臺的會員的年數。
2.2.4 企業未來發展潛力
研發人員數:是指企業內工作職責為不斷研發新產品與維護舊產品的人員。
2.2.5 運輸情況
①按時裝運評分:指的是所有已購買該店鋪產品的賣家對按時轉運評價的平均值;
②接受的交貨條件:交貨條件是進行國際貿易時,用來表明進出口商品的價格構成、買賣雙方各自應負擔的責任、承擔的費用和風險及貨物所有權轉移的術語;
③平均提前期:指從開始訂單到完成訂單的平均花費時間。
2.2.6 支付情況
①接受的付款貨幣:指在付款時能使用的付款貨幣種類;
②接受的付款方式:指在付款時能使用的付款方式。
2.2.7 服務情況
①報價次數(過去30天):指的是當前時間點過去30天內店家向賣家報價協商交易的次數;
②回復率(過去30天):指的是過去30天內店鋪回復買家問題占買家所有問題的比例;
③平均響應時間(7天):指的是在過去一個星期內,所有買家提出問題到店鋪回答問題的平均時間;
④供應商服務評分:指的是所有買家在購買產品后對供應商服務進行評分的平均值;
⑤總得分:指的是所有買家對供應商服務、按時轉運、商品質量打分的一個平均值,從總體衡量了用戶對店鋪的一個整體態度。
2.2.8 歷史交易情況
①交易數:指的是過去一年內所有的交易數;
②總評論數:指的是從開業到現今統計時間內的所有評論數。
2.2.9 產品
①主要產品種類數:指的是用戶在該店鋪主要購買的產品種類;
②所有產品種類數:指的是阿里巴巴國際站上顯示的,店鋪上架的所有產品的種類數;
③產品質量打分:指的是所有買家在購買產品后對產品質量進行評分的平均值。
決策樹具有結果解釋性強、學習速度快等特點,比較常用的決策樹算法有ID3、C4.5、CHAID和SLIQ算法。而算法的選擇與因變量與自變量的數據類型有關,根據本文的數據特點,本文的決策樹算法選擇了CHAID。
CHAID決策樹的運行機制主要包括解釋變量劃分的臨界點的尋找以及確定哪個解釋變量作為分裂節點兩部分,具體如圖1所示。其具體步驟為:
臨床有研究顯示:糖尿病患者自身抗感染能力以及機體組織愈合能力較差,極易發生骨折以及骨質疏松,骨科糖尿病患者一般以手術治療為主,術后并發癥發生率極高,切口極易出現感染、不愈合等情況,一定程度上延長了患者住院時間,增加了住院費用,加重了患者以及家屬的心理負擔和經濟壓力,由此可知圍術期的護理質量對于患者切口愈合、機體恢復極為重要[4-5]。臨床常規護理過于單一、固定,具有機械性、被動行特點,缺乏主動性,護理期間患者會感受到厭煩或者不適,稍有不慎,極易引發護患糾紛,護理效果一般,具有一定的局限性。
①若解釋變量X只有一類,則其調整為1;
②若解釋變量X有兩類,則使用Bonferroni方法計算合并好的分類的調整值;
③若解釋變量X的分類超過兩類則需要根據不同類型的目標變量Y選擇不同的檢驗方法,找出每個解釋變量X關于目標變量Y的分布差異最小的兩個類別,即值最大的兩個類別;
若目標變量Y為連續變量,則選擇F檢驗;若目標變量Y為定類變量,則使用卡方檢驗或似然估計統計量:若目標變量Y為定序或離散變量就使用似然估計統計量。其中,F檢驗的公式為(1)(2):
(1)
(2)
卡方檢驗χ2公式為(3),似然估計量L2公式為(4)。
(3)
(4)
⑤使用Bonferroni方法計算合并好的分類的調整P值;
⑥選擇具有最小調整P值的解釋變量;
⑦如果該調整值≤(用戶設定的顯著水平),則使用該解釋變量分裂節點。否則,不分裂并且考慮作為葉子節點;
⑧繼續決策樹的生長直到遇到停止規則。
圖1 CHAID決策樹運行機制圖
本文以阿里巴巴國際站中597個制造業企業作為樣本,提出了有關第三方B2B跨境平臺的制造業企業信用評估體系,分別將公司成立年限、生產設備和設施、生產能力、員工總數、生產線數量、廠房面積、貿易部門人數、年平均交易額、年度總收入、年產值、已驗證證書總數、證書總數、會員年數、研發人員數、按時裝運評分、接受的交貨條件、平均提前期、接受的付款貨幣、接受的付款方式、報價次數(過去30天)、回復率(過去30天)、平均響應時間(7天)、供應商服務評分、總得分、交易數、總評論數、主要產品種類數、所有產品種類數、產品質量評分這29個輸入指標納入評估體系中,在構建評估體系時本著全面性的原則盡可能多的納入更多的指標,并使用決策樹進行重要因素的篩選。
樣本原始數據如表3所示,由于輸入指標數據類型既有分類數據又有連續性數據,而輸出數據是共有十個分類的分類數據。
因此,根據數據的特征,本文選擇的決策樹算法是CHAID算法,使用的軟件為Modeler中的CHAID決策樹模型。
表3 原始數據
圖2 CHAID決策樹預測變量重要性圖
由圖2所示,CHAID決策樹模型所預測前10個最重要的變量按重要性從大到小為年平均交易額、總評論數、接受的交貨條件、接受的付款貨幣數、生產線數量、所有產品種類數、供應商服務評分、會員年數、接受的付款方式、貿易部門人數。
基于以上研究結果,針對利用第三方B2B跨境平臺的制造業企業在進行跨境交易中遇到的障礙,本文將對企業、平臺以及監管部門提出不同的建議。
對于在第三方B2B跨境平臺進行交易的制造業企業來說,可通過增加年平均交易額,鼓勵買家發表評論、增加可接受的交貨條件與付款貨幣數這幾種方式來提升企業的信用評估級別。根據決策樹的模型結果發現年平均交易額、總評論數、接受的交貨條件、接受的付款貨幣數這幾個屬性對信用評估具有顯著的影響,企業可針對每一個屬性來對采取相應的措施從而增加企業的信用評估級別,從而增大店鋪的曝光率從而提高其信用等級。值得注意的是,企業需要通過正規的途徑來提高信用等級,而不是通過虛假與惡劣行為來增加企業信用評估級別。
對于第三方B2B跨境平臺來說,要規避企業為提高信用評估等級進行惡意刷好評、提供虛假信息等惡意擾亂市場的行為。要確保信用評估體系的可使用性,第一步是確保數據的真實性,虛假的數據就會產生虛假的結果,這樣不僅影響進行跨境交易的主體的利益,也不利于第三方B2B跨境平臺的健康發展。
針對企業提供的第三方數據,平臺可要求企業提供相關部門的證明或者憑證來確保信息的準確性。而對于第三方B2B跨境平臺數據,因為這些數據是在交易過程中產生的,而交易雙方的數據都在在平臺上,平臺不僅可以通過企業本身來判斷信息的準確性,也可以結合交易方的信息來判斷交易的合理性。通過加大平臺對失信企業的懲罰力度或者設置警報閾值發現異常交易行為都可以在一定程度上確保信息的準確性。
對于監管部門來說,通過平臺提供或者自身建立的信用檔案,可對整個行業的信用情況有一個較為清晰的了解與認識。對監管部門出臺相應的政策進行宏觀調控具有指導性作用,通過信用評估來對企業進行劃分,找出行業中的優質企業以及失信企業。一方面可針對優質企業提供便利化措施,例如,針對這類企業開通綠色通道,享受通關便利等;另一方面,監管部門應針對失信企業進行監管,防止出現劣幣驅逐良幣的現象,使行業更加健康的發展。