李海姣


摘要:本文通過網絡問卷調查方式,收集120位“芝麻信用”用戶的線上信息作為研究樣本集,對樣本集使用相關性檢驗方法,探究芝麻信用評分機制的新影響因素。結合相關理論和實際情況,確定“芝麻信用合作共享平臺使用次數”為新的芝麻信用評分機制影響因素,并對潛在但尚不直接相關的“人脈關系”因素做出剖析與推斷,希冀完善并改進現有分析模型,補充新的解釋變量,對我國互聯網征信機構信用評分機制的進一步研究提供方向。
關鍵詞:芝麻信用 人脈關系 共享平臺
一、引言
互聯網征信作為預防互聯網金融信用風險的重要手段,成為我國征信體系中的重要部分。“芝麻信用”是國內典型的互聯網征信機構,依托互聯網平臺開展征信業務,通過信用評分機制完成對用戶信用情況的評價。與傳統征信相比,芝麻信用基于客戶群采集了大量線上行為數據,覆蓋面積更廣。如今芝麻信用已在信用卡、消費金融、融資租賃、酒店、租房、出行、婚戀、公共事業服務等上百個場景為用戶、商戶提供信用服務。芝麻信用通過數據分析技術處理采集到的數據,以信用分形式呈現。“螞蟻金服”官方雖給出了五個評價維度——信用歷史、行為偏好、履約能力、身份特質、人脈關系,但具體計算過程仍不予公開,信用分產生過程不透明,加之缺乏監督,使其可靠性和公正性難以保證。因此,有必要對芝麻信用評價體系中的影響因素進行詳細探尋。
目前國內學者對于個人信用風險評估理論與方法的研究大多還停留在論證大數據技術的必要性以及定性地提出利用互聯網大數據完善個人征信的建議上,雖有少數學者提出優化模型用于個人征信領域,但并未涉及到對目前我國互聯網征信機構信用評分機制的具象性研究。《互聯網信用評分機制的潛在缺陷與改進思路——基于“芝麻信用”的調查研究》一文運用計量方法,對芝麻信用的評分機制進行了初探,但研究結論是只有淘氣值、用戶的工作單位性質及月平均收入對芝麻信用分有影響,這顯然不能全面反應其評分機制,特別地,隨著芝麻獲取信息渠道不斷拓展,這一結論的不足更加凸顯。
本文將借鑒此文的研究思路,在其研究成果上做出完善,以網絡問卷形式收集多側面的外部信息,補充其他因素對其評分機制的影響,為我國互聯網征信機構信用評分機制的進一步研究奠定基礎。
二、確定芝麻信用評分機制中新的影響因素
芝麻信用評估方法是在美國FICO評分系統的基礎上確立了適用于我國的信息維度,原模型主要研究了用戶身份特質、履約能力及信用歷史三個維度,本文認為,考慮到近年來移動支付的“全民化”與共享經濟的快速發展,應將“人脈關系”與“芝麻信用合作共享平臺的使用情況”兩個因素納入到研究范圍中,探討與芝麻信用評分的關聯性及具體如何影響芝麻信用評分。
(一)人脈關系
人脈關系指人際來往中的影響力和好友的信用狀況,如好友的身份特質、信用分數以及與好友的互動程度等。支付寶掀起的“無現金革命”,在很大程度上將現實中的人際關系平臺化、數據化。除第三方支付業務之外,支付寶還加入了“好友列表”、“生活圈”等功能,旨在通過這些板塊采集用戶的社交信息,作為評估體系的重要部分間接衡量用戶的信用水平,較為客觀的反映出個體的信用狀況。
“人脈關系”對芝麻信用分值的影響,可能體現在兩個方面:第一,用戶支付寶好友的信用水平(芝麻信用分)。第二,與好友的互動程度,含資金往來的頻次與金額等。芝麻信用評分體系會對“互動”(“好友聊天”、“群聊天”等)這一動態過程進行多維度分析,如:關系強弱指數、社會關系模型、影響力指數等,故與好友穩定的、多場景下的互動,是衡量“人脈關系”的一個重要指標。
(二)芝麻信用合作共享平臺的使用情況
共享經濟是近年來快速發展的新興業態,已滲透到交通出行、租房住宿、消費信貸、知識技能等各類產業中。目前,芝麻信用已與共享經濟多個領域合作,均接入芝麻信用分評價機制,實行信用免押服務——若用戶的芝麻信用分達到一定標準,即可享受免押金等信用福利。
用戶對共享平臺的使用情況與芝麻信用分、信用福利之間,存在正反饋機制——用戶使用芝麻信用合作共享平臺的次數越多、信用記錄越好,個人芝麻信用分將越高,享有的信用福利就會越大;較高的芝麻信用分和較好的信用福利,也會無形中增強用戶對自身行為的規范,促使其在共享平臺上留下更優的信用記錄。
由此可見,用戶在共享平臺(芝麻信用已接入的)上的使用頻率與信用記錄,可以反映用戶的履約能力,可能影響個人芝麻信用評分。
三、實證分析
(一)調查問卷的設計
本文調查問卷從“人脈關系”和“芝麻信用合作共享平臺的使用情況”兩個維度出發,共設計了7個問題:①最近一周,與聯系最頻繁的好友之間的轉賬次數;②最近一周,與聯系最頻繁的好友使用支付寶聊天的次數;③最近一周,使用支付寶“生活圈”功能的次數;④最近一周,使用芝麻信用合作共享單車的總次數;⑤最近三個月,使用神州租車、一嗨租車的總次數;⑥最近一年中,使用螞蟻短租、小豬短租、途家、未來酒店的總次數。其中,轉賬次數、聊天次數及使用“生活圈”次數均反映了“人脈關系”維度;使用芝麻信用合作共享單車、租車、租房平臺的次數,則反映了“共享平臺的使用情況”。從外部角度囊括了芝麻信用在這兩個新要素中能夠采集到并有可能用于信用評價的用戶數據。
(二)相關性分析
1.實證檢驗
此次互聯網調查問卷通過微信、QQ等網絡平臺發放和回收,調研對象多為在校大學生,少數為社會人士。問卷共回收120份。其中,有14份問卷缺失“芝麻信用分”字段信息,屬于缺失樣本,予以剔除。此外,另有1份問卷的“轉賬次數”字段信息記錄為127,屬于異常樣本,予以剔除。經過以上清洗,最終形成105個有效觀測個體,形成樣本量為105的待分析樣本集。
對芝麻信用分(score)與六個問題的答案做pearson相關性分析,結果如圖2所示。其中,TIMESI~TIMES6分別對應問卷中的轉賬次數、支付寶聊天次數、使用“生活圈”次數、使用芝麻信用合作共享單車、租車及租房平臺的次數。
2.實證結論與分析
(1)結論
上述相關性分析結果表明:
①“人脈關系”,含轉賬、聊天及使用“生活圈”次數——與芝麻信用分無顯著相關性。
②“共享平臺的使用情況”中,“神州租車”、“一嗨租車”使用次數與芝麻信用分具有顯著相關性。
③部分解釋變量間具有多重共線性,如TIMES1與TIMES2,TIMES4與TIMES6等。
(2)分析
①在“人脈關系”維度中,不止包含轉賬、聊天及使用“生活圈”次數,還包括較為重要的一部分——好友信用狀況(好友信用分與身份特質等)。一個賬戶的信用評級必然影響另外一個賬戶的信用評級,如果好友的信用狀況都較好,那么該用戶信用極其低下的可能性也不大。但由于用戶并不能準確獲知好友的信用分數,故本次問卷調查無法采集到此項數據。因此,由于“人脈關系”維度數據采集并不全面,且無法確定“好友信用狀況”對芝麻信用分的影響程度,則不能單純判定該維度與芝麻信用評分間無相關性。本文認為,轉賬、聊天及使用“生活圈”次數變量與芝麻信用分數雖無直接相關性,但可能與“好友信用狀況”或其他人脈關系變量相關,而該變量作為“準工具變量”可能與芝麻信用評分之間有直接相關性,并構成芝麻信用評級體系中的重要成分。
②“共享平臺使用情況”與芝麻信用分之間的強相關性,則與芝麻信用與共享經濟近年來的發展趨勢密不可分,二者相互結合、相互促進,既順應市場走向,同時為社會帶來積極效應。一方面,芝麻信用的互聯網征信屬性決定了其信息來源多為用戶網上行為數據,包括淘寶、支付寶和社交媒體中的記錄等。當下大數據與云計算的發展,將越來越多的現實場景平臺化、電子化,這要求芝麻信用應涉足更多新興領域,以保證其征信信息來源的全面性、客觀性與準確性。
另一方面,共享經濟作為近年來蓬勃發展的新業態,國家政策高度支持,市場環境向好。隨著共享平臺用戶群體的數量不斷增多,用戶的行為數據也愈加具有代表性,因此共享平臺用戶行為數據對芝麻信用評分機制有很強的參考價值;此外,由于共享經濟具有“共享”、“去中介化”等特質,其健康發展高度依賴完善的信用評價機制,而芝麻信用的出現恰好在一定程度上緩解了共享經濟的“信用困境”與“押金”問題。
目前芝麻信用與共享單車、租車、租房行業的一些大眾化共享平臺均有合作,如:ofo小黃車、神州租車、一嗨租車以及螞蟻短租、小豬短租等。其中共享單車與租房的相關性不高,原因可能在于問卷調查的時間區間(“最近一周”、“最近一年”)設置不合理。而租車次數與芝麻分的顯著相關程度可代表“共享平臺使用情況”。用戶在以上共享平臺的使用次數越多,留下的行為數據就越多。這些行為數據能夠很好的反映用戶的信用歷史、履約能力及行為偏好,并對用戶的最終芝麻信用分提供重要補充。因此,用戶在芝麻信用合作方共享平臺上的使用次數,與芝麻信用評分具有較強相關性。
③部分解釋變量之間具有多重共線性,說明問卷的部分問題之間相關,分別是TIMES1與TIMES2,TIMES1與TIMES6,TIMES2與TIMES3,TIMES3與TIMES4,TIMES3與TIMES5,TIMES3與TIMES6,TIMES4與TIMES6。
TIMES1與TIMES2,TIMES2與TIMES3之間的共線性,分別表示轉賬次數與聊天次數相關,聊天次數與使用“生活圈”次數相關。以上三者均為描述“人脈關系”的測度:一個與好友互動較為頻繁的用戶,應具備一定的社交影響力,故使用“生活圈”的次數偏多,因此測度之間必然具有較強的相關性。同理,TIMES4與TIMES6的共線性表示,在芝麻信用合作平臺上的“共享單車使用次數”與“租房次數”具有一定相關性,由于二者均反映“共享平臺使用情況”,屬于同一維度的不同側面,故也應相關。
除此之外,TIMES1與TIMES6,TIMES3與TIMES4,TIMES3與TIMES5,TIMES3與TIMES6之間的多重共線性則綜合反映了“人脈關系”與“共享平臺使用次數”之間的相關程度,可以從以下兩方面進行解釋:
首先,對支付寶業務的熟悉程度,可以分別從“人脈關系”與“共享平臺使用次數”兩方面進行分析。
“人脈關系”方面:除轉賬外,好友聊天及生活圈功能與一般社交平臺具有重合性,故使用人數整體偏少。若用戶在“人脈關系”維度上表現良好,說明該用戶對支付寶功能可能有著特殊偏好,使用轉賬、互動等功能的次數較多,與一般用戶群體相比,該用戶對支付寶功能的熟悉程度會更高。
“共享平臺使用次數”方面:與芝麻信用合作的共享平臺,都會列示在支付寶頁面中。但在調研過程中發現,大部分答卷人除轉賬外,對支付寶的其他功能并不熟悉,因此較少使用支付寶頁面上共享平臺。而在“人脈關系”維度表現良好的用戶,面對租房、出行等需求時,由于較為熟悉支付寶附加業務,因此將更傾向使用芝麻信用合作的共享平臺,其使用次數也會相應增多。綜上,“人脈關系”與“共享平臺使用次數”之間具有一定的相關性。
其次,高信用分好友的輻射效應與人們的趨同效應。
與好友互動程度較高的用戶,也可通過好友推薦這一渠道,加強對支付寶功能的熟悉度,從而產生對芝麻信用合作共享平臺的偏好,增多使用次數。如,用戶的某個支付寶好友擁有較高芝麻分,對支付寶附加功能十分了解,經常使用ofo小黃車、小豬短租等平臺,則用戶在與該好友互動過程中,很可能了解到更多有關芝麻信用合作共享平臺的信息,因此較易加入共享平臺使用群體中。
四、未來研究方向及模型改進
(一)研究方向
通過對預處理后的樣本數據進行相關性檢驗,本文發現,“芝麻信用合作共享平臺的使用次數”與芝麻信用分有顯著相關性,而在“人脈關系”方面,尚無法通過現有數據與芝麻信用分直接建立相關性,但仍作為芝麻評價體系的重要成分。
由于“轉賬”、“互動”、“使用‘生活圈次數”與芝麻信用分之間并不顯著相關,故下一步研究方向是尋找“人脈關系”維度中與芝麻信用分具有顯著相關性的“隱形變量”,重點研究對象為“好友信用分數”。由于在網絡人際關系網中,好友的輻射效應與人們的趨同效應可以在較大程度上影響一個人的行為,故芝麻信用評分體系很可能將“好友信用分”作為“人脈關系”的重要評判標準。后續需要進行更廣泛與深入的數據搜集工作,研究“好友信用分”與“轉賬”,“互動”,“使用‘生活圈”次數之間的關聯性、對“人脈關系”維度的代表性、以及是否與芝麻信用分顯著相關。
(二)模型改進
下一步將對參考文獻1中的模型結論進行改進,原模型如下:
本文既已確定“人脈關系”維度中與芝麻信用分顯著相關的變量后,筆者希望將該變量與“共享平臺使用次數”一起作為新的解釋變量加入原模型中,去掉數據量綱并進行線性回歸建模估計。原模型的可決系數只有0.45,加入新解釋變量后,應提高該模型的擬合優度,增強模型對于被解釋變量的解釋力貢獻,定量分析出各解釋變量與芝麻信用分的關系,從更全面的角度分析芝麻信用評分機制,發現其不足之處并給出改進意見。