何苗
【摘要】1980年著名的未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”。大數據對各行業發展都將帶來巨大的、深遠的影響。征信行業如何應用大數據值得我們深入探討與研究。
【關鍵詞】征信業 大數據 應用
隨著互聯網、云計算的快速發展,大數據對各行業發展都將帶來巨大和深遠的影響。征信行業如何應用大數據值得我們深入探討與研究。
一、大數據的含義與特點
(一)大數據含義
2008年在維克托·邁爾-舍恩伯格及肯·庫克耶編寫的《大數據時代》中,大數據指不用隨機分析法(抽樣調查)這樣的方式,而對所有數據進行分析處理。
(二)大數據特點
大數據的核心價值是對海量數據進行存儲和分析。大數據的4V特點即:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。Volume(大量)指大數據體量巨大。從TB級別躍升到PB級別。移動互聯網、物聯網、車聯網、云計算、PC機、手機、平板電腦以及遍布全球的各式傳感器,都是數據來源。Velocity(高速)指大數據處理速度快。大數據需要依托云計算的分布式處理、分布式數據庫、云存儲和/或虛擬化技術。Variety(多樣)即數據的類型繁多,包括各種數據庫、網絡日志、視頻、圖片、地理位置信息等等。Value(價值)即價值密度低。需要從海量數據中提取有價值的信息。
(三)大數據的處理流程
1.采集與導入。指將分布的、異構數據源中的數據截取后進行清理、轉換、集成,然后加載到數據倉庫或數據集市中,作為聯機分析處理、數據挖掘的基礎。數據存取軟件主要有關系數據庫、NOSQL、SQL等。存儲模式主要有云存儲、分布式文件存儲等。
2.統計/分析。主要運用分布式數據庫、分布式計算集群對海量數據進行普通的分析、分類匯總等,以滿足分析需求。實時性需求多采用EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存儲Infobright等,而批處理或基于半結構化數據需求可使用Hadoop。其統計分析的主要方式有:假設檢驗、顯著性檢驗、T檢驗、相關分析、差異分析、卡方分析、方差分析、偏相關分析、回歸分析、距離分析、簡單回歸分析、多元回歸分析等。
3.數據挖掘。與統計/分析過程不同的是,數據挖掘一般沒有預先設定的主題,主要是在現有數據上進行基于各種算法的計算,進行預測,實現高級別數據分析需求。典型的算法有用于聚類的Kmeans、用于統計學習的SVM和用于分類的NaiveBayes,主要工具有Hadoop的Mahout等。
二、我國征信業信息系統建設情況
2013年我國出臺的《征信業管理條例》指出我國的征信業務指對企業、事業單位等組織和個人的信用信息進行采集、整理、保存、加工,并向信息使用者提供的活動。我國的征信信息系統主要有央行征信系統、行政管理征信系統、商業征信系統。
(一)央行征信系統建設情況
我國征信業監督管理機構——人民銀行建立了金融信用信息基礎數據庫(包括企業信用信息基礎數據庫和個人信用信息基礎數據庫),于2006年在全國聯網運行,是我國最重要的征信系統。其數據來源于放貸機構、政府及其他相關機構。放貸機構免費強制提供數據,政府及其他相關機構自愿提供數據。由人行征信中心匯總、處理數據。金融機構依法有償查詢,政府部門及企業和個人依法免費查詢。
該系統接入機構1811家,包括銀行機構485家,小額貸款公司700家,融資性擔保公司257家,住房公積金中心310家,財務公司10家、消費金融公司4家等。截至2014年底,企業和個人征信系統接入機構分別達1724家和1811家,分別收錄近2000萬戶企業、其他組織和8.6億自然人,其中,有信貸記錄的自然人3.5億人。
該系統采集的主要信息有:身份信息、信貸信息(包括貸款、貿易融資、保理、票據貼現等各類企業授信產品,以及個人消費貸、住房抵押貸款、信用卡、個人經營性貸款等個人信貸產品)、非金融負債信息(如電信繳費信息、公用事業繳信息)、公共信息(包括住房公積金繳存信息、社保參保繳費信息、司法信息如立案判決和執行信息、商事信息如登記注冊和財務信息等)四塊。
央行征信系統的產品與服務主要是信用報告和增值服務。增值服務主要有關聯企業的關聯查詢服務、將本機構好客戶在其他機構變差的信息提供給機構用戶的信息提示服務、“個人信用報告數字解讀”(即利用個人信用報告中信貸交易和查詢信息建模,研究開發個人信用風險量化評估工具,預測借款人未來逾期的可能性)等。此外,信貸資產結構分析、歷史違約率等產品也正在研發中。
央行征信中心通過下屬機構上海資信有限公司建成網絡金融征信系統,將p2p網貸機構納入了系統。截至2014年底,接入網貸機構370家,收錄客戶52.4萬人。目前該系統尚未接入央行征信系統,主要是幫助P2P平臺信息互享,普通消費者尚不能通過該系統查詢。
(二)行政管理征信體系
以地方政府及職能管理部門為主導建設的,收集的信息主要有工商、稅務、海關等各職能采集的數據。
(三)商業征信系統
商業征信體系指由民營機構建成并按市場方式運作的機構體系。我國上世紀80年代末、90年代初已有民營征信機構誕生,例如鵬元征信有限公司個人征信系統自2002年即已開始投入運行。過去商業征信系統沒有獨立、穩定的數據來源,主要是從前兩個體系挖取,再進行整合、分析。而近幾年以互聯網為背景的征信公司的加入改變了這一狀況。這些機構依托互聯網企業采集的電子商務、社交等信息,對征信對象進行分析。
我國《征信業管理條例》規定,設立經營企業征信業務的征信機構需向所在地央行備案,設立經營個人征信業務的征信機構須由央行頒發個人征信業務經營許可證。截止2014年末,央行已向29家機構頒發了“企業征信業務經營備案證”。2015年1月5日,央行下發《關于做好個人征信業務準備工作的通知》,要求芝麻信用、騰訊征信、前海征信、鵬元征信、中誠信征信、拉卡拉信用等8家機構做好首批個人征信業務的準備工作。8家征信機構的數據主要來源于互聯網平臺或集團公司。如芝麻信用主要利用阿里旗下淘寶、天貓、支付寶等購物和理財平臺,整合電商、網上銀行、社交、招聘、公積金社保、交通運輸等信息,最終形成相關征信信息。騰訊征信隸屬騰訊集團,主要基于QQ和微信平臺上用戶所累積的數據對用戶進行分析評級。前海征信母公司為全牌照金融企業——平安集團(集團業務包括銀行、保險、信托等,旗下陸金所是國內最大的P2P網貸平臺),該公司主要利用母公司的數據。
三、我國征信業大數據應用需關注的問題
(一)征信信息公開、轉讓、共享與個人隱私保護處理問題
在大數據征信業態下,如何正確處理兩者關系的問題更為突出。政府、公共部門、企業、個人哪些信息可以公開,哪些信息應該公開,哪些信息可以轉讓,在多大范圍、采用哪些途徑和方式公開、轉讓等尚未有專門的法律法規予以明確。目前阿里小貸雖然與淘寶、天貓等都屬于阿里巴巴集團旗下公司,電商平臺的交易數據流向阿里小貸,仍相當于法人間數據讓渡。而目前《征信業管理條例》及相關法律法規并未對征信機構向特定用戶提供數據的行為作明確規定,因此難以界定這種行為是否違規或存在法律風險。
(二)央行征信系統信息來源受限
按照《征信業管理條例》,國家建設的金融信用信息基礎數據庫接受的信息為從事信貸業務的機構和不從事信貸業務的金融機構,這限制了央行征信系統信息來源,不利于央行征信系統拓展數據采集范圍。
(三)信息安全問題
云計算、大數據采取的是云存儲、分布式文件存儲等,數據或計算分布在多臺計算機上,數據鏈條長,數據系統、結構復雜,數據保密技術要求高,增加了數據泄密的風險。
四、建議
(一)進一步完善相關法律法規
在法律法規層面明確征信信息的歸屬權,明確界定個人信息和個人隱私,以及商業化大數據機構信息可公開、轉讓、出售的內容、范圍等等。同時,明確互聯網數據使用應遵守的原則:一是目的性原則,建立數據庫要有明確目的;二是適當性原則,采集與目的要適當;三是本人同意和知情原則,數據的采集、使用等要本人同意、知情。
(二)制定大數據建設機制和標準
建立良好的運行機制,在信息覆蓋面上,要盡可能對放貸機構、借款人群和地域上的全覆蓋;在數據采集、挖掘中滿足放貸機構、信息主體、監管部門等系統參與各方的需求,以促進征信大數據建設各個環節的正規有序。建立覆蓋多個領域、動態更新的大數據建設標準,為實現網絡和信息的互連、互通奠定基礎。在各專用數據庫建設的基礎上,通過數據集成,實現各級各類信息系統的數據交換和數據共享。進一步強化信息安全與保護。
(三)依法對互聯網、大數據公司開放征信市場
互聯網、大數據征信是傳統征信的業態升級。要創造有利條件促進互聯網征信公司發展。同時,參照國外的一些做法,把傳統征信數據和互聯網數據結合起來,在互聯網征信機構做到一定規模后,金融機構信息可在保護個人隱私和信息安全的情況下允許其使用。
(四)進一步完善央行征信系統
央行征信數據源要包括證券數據、保險數據、商業信用數據、消費交易數據和公共事業繳費數據等,還需進一步拓展信息來源,從互聯網機構獲取相關信息。按照《征信業管理條例》規定,從事信貸業務的機構應按規定向金融信用信息基礎數據庫提供信貸信息,因而只要相關部門認定P2P屬于放貸機構,就應將其接入央行征信系統。同時,在將來法律法規許可的情況下,央行征信系統可進一步拓展互聯網數據采集渠道和范圍。可將互聯網企業作為征信服務業的上游機構,依法將數據提供給央行征信機構,由央行征信機構再進行整合、分析等后續工作。
(五)對征信業監管要處理好行業發展與規范的矛盾
征信機構需要采集和提供更豐富的信息以滿足信息使用者的需要,但信息采集與使用不當又容易侵害信息主體的權益,引發違規行為。監管者往往存在為避免違規而過度監管的傾向,這會影響整個行業的活力與發展。因此監管者應更好地處理二者關系,使征信業規范與發展并重。
參考文獻
[1]盧芮欣.大數據時代中國征信的機遇與挑戰.金融理論與實踐.2015.2.
[2]林平.大數據背景下加快我國征信市場發展的思考.南方金融.2014.11.
[3]魏強.大數據征信在互聯網金融中的應用分析金融經濟.2015.4.
[4]洪偌馨.大數據征信的“是與非”.第一財經日報.2015-12-09.