999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據背景下融資企業信用特征分析

2019-01-13 01:26:07王寧王澍張江陶鵬
經濟研究導刊 2019年35期

王寧 王澍 張江 陶鵬

摘? ?要:國網大數據中心泛在電力物聯網建設對電網金融數據分析的范圍、模式和方法提出了更高要求。面向大數據樣本研究,如何將大樣本相比于小樣本的獨有特征體現在分類模型中值得深入探索。以供應鏈的金融數據的分布特征為出發點,研究了影響信用風險分類模型的主要因素,進而概括出信用數據的分布特征,并探討了進一步的解決策略。通過電網供應鏈金融大數據分布特征的分析,旨在研究出電網全業務數據后隱含的信息,以此來為信用風險模型的構建提供了前提條件。

關鍵詞:泛在電力物聯網;供應鏈金融;信用風險;國網大數據;全業務數據中心;離群點;多維

中圖分類號:F276.3? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2019)35-0131-02

引言

大數據(Big Data,BD)是經濟發展到一定階段的產物,是時代的烙印。尤其是數字時代的今天,它促使具有多重媒介的電網業務數據出現大幅上漲。國際數據公司IDC(International Data Corporation)在《2018—2019年產業發展研究報告》中指出,2018年全球超大規模數據中心為430個,較2017年增長11%;全球業務市場整體規模達到6 253.1億元人民幣,較2017年增長23.6%。大數據的到來在很大程度上改變了電網業務的發展,通過研究電網業務數據來側面反映出用戶行為規律,從而進一步挖掘潛在的商業價值以及社會效益,也創造了更多具有價值的信息。Gantz等描述了包含體積(Volume)、變化(Variety)、速度(Velocity)、準確性(Ve-racity)和價值(Value)五個方面內容構成的大數據5V理論。其在闡述5V理論時指出數據的準確性及價值對于大數據而言是非常重要的,如果沒有數據分析出存儲、管理等方面的內容的話,它將不會產生更多價值。

一、國家電網供應鏈金融大數據分析的現狀

電網供應鏈金融是以核心企業為中心的,并通過管理物資流、現金流以及信息流來將其上、下游各級供應商及終端客戶緊密聯系在一起的一個網絡結構。它是國家電網公司落實支持實體經濟和小微企業的央企責任的重要手段,有助于優化產業鏈條生態環境,提高供貨的穩定性,降低網省公司經營風險,同時,供應鏈金融作為新興信貸服務模式,將成為國家電網公司金融業務新的重要增長點。電網供應鏈融資比傳統的融資模式具有很多的不同點,例如,評價指標動態多樣化、資金關系復雜等,這也使得電網供應鏈融資的風險及風險評價有其獨特之處。通過大數據形成的多維評價機制能有效的對融資企業的數據進行準確、客觀的分析出其的資信狀況,這也在很大程度上為多數風險型的企業提供資金融通,從而推動電網公司與融資企業的和諧發展。

二、融資企業信用數據的分布特征

(一)信用數據的非對稱性與不平衡性

信用評估其實可以直接將其看成是一個二元的客戶分類問題,信用樣本的獲取具有涌現性的特征,指的是在眾多樣本中往往很少發現具有價值的樣本點,而且這類樣本明顯少于其他類樣本的集合被稱為不均衡樣本,總而言之,信用評估問題具有很多特性,譬如類別分布不平衡與不對稱等,這些對供應鏈金融風險評價形成了較大制約。

(二)信用數據噪聲和離群點問題

在信用風險評價領域的發展中,噪聲和離群點會直接導致信息、周期性的統計誤差以及報告偏倚出現錯誤。噪音離群點又被稱為孤立點,它的存在會直接影響分類精度。而引起噪音離群點產生的原因有多種,例如異類、數據變量的固有變化、數據誤差等。因此,加強高維空間的數據稀疏問題處理力度,并采用合適的度量方法,能有效促進離群點的發展。

3.3信用數據的非線性多維特征

信用風險評估具有多個特點,如高維、非線性等,而現有的分類方法都是一句數據間的相似度來區分的,但是,如果是在高維的情況下,由于數據比較稀疏,會使得數據間的距離及區域米密度不再明顯,再加上高維度的數據對樣本數量的要求較高,當數據維度大于樣本數量時,就會出現擬合現象,因此,完善高維數據的本質低維結構,就必須首先解決數據低維問題。

三、解決信用數據分布特征的相關策略

(一)非均衡樣本的解決策略

1.基于數據分布的調整

數據準備階段是進行數據分布調整的基礎,因此,必須做好數據準備,才能通過數據分組或者數據采樣等方式促使類別的平衡,以此來消除類別的不平衡問題。由于利用重抽樣算法來擴充少量樣本會直接產生擬合問題,無法得到理想的效果,于是Pierri等人就采用了案例控制匹配的Logistic回歸、平衡樣本的Logistic回歸和ROSE(Random Over Sampling)平衡樣本回歸這三種方法來解決非均衡信用數據所產生的分級問題,并取得了很好的效果。這也同樣能適用于供應商的信用評級問題的解決。

2.基于監督模型的策略

隨著機器研究的不斷發展,非均衡樣本通過采用神經網絡算法、支持向量機等方法也有了新的發展結果。Li等人通過在子空間與貝葉斯神經網絡集成方面采用有別于傳統算法的深度方差網絡算法,使得非均衡樣本分類產生了很好的識別效果。主要區別在于考慮了樣本數據的異類以及類間的異構性,從而將貝葉斯模型引入到神經網絡學習框架中,將每次得到的特征聚類到與判別相關子空間中,進而使得非平衡訓練數據上的同質性以及異質性得到自行調整。

3.基于半監督模型的策略

上述方法都屬于監督式分類建模的研究范式,也就是通過研究前進行有效架設,將已存在一定數量的標簽樣本用于建立風險評價模型中,但是,由于供應鏈融資具有很強的復雜性,使得在此過程中難以得到大量的準確標簽樣本,而只能依靠少量的標簽數據是難以得到數據分布規律的。肖進等人提出了可在隨機子空間的半監督模型,它是通過采用RSS的方法來得到基本分類器,繼而從大部分的無類別標簽中通過選擇性的標記適合的樣本加入到原始訓練集中,從而在最終的訓練集中得出訓練分類模型,進而進行有效分類。通過在三個客戶信用評估數據集的分析顯示RSSCI模型具有監督式集成信用評估模型與半監督協同訓練信用評估模型所沒有的優勢。

4.基于集成處理的策略

實驗表明,通過對多個分類器的分類結果進行有效集成,使每個分類模型都發揮自身的優勢,比進行單個分類模型更能提高客戶信用評估模型的準確性。集成處理策略時通過大量的弱分類器組成的一個強分類器。Sun等人認為,特征選擇與非均衡數據處理在信用分析評價中都占據著至關重要的地位,為此提出了以T-test和分支定界(B&B)為基礎的動態特征選擇模型,并以SSVMS和多重判別分析為基分類器進行集成以處理非均衡樣本模型(IOMCE)。通過實驗表明IOMCE模型對于處理分均衡信用樣本的分類問題具有積極作用,而且通過特征選擇模型進行分類數據維度的降低也能很好地提高非均衡信用樣本的評價精度。

(二)噪聲離群點的解決策略

1.基于統計學的探測方法

偏離平均值μ超過3σ的數據點指的是在正態分布中的一個具有代表性的離群點,由于其與標準差存在很大的差異,對此賈潤達等人認為,可通過一種叫做魯棒M估計的間歇過程離群點檢測方法來進行檢測,進而將積分方程離散化將問題轉換成最小二乘優化問題,并通過Tikhonov正則化方法及魯棒M估計來減少對參數的影響,然后分析出各個樣本點的權值,從進而實現對離群點的檢測。研究表明,即使在不確定的市場環境中,創造性的財務與自由裁量權所造成的噪聲與違約概率會自然形成同向關系,反之則會形成反向關系。

2.基于聚類的探測方法

聚類的方法使用來檢測對象與簇之間的關系的,因此,可將數據集分成類簇,如若出現一個對象不屬于任何類簇,可以將其視為基于聚類的離群點。Jiang等[6]人認為可通過兩階段聚類離群檢測算法進行檢測,這一算法認為可在第一階段運用K-means算法將所有的數據集轉變成若干個干聚類,然后在第二階段運用多個簇類將其質心代替后形成新的數據庫,進而使質心間的距離作為權值成為最小生成樹,去掉長邊,形成多棵子樹,將較少結點的樹對應的小簇類可將其視為離群點。

3.基于距離的探測方法

為了彌補以上算法的不足,王習特等[7]人通過新型的分布式計算方法,通過運用BDSP(Balance Driven Spatial Partitioning)空間數據的方法來處理數據,再通過采用BDSP算法引出一種BOD(BDSP-basedOutlierDetection)離群點檢測算法得出每個計算結點本地。該算法是通過R樹索引從而進行大量過濾得出本地離群點進而得出候選集,然后采用BDSP的快編碼規則確定相鄰塊,從而得出最終結果。

4.基于密度的探測方法

上述關于離群點的含義及剔除都是縱觀全局得到的,由于實際數據集結構更加復雜,由此還存在數據觀察異常的現象,它被稱為局部離群點。Breunig等[8]認為可通過離群點的檢測算法,將其鄰域的考察數據點與其近鄰“密度”的差異來斷定其是否是離群點,從而將這種存在的差異點稱為局部離群因子(LocalOutlierFactor,LOF)。

結語

綜上所述,信貸增量控制導致實體經濟缺乏充分發展的條件,尤其是供應商融資方面的影響,國家電網公司的供應鏈金融發展的實質就是解決發展處于劣勢地位的供應商的融資問題,是“三型兩網”世界一流能源互聯網企業建設的重要探索,是提高金融業務創新活力、推進產融協同、服務公司高質量發展的重要舉措。由于供應鏈融資具有評估指標靈活多樣以及資金關系較為復雜等特點,加上我國供應商的密集性、多樣性從而使得數據分析方法較為復雜。大數據是通過分析供應商的信用特征,從而梳理出主要影響因素,進而對評估數據中的的內在信息與研究價值進行分析,最終為構建更優越的電網供應鏈金融平臺奠定理論基礎。

參考文獻:

[1]? 肖進,薛書田,黃靜,等.客戶信用評估半監督協同訓練模型研究[J].中國管理科學,2016,24(6):124-131.

[2]? 賈潤達,劉俊豪,毛志忠,等.基于魯棒M估計的間歇過程離群點檢測[J].儀器儀表學報,2013,34(8):1726-1731.

[3]? 王習特,申德榮,白梅,等.BOD:一種高效的分布式離群點檢測算法[J].計算機學報,2016,39(1):36-50.

主站蜘蛛池模板: 性喷潮久久久久久久久| 国产黄在线免费观看| 精品国产香蕉伊思人在线| 91最新精品视频发布页| 麻豆国产精品| 真实国产乱子伦视频| 亚洲人成在线免费观看| 欧美笫一页| 99热这里只有精品在线播放| 免费国产小视频在线观看| 免费毛片视频| 亚洲第一成年免费网站| 欧美精品啪啪| 国产日韩久久久久无码精品 | 亚洲精品天堂在线观看| 国产精品19p| 亚洲综合在线最大成人| 天天综合网亚洲网站| 亚洲精品日产AⅤ| 99久久精品免费看国产免费软件| 欧美成人精品一级在线观看| 国产精品无码AV片在线观看播放| 人人91人人澡人人妻人人爽| 精品91视频| 成人午夜免费观看| 亚洲无限乱码一二三四区| 欧亚日韩Av| 欧美日韩精品在线播放| 亚洲国产成人超福利久久精品| 在线不卡免费视频| 动漫精品啪啪一区二区三区| 亚洲大尺码专区影院| 日韩小视频网站hq| 青青青国产视频手机| 欧美有码在线观看| 欧美劲爆第一页| 国产毛片不卡| 国产成人艳妇AA视频在线| 亚洲品质国产精品无码| 国产成人欧美| 狠狠久久综合伊人不卡| 亚洲美女一级毛片| 最新国产在线| 国产精品成人久久| 国产导航在线| 国产亚洲现在一区二区中文| 黄片在线永久| 婷婷99视频精品全部在线观看 | 国产美女精品一区二区| 久久先锋资源| 精品撒尿视频一区二区三区| 日韩视频福利| 国产亚洲高清视频| 真人高潮娇喘嗯啊在线观看| 国产一级α片| 日本道中文字幕久久一区| 久久中文无码精品| 国产成人久视频免费| 国产精品一区二区不卡的视频| 亚洲综合激情另类专区| 国产成人高清亚洲一区久久| 国产成人夜色91| 4虎影视国产在线观看精品| 亚洲日韩精品无码专区97| 中国国产一级毛片| 亚洲精品视频在线观看视频| 亚洲欧美精品一中文字幕| 亚洲国产精品不卡在线| 日本91在线| 国产老女人精品免费视频| 亚洲一区波多野结衣二区三区| 免费人成视网站在线不卡| 8090成人午夜精品| 亚洲精品色AV无码看| 乱系列中文字幕在线视频| 亚洲第一成年网| 亚洲一区无码在线| 手机在线免费毛片| 中文字幕一区二区人妻电影| 免费午夜无码18禁无码影院| 国产亚洲精品自在久久不卡| 午夜国产不卡在线观看视频|