999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于冗余數據壓縮算法的經濟信用風險研究

2017-05-09 05:41:51季姝俞靜河海大學商學院江蘇南京211100
電子設計工程 2017年7期

季姝,俞靜(河海大學 商學院,江蘇 南京 211100)

基于冗余數據壓縮算法的經濟信用風險研究

季姝,俞靜
(河海大學 商學院,江蘇 南京 211100)

針對信貸市場中的大數據難以有效分析經濟信用風險的問題,本研究以終端云計算存儲網絡平臺的金融數據包為基礎,通過篩選過濾和降維處理的操作,在靜態的分塊模塊中將上傳的數據包文件進行分割得到不同容量的數據包從而實現對冗余數據的高緯度的立體空間映射;動態的分塊模塊中時間序列數據副本邊緣特征空間向量的迭代操作步驟數對冗余數據包進行模式的轉換。選取國民經濟中劃分的18個行業81個月實驗結果表明:時間滑動窗口為5 s,對象個數為40個時,經濟信用風險的誤差在1%左右,數據誤差和標準差分別在3%和4%以內,數據集檢出準確率超過95%;冗余數據的壓縮率為5.93%以內。

壓縮算法;冗余數據;云存儲;信用風險

隨著當代信息科技的發展,人們進入大數據時代,信貸市場的大量數據猶是如此[1]。云端為信貸市場數據存儲提供了平臺[2],它不僅提供了存儲的空間,還提供了計算和管理的功能。在云計算系統背景之下大數據的處理問題也日益呈現[3]。在電子計算機云系統中,云端作為一個可變的規模,其能夠任意的伸縮[4],但是由于在計算過程中儲存子節點同構互換,使得在數據傳輸的次通道中產生了大量的冗余數據,通過對冗余數據的篩選和壓縮能夠減少云計算的成本[5]。因此,對數據庫數據進行降維處理并實現對冗余數據的壓縮篩選[6]和濾除濾波并刪除[7],能夠提高云端計算的速度和效率,降低信貸雙方的計算開銷。目前對于云端次通道中產生的冗余數據處理方法主要有分數階傅里葉變換的處理方法[8]、神經網絡控制的處理方法[9]和支持向量機特征分類的處理方法[10],然而以上冗余數據的處理方法存在信息成本高,計算開銷大以及次通道中冗余數據特征維數較高等問題[11]。針對上述問題,文中提出一種基于特征壓縮的云計算冗余數據降維算法對經濟信用風險進行研究,以期減少經濟風險成本。

1 冗余數據壓縮算法

1.1 冗余數據生成機制與體系構架

一般情況下,基于電子計算機系統之下的外環境通過將用戶群使用的終端軟件、網絡處理器以及經過虛擬處理的核心云計算電子平臺相結合[12]。但是很多情況下,隨著電子計算機云端存儲的中樞系統與電子設備結構的發展相適應,其中的技術和結構的變化容易對數據產生傳輸的次通道[13],在數據傳輸的次通道中會出現動態的衍生和節點轉換的現象,由此在數據處理和傳輸的過程中就會產生相當數量的冗余數據,對于產生的冗余數據需要進行篩選濾除以及降維處理[14],同時要兼顧開發處理使用的軟件以及電子計算機云端存儲平臺的特征相適應。電子計算機的云端存儲平臺遵循的存儲機制如下:數據輸入輸出端口、存儲設備層,節點管理器和組件層調用管理云存儲外部環境下的大數據。基于電子計算機系統之下的外環境進行存儲數據和管理數據的具體過程流程圖如圖1所示。

圖1 數據存儲與管理流程

為了使數據的處理更有針對性,面向不同的用戶群和受眾,在數據傳輸的次通道中分布有不同的資源節點,利用四元組G來表示在數據處理過程中冗余數據的存儲結構,即G=(V,E,W,C),同時對移動終端的云計算存儲網絡平臺的數據包進行定義,將傳輸的第i個數據包定義為ith,其主要的運行機制是首先在靜態的分塊模塊中將上傳的數據包文件進行分割得到不同容量的數據包,故存在不同大小的冗余數據模塊,從而實現了對冗余數據的高緯度的立體空間映射。在電子計算機云端存儲系統中數據變化導致的次通道中存在的分隔分片函數可以如下表示:

其中,g表示在高緯度的立體空間中進行迭代操作的步驟數,t表示在動態的時間序列數據副本中的一些存在邊緣特征的空間向量的迭代操作步驟數。在資源節點的分布管理中,利用設置的組件進行調用和降維處理和篩選,并對冗余數據包進行模式的轉換,最終得到電子計算機云端存儲系統下次通道中冗余數據包的采樣時間向量,以及得到冗余數據包在云存儲系統中的處理順序序列,其規模如下:

在進行冗余數據壓縮的同時可能會存在云端存儲的資源節點分布對冗余數據堆產生降維干擾的影響,為了盡可能的減少這樣的影響提升數據壓縮的效率,需要對分布節點進行干擾濾波,并通過空間降維的方法最終實現對冗余數據的過濾和篩選達到冗余數據壓縮的目的。

1.2 冗余數據的空間降維與特征值提取

在進行云存儲系統中系統結構的冗余數據包進行分析和空間重組降維處理[15],同時需要以互聯網為媒介進行信號的算法處理并且實現對冗余數據的提取和讀取處理。在電子計算機云端存儲系統中利用資源節點分布來調用中間組件進行調試,一般情況下會產生冗余數據包的漂移情況,設冗余數據包的時間區間長度為N,將收集錄入的數據進行分類匯總,得到C個分類,根據其空間特征獲得電子計算機云端存儲系統中次通道冗余數據的空間重組表達公式:

其中,x(t)用以表明時間序列,j為對空間進行重構的分割尺度,m是冗余數據包中的維數。一般在上述構建的多維空間內對次通道中的冗余數據特征值進行提取,設在向量特征值提取的過程中的降維矢量集合表示如下:

在電子計算機的云端存儲系統中,將次通道中的冗余數據集合形成向量進行歷遍運算流程之后得到了含有n個樣本特征值的有限元,采集的樣本共有n個,冗余數據包的空間多維向量為:xi=(xi1,xi2,…,xis)T。對冗余數據的不同量化模式進行不同步長的熵編碼[16],將編碼的矢量設為c類 ,其范圍為1<c<n,利用高階高維的特征向量壓縮處理方法處理冗余數據的聚類中心,表達如下:

其中,Vi表示第i個對冗余數據產生干擾的向量,通過SVD分解法得到冗余數據分解結果:

將冗余數據的降維目標函數定義如下:

其中歐式距離dik公示表達如下:

結合上述所有的約束條件并聯系中心極限定理的原理得到如下的冗余數據特征空間壓縮的目標函數的極值[17]:

通過設定能夠干擾向量,并輸入初值結合模糊度指標m,最終實現高維冗余數據的降維處理和特征值提取。

2 經濟信用風險分析

2.1 信用風險度量

對于信用風險的度量目前主要是CCA方法[18],其理論根源為期權定價理論,對于信貸市場的信用風險度量有著非常重要的經濟意義。CCA方法主要特點在于其將企業的公開財務數據和市場的數據相結合,對于信用風險的度量更為準確也更為及時,能夠表現企業和銀行在信貸市場信用風險變動的動態趨勢,從而在業界得到了廣泛的應用。在CCA方法中利用違約距離DD來衡量信用風險。當假設企業資產價值At服從幾何布朗運動時,根據Black-Scholes公式及伊藤引理得[19]:

其中,B為違約障礙,E為債務低級索取權,σA、σE分別表示企業資產波動率及企業低級索取權波動率,r為無風險利率,T-t為期限d2=d1-σ,滿足P{At≤Bt}=N-d2通過利用牛頓迭代法即可計算出違約距離DD。

2.2 信用風險冗余數據壓縮算法步驟

根據經濟中信用風險數據的特性,將本算法具體劃分為3個步驟:1)時間序列的歸類:運行數據庫數據,將經濟市場數據按照特征根據元組標碼,對于屬于同一個簇的元組分標,此處簇可為不動點也可為噪聲點的集合;2)對簇的類型進行判別:對已標號分類的聚類進行判斷,并從中匯聚出不動的噪聲點和不動點和數據波動軌跡;3)壓縮數據:根據特征提取和降維處理對數據進行壓縮處理。從第一個未被標記的子算法開始運行整個數據庫,按時間先后進行處理,整個子算法的運行直到所有的數據遍歷為止,最終所有數據都會被標注相應的記號,最后再根據特征提取和降維處理實現冗余數據的壓縮。子算法的具體流程如圖2所示。

圖2 簇類別判斷與冗余壓縮合成算法

3 實驗結果分析

實驗中的算法運行CPU硬件選取雙核AMD FX-8350 4GHz,內存DDR3 1866 8GB,并采用CSR-6930Z超高頻固定式讀寫器,在操作系統為Windows 7的PC機上完成。文中用于實驗的數據為國民經濟中劃分的18個行業,取其行業市值在全行業市值中所占比重為前九的行業作為樣本,樣本區間為2008 年1月至2014年9月,共81個月。為了驗證冗余數據壓縮算法對經濟信用風險分析的有效性,本研究選取數據壓縮率和準確率作為標準,同時實驗所用的時間滑動窗口大小和對象個數作為參數,獨立重復實驗30次獲取對信貸市場所選取的9個行業作為樣本的月度數據的數據庫進行降維處理和特征值提取進行數據壓縮和冗余數據的篩選,如表1所示。

表1 時間滑動窗口大小與對象個數的壓縮率和準確率

由表1可知,經濟信用風險的冗余數據的時間滑動窗口大小和對象個數對原始數據集有重要的影響。壓縮率愈小說明冗余數據在降維處理后的數據量占比愈小,并且準確率愈大說明算法對經濟信用風險的冗余數據識別所占比愈大。其中,隨著時間滑動窗口用時遞增,壓縮率逐漸降低,而準確率逐漸提高,且當時間窗口為6 s時,壓縮率僅為9.54%,準確率為99.89%;隨著對象個數的增加,壓縮率逐漸降低,準確率逐提升,且當對象個數為60時,壓縮率為24.54%,準確率僅為99.91%。為了進一步研究經濟信用風險的波動情況,本研究選用時間滑動窗口為5 s,對象個數為40個,標記出經濟信用風險的違約距離的動態波動軌跡,其動態趨勢如圖3所示。

圖3 經濟信用風險的冗余數據動態趨勢檢驗

由圖3可知,經濟信用風險的誤差在1%左右,在本實驗中數據誤差和標準差分別在3%和4%以內,此時數據集中不動點的檢出準確率最高,超過95%;冗余數據的壓縮率為5.93%以內。

4 結 論

由于信貸市場由于貸款雙方信息不對稱所導致的信用風險,為了解決在銀行在決定放貸之前對企業的財務數據進行評級所遇到的數據冗余問題,本文根據數據特征進行按簇分類提出了一種基于冗余數據壓縮壓縮算法的經濟信用風險研究方法。本文算法首先根據修正的CCA方法并結合冗余數據的壓縮算法,以經濟運行中的九大行業為樣本采集到企業的財務狀況數據,參照基于時序的聚類算法將每個行業的財務數據按照特征歸類并分成若干簇,形成的每個簇都是按照其屬性進行歸類運動的運動軌跡或靜止點形成的噪聲數據;根據之前設定的參數對所劃分歸類的簇進行判斷并按照元組為單位對冗余數據進行壓縮。通過進行本實驗表明,本文提出的冗余數據壓縮算法能夠對各種類型的數據進行壓縮聚類,實現對冗余數據的篩選壓縮和處理。對于經濟信用風險數據的壓縮準確性和算法運行效率的提高將是研究的下一個方向。

[1]張杰,劉鳳,賀立龍.基于企業規模的中小企業信貸融資特征分析[J].統計與決策,2012(15):92-95.

[2]秦秀磊,張文博,王偉,等.面向云端Key/Value存儲系統的開銷敏感的數據遷移方法 [J].軟件學報,2013(6):1403-1417.

[3]劉正偉,文中領,張海濤.云計算和云數據管理技術[J].計算機研究與發展,2012,49(1):26-31.

[4]張友鵬,權海寧.新型分布式全電子計算機聯鎖系統研究[J].計算機工程與應用,2012,21(6):164-166.

[5]聶軍.基于K-L特征壓縮的云計算冗余數據降維算法[J].微電子學與計算機,2016(2):125-129.

[6]王汝言,吳晴,熊余,等.壓縮感知的多參數鏈路故障定位算法 [J].電子與信息學報,2013(11): 2596-2601.

[7]郭鳳鳴,李兵,何怡剛.密集環境下RFID系統濾波方法研究[J].計算機工程與應用,2014,50(13): 210-213.

[8]譚鴿偉,潘光武,林薇.基于分數階傅里葉變換的兩步運動補償CS算法[J].計算機應用研究,2015,32 (1):89-92.

[9]朱金華.組合模型在商業銀行信用風險評估中的研究[J].計算機仿真,2011,28(9):361-364.

[10]焦衛東,林樹森.整體改進的基于支持向量機的故障診斷方法[J].儀器儀表學報,2015,36(8): 1861-1870.

[11]刁愛軍.基于壓縮特征編碼的混合云冗余數據刪除算法[J].科技通報,2015,31(8):42-44.

[12]張偉娜.以云計算為導向的計算機操作系統教學研究[J].軟件,2014(7):85-88.

[13]唐懿芳,鐘達夫.基于數據冗余的BDS長報文傳輸機制改進算法[J].指揮控制與仿真,2016(1): 152-157.

[14]李蓉,周維柏.基于多特征選取和類完全加權的入侵檢測[J].計算機技術與發展,2014(7):145-148.

[15]付仲良,趙星源,王楠,等.一種基于流形學習的空間數據劃分方法[J].武漢大學學報:信息科學版,2014(7):145-148.

[16]黃慶卿,湯寶平,鄧蕾,等.無線傳感器網絡子帶能量自適應數據壓縮方法 [J].儀器儀表學報,2014,35(9):1998-2003.

[17]葉清,吳曉平,葉曉慧,等.基于PCA與FCM的入侵檢測樣本數據壓縮方法[J].海軍工程大學學報,2012,24(5):25-30.

[18]管薇薇,周凱.信用風險數據集市的構建探討[J].電腦知識與技術,2014(8):5155-5158.

[19]王飛,孫維堯.基于Black-Scholes方程的股指期貨期現套利模型及交易算法[J].計算機應用,2013,33 (1):326-328.

Research on economic credit risk of based on redundant data compression algorithm

JI Shu,YU Jing
(Business School,Hohai University,Nanjing 211100,China)

For the credit markets effectively analyze large data difficult economic problems of credit risk,this study terminal cloud storage network platform of financial data packet basis,by operating the screening and filtration reducing the dimension of the block in the module,in a static Upload file packets obtained by dividing the capacity of different packets of three-dimensional space in order to achieve high latitudes redundant data mapping;Iterative procedure number of copies of the data dynamic partitioning module for the time series feature space vector edge of redundant data packet conversion mode.Select the national economy division 18 industry 81 months results show that:the sliding window of time 5 s,the number of objects is 40,the credit risk in the economy error of about 1%,the data error and standard deviation,respectively,and 3%less than 4%,the detection accuracy of the data set more than 95%;redundant data compression rate of less than 5.93%.

compression algorithm;redundant data;cloud storage;credit risk

TN<919.6 文獻標識碼:A class="emphasis_bold">919.6 文獻標識碼:A 文章編號:1674-6236(2017)07-0015-04919.6 文獻標識碼:A

1674-6236(2017)07-0015-04

A 文章編號:1674-6236(2017)07-0015-04

2016-06-22稿件編號:201606173

國家自然科學基金面上項目(71171207);河海大學中央高校基本科研業務費項目(2013B33114)

季 姝(1992—),女,江蘇南通人,碩士研究生。研究方向:信用風險。

主站蜘蛛池模板: 国产亚洲欧美日韩在线一区二区三区| 丰满人妻中出白浆| 色国产视频| 国产视频a| 九九这里只有精品视频| 台湾AV国片精品女同性| 天天综合网色| 亚洲色图综合在线| 高潮毛片无遮挡高清视频播放| 国产99热| 99ri国产在线| 久久精品无码中文字幕| 国产精品人人做人人爽人人添| 青青操国产视频| 日韩高清无码免费| 国产欧美另类| 欧美另类视频一区二区三区| 曰AV在线无码| 久久77777| 国产免费看久久久| 成人精品区| 亚洲免费成人网| 亚洲国产91人成在线| 国产裸舞福利在线视频合集| 国产亚洲欧美日韩在线一区| 亚洲美女一区二区三区| 日韩午夜福利在线观看| 中文字幕66页| 成年人久久黄色网站| 亚洲国产中文欧美在线人成大黄瓜| 97超碰精品成人国产| 自拍欧美亚洲| 无码粉嫩虎白一线天在线观看| 国产99视频在线| 美女扒开下面流白浆在线试听 | 伊人AV天堂| 成人毛片免费在线观看| 日韩二区三区无| 欧美午夜久久| 欧美一级色视频| 人妻丰满熟妇AV无码区| 成人a免费α片在线视频网站| 91亚洲视频下载| 久久国产热| 一级毛片在线免费视频| 伊人色天堂| 全部免费特黄特色大片视频| 综合色在线| 免费国产黄线在线观看| 国产成人免费手机在线观看视频 | 免费av一区二区三区在线| 青草国产在线视频| 色国产视频| 91毛片网| 亚洲第一天堂无码专区| 欧美精品色视频| 国产在线自乱拍播放| 九九热精品免费视频| 91小视频在线观看免费版高清| 国产在线拍偷自揄观看视频网站| 亚洲成人一区二区| 国产精品一区二区久久精品无码| 激情综合图区| 人妻出轨无码中文一区二区| 麻豆AV网站免费进入| 97视频精品全国免费观看| 免费毛片视频| 国产主播在线观看| 97人人做人人爽香蕉精品| AV片亚洲国产男人的天堂| 四虎国产精品永久一区| 国产偷国产偷在线高清| 日韩欧美国产综合| 最新国产成人剧情在线播放| 久无码久无码av无码| 91久久偷偷做嫩草影院电| 欧美午夜一区| 丁香六月综合网| 99re免费视频| 米奇精品一区二区三区| 久久窝窝国产精品午夜看片| 欧美日韩国产在线播放|