999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于分布式技術的銀行大數據架構方案

2018-01-23 18:49:22韓健
中國科技縱橫 2017年24期
關鍵詞:大數據銀行

韓健

摘 要:大數據技術在銀行業引發了越來越多的關注。在數據爆發式增長的今天,銀行每天都在生成、獲取海量數據,如何能夠更加有效的處理和存儲銀行的數據成為銀行的新課題。本文以分布式數據處理和存儲技術為核心,試圖為傳統銀行搭建一條大數據的架構路線。

關鍵詞:銀行;大數據;分布式;架構

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1671-2064(2017)24-0036-01

自2013年大數據元年之后,互聯網、物聯網、社交網絡的數據洪流不斷沖擊傳統數據存儲和處理手段。據IDC(International Data Corporation)報告顯示到2020年全球數據總量將達到40ZB,全球在15年的數據總量為7.9ZB,而中國數據總量約占全球數據總量的13%。面對數據的爆炸性增長,傳統的數據存儲系統、傳統的數據庫技術和數據倉庫架構越來越感到吃力。數據庫也在從傳統的關系型數據庫到NoSQL非關系數據庫再到現在基于內存的NewSQL數據庫遞進發展。數據存儲量上數據處理速度上也在遞進發展。

對于如何處理大數據,計算機科學界有兩大方向:一種是集中式計算,一種是分布式計算。過去,分布式計算理論比較復雜,技術實現比較困難,因此在處理大數據方面,集中式計算一直是主流解決方案。IBM的大型機就是集中式計算的典型硬件,很多銀行和政府機構都用它處理大數據。不過,一方面大型機的價格過于昂貴,另一方面由于大型機技術長期以來被國外壟斷,不利于我國自主技術的研發。因此,國家提出了“去IOE”的計劃,大力鼓勵我國自主研發的技術。在這種大的時代背景下,基于分布式數據存儲和計算的系統在大數據領域擁有更加廣闊的前景。

1 分布式處理技術和存儲系統

當前,IT廠商推出的大數據平臺或產品以及各種開源大數據解決方案基本都采用了分布式計算和分布式文件系統,很好地解決了海量數據的存儲與計算難題。

1.1 分布式計算處理

分布式計算,即把一個需要非常大計算能力才能解決的問題分成若干部分,然后把這些部分分配給許多計算節點處理,再把計算結果綜合起來得到最終的結果。這種算模式,改變了原有的數據庫模式,即將所有的數據集中起來,通過不斷縱向擴展計算機性能來實現高性能的大數據處理。其靈活可擴展的架構,使得計算性能的橫向擴展更易實現。

1.2 分布式存儲系統

分布式存儲系統,多部署于低廉的硬件上(x86及本地磁盤)。在分布式存儲系統中,數據文件被分割成一個或多個數據塊,存儲在一組數據節點上,并通過多副本的機制有效保障了數據的可用性和完整性。同時,分布式存儲系統還提供高吞吐量來訪問應用程序的數據,適合那些有著超大數據集的應用程序。一些分布式存儲系統還可以實現以流的形式訪問文件系統中的數據。在集群中我們可以通過橫向擴展集群,來提高其性能與吞吐量。分布式存儲系統在高性能磁盤系統高效高成本和磁帶系統低效率低成本之間,找到了大數據存儲的解決方案。

2 MPP關系型數據庫與Hadoop的非關系型數據庫

目前分布式大數據存儲技術路線很典型的主要有兩種:第一種是采用MPP架構的新型數據庫集群,采用Shared Nothing架構,通過列存儲、粗粒度索引等多項大數據處理技術,再結合MPP架構高效的分布式計算模式,完成對分析類應用的支撐,運行環境多為低成本PC Server,具有高性能和高擴展性的特點,在企業分析類應用領域獲得極其廣泛的應用。這類MPP產品可以有效支撐PB級別的結構化數據分析,這是傳統數據庫技術無法勝任的。對于企業新一代的數據倉庫和結構化數據分析,目前選擇是MPP數據庫。

第二種是基于Hadoop的技術擴展和封裝,圍繞Hadoop衍生出相關的大數據技術,應對傳統關系型數據庫較難處理的數據和場景,例如針對非結構化數據的存儲和計算等,充分利用Hadoop開源的優勢,伴隨相關技術的不斷進步,其應用場景也將逐步擴大,目前很為典型的應用場景就是通過擴展和封裝Hadoop來實現對互聯網大數據存儲、分析的支撐。這里面有幾十種NoSQL技術,也在進一步的細分。對于非結構、半結構化數據處理、復雜的ETL流程、復雜的數據挖掘和計算模型,Hadoop平臺更擅長。

3 多種技術平臺相結合的大數據架構

在大數據時代,為了更好地挖掘不同類型數據的價值,同時更有效地使用各類數據處理平臺,大數據存儲和管理方案,應采用多種處理平臺相結合的模式,這樣可以實現高效低成本的儲存目標。由于業務處理層(ODS層)對事務完整性和實時性的要求都比較高,因此,從數據處理角度上來看,可采用傳統的高性能關系型數據庫(OLTP型數據庫)作為處理平臺。而對于數據消費層(ADS層),則可以采用大數據技術,使用MPP分布式數據庫和Hadoop技術作為分析型數據庫處理平臺。

MPP分布式數據庫較Hadoop分布式系統,在復雜邏輯的結構化數據處理上具有一定的優勢,且可基于SQL開發,對于有較豐富SQL經驗的銀行系統開發者開發與運維更容易。當然,業界MPP分布式數據庫產品價格也要高于Hadoop這個源于開源社區的產品。如表1所示。

銀行系統數據中,結構化數據價值密度通常高于非結構化或半結構化數據,而在銀行數據中非結構化數據占用了大量的存儲資源。這是因為銀行系統中結構化數據以賬務數據為主,而非結構化數據則主要集中在憑證影像等數據。當然結構化數據中也包括部分日志信息等價值密度不高的數據。

參考文獻

[1]張冬.大話存儲[M].北京:清華大學出版社,2008:19-58.

[2]王月,賈卓生.網絡存儲技術的研究與應用[J].計算機技術與發展,2006,16(6):107-109.endprint

猜你喜歡
大數據銀行
10Gb/s transmit equalizer using duobinary signaling over FR4 backplane①
中關村銀行、蘇寧銀行獲批籌建 三湘銀行將開業
銀行家(2017年1期)2017-02-15 20:27:53
保康接地氣的“土銀行”
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
“存夢銀行”破產記
銀行激進求變
上海國資(2015年8期)2015-12-23 01:47:31
銀行取款
主站蜘蛛池模板: 亚洲日韩在线满18点击进入| 黄色片中文字幕| 久久中文字幕不卡一二区| 久久黄色毛片| 日韩av在线直播| 亚洲成人一区二区| 欧美a级在线| 免费99精品国产自在现线| 99一级毛片| 免费女人18毛片a级毛片视频| 99久久精品免费观看国产| 在线国产91| 嫩草在线视频| 久久永久视频| 精品视频在线观看你懂的一区| 亚洲三级电影在线播放| 亚洲床戏一区| 欧美一级片在线| 在线无码九区| 国产尤物在线播放| 国产麻豆91网在线看| 3344在线观看无码| 亚洲日本一本dvd高清| 亚洲黄色成人| 一级全黄毛片| 亚洲91在线精品| 欧美日本在线播放| 中文字幕无码制服中字| 91探花国产综合在线精品| 女人18一级毛片免费观看| 一区二区三区国产精品视频| 免费日韩在线视频| 性视频一区| 欧美日韩午夜| 老色鬼欧美精品| 精品国产自| 亚洲免费毛片| 91亚洲视频下载| 国产精品永久免费嫩草研究院| 国产大片黄在线观看| 午夜精品久久久久久久2023| 夜夜操国产| 久久一级电影| 日韩久草视频| 亚洲二区视频| 欧美日韩理论| 日韩精品久久久久久久电影蜜臀| 日韩在线永久免费播放| 欧美一级在线| 久久国产亚洲偷自| 亚洲色图在线观看| 日本在线亚洲| 玖玖免费视频在线观看| 国产精品第页| 免费又黄又爽又猛大片午夜| 国产成人1024精品| 国产美女主播一级成人毛片| 少妇精品在线| 久久久久国产精品免费免费不卡| 免费国产无遮挡又黄又爽| 久久婷婷色综合老司机| 高潮毛片免费观看| 99尹人香蕉国产免费天天拍| 91精品人妻互换| 四虎永久免费地址| 天天躁夜夜躁狠狠躁躁88| 国产色伊人| 99视频精品在线观看| 欧美激情视频二区| 欧美一级99在线观看国产| 波多野结衣一区二区三区AV| 欧美激情视频在线观看一区| 国产欧美视频综合二区| 性做久久久久久久免费看| 欧美日韩成人在线观看| 国产主播在线一区| 很黄的网站在线观看| 看你懂的巨臀中文字幕一区二区 | 亚欧乱色视频网站大全| 韩日午夜在线资源一区二区| 精品人妻无码中字系列| 91网址在线播放|