999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于HBase的小集群風電SCADA系統(tǒng)高效數(shù)據(jù)存取算法研究

2021-01-11 10:12:38湯曉安
自動化與儀表 2020年12期
關鍵詞:方法系統(tǒng)

陳 敏,湯曉安,劉 行,謝 鑫

(1.湖南信息學院 電子信息學院,長沙410151;2.國防科技大學 電子科學學院,長沙410073;3.長沙北斗產(chǎn)業(yè)安全技術研究院,長沙410205)

當前,風力發(fā)電已成為二十一世紀全球最重要的綠色再生能源。預計2020年,世界風力發(fā)電機的裝機容量將達到12.45 億千瓦,發(fā)電量占世界電力消費量的12%[1]。目前中國的中小風力發(fā)電廠占全國風力發(fā)電企業(yè)總數(shù)的90%[2],可以看出現(xiàn)階段中小型風力發(fā)電廠是我國風力發(fā)電行業(yè)的主力軍。對于風力發(fā)電而言,高性能數(shù)據(jù)存取是風力發(fā)電SCADA 系統(tǒng)的核心,是風電行業(yè)健康發(fā)展的基石[3]。隨著風電行業(yè)的高速發(fā)展,數(shù)據(jù)量隨之增多,而傳統(tǒng)數(shù)據(jù)庫數(shù)據(jù)存取性能有限,不能很好地支持風電數(shù)據(jù)高性能的存儲、查詢和分析[4]。

關于高性能數(shù)據(jù)存取,現(xiàn)階段主要采用大數(shù)據(jù)分布式列式數(shù)據(jù)庫系統(tǒng)HBase 作為存儲載體[5]。此方面,國內外已有較多研究成果,文獻[6]已經(jīng)成功應用HBase 并且進行了開源版本很多再開發(fā)和創(chuàng)新;文獻[7]利用HBase 重構了其存儲層,進行了基于HBase 的實時傳輸平臺研究;文獻[8]提出了一種基于HBase 的時序監(jiān)控數(shù)據(jù)存儲以及提升數(shù)據(jù)存儲和處理效率的方案;文獻[9]深入研究了基于HBase的配用電海量時序數(shù)據(jù)存取技術;文獻[10]設計了一個基于Hadoop 集群的變壓器在線監(jiān)測數(shù)據(jù)存儲方案,該方案利用HBase 具有快速實時讀寫數(shù)據(jù)的優(yōu)勢,將變壓器在線監(jiān)測系統(tǒng)采集的海量數(shù)據(jù)實時快速地存儲;文獻[11]研究并實現(xiàn)了一個基于HBase的高效數(shù)據(jù)存取平臺;文獻[12]通過改進 HBase 表的設計以及k-means 聚類算法,較大程度地提高了公安大數(shù)據(jù)圖片的檢索效率。

但是上述研究成果主要是面向大集群、高成本的業(yè)務需求,眾多國內基于小集群低成本環(huán)境(當前小集群低成本主要指不超過5 臺中低性能服務器)的中小風力發(fā)電廠由于其固有的服務器規(guī)模小、成本投入低等局限性無法直接使用現(xiàn)有研究成果,所以針對現(xiàn)有眾多小集群、 低成本環(huán)境下的風電SCADA 系統(tǒng),開展其高性能數(shù)據(jù)存取算法研究意義重大且迫在眉睫。

本文以HBase 為工具載體,研究基于HBase的、 適用于小集群風電SCADA 系統(tǒng)的高效數(shù)據(jù)存取算法。本文研究以長沙北斗開放實驗室下屬風能新技術開放實驗室的 “風電場跨平臺中央監(jiān)控系統(tǒng)”為應用場景。論文對現(xiàn)有Hbase 數(shù)據(jù)存取方法的存取性能進行了深入對比研究;基于此,綜合運用Hbase API、批量存取、多線程等相關技術,創(chuàng)新性地提出適用于小集群、 低成本風電SCADA 系統(tǒng)的高性能數(shù)據(jù)存取算法;最后對該算法進行了實現(xiàn)與系統(tǒng)應用。實際應用表明,該算法較好地實現(xiàn)了小集群、低成本環(huán)境下的高性能數(shù)據(jù)存取,滿足應用系統(tǒng)的實際需求。

1 Hbase 數(shù)據(jù)存取性能對比研究

HBase 具有數(shù)據(jù)存儲量大、面向列、稀疏存儲的特點。HBase 系統(tǒng)主要由HMaster 服務器和HRegion服務器群構成,它遵循簡單的主從服務器體系結構模型。具體到表格存儲而言,HBase 是以Region作為最小單位實現(xiàn)存儲負載,依據(jù)存儲量分裂成多個Region 模塊分配到不同的集群之中達到分布式存儲。

Hbase 數(shù)據(jù)存取又稱為“HBase 數(shù)據(jù)導入導出”。當前,主流的HBase 數(shù)據(jù)導入導出方式有2 種,一種是“單條數(shù)據(jù)導入導出”,另一種是“批量數(shù)據(jù)導入導出”;同時,后者又可分為“HBase API 批量導入導出”與“MapReduce 批量導入導出”2 個方法。

以下就上述Hbase 數(shù)據(jù)存取3 種主要的數(shù)據(jù)導入導出方法的性能進行對比分析,測試環(huán)境為大數(shù)據(jù)軟件環(huán)境Hadoop2.7.6+HBase1.4.9,通過5 臺中低性能服務器在實際風電場搭建小集群環(huán)境進行研究。因同條件下導出與導入性能差異不大,下面僅對數(shù)據(jù)導入展開研究:

方法一“單條數(shù)據(jù)導入”主要是對環(huán)境的隨機數(shù)據(jù)寫入能力進行分析,試驗通過多次運行Java代碼,發(fā)現(xiàn)單條數(shù)據(jù)導入運行效率保持在100 ms~250 ms 之間,實際的效率與實時CPU 性能關系密切。

方法二“HBase API 批量數(shù)據(jù)導入”主要是測試HBase 在寫入不同規(guī)模數(shù)據(jù)時所消耗的時間,導入數(shù)據(jù)為風力發(fā)電實時秒級數(shù)據(jù),數(shù)據(jù)列固定118列,批量規(guī)模從10 條到500 萬條。批量數(shù)據(jù)寫入通過Java 代碼編寫,其中使用到BufferedMutator 類進行批量導入的容器管控。

方法三“MapReduce 批量數(shù)據(jù)導入”主要是測試MapReduce 在寫入不同數(shù)據(jù)規(guī)模時的性能情況,直接使用原生API 將文件進行導入。

上述3 種HBase 數(shù)據(jù)導入方法的測試結果對比如表1 所示,逐步增加導入數(shù)據(jù)的規(guī)模并記錄實際消耗時間。因為HBase 自帶的數(shù)據(jù)導入算法都是單線程實現(xiàn),所以無論是方法一還是方法二都無法滿足高性能數(shù)據(jù)導入要求,而且會出現(xiàn)CPU 負載高,HMaster 服務崩潰 (如表1 中,“-” 代表服務崩潰)。方法三由于是采用多線程實現(xiàn),其性能顯然優(yōu)于前兩種方式。但是,通過進一步對小集群研究發(fā)現(xiàn),MapReduce 其自啟動需要消耗一定的基礎資源,且其性能優(yōu)劣與集群規(guī)模大小呈正相關,對于數(shù)據(jù)量到達千萬級及以上大小的大集群才能發(fā)揮比較好的性能表現(xiàn),而小集群數(shù)據(jù)規(guī)模通常保持在500 萬以下,因而,小集群規(guī)模環(huán)境下其性能優(yōu)勢并不明顯。因此,小集群想要獲得更高效的數(shù)據(jù)導入,并不能直接采用方法三“MapReduce 批量導入”,而需要設計一種新的算法,本文考慮對方法二“HBase API 批量數(shù)據(jù)導入”進行算法改進。新算法的設計目標是性能超越現(xiàn)有3 種主流HBase 數(shù)據(jù)導入方法中最好的方法三。

表1 HBase 數(shù)據(jù)導入性能對比Tab.1 HBase data import performance comparison

2 基于Hbase 的小集群風電SCADA 系統(tǒng)高效數(shù)據(jù)存取算法

2.1 算法總體思路

分析表1 可知,要想實現(xiàn)基于小集群的HBase高效數(shù)據(jù)導入算法,既要充分利用小集群的CPU 以及其它硬件資源,同時也要實現(xiàn)導入算法服務本身較低的資源占用。基于以上分析,現(xiàn)采用多線程與HBase 的原生API 算法二者相結合的方法,進行多線程文件數(shù)據(jù)讀取以及批量數(shù)據(jù)導入;同時依據(jù)服務器實時性能情況,進行資源負載均衡。

2.2 算法處理流程

基于上述算法總體思路,設計高效數(shù)據(jù)存取算法的處理流程如圖1 所示。首先通過獲取文件,并對其是否已經(jīng)完成導入做好標記;接著獲取服務器的性能情況,依據(jù)實際的服務器性能給予不同的多線程開啟;然后對獲取的文件進行分解,依據(jù)HBase提供的原生API 進行批量導入;在導入的過程中對服務器性能進行監(jiān)控并做好負載均衡;最后判斷文件是否完全導入完畢,整個高性能導入算法結束。

圖1 基于HBase 的小集群高效數(shù)據(jù)存取算法流程Fig.1 High efficient data access algorithm flow chart of small cluster based on HBase

2.3 算法運行測試與對比分析

依據(jù)圖1 所示算法,基于現(xiàn)搭建的小集群環(huán)境,使用中小風力發(fā)電廠常用的CSV 文件與數(shù)據(jù)庫DB 文件進行測試,測試結果如表2 所示。表中,第3列“新算法”是指圖1 所示算法,也即對表1 中的原“方法二”的改進算法。進一步將表2 中“新算法數(shù)據(jù)導入耗時”與表1 中原“方法三:MapReduce 批量數(shù)據(jù)導入耗時”進行對比分析,可以發(fā)現(xiàn)新算法導入性能有明顯提升,依然分別針對10~5000000 數(shù)據(jù)行數(shù),數(shù)據(jù)導入耗時分別減少17.3%~92.1%不等,平均減少約36.5%,如表2 所示。

進一步將新算法與原方法三“MapReduce 批量導入算法”的服務器性能情況作對比,分析其是否充足利用了服務器資源,測試結果如圖2 和圖3。可以發(fā)現(xiàn),原方法三“MapReduce 批量導入算法”占用CPU 保持在50%左右,新算法保持在95%左右,顯然,新算法實現(xiàn)了對CPU 的充分利用。

表2 新算法數(shù)據(jù)導入性能及與原方法的對比Tab.2 Data import performance and comparison of new algorithm

圖2 原方法三“MapReduce 批量導入算法”執(zhí)行資源消耗情況Fig.2 Execution resource consumption of original MapReduce batch import algorithm

圖3 新算法執(zhí)行資源消耗情況Fig.3 New algorithm performs resource consumption

3 系統(tǒng)設計與算法應用

本文所研究的高性能存儲算法是基于長沙北斗開放實驗室下屬“風能新技術開放實驗室”的“風電場跨平臺中央監(jiān)控系統(tǒng)”(以下簡稱“系統(tǒng)”)為應用環(huán)境,該系統(tǒng)軟硬件架構如圖4 所示。由圖4 可以看出本系統(tǒng)是一個天然的小集群分布式架構,其無法直接套用大公司的高性能大集群存取方案,因而當前不得不采取MySQL 數(shù)據(jù)庫存儲+文件存儲方式。系統(tǒng)監(jiān)控50 臺風機,數(shù)據(jù)總量800 G/年,原系統(tǒng)在進行較大數(shù)據(jù)量存取時,經(jīng)常出現(xiàn)系統(tǒng)崩潰或者等待時間超過5 min 等問題,無法滿足實際應用的需求。

本文通過對該系統(tǒng)原有系統(tǒng)架構進行分析,在原有系統(tǒng)軟件架構中增加“數(shù)據(jù)高性能處理區(qū)”,修改系統(tǒng)原有的“數(shù)據(jù)存儲分析區(qū)”內容并搭建分布式數(shù)據(jù)庫HBase 存儲環(huán)境;將數(shù)據(jù)交互方式由直接從“數(shù)據(jù)存儲分析區(qū)”獲取數(shù)據(jù)(圖4 左部分空心舊通道)改為由“數(shù)據(jù)高性能處理區(qū)”獲取數(shù)據(jù)(圖4左部分實心新通道)。將本文設計的算法應用于系統(tǒng)“數(shù)據(jù)高性能處理區(qū)”,系統(tǒng)搭建成功后,系統(tǒng)總體運行穩(wěn)定,系統(tǒng)的實時監(jiān)控模塊與高分辨率數(shù)據(jù)分析模塊性能優(yōu)化均十分明顯,其中,高分辨率數(shù)據(jù)分析模塊能夠實現(xiàn)共兩個月時間范圍、秒級數(shù)據(jù)的實時查詢與波形圖顯示,滿足應用的實際需要,如圖5 所示。

4 結語

圖4 小集群風力發(fā)電SCADA 系統(tǒng)軟硬件架構圖Fig.4 Software and hardware architecture of SCADA system for small cluster wind power generation

圖5 風電場跨平臺中央監(jiān)控系統(tǒng)“高分辨率數(shù)據(jù)分析模塊”數(shù)據(jù)高性能存取展示Fig.5 High performance data access display of“high resolution data analysis module” of wind farm cross-platform central monitoring system

小集群環(huán)境是現(xiàn)階段眾多風力發(fā)電廠的主要特征,小集群風力發(fā)電廠由于其成本與技術的劣勢無法滿足日益增長的高性能計算需求。基于以上背景,本文依托長沙北斗開放實驗室下屬風能新技術開放實驗室的“風電場跨平臺中央監(jiān)控系統(tǒng)”項目開展了基于小集群背景下風電SCADA 系統(tǒng)高性能數(shù)據(jù)存儲算法的研究與優(yōu)化工作。論文對現(xiàn)有多種Hbase 數(shù)據(jù)存取方法的存取性能進行了深入對比分析,從原理中尋求小集群存儲優(yōu)化的解決方案,提出并實現(xiàn)了一個基于大數(shù)據(jù)存儲平臺Hbase、 適用于小集群低成本風力發(fā)電SCADA 系統(tǒng)的高性能數(shù)據(jù)存取算法。應用表明,該算法性能高效,能夠滿足小集群風電監(jiān)控系統(tǒng)存取需要,因而具有較好的工程推廣價值。

猜你喜歡
方法系統(tǒng)
Smartflower POP 一體式光伏系統(tǒng)
WJ-700無人機系統(tǒng)
ZC系列無人機遙感系統(tǒng)
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統(tǒng)
學習方法
半沸制皂系統(tǒng)(下)
連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 国产精品免费露脸视频| 丁香婷婷综合激情| 在线中文字幕日韩| 国产视频只有无码精品| 亚洲天堂精品视频| 一区二区三区四区在线| 一级黄色网站在线免费看| 久久五月视频| 欧美精品在线视频观看| 九九热精品在线视频| 亚洲成人网在线播放| 国产白浆视频| 成人噜噜噜视频在线观看| 欧美日本在线观看| 福利姬国产精品一区在线| 伊人AV天堂| 亚洲欧洲日产国码无码av喷潮| 亚洲男人的天堂在线观看| 中国一级特黄大片在线观看| 亚洲视频无码| 日韩欧美网址| 国产成人无码久久久久毛片| 99一级毛片| 五月婷婷欧美| 国产精品福利导航| 谁有在线观看日韩亚洲最新视频| 色爽网免费视频| 九色在线观看视频| 五月激情综合网| 亚洲有无码中文网| 久久精品国产国语对白| 国产毛片片精品天天看视频| 一级全免费视频播放| 亚洲首页国产精品丝袜| 九九久久99精品| 成AV人片一区二区三区久久| 日韩精品无码免费专网站| 亚洲日韩国产精品综合在线观看 | 在线播放国产99re| 亚洲午夜国产片在线观看| 五月婷婷丁香综合| 丁香亚洲综合五月天婷婷| 亚洲人成网线在线播放va| 欧美精品一区二区三区中文字幕| 日韩无码黄色| 国产黄在线免费观看| 国产精品亚洲精品爽爽| 婷婷六月综合| 国产精品99r8在线观看| 欧美日韩精品一区二区在线线| 国产手机在线ΑⅤ片无码观看| 日韩国产高清无码| 国产永久无码观看在线| 亚洲最大福利视频网| 免费毛片视频| 国产最新无码专区在线| 成人综合网址| 国产69精品久久| 国产精品熟女亚洲AV麻豆| 亚洲精品波多野结衣| 污污网站在线观看| 好吊色妇女免费视频免费| 亚洲国产精品国自产拍A| 欧美怡红院视频一区二区三区| 热99re99首页精品亚洲五月天| 国产一区二区人大臿蕉香蕉| 天天色综合4| 在线免费看片a| 国产精品视频白浆免费视频| 黄片在线永久| 一本大道无码高清| 91区国产福利在线观看午夜| 日韩毛片视频| 久久黄色视频影| 欧美成人免费| 国产一级特黄aa级特黄裸毛片 | 中文无码日韩精品| 国产欧美综合在线观看第七页| 中日无码在线观看| 在线欧美日韩| 91网站国产| 欧美精品在线视频观看|