999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

建設大壩監測的大數據應避免的問題

2015-04-08 06:39:10王衛列
水電與抽水蓄能 2015年2期
關鍵詞:分析系統

王衛列,高 嵐

(1.國網電力科學研究院,江蘇省南京市 211106;2.國網電力科學研究院,江蘇省南京市 211106)

建設大壩監測的大數據應避免的問題

王衛列1,高 嵐2

(1.國網電力科學研究院,江蘇省南京市 211106;2.國網電力科學研究院,江蘇省南京市 211106)

目前國內各個行業都在上大數據項目,大壩監測行業也是一樣,但行業內存在對大數據技術概念認識模糊的現象,在技術構想方面有一些盲動現象。本文探討了大壩監測大數據建設中可能存在的一些錯誤思路,希望能促進同行一起思考,避免走彎路。

大數據;大壩監測

0 前言

無疑,大數據和云計算是當下IT的發展熱點,隨之國內很多新的IT項目紛紛貼上了大數據和云計算的概念標簽,然而由于處于大數據系統的發展初期,各自對其的認識存在不同,不免會出現一些不成熟的發展思路,本文結合大壩安全監測信息系統引入對大數據的展望,探索其發展過程中應避免的各種問題。

1 應該避免的問題

1.1 傳統系統的重復建設

很多新大數據項目都聲稱將極大地提高決策和智能水平,然而仔細審視這些項目的內容卻發現其實質還屬于“新瓶裝老酒”,只是用大數據的概念裝飾了一下。

例如,建立某個數據中心,主要內容是將多個工程現場的數據匯集到中心,然后在中心通過與工程現場相似的應用系統再分析處理這些數據,其內容實質還是一個傳統的系統,只是搬了個家,常常發現其挖掘的數據價值并沒有發生超越。

對這種系統我們應該有鑒別能力,避免國家的重復投資。

1.2 有Hadoop就是大數據

很多人認為有Hadoop(或其他類似系統,如Spark等)就是大數據了,于是只重視創Hadoop系統然后將各路工程的數據匯入,然后聲稱實現了某大數據系統,其實Hadoop只是解決了大規模存儲和并發,雖然突破了大數據的幾個關鍵技術瓶頸,但遠遠不是大數據的全部,再者在并發和存儲方面Hadoop還不是唯一的解決方案。

驗證是否是大數據,可以參考業界提出的4V特征,Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值),其中value是大數據的終極目標,也就是通過對大數據的分析來獲取以往傳統系統難以得到的有價值的信息,從而獲得巨大的經濟和社會效益,如果只是停留在用Hadoop及類似系統解決了前3個V的話,那么這樣的大數據系統只是徒有其表。

以后在鑒別大數據系統的真偽時,不要被Hadoop之類的數據術語所遮目,要全面考量4V在系統中的必要性,尤其要看清能為我們帶來什么分析價值(即value)。

下面我們具體結合大壩監測信息系統來分析是否符合4V特性。我們曾做過一次試驗,我們的在系統存儲了2億7000萬條測量數據,一共花了140G存儲空間,這個數據規模相當于一天存入1萬條測量數據共使用了73年(通常情況下大壩測點每天就一條測量數據),顯然這種數據規模還遠沒有達到所謂的Volume問題(即使將多個大壩的測量數據匯聚到一起,注:這里不是說數據匯聚時直接使用工程中的原測量數據,這里只是用這個細粒度的數據做一個規模估計);另外,我們系統僅僅供少數專業人士查看,所以其并發性要求很不高,如果與阿里巴巴、騰訊等系統相比,其Velocity要求實在是太低了;在Variety方面,大壩除了測量數據外,確實還會有一些非結構化數據(如圖片、視頻等),但比起社交網絡形成的非結構化數據,其復雜度還相對比較低,對這些數據,通過關系數據庫中的BLOB和xml字段也能應付,當然在這方面,今后可能會有所發展;在Value挖掘方面,如果使用原來的大壩監測數據,則其價值已經被發掘得差不多了,在數據中心重復這樣的系統,意義不大。

當然,我們不必為大壩監測數據尚不滿足4V特性而去否定大壩數據在大數據建設中的作用,我們的眼光不能僅僅限制在自己的專業領域,大數據的價值發現一般是通過跨領域的數據挖掘產生,當大壩專業領域的安全監測、施工管理等數據與水情水調、氣象、強震監測、堤防監測、防災應急等系統的數據進行聯合挖掘時,可以充分體現自身的價值(value),這方面是我們的空白,也是我們今后發展的方向。

1.3 無分析目標的數據匯聚

常常有這樣的現象,在做大數據項目的計劃時,不管三七二十一,先把分布在各廠中的多個系統數據傳送到數據中心,如此缺少目的性的數據匯聚很容易形成數據垃圾,最后因做無用功而造成浪費。

我們建立大數據中心,一個很重要的目的是為了從數據中發現價值,而且是那些在我們已有系統中挖掘不出來的價值,這需要對跨領域、跨系統的數據進行分析才能獲得,在這個層面上看,似乎上述的數據匯聚方式是合理的,但答案是否定的。 因為任何一個數據分析問題都需要有針對性的數據建模,只有在我們確定具體分析目標后,才能決定哪個數據源中的哪些數據列是有效的,才能確定數據格式和粒度,才能考慮跨系統的數據維度如何統一,才能確立挖掘的數據模型如何建立,如此精細的數據需求不可能通過盲動的數據匯聚得到。有人說,可以先匯到中心,然后再慢慢抽取(ETL),然而已建的子系統種類多、數據量大,無端消耗中心的大量存儲實難稱道,所以目的性不強的數據匯聚一定會浪費大量的人力、財力。當然,分析目標的確定不會一蹴而就,常常是一個反復迭代的過程,在其后的定義問題(確定分析目標)、數據準備、形成數據視圖、數據建模和部署發布的過程中都會根據實施過程中遇到的問題反復調整分析目標,然而這些都是目的性很強的活動,我們只是花了我們必須付出的代價,只有這樣才能最大程度地減少因盲動而造成的損失。

除了對大數據的認識程度以外,沒有確定分析目標(定義問題)的原因很大程度上是因為這項工作的確有難度,這需要業務決策人員和數據挖掘專業人員深入進行溝通,我們常常遇到的情況是僅僅技術人員在那里空想,沒有對業務問題的深入理解,是不可能完成這項任務的,所以業務決策人員不要坐等系統完成后才介入。

業務決策人員可以從業務流程的角度去發現問題(決策時需要查詢的數據、預測、評估等),數據挖掘專業人員則思考如何構建數據模型,數據挖掘人員可以從技術角度提出一些問題來和業務人員溝通,另外定義問題的重點在跨系統的數據分析(單個系統能回答的問題無需數據中心來分析)。

這里舉個例子來說明如何確定分析目標,申明一下,可能所涉及的業務問題不一定正確,我們只是來模擬一個確定分析目標的過程,假設我們現在要做出的是:洪水來臨時,區域內多個大壩的棄、保水決策,為了支持這個決策,需要系統能回答很多數據查詢和預測問題,如:目前的氣象條件以及保水策略下水庫水位的預測;在目前的水位和大壩的狀態下,升水速率限制什么范圍可保證大壩的安全?在目前的水位下,流域內大壩聯動泄洪策略是否可保洪峰安全度過,泄洪時應該如何組織人力資源執行應急預案,這些問題由業務決策人員根據自己的決策流程的需要來提出,數據分析專業人員會和業務決策人員反復溝通后分析需要哪些數據以及如何數據建模,這可能涉及氣象預測、洪水預報、大壩安全監測和分析、流域三維數據、歷史泄洪水土流失數據、歷史泄洪形成的重大民事事件、應急預案、視頻監控、汛期值班任務、人力資源、搶險器材庫存等數據,需要雙方緊密合作來確定這些問題,然后由專業人員來采集數據、建模并實現所需的分析預測目標,如果相關基礎數據缺失,還可以提出相應的數據建設需求。

總之,盡管確定分析目標是困難的,但是這是我們大數據分析的出發點,必須從這里開始考慮。

1.4 大數據中心沒有自己的研發隊伍

國內某些單位常有這樣的習慣性思維,就是要搞什么系統就是委托第三方廠家研發一套,最后經過安裝、培訓來接手這套系統,然而如果要建的是具有大數據概念的數據中心,則需要改變這種思路。可以仔細了解一下已有的大數據系統(阿里巴巴、騰訊、亞馬遜,Microsoft Azure),無一不是自己的研發隊伍在運維這套系統;不然進場的各應用廠家各行其是,必定造成中心的應用邏輯混亂,成為信息的垃圾場。

數據中心將匯聚各種所需專業系統的數據,而對它們的分析要求常常是原來某個專業系統所不能提供的,而且分析目標也是不斷變化的,這需要中心有自己的數據分析開發人員。

數據中心所涉及的云計算和大數據軟硬件架構,對其維護升級需要技術能力很強的專職技術人員,依賴第三方做到這點也是不可能的。

各種專業應用是如何影響中心的數據建設呢?其實只有在中心進行數據采集時才會發生關系,其采集模式無論是拉模式還是推模式,只要符合其交互的服務接口和數據標準即可,而這些標準也應該是中心的技術人員提出。

綜上所述,中心的工作必須有一支自己的研發隊伍,而且是研發的主體。

1.5 不注重信息安全問題

數據中心很多信息影響到國家的安全,例如在做局域網應用時,常常比較重視功能性開發,對非功能性的安全問題重視不夠,如今數據中心是依賴于Internet運行的,其信息安全問題是首先要解決的問題,這方面涉及的技術繁多且復雜,在這里不多贅述,應該高度重視該問題才是。

2 綜述

無論我們采用什么技術手段,應該深刻理解其技術內涵,不能為贏得什么彩頭而使用技術,不然會造成國家財產的嚴重浪費;隨著大數據和云計算技術在國內應用的深入,我相信對這些技術的使用會越來越成熟,會為我們的國家和社會創造巨大的價值。

[1] 郭曉科.大數據.北京:清華出版社,2013.

[2] 高彥杰.Spark大數據處理.北京:機械工業出版社,2014.

[3] 大數據研究報告編寫組.綜合分析冷靜看待大數據標準化漸行漸近.信息技術與標準化,2013,(9).

王衛列(1961—),男,高級工程師,主要研究方向:電力系統軟件開發。E-mail:wangweilie@sgepri.sgcc.com.cn

高 嵐(1965—),女,高級工程師,主要研究方向:電力系統計算機應用。E-mail:gaolan@sgepri.sgcc.com.cn

Problems Should Be Avoided in Constructing the Big Data System of Dam Monitoring

WANG Weilie1,GAO Lan2
(1. State Grid Electric Power Research Institute,Nanjing 211106,China;2. State Grid Electric Power Research Institute,Nanjing 211106,China)

Big data is more and more popular today and it is same in dam monitoring system also. But within the industry there are large technical concepts of fuzzy phenomena,some blind in technology ideas. This article discusses some wrong ideas in construction of big data system of dam monitoring. I hope peers to reflect together on how to avoid these mistakes.

big data;dam monitoring

猜你喜歡
分析系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
隱蔽失效適航要求符合性驗證分析
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
電力系統及其自動化發展趨勢分析
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 国产精品福利在线观看无码卡| 六月婷婷综合| 中文字幕天无码久久精品视频免费| 九九免费观看全部免费视频| 国产精品yjizz视频网一二区| 久久毛片免费基地| 丁香六月综合网| 欧美日韩免费| 好吊色妇女免费视频免费| 亚洲天堂视频网站| 精品视频一区二区观看| 国产Av无码精品色午夜| AV老司机AV天堂| 白丝美女办公室高潮喷水视频| 亚洲一区网站| 69免费在线视频| 毛片三级在线观看| 2020国产免费久久精品99| 国产永久免费视频m3u8| 一级毛片免费的| 久久久成年黄色视频| 永久免费无码日韩视频| 黄片一区二区三区| 国产精品亚洲五月天高清| 久久精品国产999大香线焦| 综合色88| 亚洲国产精品日韩欧美一区| 国产精品亚洲专区一区| 国产精品99r8在线观看 | 国产网站免费观看| 一级成人a毛片免费播放| 成人毛片免费在线观看| 国产亚洲欧美在线人成aaaa| 日韩精品毛片| 亚州AV秘 一区二区三区 | 免费高清a毛片| 午夜视频免费试看| 欧美成人怡春院在线激情| 伊人色综合久久天天| 日本中文字幕久久网站| 热这里只有精品国产热门精品| 亚洲成人精品久久| 在线视频精品一区| 久久国产香蕉| 在线播放精品一区二区啪视频 | 国产精品无码AV中文| 国产精品亚欧美一区二区三区| 午夜在线不卡| 55夜色66夜色国产精品视频| 婷婷亚洲天堂| 国产成人禁片在线观看| 久久www视频| 国产一级毛片在线| 国产区免费| 国内黄色精品| 亚洲欧美成人综合| 在线看片中文字幕| 国产主播一区二区三区| 亚洲a级毛片| 亚洲高清资源| 国产精品亚洲一区二区三区在线观看| 激情综合网址| 日韩经典精品无码一区二区| 日日拍夜夜操| 91精品免费高清在线| 亚洲精品成人7777在线观看| aa级毛片毛片免费观看久| 亚洲成综合人影院在院播放| 国产毛片一区| 欧美一区二区自偷自拍视频| 国产一级二级三级毛片| 久久综合结合久久狠狠狠97色| 欧美日韩在线成人| 国产成年女人特黄特色毛片免| 在线无码九区| 久久国产香蕉| 欧美亚洲欧美区| 精品一区二区三区视频免费观看| 欧美色视频在线| 成人在线天堂| 午夜成人在线视频| 亚洲人成亚洲精品|