■ 張俊杰

近年來,大數據快速興起。它和人工智能、云計算一起,成為智慧水務技術創新的一種標志。但是能夠正確理解、認識、應用大數據,把大數據挖掘真正應用于生產經營和產銷差控制中的,卻寥寥無幾。原因是人們對大數據的認識還停留在簡單、膚淺的概念上,根本就沒掌握大數據的精髓和本質。大數據本質是為了獲取規律和見解,與獲取收集的數據量無關,與數據是否恰當、正確有關。因此,非常有必要對大數據的恰當性和正確性進行探討和研究,以便為未來大數據的挖掘和應用提供一種嶄新的視野。
大數據(big data)是一個寬泛的概念,大數據不是數據大,這一點是公認的。大數據本質和精髓在于價值,而不是體量和規模。因此,辯證地看待大數據的體量才是科學的。就水務行業而言,大數據存在著數據體量不夠大、數據冗余、數據品質差等諸多問題。因此,有必要對當前水務大數據的現狀進行分析。

圖1 水務大數據架構圖
不論從產銷差控制與管理,還是從智慧水務角度看,水務大數據體量都不夠大。首先,對水務大數據理解和認識上就有偏差,總以為水務大數據就是水務行業本身產生的大數據,這顯然是欠妥的。從狹義上講,水務大數據是指水廠、生產、調度、管網、客服、營業、施工、檢漏、搶維修、物資采購等部門,通過調度系統、壓力監測系統、GIS 管網系統、DMA分區計量系統、ERP 資產管理系統、客戶服務系統、營銷系統以及人工臺賬等各種途徑,采集的實時數據,人工數據、電子報表數據集成的海量數據?!?br>