付繼承
中圖分類號:G203 文獻標識:A 文章編號:1674-1145(2018)2-000-02
摘 要 本文描述了大數據的概念和特征,分析了電網大數據的來源。在電網信息化工作中,電網大數據的應用、面臨的安全風險,以及應采取的安全應對措施
關鍵詞 大數據 智能電網 三集五大 數據安全
大數據時代,數據已成為企業的核心競爭力,是企業智商的最重要載體。隨著三集五大體系建立、智能電網建設和一體化運維檢修等,電網企業勢必產生更多的數據,這些龐大的數據多種多樣、雜亂無章、相互關聯。如何處理好這些數據,從中提取有用信息用于指導電網企業的生產運營和管理,已成為電網信息化工作的重要任務。
一、大數據的概念
大數據與信息技術的發展如影隨形,人類的工作、學習和生活等各種行為都可以以數據的形式存在于網絡,這些龐大的數據絕大多數是“非結構化數據”,通常不能為傳統的數據庫所用,具有顯著的4V特征。
一是數據體量龐大(Volume)。當前個人計算機硬盤的容量為TB量級,1T大約能存儲12萬張1800萬像素的JPG格式照片。權威機構預測到2020年,全球數字宇宙將會膨脹到40ZB(1ZB=2^30TB),這些數據均產生于我們的日常行為當中,多數顯得沒有那么重要,卻又有著千絲萬縷的關聯。
二是數據類型多樣(Variety)。相對于以往便于存儲的以文本為主的數據,現在更多的是圖片、視頻、音頻、地理位置信息等多類型、個性化數據。
三是數據處理速度快(Velocity)。這是大數據區別于傳統數據挖掘的最顯著特征。數據處理是從大量的、雜亂無章的、難以理解的數據中抽取并推導出對于某些特定的人們來說是有價值、有意義的數據;數據處理的效率就是企業的生命,在如此海量的數據面前快速獲得高價值的信息,必須具有更快的數據處理速度。
四是數據價值密度低(Value)。數據價值密度的高低與數據總量的大小成反比。以視頻為例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能僅有一兩秒。
基于此,大數據可以定義為“無法用現有軟件工具提取、存儲、搜索、共享、分析和處理的海量的、復雜的、無規律的數據集合”。
二、電網大數據的來源
隨著電力工業與信息化的深度融合,智能電網建設、“三集五大兩中心”體系建設的推進,產生了大量的數據,電網信息化對電網企業的決策、運營、銷售的作用不斷增強。這種作用的提升,使電網企業具有大數據的時代特征,電網信息化勢將突破傳統運維,被賦予更多的職能,比如強大的數據挖掘、數據分析和決策能力,產生更多的增值服務,甚至催生管理模式的創新。
電網企業數據主要來源于生產運營業務數據和管理業務數據。生產運營業務數據既包括通過傳感器、智能化設備、視頻監控設備、音頻通信設備和移動終端等各種數據采集設備收集到的電網運行狀態實時數據,也包括交易電價、售電量、用電客戶等企業營業數據,以及物聯網、云計算、新能源并網等技術帶來的新業務數據,《中國電力大數據發展白皮書》指出,電力行業的數據由以往類型較為單一、增長較為緩慢的情況發生轉變,正逐漸步入由結構化、半結構化和非結構化的海量業務數據源廣泛存在和驅動的大數據時代;管理業務數據則包括電網的規劃、建設、運行等管理工作中產生的數據,也包括 ERP、一體化平臺、協同辦公等應用系統產生的數據,三集五大體系的建設,實現了人、財、物的集約化管理,構建了大規劃、大建設、大運行、大檢修、大營銷體系,將使數據更加集中、更加龐大。
三、電網大數據的應用
信息技術的推進和發展,使電網企業的數據成爆炸式增長,如何使用好大數據,充分活化企業數據資產,更好地服務電力事業發展和廣大用電客戶,已成為擺在電網企業面前值得思考的課題。
目前,電網大數據應用場景主要在以下方面:
1、規劃—提升電網布局能力。通過對大數據的分析,利用數據挖掘技術,更準確地掌握用電負荷的分布和變化規律,提高中長期負荷的預測準確度;利用大數據的數據挖掘技術提供給規劃人員支撐電站建設布局的決策數據,實現項目建設的科學調配。
2、建設—提升現場安全管理能力。對現場照片進行批量比對分析,利用分布式存儲、并行計算、模式識別等技術,掌握施工現場的安全隱患,或者核查安全整改措施的落實情況。
3、運行—提升調度管理能力。利用機器學習、模式識別等多維分析預測技術,通過關聯降水、風速、光照、溫度等氣象因素,分析水電、火電、以及風電、光電等新能源的發電運行情況,更準確地對電網調度進行預測和管理。
4、檢修—提升狀態檢修管理能力。研究消缺、檢修、運行工況、氣候條件等因素對設備狀態的影響,以及設備運行的風險水平,利用并行計算等技術實現檢修策略優化,指導狀態檢修的深入開展。
5、營銷—提升對用電行為的分析能力。擴展用電采集的范圍和頻次,開展對用電行為特征的深入分析,實施區別化的用戶管理策略,可以使客戶更有效地用電和合理管理用電成本,收集到的數據也有助于電網企業為客戶定制電力管理程序和提供個性化定制服務。
6、運監—提升業務關聯分析能力。利用流式計算、可視化和并行處理等技術,實現全方位在線監測、分析、計算,通過聚類和模式識別技術,解決對跨業務的關聯分析、數據因子分析、數據診斷規則和算法,提高數據質量監控和治理。
7、客服—提升服務效率。對客服錄音進行實時監管,利用模式識別、機器學習等技術,對熱點問題的服務資源進行優化分配,提升交互水平。
四、電網大數據的安全風險
人們的生活正在被數字化,大量數據產生的背后隱藏著巨大的經濟利益和政治利益。大數據不僅為電網企業帶來了更多的機遇,同時也帶來了新的安全風險。
一是大數據成為網絡攻擊的顯著目標。在網絡空間,大數據是更容易被“發現”的大目標。一方面,大數據意味著海量的數據,這些數據會吸引更多的潛在攻擊者;另一方面,數據的大量匯集,使得黑客成功攻擊一次就能獲得更多數據,增加了“收益率”。
二是大數據加大隱私泄露風險。大量數據的匯集不可避免地加大了用戶隱私泄露的風險。一方面,數據集中存儲增加了泄露風險,這些數據不被濫用,也成為信息安全的一部分;另一方面,一些敏感數據的所有權和使用權并沒有明確界定,很多基于大數據的分析都未考慮到其中涉及的個體隱私問題。
三是大數據威脅現有的存儲和安防措施。數據大集中的后果是復雜多樣的數據存儲在一起,很可能會出現將某些生產數據放在經營數據存儲位置的情況,致使企業安全管理不合規。安全防護手段的更新升級速度無法跟上數據量非線性增長的步伐,就會暴露大數據安全防護的漏洞。
四是大數據成為高級可持續攻擊(APT)的載體。APT攻擊是一個實施過程,無法被實時檢測,大數據的價值低密度性,使得安全分析工具很難聚焦在價值點上,黑客可以將攻擊隱藏在大數據中,給安全服務提供商的分析制造很大困難。
五、電網大數據安全措施
信息安全在任何信息發展階段都占有不可忽視的地位,在對大數據發展規劃的同時,必須確保數據的安全和規范使用。為此,保證大數據安全采取的措施有以下幾種:
一是重視大數據及其信息安全體系建設。建議加大對大數據信息安全形勢的宣傳力度,明確大數據的重點保障對象,加強對敏感和要害數據的監管,加快面向大數據的信息安全技術的研究,培養大數據安全的專業人才,建立并完善大數據信息安全體系。
二是加強對重點領域敏感數據的監管。海量數據的匯集加大了敏感數據暴露的可能性,對大數據的無序使用也增加了要害信息泄露的危險。在企業層面,建議加強企業內部管理,制定設備特別是移動設備安全使用規程,規范大數據的使用方法和流程。
三是對數據進行標記。大數據類型繁多、數量龐大直接導致了大數據較低的價值密度。從海量數據中篩選出有價值的數據,既能保證其安全性,又能實現大數據的快速運算,其實現方法是對大數據進行分類標識。
四是設置用戶權限。分布式系統架構適用于具有超大數據集的應用程序,可以對用戶訪問權限進行設置,為不同的用戶賦予不同的訪問權限,不允許任何用戶超過為其設定的最大權限。
五是增強加密系統。為了保證大數據傳輸的安全性,需要對數據進行加密處理。通過加密系統對要上傳的數據流進行加密,對要下載的數據同樣要經過對應的解密系統才能查看。因此需要在客戶端和服務端分別設置一個統一的文件加/解密系統對傳輸數據進行處理。同時,為了增強其安全性,應該將密鑰與加密數據分開存放。
六是發現潛在的數據聯系。大數據的信息安全更加注重的是安全技術而不是對數據本身的保護,目前已有對數據的安全性保護措施,但這些技術對于大數據來說是否可以同樣使用還需要驗證。