□魏丹青
大數據蘊含豐富的信息和潛在的知識,給應對氣候變化研究開辟了一個以數據為驅動的全新研究方式,將極大地推進應對氣候變化工作進程
應對氣候變化研究是一項綜合性研究,涉及能源、生態、經濟、環境等眾多學科,具有復雜性、動態性和不確定性,要平衡溫室氣體排放與環境、經濟、社會需要,實現最優決策是一個巨大挑戰。目前應對氣候變化戰略實施仍然停留在政策驅動層面,如何落實到技術實施,是應對氣候變化工作面臨的瓶頸問題。
大數據時代的來臨為應對氣候變化研究帶來新的機遇和挑戰。美國國家標準和技術研究院對大數據作出定義:“大數據是指其數據量、采集速度,或數據表示限制了使用傳統關系型方法進行有效分析的能力,或需要使用重要的水平縮放技術來實現高效處理的數據。”目前大數據技術在經濟、電子商務及政務、醫藥、電網調配、交通物流、能源等國民生產生活的各個領域已經有了廣泛應用。例如在智能電網方面,就有利用大數據進行配電網運行狀態診斷、用戶用電行為特征解析、輸電線路狀態評估等。近年來較熱的“互聯網+”智慧能源也利用大數據技術分析居民用能水平數據、企業能耗、用能負荷等幫助政府制定能源規劃與能源政策。
當前關于溫室氣體數據的應用研究多是基于模型計算及情景分析方法,這些方法大多需要時間和成本代價,且僅能從局部或簡化的角度出具分析結果,無法充分利用海量、多維、異構數據做出全面分析評估。而大數據是應用、算法、數據和平臺4個要素的有機結合,以數據為基礎,以平臺建設為支撐,通過理論、算法研究與實際問題、應用研究相結合,可以充分挖掘溫室氣體數據的潛在價值,拓展數據的應用領域,解決應對氣候變化面臨的問題復雜性、計算效率、方法可擴展性等挑戰。
以數據為基礎。大數據模型是數據驅動的經驗模型,從海量數據出發,通過復雜計算,最終得出復雜模型。與一般統計建模實驗數據不同,大數據從數據獲取、數據建模以及預測均是計算機自動進行。隨著衛星技術、傳感技術的應用,應對氣候變化領域采集到的溫室氣體、能源、經濟等各類數據無時無刻不在增加。
以平臺為支撐。海量數據的收集、存儲以及提取都不同于常規數據,需要全新的軟硬件技術支持,這些技術以及用于存儲和查詢系統的總和,便是支撐大數據分析的技術平臺。浙江省從2013年開始建設省級氣候變化研究交流平臺,建立了高時空分辨的多過程碳排放數據庫,開展各類數據特征挖掘和模型模擬研究。自平臺建成以來全省溫室氣體數據平均每天新增12萬條,積累了自2005年至今省市縣企業多層級的全領域溫室氣體數據。近期在碳排放計算框架基礎上,開發了基于大數據的碳排放決策支持系統,分析碳排放的時空動態分布,進行峰值預測,為碳排放監管以及政策措施效果的評估提供技術支持。
優化算法與應用。大數據的主要研究方法是數據挖掘,主要技術有分類、關聯分析、聚類分析以及異常檢測。廈門大學的周綺鳳等學者已采用大數據挖掘技術來研究建筑行業的溫室氣體排放影響,提出了基于數據驅動的建筑環境影響評價模型。利用基于約束的特征選擇研究解決環境熱點分析問題;利用異構社區發現、半監督聚類集成研究降低大規模建筑環境影響評價的代價;利用多重異構聚類研究輔助綠色建筑設計指導,將建筑環境影響評價數據處理的難題轉化為一系列特征選擇、分類、聚類的數據挖掘問題,再通過構建大規模分布式可持續發展數據處理平臺,實現任務的分解與集成以及大規模算法的高效求解,大大降低已有評估方法所需的時間和代價。
隨著國家建設數據強國戰略的提出,大數據技術作為一種高效有序、交叉性強、綜合性高的數據處理技術,必然成為信息化發展道路上的重要工具。應對氣候變化領域的關鍵問題最終可以轉化成計算和信息科學領域的決策和優化問題,將政策驅動真正落實到技術踐行。