胡清,呂廣豐,高菁陽,3,付冬雪,苗波
(1.南方科技大學環境科學與工程學院,廣東深圳 518055;2.北京環丁環保大數據研究院,北京 100083;3.北京大學工學院,北京 100871)
區塊鏈是一種在互聯網上由多方共同維護,使用密碼學保證傳輸和訪問安全,能夠實現數據一致存儲、難以篡改、可追溯的記賬技術,也稱為分布式賬本技術。典型的區塊鏈把數據塊以鏈式結構進行分布存儲,從本質上講,區塊鏈是一種分布式網絡數據庫[1]。區塊鏈作為一種在不可信的競爭環境中低成本建立信任的新型計算范式和協作模式,憑借其獨有的信任建立機制,正在改變諸多行業的業務機制和運行規則,在數據可信、存證溯源、交易信任等需求場景具有內在的技術優勢[2]。
區塊鏈作為“信任的鑰匙”,將改變數字化經濟下社會價值的傳遞方式,是數字經濟時代產業數字化的重要基礎設施,是未來發展數字經濟、構建新型信任體系、建立新型政府管理機制、建設智慧城市等不可或缺的技術之一[3]。我國已將區塊鏈作為國家核心技術自主創新重要突破口,各省級政府都出臺了區塊鏈專項行動計劃或發展規劃。區塊鏈已初步應用于金融、政務、民生、司法等領域[4,5],應用于生態環境領域也是未來發展的必然趨勢。
環境監測是環境質量保證及環境管理的根本基礎及重中之重,沒有真實的環境監測數據,就談不上污染治理,更無法保證生態環境的管控。2017 年9 月,中共中央辦公廳、國務院辦公廳印發了《關于深化環境監測改革提高環境監測數據質量的意見》。意見指出:“環境監測是保護環境的基礎工作,是推進生態文明建設的重要支撐。環境監測數據是客觀評價環境質量狀況、反映污染治理成效、實施環境管理與決策的基本依據。”在意見的要求和指導下,我國的環境監測質量控制體系已經基本建立[6,7],但干擾現場采樣、違規操作、數據失真、人為篡改等違規違法行為仍時有發生。據生態環境部官網消息,2021 年前10個月,全國共查處重點排污單位自動監測數據弄虛作假案件達270 起。因此,推進環境監測新技術、新方法研究,健全生態環境監測技術體系[8],提高環境監測的數據質量,確保監測數據真實可信,實現環境監測數據真準全的需求迫切、任務艱巨。
綜上所述,環境監測數據質量面臨的數據可信問題正是區塊鏈技術的優勢應用場景,開展區塊鏈在環境監測中的應用研究具有重要的現實意義。
2008 年11 月9 日,中本聰在Sourceforge.org 注冊了bitcoin 項目,2009 年1 月9 日,發布了開源的0.1 版比特幣客戶端。比特幣的出現,標志著第一代區塊鏈技術體系的形成。比特幣開創了去中心化密碼貨幣的先河,充分檢驗了區塊鏈技術的可行性和安全性,奠定了區塊鏈技術的基礎。比特幣是區塊鏈技術的初始版本,存在協議的擴展性不足、腳本語言功能有限等應用缺陷。2013 年末,以太坊創始人Vitalik Buterin 發布了以太坊初版白皮書。以太坊是第二代區塊鏈技術的典型代表,它借助了比特幣的核心思想,解決了比特幣的缺陷,加入了智能合約,增強了擴展性和靈活性,但還存在處理能力不足、智能合約成本高的缺陷。
比特幣和以太坊都是以數字貨幣為主要應用的區塊鏈技術,很難與現實的應用結合。第三代區塊鏈以聯盟鏈為主要特征,將鏈式記賬、智能合約和實體領域深度結合起來,實現去中心化的自治,發揮區塊鏈的應用價值。自此,區塊鏈技術進入區塊鏈治理時代。我國具有自主知識產權的“長安鏈”是第三代區塊鏈的杰出代表,具有靈活裝配、軟硬一體、開源開放的特點,目前已經廣泛應用到銀行、電力、通訊等關乎國計民生的多個行業。
區塊鏈技術的應用場景日益廣泛,從金融、產品溯源、政務民生、電子存證、知識產權到數字身份與供應鏈協同,應用場景不斷深入和多元化,在供應鏈金融、政務大數據共享、智慧城市、物流溯源、司法存證、信貸審核等方向上已經有很多應用系統在運行并取得了較好的效果,顯示出區塊鏈技術的重大意義和極為廣闊的發展空間。
2021 年1 月,北京微芯區塊鏈與邊緣計算研究院發布國內首個自主可控的區塊鏈軟硬件技術體系——“長安鏈”,它具有全自主、高性能、強隱私、廣協作等特性。同年6 月,全球首創的96 核區塊鏈專用加速芯片發布,該芯片采用專用處理器內核,保障核心技術自主可控,以芯片為核心打造的超高性能區塊鏈專用加速板卡,區塊鏈轉賬類智能合約處理速度提升50 倍。此外,該芯片還具備強大的數據隱私保護能力,為實現“數據可用不可見”提供了自主可控、高效實用的方案。“長安鏈”正持續推進在重大民生、經濟、社會治理等場景的應用,如數字人民幣企業支付、電子政務跨省通辦、冷鏈防疫、綠色減碳、司法存證等。長安鏈生態聯盟成員達50 家,囊括了27 家央企、28 家“世界500 強”企業。可以看到區塊鏈已經越來越頻繁地被應用于各行各業。
環境監測業務分為采、測、傳、存、管、用等環節,每個環節都可能存在干擾數據質量的風險,在不同環節,人為干擾環境監測數據質量的手段和方法各不相同,下面結合實際案例進行說明。
案例1:自2017 年上半年起,山西某市生態環境部門為降低該市環境污染指標數據,授意相關人員伙同部分運維人員對該市6 個國控環境空氣自動監測站進行人為干擾。作案人員采用堵塞采樣頭、噴水或氫氧化鈉中和等方式,同時或交替對市域內6 個國控站點細顆粒物(PM2.5)、可吸入顆粒物(PM10)、二氧化硫(SO2)采樣設備進行人為干擾,導致監測數據嚴重失真。為防止作案過程被視頻監控拍攝,作案人員對視頻監控進行了遠程屏蔽。
案例2:2019 年12 月,浙江某國家地表水自動監測站相關人員將塑料水管從河邊自來水龍頭接到自動監測站采水管,采用自來水稀釋和間斷性放水的手段降低地表水污染物濃度,導致監測數據嚴重失真。
案例3:2018 年起,河北某鋼鐵有限公司采取拔掉自動監測設備上污染物取樣管的方式,給未在現場的生態環境部門以工廠已經停產的假象,擾亂了應急響應時的整體部署。
干擾采樣環境是環境監測數據造假的主要手段,造假手法多樣,本質上都是從采樣端造假,改變了樣品的特征,讓傳感器接觸不到真樣品[9]。
案例1:2018 年6 月,河南某碳素制品有限公司修改量程、斜率等可以影響最終排放數據的參數,進行監測數據造假。
案例2:2021 年上半年,河北某公司運維人員與當地某板材有限公司相關人員通過手機修改在線監測數據。
干擾監測設備是環境監測數據造假手段之一,主要通過修改監測設備關鍵參數或監測數值的方法實現。這種方式技術要求較高,一般需要與設備廠家或運維公司合謀,其本質是通過特殊代碼或后門程序修改監測設備中的數據[9]。
案例1:2017 年5 月,湖北某陶瓷有限公司在系統端篡改偽造二氧化硫排放量。
案例2:2019 年2—7 月,浙江省某縣污水處理公司技術員因擔心考核不達標被扣工資,兩次關掉監控系統,重置相關檢測儀器,導致數據失真。
在系統端篡改數據是前幾年常見的環境監測數據造假方式之一[9],這種方式簡單粗暴,非常容易得手。但由于現在的監測系統都具有較為完備的日志文件,這種造假方式較容易被發現和鎖定責任人,近兩年類似的違法行為越來越少。
案例1:2021 年5 月,湖南某建材公司2021 年以來自動監測設備無運維記錄,所用的標準氣體已過期,導致自動監測數據出現連續性恒值情況。
案例2:2021 年1 月,河北某焦化公司未按規范要求對設備進行定期維護,導致自動監測設備出現冷凝器故障、采樣管路多處積水等問題,造成監測數據失真。
違規運維通常是業主或供應商為了節省成本,在監測系統的運維中偷工減料,導致設備不能正常運行而影響監測數據質量,這種數據造假方式在現實中較為常見[9]。
針對上述人為影響環境監測數據質量的手段,可采用區塊鏈、大數據、人工智能(AI)、可信計算等技術,從采樣環境保真、監測數據可信、數據防篡改、設備全生命周期可信管理等方面開展技術方案研究[10]。
3.1.1 監測監控設備的可信
監測設備的參數或監測數據被后門程序修改、監控設備被干擾或屏蔽,這些現象都說明監測監控設備自身的可信性沒有得到有效保障。顯然,設備自身的可信是解決采樣環境保真與監測可信的基礎,就像中央派出的環保督察組一樣,他們一定要講真話,把看到的問題真實地記錄下來并可靠地反饋回來,如果不能做到這一點,督察工作的效能便無從談起。因此,如何保證監測監控設備“講真話”是提高環境監測數據質量首先要解決的問題。
區塊鏈與可信計算技術相結合是解決監測監控設備可信問題的有效途經。可信計算是一種主動免疫的新型計算模式,具有身份識別、狀態度量、保密存儲等功能,是保障關鍵信息技術基礎設施自主可控、安全可信的核心關鍵技術[11]。可信計算是通過一個可信計算模塊來實現的,像網卡的物理地址一樣,每個可信模塊都有一個唯一的標識碼[11]。采用了可信模塊的監測監控設備具有硬件化的唯一標識碼,可以接受區塊鏈CA(Certificate Authority)認證管理,成為區塊鏈的一個輕節點,實現監測監控數據及參數的上鏈。可信監測監控設備的邏輯結構[12]如圖1 所示。

圖1 可信監測監控設備的邏輯結構
可行監測監控設備通過ETPM(Embedded Trust Platform Module)實現設備可信環境度量[13]。設備加電后,ETPM 首先啟動,以可信根為起點,首先對BIOS(Basic Input Output System)進行可信度量,度量通過后啟動BIOS,BIOS 首先對系統的存儲(如FLASH 或磁盤分區等)進行安全度量,度量通過后,BIOS 再對OS Loader 進行度量,度量完成后把控制權交給OS Loader,OS Loader 再去度量監測設備的操作系統,就這樣依次把可信傳遞下去,直到系統參數、應用配置參數、其他與監測值形成相關的可配置參數以及應用程序。通過可信鏈的傳遞,保證了監測監控設備的軟、硬件環境和參數的可信性[14],杜絕了后門程序和特殊代碼,從而保證監測監控數據的可信性。可信監測監控設備的引導過程如圖2 所示。

圖2 可信監測監控設備引導過程
3.1.2 采樣環境保真
在監控、安防等設備可信的前提下,通過以下兩個方面實現采樣現場的保真:
(1)設備被干擾、屏蔽時異常報警與狀態存證。當設備被干擾、屏蔽或非法侵入時,設備的參數會發生異常,可信設備的軟、硬件安全保障機制會發現這一異常,及時進行報警并通過區塊鏈對狀態進行存證,為設備的異常歸因和責任追溯保留證據。
(2)結合大數據、AI 技術進行場景異常識別[15]。當監測設備記錄下采樣環境后,通過融合多源數據進行智能研判,判別當前場景是否被人為干擾。例如,某個站點的可信環境監控設備監測到站點濕度異常,可通過當地氣象數據、相鄰站點數據、視頻監控數據、新聞輿情數據等多源數據進行綜合研判,及時發現對采樣頭噴水等行為。結合大數據、AI 等技術實現環境采樣現場保真的邏輯如圖3 所示。

圖3 環境監測現場保真的實現邏輯
3.1.3 監測數據可信
可信的監測設備保證了設備軟、硬件與參數的安全性,使監測設備能夠真實地記錄采樣環境。除此之外,監測設備從區塊鏈系統獲取可信數據進行邊緣智能分析也是實現監測數據可信的一種手段,如圖4 所示。監測設備通過鏈上鏈下數據比對、時序數據異常分析、多參數關聯分析、同行業排放置信區間分析等方法識別監測數據異常,防范監測數據造假。

圖4 監測設備邊緣智能分析
監測數據篡改一般發生在數據傳輸和數據應用這兩個環節。下面分別介紹區塊鏈技術在這兩個環節上防篡改的原理和方案。
3.2.1 數據傳輸過程中防篡改
可信監測設備的數據以加密的形式存儲在可信設備中,如何可靠地進行數據傳輸是實現數據可信的一個重要環節。實現數據的可靠傳輸要解決兩個問題,一是監測設備如何接入區塊鏈系統,二是數據傳輸過程的可靠。
監測設備一般是嵌入式設備,具有算力低、存儲空間小、網絡帶寬低的特點,不能滿足作為區塊鏈節點的性能需求。本文提出了代理上鏈的方案,巧妙地解決了監測設備接入區塊鏈系統的問題。可信監測監控設備接入區塊鏈及數據上鏈過程如圖5 所示。

圖5 可信監測監控接入區塊鏈及數據上鏈過程
區塊鏈技術的非對稱加密技術與數字簽名技術保障了數據傳輸過程的安全可靠,在區塊鏈網絡中,數據的傳輸就是一個簽名—傳輸—簽名驗證的過程,數據可靠傳輸示意如圖6 所示。

圖6 區塊鏈網絡中數據可靠傳輸示意
3.2.2 數據應用過程中防篡改
當可信監測數據被區塊鏈存證后,根據區塊鏈的特性,數據是不可以被篡改的。由于區塊鏈通過分布式一致性存儲、交易共識、數字簽名等機制來保證數據的安全,其效率和吞吐量必然受到影響,為了保證應用系統的效率,在許多區塊鏈應用系統中都采用雙通道存儲機制,即數據既存儲到區塊鏈上,也保存到傳統的數據庫中。篡改和偽造數據的行為只能發生在傳統數據庫中,因此只要在數據應用中用區塊鏈數據進行校驗就能遏制篡改和偽造數據行為。區塊鏈數據校驗實現流程[16]如圖7所示。也可以在應用訪問基礎監測數據或關鍵參數時同時訪問區塊鏈和關系數據庫,經校核一致后,方可作為應用的有效數據。

圖7 區塊鏈數據驗證流程
環境監測系統雖然有集中化的設備運維管理平臺,但設備的全生命周期管理還有不完善的地方,供應商和運維機構在利益的驅使下,還存在設備運維偷工減料、篡改運維數據、人為變更運維流程的現象。另外,監測設備的巡檢方式仍處于數字化/智能化轉型過程中,巡檢數據的自動采集、可信存儲、記錄溯源、智能分析等全流程管控技術仍不完備。區塊鏈的智能合約技術適用于業務流程管控,能確保業務流程不被人為干預、對業務流程數據進行區塊鏈存證,對解決監測設備運維工作中面臨的不足具有突出的技術優勢。
針對環境監測設備運維管理方面的不足,本文利用區塊鏈數據可信、流程可控的特征,結合物聯網、大數據、AI 等技術,為環境監測系統運維和設備全生命周期管理設計了技術方案,方案的功能架構如圖8 所示。

圖8 監測設備全生命周期管理功能架構
以其中的設備運維管理部分為例,通過把設備及配件的校驗、入庫、安裝、調試、運行、維修、下線全生命周期流程智能合約化,結合相應的可信數據采集設備,把流程執行的每一個步驟產生的數據都存證在區塊鏈上,實現業務流程的不可干預。采用區塊鏈進行監測設備運維管理流程控制的方法如圖9 所示。

圖9 采用區塊鏈進行監測設備運維流程控制示意
前述介紹了區塊鏈在環境監測中應用方案,方案中涉及的采樣環境保真和監測數據可信都需要更換現有的監測監控設備,這需要較大的成本和較長的過程。針對現有環境監測系統,本文以空氣質量監測系統為例,提出了基于軟、硬件結合的區塊鏈智能數據質量控制器進行數據核驗和存證的方式進行系統改造,從而提高監測數據質量的技術方案。
區塊鏈智能數據質量控制器是一個邊緣計算設備(圖10),采用國內自主研發的“長安鏈”作為底層平臺,具有較強的計算能力和較大的存儲空間,可以作為區塊鏈的節點,也可以進行AI 模型計算,在系統中完成實時數據上鏈、邊緣計算、鏈上權限管理、分布式存儲等功能。

圖10 區塊鏈智能數據質量控制器
現有監測系統一般通過數據采集傳輸儀(以下簡稱“數采儀”)管理前端監測設備,數采儀負責監測設備的參數管理、數據緩存[17]。區塊鏈數據智能數據質量控制器通過USB 與數采儀連接,從數采儀中讀取監測參數、系統運行參數和監測數值。控制器的業務功能與流程如圖11 所示。

圖11 區塊鏈智能數據質量控制器的業務功能與流程
本文以區塊鏈智能數據控制器為基礎,以系統最小耦合為原則,以基本不影響原來系統的業務、功能和流程為前提,提出了對現有空氣質量監測系統進行區塊鏈化改造的解決方案,為現有的空氣質量自動監測系統增加數據防篡改、數據存證與溯源、運維流程監督等功能。改造方案主要包括以下4 個方面:
(1)關鍵數據上鏈。關鍵數據包括監測設備參數、監測值、監測設備運行記錄、關鍵過程數據等。區塊鏈智能數據質量控制器從數采儀獲取數據后對數據進行數字簽名、加蓋簽名時間戳,利用自身通訊模塊將簽過名的數據廣播至分散在不同監測子站的控制器和后臺數據中心共同組成的區塊鏈網絡,并同步更新網絡中各節點的數據賬本。實現關鍵數據的存證、可追溯、防篡改[18]。
(2)數據異常發現與異常歸因。針對空氣自動監測站的大氣常規6 項污染物(SO2、NO2、O3、CO、PM10、PM2.5)以及固定污染源監測站的非甲烷總烴(NMHC),以高時間分辨率周期性記錄污染物監測數值和儀器各類參數,并將數據采集系統運行記錄按日匯總。基于數據異常診斷算法,利用實時監測數據、儀器參數數據、運維操作數據,并結合歷史可信數據,對污染物濃度變化趨勢進行預測。基于污染物濃度趨勢,采用箱線圖判定法、LSTM 閾值判定法等數值預測方法,對當前監測數據合理值進行分析預測,給出監測值置信區間,得到監測數據異常概率。通過監測數據時序分析、環境參數交叉比對、多設備設置參數交叉驗證、系統參數修改分析、外部設備接入分析等方法進行數據異常歸因。
(3)監測設備全生命周期健康管理。設備健康是監測數據質量保證的前提,本文采用3.3 節的方案,通過區塊鏈進行設備運維管理,存證運維過程數據,結合設備重點參數、設備運行狀態的監控數據。以設備運維過程、設備狀態兩類指標來描述設備的健康狀況,采用基于定基指數的動態權重儀器健康指數算法進行設備健康評價。通過設備運維流程智能合約化進行運維業務流程控制。通過可信運維過程數據記錄進行運維過程數據存證。綜合以上方法實現監測設備全生命周期健康管理。
(4)監測數據追溯與查詢。環境監測數據造假手段多樣、行為隱蔽,具有多源頭協同干擾、上下游串聯的突出特點,僅依靠相關人員經驗和結合有關數據綜合判斷的監管方式難以高效、全面地發現異常問題;對于發現的疑似監測數據異常,難以完整地還原在監測數據疑似異常出現時段監測設備的運行狀況。針對上述問題,本文以區塊鏈智能數據質量控制器的數據存證為基礎,提出結合大數據、AI 技術,追溯和查詢包括數據篡改、數據突變、設備健康報警、采樣口異常等狀況的方案,完整地還原在疑似監測數據異常出現時段監測設備的運行狀況,增強異常數據的追溯和查詢能力。
研究團隊實現了基于區塊鏈數據質量控制器的現有空氣質量監測系統改造方案,并在北京空氣質量監測系統上進行了試點示范。試點示范共部署了5 個點,點位部署如表1 所示。

表1 區塊鏈數據質量控制器試點示范布點方案
試點示范共持續了6 個月,在試點示范期間,通過雙盲測試和實際運行案例,共發現設備異常、篡改參數、堵塞采樣口、篡改數據等狀況16 起,例如:2021 年4 月14 日10—15 點,系統通過鏈上數據交叉核驗,識別到車公莊站點因柳絮進入探頭引起PM2.5監測儀器異常;2021 年3 月30 日,識別到亦莊站點SO2監測儀器健康值過低;2021 年1 月29 日,識別到亦莊站點PM10監測設備運維異常等等。試點示范驗證了區塊鏈能助力空氣質量監測系統實現多類數據篡改行為和數據異常的自動識別,可有效防止監測造假、篡改數據、違規運維等行為,能顯著提高空氣質量監測的數據質量。
區塊鏈作為引領全球新一輪技術變革和產業變革的信息技術,正在被引入到越來越多的行業中,在溯源、存證、信任等方面的應用中表現出了突出的優點。環境監測行業數據質量控制所面臨的主要問題也是溯源、存證和信任的問題。因此,區塊鏈在環境監測中具有良好的應用前景和可操作性。
原生區塊鏈監測系統以可信監測設備為基礎,需開發可信監測、監控設備來保證環境保真、監測可信與傳輸可靠。通過數據校驗機制、數據防篡改機制、智能合約流程控制技術實現監測系統數據可信和流程可控,可以全面提高環境監測的數據質量,但需要全面更換現有的監測監控設備,具有較大的成本壓力。
針對現有監測系統,以具有邊緣智能、數據存證、交叉核驗、自適應組網等功能的區塊鏈智能數據質量控制器為基礎進行改造升級,可以實現監測數據及關鍵參數的存證、多類數據篡改行為和數據異常的自動識別與歸因、監測監控設備的全生命周期可靠管控,可有效提高環境監測的數據質量。通過在北京市生態環境監測中心的試點示范,證明了方案的可行性和先進性。
區塊鏈已經被確定為我國信息技術領域的戰略發展方向,在環境領域廣泛深入應用是大勢所趨,是保證精準治污、依法治污的關鍵“鑰匙”。因此,抓住機遇,做好布局,積極行動,大力推進區塊鏈在環境監測乃至環境管理中的應用具有重要意義。