
















關鍵詞:
濃度監測;多源數據融合;遙感;移動傳感;機器學習中圖分類號:X831 文獻標識碼:A 文章編號:1008-9500(2025)04-0171-03DOI: 10.3969/j.issn.1008-9500.2025.04.047
Research on Urban
Concentration Monitoring Technology Based on Multi-Source Data Fusion
YUE Tierong, ZHONG Shuhua, ZHANG Shuang
ouEcologicalEnvironmentMontoringCenterofHubeiProvincialDepartmentofEcologyandEnvionment,Ezhou46,C
Abstract:Traditional singledata source monitoring methodshaveproblems suchas lowaccuracyand limitedcoverage.In view of this,this study proposes a city
concentration monitoring technology based on multi-source data fusion,which comprehensivelyutilizes various data sources such as ground monitoring stations,remote sensingsatelites,and mobile sensors.Throughstepssuchsdatapreprocesing,featureextractionndfusionagorithmoptimzation,ahigh-precisinnd large-scale
concentration monitoring model is constructed.The experimental results show that this method significantly improves monitoringacuracyandspatiotemporalresolution,providingstrongsupportforurbanairqualitymanagement.
Keywords:
concentration monitoring; multi-source data fusion;remote sensing; mobile sensing; machine learning
作為一種直徑小于或等于
的細顆粒物,已成為影響城市空氣質量的主要污染物之一。準確監測
濃度對于評估空氣質量、制定污染防控策略至關重要。近年來,隨著遙感技術和物聯網的發展,多源數據融合為監測
提供了新的思路和方法。本研究旨在探索如何有效整合多種數據源,構建更加精確、全面的
濃度監測體系,為城市空氣質量管理提供科學依據。
1多源數據獲取與預處理
1.1地面監測站數據采集
地面監測站是獲取
濃度數據的主要來源之一。研究采用標準的顆粒物采樣器和 β 射線衰減法測量儀器,在城市不同功能區域設置多個監測點[1]監測站持續記錄
濃度、溫度、濕度、風速及風向等參數,數據采集頻率為每小時一次。為確保數據可靠性,定期對儀器進行校準和維護。監測站網絡的布局考慮了城市地形、人口分布和主要污染源的位置,以獲得具有代表性的數據樣本。同時,建立了實時數據傳輸系統,將采集的數據及時傳送至中央數據庫,為后續分析提供基礎。
1.2衛星遙感數據獲取
衛星遙感技術為大范圍
監測提供了重要數據支持。研究主要利用中分辨率成像光譜儀(Moderate-resolution Imaging Spectroradiometer,MODIS)和可見光紅外成像輻射儀(VisibleInfrared
ImagingRadiometerSuite,VIRS)等衛星搭載的光學傳感器,獲取氣溶膠光學厚度(Aerosol OpticalDepth,AOD)數據。衛星數據的空間分辨率為
時間分辨率為每日一次。通過美國國家航空航天局的LAADSDAAC平臺下載原始數據產品,并使用專業的遙感圖像處理軟件進行幾何校正、大氣校正和云檢測等預處理。考慮到大氣條件對遙感反演結果的影響,研究還收集了同期的氣象數據,包括相對濕度、邊界層高度等參數,用于后續構建AOD-
轉換模型。
1.3移動傳感器數據收集
為彌補固定監測站點的空間局限性,研究設計了基于車載移動傳感器的數據采集方案。選用高精度的小型化
傳感器,集成全球定位系統(GlobalPositioningSystem,GPS)定位模塊和無線通信模塊,安裝在公交車、出租車等城市公共交通工具上。傳感器實時采集
濃度數據,同步記錄時間戳和地理位置信息,數據采樣間隔為 1 0 s 。通過4G、5G網絡,采集的數據實時上傳至云服務器。移動傳感網絡覆蓋了城市主要道路和居民區,提供了高時空分辨率的
濃度分布數據,有效補充了固定監測站的數據缺口。
2多源數據融合算法設計
2.1數據特征提取
數據特征提取是多源數據融合的基礎環節,旨在從原始數據中提取有效信息,提高后續融合算法的效率和精度[2]。對于地面監測站的數據,采用時間序列分析方法提取
濃度的周期性特征和趨勢特征,如小波變換和經驗模態分解。衛星遙感數據的特征提取側重于空間紋理信息,應用灰度共生矩陣和Gabor濾波器等方法。移動傳感器數據則重點提取時空變化特征,使用滑動窗口法計算局部統計量。此外,結合氣象數據,提取溫度、濕度、風速等環境因子與
濃度的相關特征。通過主成分分析(Principal Component Analysis,PCA)和獨立成分分析(Independent ComponentAnalysis,ICA)等降維技術,消除冗余特征,保留最具代表性的特征集,為后續融合模型提供高質量輸入。
2.2機器學習融合算法選擇與優化
機器學習融合算法是實現多源數據有效整合的核心。研究比較了多種機器學習算法,包括隨機森林、梯度提升決策樹(Gradient Boosting Decision Trees,GBDT)、支持向量回歸(Support VectorRegression,SVR)和深度神經網絡(DeepNeuralNetwork,DNN)。隨機森林具有良好的特征處理能力和抗過擬合性,GBDT擅長處理非線性關系,SVR適用于高維特征空間,DNN能夠自動學習復雜的特征表示。針對
濃度預測的特點,設計了基于長短時記憶網絡(LongShort-TermMemory,LSTM)的時序預測模型,捕捉長期依賴關系。為提高模型性能,采用貝葉斯優化算法對超參數進行自動調優。同時,引入集成學習策略,整合多個基學習器的預測結果,提高模型的泛化能力和健壯性。通過特征重要性分析,識別對
濃度預測貢獻最大的特征,優化特征選擇過程。
2.3模型驗證與精度評估方法
模型驗證與精度評估是確保融合算法可靠性的關鍵步驟。研究采用多重交叉驗證策略,包括K折交叉驗證和留出法,以評估模型的泛化性能[3]。評估指標涵蓋均方根誤差(RootMean SquareError,RMSE)、平均絕對誤差(MeanAbsoluteError,MAE)、決定系數(
)和一致性指數等,全面反映模型的預測精度和擬合程度。通過殘差分析,檢驗模型預測誤差的分布特征和空間自相關性。引入Taylor圖和目標圖等可視化工具,直觀展示不同模型的性能比較結果。對于時間序列預測,采用滾動預測法評估模型的短期和長期預測能力。通過敏感性分析,評估模型對輸入數據變化的響應程度,識別關鍵影響因素。
3試驗設計與結果分析
3.1試驗區域選擇與數據采集
試驗選取北京市作為研究區域,時間跨度為2023年1一12月。在城市內設置了50個地面監測站,均勻分布在不同功能區。衛星遙感數據采用MODIS的每日氣溶膠光學厚度產品,空間分辨率為 3 k m 。移動傳感器安裝在100輛公交車上,覆蓋主要道路網絡。數據采集頻率:地面站每小時一次,衛星數據每日一次,移動傳感器每10s一次。試驗期間共收集地面監測數據438000條,有效衛星觀測數據320景,移動傳感器數據約5200萬條。氣象數據來自北京市氣象局,包括溫度、濕度、風速、風向等參數。數據質量控制后,有效數據率在 9 5 % 以上。數據采集情況如表1所示。

3.2單一數據源與多源融合結果對比
為評估多源數據融合的效果,研究分別使用單一數據源和多源融合方法進行
濃度估算。單一數據源方法包括僅使用地面監測站數據的反距離權重插值、僅基于氣溶膠光學厚度的線性回歸模型及僅利用移動傳感器數據的克里金插值。多源融合則采用經過優化的隨機森林算法,綜合利用地面監測、衛星遙感和移動傳感器數據。通過與實測值對比,計算各方法的均方根誤差和相關系數。結果顯示,多源融合方法的均方根誤差降低了 2 5 % ,相關系數提高了
0在空間分布上,多源融合方法明顯優于單一數據源方法,特別是在監測站稀疏區域。融合方法成功捕捉到城市內
濃度的空間異質性,揭示了受交通、工業活動影響的局部高濃度區域。
3.3時空分辨率提升效果分析
多源數據融合顯著提升了
濃度監測的時空分辨率。在空間分辨率方面,從原有地面監測站的點狀分布,提升到 1 k m× 1 k m 的網格化覆蓋,實現了對整個城市區域的細粒度監測。時間分辨率從每日平均提高到小時尺度,能夠捕捉
濃度的短時變化。為量化提升效果,研究選取城市內5個典型區域,包括城市中心、工業區、居民區、郊區及交通密集區,比較融合前后的時空分辨率指標。結果表明,空間分辨率平均提升了8倍,時間分辨率提升了24倍。高分辨率結果成功捕捉到更多局部污染特征和短時變化,如早晚高峰期交通擁堵導致的污染峰值,以及工業區排放造成的局部污染團。
3.4不同天氣條件下的模型表現
為評估模型在不同天氣條件下的適應性,將試驗期間的天氣狀況分為晴朗、多云、雨天和霧霾4類,分別驗證模型性能。結果顯示,模型在晴朗天氣下表現最佳,均方根誤差為
,相關系數為0.92。霧霾天氣次之,均方根誤差為
,相關系數為 0 . 8 8 。多云和雨天條件下,由于衛星數據質量下降,模型性能略有降低,但均方根誤差仍控制在
以內,相關系數保持在0.84以上。通過引入氣象參數和移動傳感器數據,多源融合模型顯著提高了惡劣天氣下的監測精度。不同天氣條件下的模型性能指標如表2所示。

4結論
基于多源數據融合的城市
濃度監測技術為解決傳統監測方法的局限性提供了新思路。通過整合地面監測站、遙感衛星和移動傳感器等數據源,該技術顯著提高了
濃度監測的精度和時空分辨率。試驗結果表明,多源數據融合方法在不同天氣條件和復雜地形環境下均表現出良好的適應性和穩定性。未來研究應關注數據質量控制、算法優化和實時監測系統構建,以進一步提升監測效果,為城市空氣質量管理和環境政策制定提供更加可靠的科學依據。
參考文獻
1易仁玲,陳志永,王珂,等.常州市大氣
中金屬元素濃度變化、來源及健康風險:以武進區監測點為例[J].環境衛生學雜志,2024(7):578-584.
2 薛京洲,王旭陽,李小宇.瀘州環境空氣自動監測
和
質量濃度“倒掛”現象及原因分析[J].新疆環境保護,2024(2):26-30.
3 葉昊天,鄒春輝,田宏偉.一種基于機器學習和葵花8號數據的
濃度監測方法[J].氣象與環境科學,2023(3):89-97.