


摘要:數學建模的過程離不開數據的處理,針對大數據的處理有很多簡潔有效的典型方法。本文結合主成分分析基礎上對收集的數據進行分析,通過對指標數據的處理,結合Excel數據分析,對結合差值的回歸分析建模方法進行了說明。
關鍵詞:差值;數學建模;回歸分析;質量監測
大數據伴隨信息化社會的發展越來越凸彰顯出它存在的重要性。2019年的全國大學生數學建模競賽專科組題目一個是關于超市的“薄利多銷”策略研究,另一個是“空氣質量監測”分析,都是基于大數據下的數學建模問題。處理大數據往往有很多典型的方法,解決的思路也具有明顯的代表性。下面以“基于大數據處理下空氣質量監測的校準”為例,闡述這一類數學模型問題中的一個具體解決方法——結合差值的回歸分析方法。
一、模型分析
就本題的價值意義來講,空氣質量監測從現實角度來說對環境保護有著重要的作用。分析國控點與自建點的監測數據之間的差異性,便于更好地改進監測設備,更準確的監測數據,從而為建設更好空氣質量服務。
分析自建點數據與國控點數據進行探索性分析,采集主成分數據并按照每個月份來計算 ?、 、 、 、 、 ?和氣象參數溫度、濕度、風速、氣壓、降水量的均值,通過對比可以得出自建點監測值與國控點的檢測值存在差異性。然后對造成這種差異的因素進行分析,對其差異利用兩者監測數據差值表示,然后將差值與各個氣象參數如風速、壓強、降水量、溫度、濕一一進行對比,檢測它們的變化程度。因為差值的大小反映的是在某一因素影響下的變化的大小,對于數據的校準來說具有代表性,所以結合差值對各項指標變化進行比較,通過散點圖的方式分析兩者總體趨勢,了解他們是否存在相關關系,最后結合圖像與相關系數進行分析解答。
二、模型的求解方法闡述
下面以此題中的 為例,從建模求解的角度進行方法闡述。
通過自建點與國控點 的差值不難通過描繪散點圖,求得線性回歸函數,如圖1。
自建點與國控點的 的差值在不斷減小,說明自建點的數值越來越趨于標準的國控點數值,而在這種情況下風速沒有變化,如圖2。
說明自建點與國控點之間的 的差值不是由于風速造成的,所以風速不會影響自建點的電化學氣體傳感器,風速不是導致自建點與國控點形成差異的因素。自建點與國控點 的差值和壓強之間關系如圖3。
在自建點和國控點 差值不斷減小的情況下,壓強也在不斷降低,說明自建點與國控點 差值與壓強呈正相關。壓強越高 的差值越大,自建點的數值不斷遠離標準國控點的數值,對自建點的電化學氣體傳感器影響越大,壓強越低對自建點的電化學氣體傳感器越小,對自建點越有利。所以,壓強是導致自建點數據與國控點數據造成差異的因素。
自建點與國控點 的差值與溫度比較中,自建點與國控點 PM2.5 差值在不斷減小的過程中,溫度的數值是在不斷增加的,如圖4。
因此,自建點與國控點 的差值與溫度呈負相關,說明了溫度影響了自建點微型空氣質量檢測儀,溫度影響了自建點化學氣體傳感器,可以得出溫度是導致自建點與國控點造成差異的影響因素。
在自建點與國控點 差值不斷減小的過程中,再依次對降水量、溫度的變化進行分析,可以得出類似的結論:降水量不是導致自建點與國控點差異的因素;溫度是導致自建點與國控點造成差異的影響因素。相關系數表現如下:
基于主成分下的數據處理,采用結合差值的回歸分析方法進行數學建模思路清晰,簡潔明了,結合圖像進行分析,便于精細觀察直觀易懂。由于數據采集本身隨機性的特點,此類方法在精確度上難免存在誤差,但仍然掩飾不了此類方法本身具有的簡潔性和有效性。
參考文獻:
[1]冷建飛等.多元線性回歸統計預測模型的應用[J].統計與決策.2016(4)
[2]劉萍.空氣質量評價方法研究[J].《環境保護與循環經濟》.2018(7)
[3]王麗娜等.空氣質量時空變化特征分析研究[J].環境科學與管理.2019(7)
[4]任湯磊.環境空氣檢測數據分析及處理方法研究[J].生物化工.2017(6)
作者簡介:戴洪峰(1981.02-),男,漢族,山東淄博,講師,數學教師,研究方向:高校理論數學;教育教學理論。