王秀英 金欣 黃志鳳 歐建芳 羅少輝



摘 要:為探究西寧地區地閃頻次與雷電流幅值的關系,利用2013—2017年閃電定位監測數據,運用R語言研究該區域內地閃頻次和雷電流幅值變化特征,通過可視化直觀展示兩者間的相關性,在相關性分析基礎上,建立基于地閃頻次的小時雷電流幅值回歸模型。結果表明,2013—2017年西寧市轄區內小時地閃頻次最大為98次,雷電流幅值最大值為138 kA;地閃頻次極值點處,雷電流幅值為峰值或在峰值左右;累計時次內的地閃頻次和雷電流幅值最大值呈顯著正相關,相關系數達0.856([N]=29);基于地閃頻次擬合的小時雷電流幅值回歸模型能夠解釋觀測值73%的方差,模型的模擬效果較好,可用于小時雷電流幅值的預測。但由于樣本有限,需要在多資料融合的基礎上研究閃電定位監測數據,才能使模型穩定性更強,更深入了解雷電流幅值變化的機制,從而為雷電災害風險區劃和雷電災害調查提供技術指標,為氣象防災減災提供決策依據。
關鍵詞:雷電流幅值;地閃頻次;統計分析;R語言
中圖分類號:P468.02文獻標識碼:A文章編號:1003-5168(2020)34-0144-06
The Characteristic Analysis and R Realization of Ground Flicker Frequency
and Lightning Current Amplitude in Plateau Region
WANG Xiuying JIN Xin HUANG Zhifeng OU Jianfang LUO Shaohui
(Qinghai Meteorological Disaster Prevention Technology Center,Xining Qinghai 810000)
Abstract: In order to explore the relationship between lightning frequency and lightning current amplitude in Xining area, this paper used the lightning location monitoring data from 2013 to 2017, studied the variation characteristics of lightning frequency and lightning current amplitude in the region by using R language, and visually displayed the correlation between them. Based on the correlation analysis, the regression model of hourly lightning current amplitude based on ground flash frequency was established. The results show that the maximum hourly lightning frequency is 98 times and the maximum lightning current amplitude is 138 kA in Xining City from 2013 to 2017, and the lightning current amplitude is the peak value or around the peak value at the extreme point of ground flicker frequency. There was a significant positive correlation between the lightning flicker frequency and the maximum lightning current amplitude, and the correlation coefficient was 0.856 (n=29). The maximum regression model of lightning current amplitude fitting based on ground flicker frequency can explain the variance of observed value by 73%, and the simulation effect of the model is good, which can be used to predict the maximum value of lightning current amplitude. However, due to the limited samples, it is necessary to study and analyze the lightning location monitoring data on the basis of multi-data fusion, in order to make the model more stable and to understand the mechanism of lightning current amplitude change more deeply. It can provide technical index for lightning disaster risk regionalization and lightning disaster investigation, and provide decision basis for meteorological disaster prevention and mitigation.
小時地閃頻次.次.? ? ? ? ? ? ?1.0000000? ? ? ? ? ? ? 0.8563068
小時雷電流幅值.kA.? ? ? ? ? ?0.8563068? ? ? ? ? ? ? 1.0000000
結果表明,小時地閃頻次與不同地閃頻次的小時雷電流幅值呈顯著正相關,相關系數為0.856([N]=29)。
4.2 相關關系的顯著性檢驗
利用R語言模塊中的cor.test()函數對單個的Pearson相關系數進行檢驗。結果表明,小時地閃頻次與不同地閃頻次的小時雷電流幅值兩者之間相關度不為0。相關關系顯著性檢驗的R核心代碼如下:
cor.test(data_1[,1],data_4[,2])
#運行結果
Pearson's product-moment correlation
data:? data_1[, 1] and data_1[, 2]
t = 8.6153, df = 27, p-value = 3.137e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.7138306? 0.9307155
sample estimates:
cor
0.8563068
4.3 回歸分析
利用OLS(Ordinary Least Square,普通最小二乘法)回歸法研究地閃頻次和雷電流幅值之間的變化規律。線性回歸模型側重考察變量之間的變化規律,并通過線性回歸方程來描述其關系,進而確定一個變量的變化對另一個變量的影響程度,為預測提供科學依據。在R語言中,擬合線性模型最基本的函數是lm()[22]。為了使結果更加直觀,制作小時地閃頻次與不同地閃頻次的小時雷電流幅值的散點圖,如圖5所示。從圖5可知,地閃頻次和雷電流幅值呈線性關系,由此作回歸分析研究。
回歸分析的R核心代碼如下:
data_2-read.delim("clipboard")
myfit<-lm(LD~LN,data=data_2)
summary(myfit)
#運行結果
Call:
lm(formula = LD ~ LN, data = data_2)
Residuals:
Min? ? ? 1Q? ? ?Median? ? ? 3Q? ? ?Max
-52.883? ?-7.541? ? -1.311? ? 12.288? ?26.480
Coefficients:
Estimate? Std. Error? t value? Pr(>|t|)
(Intercept)? ?25.4612? ?4.3558? ? 5.845? ?3.18e-06 ***
LN? ? ? ? ? ? 0.9623? ? 0.1117? ? 8.615? ?3.14e-09 ***
Signif. codes:? 0 ‘*** 0.001 ‘** 0.01 ‘* 0.05 ‘. 0.1 ‘ 1
Residual standard error: 16.98 on 27 degrees of freedom
Multiple R-squared:? 0.7333, Adjusted R-squared:? 0.7234
F-statistic: 74.22 on 1 and 27 DF,? p-value: 3.137e-09
由計算結果得到:
[β0=25.4612β1=0.9623sd(β0)=4.3558sd(β1)=0.1117]? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
回歸系數的[P]值均小于3.18×10-6,顯著性差異明顯,模型的方差解釋率達到73.3%。F分布的[P]值為3.137×10-9,顯著性差異明顯,該模型通過了t檢驗和F檢驗,因此,回歸方程為:
[LD=25.46+0.96×LN]? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
其中,[LD]為小時雷電流幅值;[LN]為小時地閃頻次。
5 結論和討論
5.1 結論
本文基于R語言,將數理統計分析引入雷電信息化系統中,為雷電數據的深入分析、挖掘提供了便利。研究結果表明,2013—2017西寧市轄區閃電定位監測數據小時地閃頻次最大為98次,小時雷電流幅值為138 kA。由地閃頻次和雷電流分布圖可知,地閃頻次極值點處,雷電流幅值為峰值或在峰值左右。小時地閃頻次與小時雷電流幅值散點矩陣圖表明,累計時次內的地閃頻次和雷電流幅值呈顯著正相關,相關系數為0.856([N]=29),說明地閃頻次和雷電流幅值具有較高相關性,地閃頻次越高,雷電流幅值越大。基于地閃頻次擬合的小時雷電流幅值回歸模型能夠解釋觀測值73%的方差,模型的模擬效果較好,可用于小時雷電流幅值的預測。
5.2 討論
在利用雷電流強度和頻次進行雷電流活動特征研究分析過程中,國內研究人員[23-27]大部分立足于雷電災害的致災因子、孕災環境和承災體系統,計算評估值,得出雷電災害發生的潛勢等級。本文利用R語言實現地閃頻次和雷電流幅值的可視化,并通過模型建立,得出地閃頻次和雷電流幅值間的線性關系。研究表明,地閃頻次和雷電流幅值的回歸模型差異性顯著([P]<0.05),模型可以預測雷電流幅值的大小,找出可能造成雷擊災害的地閃頻次數。然而,由于閃電數據樣本有限,導致模型穩定性不強,因此,在多資料融合的基礎上,閃電定位數據的特征有待進一步研究。另外,本研究統計分析結果出現離群點,在未來研究中,將針對異常雷電流幅值進行探索研究,以便更深入地理解雷電流幅值變化的機制,從而為雷電災害風險區劃和雷電災害調查提供技術指標,為氣象防災減災提供決策依據。
參考文獻:
[1]張春松,楊曉玲,劉蓉,等.甘肅武威市雷暴天氣時空分布特征[J].干旱氣象,2015(4):659-665.
[2]王智剛,丁海芳.建(構)筑物雷電災害區域影響評估方法與應用[M].北京:氣象出版社,2014:14.
[3]劉維成,陶健紅,邵愛梅,等.雷電監測預警預報技術簡述[J].干旱氣象,2014(3):446-453.
[4]林溪猛,盧輝林,黃月清,等.福建古雷石化基地雷電活動特征及對策分析[J].氣象與環境科學,2016(4):109-114.
[5]高峰,楊金玲.基于閃電定位儀監測的雷暴特征分析[J].現代農業科技,2017(23):194-198.
[6]鄧猛.山東地區雷暴分布特征及潛勢預報研究[D].南京:南京信息工程大學,2013:10-11.
[7]張雅斌,高菊霞.高原東北側災害性雷暴的大氣電場特征分析[C]//第26屆中國氣象學會年會論文集.陜西省防雷中心,2009:2068-2074.
[8]鄒宗峰,朱艷科,夏云等.基于R語言的AHP分析程序設計[J].數理醫藥學雜志,2013(4):468-470.
[9]黎一盈,王恒儉,李宏超,等.大數據時代下高危污染源的預警研究[J].科技資訊,2016(4):468-470.
[10]楊霞,吳東偉.R語言在大數據處理中的應用[J].科技資訊,2013(23):19-20.
[11]楊帆,申貴成.基于R語言的網頁抓取與數據收集[J].現代經濟信息,2017(33):307-308.
[12]卡巴克弗.R語言實戰[M].2版.王小寧,等譯.北京:人民郵電出版社,2016:121.
[13]袁佳.R語言及ggplot2在環境空氣監測數據可視化中的應用[J].中國高新技術企業,2015(16):89-91.
[14]王志良,曹蕾,李彬彬.R語言在降水極值統計分析中的應用[J].人民黃河,2012(5):22-24.
[15]肖穎為,葛銘.R語言在數據預處理中的開發應用[J].杭州電子科技大學學報,2012(6):165-168.
[16]趙義軍,張小軒,商夢嬌.多元回歸分析在溫度預測中的應用及R實現[J].佳木斯大學學報,2016(6):1020-1025.
[17]盛坤,楊麗娟,李曉航等.基于R語言的冬小麥品種穩定性分析[J].中國農學通報,2016(30):14-21.
[18]劉二剛,馬建強.R語言在統計分析中的使用技巧[J].電腦知識與技術,2017(1):251-253,256.
[19]陳希.基于R語言數據挖掘的社交網絡客戶細分研究[D].北京:北京郵電大學,2011:34-40.
[20]陳毅恒,梁沛霖.R軟件操作入門[M].北京:中國統計出版社,2006:76-78.
[21]葉文春.淺談R語言在統計學中的應用[J].中共貴州省委黨校學報,2008(4):123-125.
[22]薛毅,陳立萍.統計建模與R軟件[M].北京:清華大學出版社,2007:32-33.
[23]王鳳嬌,任鐘冬,韋良文,等.雷電災害等級劃分及發生潛勢指標探討[J].氣象科技,2009(6):744-747.
[24]郭虎,熊亞軍,扈海波.北京市雷電災害災情綜合評估模式[J].災害學,2008(1):14-17.
[25]李家啟,秦健,李良福,等.雷電災害評估及其等級劃分[J].西南大學學報(自然科學版),2010(11):140-144.
[26]王敏,孔尚成,王秀英.青海東部地區雷電災害易損性分析與區劃[J].氣象科技,2018(2):26-31.
[27]程萌,王秀麗.基于閃電定位數據的魯西南地區雷電災害易損度區劃[J].氣象與環境科學,2017(4):126-131.