張麗連
(天津財經大學理工學院 天津 300222)
?
實時追蹤森林火災受災范圍的自動估算方法的介紹與評價
張麗連
(天津財經大學理工學院 天津 300222)
本文介紹了一項由Xu Zhong,Matt Duckham等人(2016)提出的基于緊急電話報警服務數據的眾包信息數據使用聚類算法進行實時追蹤森林火災受災范圍的自動估算方法,并對其創新性以及實際應用價值進行了評價。
火災;聚類算法;實時追蹤
用于計算自然災害例如森林火災或者洪水泛濫的有關空間范圍的實時信息可以協助救災者快速有效地組織救災活動,以及幫助群眾了解災情。然而官方信息資源往往受到阻礙,并且是滯后的,而由使用者創造信息的社會媒體信息又往往缺乏必要的結構和真實性用以進行可靠的自動處理。在緊急災難中,眾包信息數據通常比官方信息產生得更迅速,因此在實時估計中利用這些信息更具有優勢。但是這些眾包信息又因為最小數據結構的限制和數據噪聲的影響使得與目標事件并不直接相關,因此在使用這些信息前應該先對其進行過濾、真實性驗證以及質量控制。利用眾包信息數據進行實時估計的好處是明顯的。在確保較為滿意的精度下,使用眾包數據可以做到實時估計比傳統估計更靈活,且成本更低。
本文介紹的實時追蹤森林火災受災范圍的自動估算模型由Xu Zhong,Matt Duckham等人(2016)提出,文章發表在自然雜志子刊科學報告上。該文章提出了一種基于緊急電話報警服務數據的公眾可用的眾包數據進行實時追蹤森林火災受災范圍的自動計算估計技術。作者先介紹了實時估計森林火災的背景,再對傳統官方信息以及眾包信息在森林火災范圍估計中的優劣進行了比較。然后利用2009年澳大利亞維多利亞黑色周六森林火災的數據來展示這個模型在比較令人滿意的精度上自動實時辨別和追蹤森林火災邊長可能線。通過結合其他官方人口統計學和環境信息,例如人口密度和風場動態變化的數據來提高該模型估計的精確度。并對部分參數進行直覺上的調整。模型建立后,再把2014年墨西哥米克勒姆森林火災數據代入模型中進行交叉驗證,驗證了模型具有良好的精確性。
以下對模型進行介紹。
(1)數據:Xu Zhong等選取了2009年澳大利亞維多利亞黑色周六森林火災報警數據進行模型的擬合和估計。該數據集主要包括三個方面:報警時間、所處位置、報告事故類型。報警數據可能受以下兩個因素的影響:不同地點的呼叫電話可能是來自同一場火災前線;而相近點的報警電話可能是不同的火災前線,即使在重大火災中緊急呼叫電話也可能是其他事件的。因此需要利用已存在的空間聚類和結構構建技術對呼叫電話根據主題,時間,地點進行聚類篩選。
(2)模型主要參數:檢測到的火災最小面積(At);火災最長的移動多邊形的周長范圍(x);處理中的報警電話所在區域的“窗口”大小;受限于空間(Es)和時間(Et)用于ST-DBSCAN聚類算法的最小街區電話報警數(minPts)。
(3)模型構建的四個步驟:1)對事故信息進行過濾;2)使用ST-DBSCAN算法進行空間聚類;3)重塑火災周長形狀;4)基于地面信息對估計量的甄別。
(4)估計精確度的判斷標準:召回率、精確率以及F1分數。
Xu Zhong等按照以上的步驟建立了實時估計模型,并利用人口密度和風場動態變化的數據,對部分參數進行調整。最后他們把模型應用在實時估計2014年米克勒姆森林火災周長范圍,模型的預測表現出了高召回率低精確率。由于在火災范圍實時估計中高召回率更具有價值,因此該模型的應用具有很大的現實意義。
該方法的創新性主要體現在兩個方面。
第一,相比過去的檢測技術,該項技術可以做到實時檢測,并且成本較低。過去計算火災范圍只能依靠實體硬件技術檢測,例如地面檢測儀、高空衛星檢測或者空中紅外線檢測等,但是這些檢測都無法做到實時監測和預測,且存在明顯的滯后性。這大大降低了監測的價值,因為如果可以實現火宅周長實時估計就能夠挽救大量的生命和財產并從而把火宅造成的損失降到最低。同時使用這些硬件設備進行監測的成本往往是高昂的,有很多地方都沒能使用上這些硬件設備進行森林火宅檢測,而文章中介紹的利用報警電話數據以及結合其他一些低成本并且可實時獲取的輔助信息對森林火災周長進行實時估計,充分地利用和挖掘眾包信息數據的價值。
第二,文章結合過去已經研究深徹的ST-DBSCAN聚類算法以及χ-shapes形狀重塑算法還有新設計的算法形成新模型對森林火宅進行實時估計。算法的設計基本上是現成的,但是在實際操作設計上,Xu Zhong等充分發揮了其對火宅周長計算的經驗從而對計算的具體情況的準確把握大大提高整個計算的精確度。
文中介紹的這種方法背后的思維方法促使人對數據挖掘產生了一種新的理解。隨著信息時代的不斷滲透,生活處處是數據,我們無時無刻不在產生出數據。過去有大量的數據我們并不知道如何去使用和發揮其價值,但如今我們越來越意識到應該學會如何從這些看似沒有很大用途的數據中挖掘出“黃金”。就如同當年沉寂在農場站里的90多年的繁雜數據一樣,經過偉大的統計學家費歇爾的重新設計和利用重現其應有的價值一般。
同時,筆者認為該方法如果能夠應用到我國的火災或者洪水泛濫的災情預測中,將可以大大地降低人民群眾的生命財產損失。但是在應用這項技術之前,應該注意到我國目前的報警電話數據的數據結構還需要進一步改善,即需要登記者在錄入報警信息時按照一定的格式錄入,讓報警者提供與預測最相關的數據。這就有賴于相關部門對報警電話信息錄入方法的改進,同時加強對災情預測技術的進一步的研究。
[1]Xu Zhong,Matt Duckham,Derek Chong,* & Kevin Tolhurst.Real-time estimation of wildfire perimeters from curated crowdsourcing.Nature:Scientific Reports 6,Article number:24206(2016)
張麗連(1990-),女,漢族,廣東茂名人,碩士,天津財經大學理工學院,統計學。