張麗連
(天津財經(jīng)大學(xué)理工學(xué)院 天津 300222)
?
實(shí)時追蹤森林火災(zāi)受災(zāi)范圍的自動估算方法的介紹與評價
張麗連
(天津財經(jīng)大學(xué)理工學(xué)院 天津 300222)
本文介紹了一項(xiàng)由Xu Zhong,Matt Duckham等人(2016)提出的基于緊急電話報警服務(wù)數(shù)據(jù)的眾包信息數(shù)據(jù)使用聚類算法進(jìn)行實(shí)時追蹤森林火災(zāi)受災(zāi)范圍的自動估算方法,并對其創(chuàng)新性以及實(shí)際應(yīng)用價值進(jìn)行了評價。
火災(zāi);聚類算法;實(shí)時追蹤
用于計算自然災(zāi)害例如森林火災(zāi)或者洪水泛濫的有關(guān)空間范圍的實(shí)時信息可以協(xié)助救災(zāi)者快速有效地組織救災(zāi)活動,以及幫助群眾了解災(zāi)情。然而官方信息資源往往受到阻礙,并且是滯后的,而由使用者創(chuàng)造信息的社會媒體信息又往往缺乏必要的結(jié)構(gòu)和真實(shí)性用以進(jìn)行可靠的自動處理。在緊急災(zāi)難中,眾包信息數(shù)據(jù)通常比官方信息產(chǎn)生得更迅速,因此在實(shí)時估計中利用這些信息更具有優(yōu)勢。但是這些眾包信息又因?yàn)樽钚?shù)據(jù)結(jié)構(gòu)的限制和數(shù)據(jù)噪聲的影響使得與目標(biāo)事件并不直接相關(guān),因此在使用這些信息前應(yīng)該先對其進(jìn)行過濾、真實(shí)性驗(yàn)證以及質(zhì)量控制。利用眾包信息數(shù)據(jù)進(jìn)行實(shí)時估計的好處是明顯的。在確保較為滿意的精度下,使用眾包數(shù)據(jù)可以做到實(shí)時估計比傳統(tǒng)估計更靈活,且成本更低。
本文介紹的實(shí)時追蹤森林火災(zāi)受災(zāi)范圍的自動估算模型由Xu Zhong,Matt Duckham等人(2016)提出,文章發(fā)表在自然雜志子刊科學(xué)報告上。該文章提出了一種基于緊急電話報警服務(wù)數(shù)據(jù)的公眾可用的眾包數(shù)據(jù)進(jìn)行實(shí)時追蹤森林火災(zāi)受災(zāi)范圍的自動計算估計技術(shù)。作者先介紹了實(shí)時估計森林火災(zāi)的背景,再對傳統(tǒng)官方信息以及眾包信息在森林火災(zāi)范圍估計中的優(yōu)劣進(jìn)行了比較。然后利用2009年澳大利亞維多利亞黑色周六森林火災(zāi)的數(shù)據(jù)來展示這個模型在比較令人滿意的精度上自動實(shí)時辨別和追蹤森林火災(zāi)邊長可能線。通過結(jié)合其他官方人口統(tǒng)計學(xué)和環(huán)境信息,例如人口密度和風(fēng)場動態(tài)變化的數(shù)據(jù)來提高該模型估計的精確度。并對部分參數(shù)進(jìn)行直覺上的調(diào)整。模型建立后,再把2014年墨西哥米克勒姆森林火災(zāi)數(shù)據(jù)代入模型中進(jìn)行交叉驗(yàn)證,驗(yàn)證了模型具有良好的精確性。
以下對模型進(jìn)行介紹。
(1)數(shù)據(jù):Xu Zhong等選取了2009年澳大利亞維多利亞黑色周六森林火災(zāi)報警數(shù)據(jù)進(jìn)行模型的擬合和估計。該數(shù)據(jù)集主要包括三個方面:報警時間、所處位置、報告事故類型。報警數(shù)據(jù)可能受以下兩個因素的影響:不同地點(diǎn)的呼叫電話可能是來自同一場火災(zāi)前線;而相近點(diǎn)的報警電話可能是不同的火災(zāi)前線,即使在重大火災(zāi)中緊急呼叫電話也可能是其他事件的。因此需要利用已存在的空間聚類和結(jié)構(gòu)構(gòu)建技術(shù)對呼叫電話根據(jù)主題,時間,地點(diǎn)進(jìn)行聚類篩選。
(2)模型主要參數(shù):檢測到的火災(zāi)最小面積(At);火災(zāi)最長的移動多邊形的周長范圍(x);處理中的報警電話所在區(qū)域的“窗口”大小;受限于空間(Es)和時間(Et)用于ST-DBSCAN聚類算法的最小街區(qū)電話報警數(shù)(minPts)。
(3)模型構(gòu)建的四個步驟:1)對事故信息進(jìn)行過濾;2)使用ST-DBSCAN算法進(jìn)行空間聚類;3)重塑火災(zāi)周長形狀;4)基于地面信息對估計量的甄別。
(4)估計精確度的判斷標(biāo)準(zhǔn):召回率、精確率以及F1分?jǐn)?shù)。
Xu Zhong等按照以上的步驟建立了實(shí)時估計模型,并利用人口密度和風(fēng)場動態(tài)變化的數(shù)據(jù),對部分參數(shù)進(jìn)行調(diào)整。最后他們把模型應(yīng)用在實(shí)時估計2014年米克勒姆森林火災(zāi)周長范圍,模型的預(yù)測表現(xiàn)出了高召回率低精確率。由于在火災(zāi)范圍實(shí)時估計中高召回率更具有價值,因此該模型的應(yīng)用具有很大的現(xiàn)實(shí)意義。
該方法的創(chuàng)新性主要體現(xiàn)在兩個方面。
第一,相比過去的檢測技術(shù),該項(xiàng)技術(shù)可以做到實(shí)時檢測,并且成本較低。過去計算火災(zāi)范圍只能依靠實(shí)體硬件技術(shù)檢測,例如地面檢測儀、高空衛(wèi)星檢測或者空中紅外線檢測等,但是這些檢測都無法做到實(shí)時監(jiān)測和預(yù)測,且存在明顯的滯后性。這大大降低了監(jiān)測的價值,因?yàn)槿绻梢詫?shí)現(xiàn)火宅周長實(shí)時估計就能夠挽救大量的生命和財產(chǎn)并從而把火宅造成的損失降到最低。同時使用這些硬件設(shè)備進(jìn)行監(jiān)測的成本往往是高昂的,有很多地方都沒能使用上這些硬件設(shè)備進(jìn)行森林火宅檢測,而文章中介紹的利用報警電話數(shù)據(jù)以及結(jié)合其他一些低成本并且可實(shí)時獲取的輔助信息對森林火災(zāi)周長進(jìn)行實(shí)時估計,充分地利用和挖掘眾包信息數(shù)據(jù)的價值。
第二,文章結(jié)合過去已經(jīng)研究深徹的ST-DBSCAN聚類算法以及χ-shapes形狀重塑算法還有新設(shè)計的算法形成新模型對森林火宅進(jìn)行實(shí)時估計。算法的設(shè)計基本上是現(xiàn)成的,但是在實(shí)際操作設(shè)計上,Xu Zhong等充分發(fā)揮了其對火宅周長計算的經(jīng)驗(yàn)從而對計算的具體情況的準(zhǔn)確把握大大提高整個計算的精確度。
文中介紹的這種方法背后的思維方法促使人對數(shù)據(jù)挖掘產(chǎn)生了一種新的理解。隨著信息時代的不斷滲透,生活處處是數(shù)據(jù),我們無時無刻不在產(chǎn)生出數(shù)據(jù)。過去有大量的數(shù)據(jù)我們并不知道如何去使用和發(fā)揮其價值,但如今我們越來越意識到應(yīng)該學(xué)會如何從這些看似沒有很大用途的數(shù)據(jù)中挖掘出“黃金”。就如同當(dāng)年沉寂在農(nóng)場站里的90多年的繁雜數(shù)據(jù)一樣,經(jīng)過偉大的統(tǒng)計學(xué)家費(fèi)歇爾的重新設(shè)計和利用重現(xiàn)其應(yīng)有的價值一般。
同時,筆者認(rèn)為該方法如果能夠應(yīng)用到我國的火災(zāi)或者洪水泛濫的災(zāi)情預(yù)測中,將可以大大地降低人民群眾的生命財產(chǎn)損失。但是在應(yīng)用這項(xiàng)技術(shù)之前,應(yīng)該注意到我國目前的報警電話數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)還需要進(jìn)一步改善,即需要登記者在錄入報警信息時按照一定的格式錄入,讓報警者提供與預(yù)測最相關(guān)的數(shù)據(jù)。這就有賴于相關(guān)部門對報警電話信息錄入方法的改進(jìn),同時加強(qiáng)對災(zāi)情預(yù)測技術(shù)的進(jìn)一步的研究。
[1]Xu Zhong,Matt Duckham,Derek Chong,* & Kevin Tolhurst.Real-time estimation of wildfire perimeters from curated crowdsourcing.Nature:Scientific Reports 6,Article number:24206(2016)
張麗連(1990-),女,漢族,廣東茂名人,碩士,天津財經(jīng)大學(xué)理工學(xué)院,統(tǒng)計學(xué)。