Seth Stein,Robert Geller,Mian Liu
1)Department of Earth and Planetary Sciences,Northwestern University,Evanston,Illinois 60208U.S.A.
2)Department of Earth and Planetary Science,Graduate School of Science,University of Tokyo,Tokyo 113-0033Japan
3)Department of Geological Sciences,University of Missouri,Columbia,Missouri 65211U.S.A.
是假設有誤還是運氣不佳:地震危險性圖為什么需要客觀檢驗*
Seth Stein1),Robert Geller2),Mian Liu3)
1)Department of Earth and Planetary Sciences,Northwestern University,Evanston,Illinois 60208U.S.A.
2)Department of Earth and Planetary Science,Graduate School of Science,University of Tokyo,Tokyo 113-0033Japan
3)Department of Geological Sciences,University of Missouri,Columbia,Missouri 65211U.S.A.
近年來,許多破壞性大地震都發生在地震危險性圖中明確標注為危險性相對較低的地方。令人驚奇的是,雖然許多國家都在使用這樣的地震危險性圖,但其效果卻從未得到客觀驗證。
第二次世界大戰期間,后來的諾貝爾獎獲得者Kenneth Arrow擔任軍事天氣預報員。他寫道:“我的同事負責長期天氣預報,即預測未來一個月的天氣情況”。“我們的統計人員對這些預報進行了驗證,結果顯示預報與全憑運氣猜測沒有什么區別。就連預報人員自己都信服了,并主動要求停止預報。他們大概是這樣答復的:‘司令官明明知道預報沒什么用。然而,為了作戰計劃,他需要這些情報。’”[1]
在編制地震危險性圖(中國通常稱“地震區劃圖”——譯者注)時,地震學家往往遇到同樣的情況,即期待地震危險性圖能夠像人們想象的那樣完美地描繪一個地區的地震危險性水平,并為地震防災減災提供科學依據。然而,近年來許多破壞性大地震都發生在圖中明確標示為危險性相對較低的地方[2]。一個突出的實例就是2011年3月的M9.1(多數文獻稱M9.0——譯者注)東日本大地震。此次地震發生在日本國家地震危險性圖中標示為危險性相對較低的一個區域。圖1[3]說明了Geller的觀點:
“圖中被評估為最危險的區域位于3個‘假想地震’(東海、東南海和南海;見圖1)的地震帶上。但事實上,日本自1979年以來造成死亡10人或以上的地震都發生在被指定為概率相對較低的地方。最近呈現的這些與特征地震模型及類似的地震空區模型相悖的結果強烈表明,這種地震危險性圖及其所使用的方法是有缺陷的,應該被擯棄。”
類似的與事實不符的情況在全世界范圍內也時有發生。2008年中國汶川地震(M7.9)

圖1 日本政府的危險性圖與1979年以來死亡10人或以上地震的實際位置的比較[3]。日本政府每年出版與此類似的國家地震危險性圖。但自1979年起,日本造成10人或以上死亡的地震均發生在被指定為低危險性的地方
在上面的事例中,危險性圖大大低估了地震危害。然而,編圖人員可能會據理力爭,認為實際發生的比預期大得多的地震及其產生的震動畢竟是偶發事件,它們不應該被用作判定危險性圖不成功的標準,因為危險性圖預測的是某一時間間隔內具有某種概率的最大震動。那么我們應該如何判斷危險性圖的性能呢?目前還沒有公認的標準。令人驚奇的是,雖然許多國家都在使用這樣的地震危險性圖,但其效果卻從未得到客觀驗證。
對于科學而言,一個基本原則就是,某些方法只有經過證實比那些基于零假設——通常基于隨機幾率——的方法更加成功才應該被采納。否則的話,無論其假說看起來多么具有吸引力,它們也應該被摒棄。
源自其他領域(如對廣泛采用的療法進行客觀評價的循證醫學)的結果同樣具有啟示意義。例如,Moseley等[4]發現,雖然每年接受膝關節鏡手術的病例超過65萬、每例花費約5000美元,但一項對照實驗表明“其效果并不比僅僅給予安慰劑治療的效果好。”
天氣預報,從概念上講類似于地震危險性圖的編制,它們必須接受例行評估以核定其預測與實際天氣情況的吻合程度究竟有多高[5]。對天氣預報的檢驗還包括,它們是否比利用往年同一日期的平均值來預報更加準確,或者比假定今天的天氣與昨天的天氣一樣這種預報結果更加準確。幾年來,這一運作方式使得預報方法和效果有了重大改進,并且對不確定因素給出了較明確的評估。這種概念化方法也是氣候模擬人員使用的工具,他們提供一系列的模型預測、對比,并探討建模所用的各種假設對于不確定因素有何影響。
最近發生的幾次比危險性圖預測的地震動強烈得多的地震事件表明,地震預報也需要一種類似的模式。這就牽涉到用于危險性圖檢驗的客觀標準的制定問題,檢驗所采取的方式就是將地震危險性圖與其公布后實際發生的地震活動情況進行比較。這種檢驗方式可以顯示出危險性圖的實際效果如何,還可以對其真實的不確定因素作出較好的評估,并表明隨著時間的推移其方法的改變能否提高危險性圖的性能。對此,有多種衡量標準可以使用。其中一種合乎自然規則的標準是,將幾年來在危險性圖所涉及的區域內觀測到的最大加速度與危險性圖以及零假設所預測的最大加速度進行比較。一種簡單的零假設就是假定區域地震活動的分布為均勻分布。圖1表明日本的危險性圖比零假設表現得還要糟糕。
檢驗危險性圖采用的記錄越長越好,這一點很重要。因此,對于這種檢驗而言最主要的挑戰就是只能獲得相對較短的地震動記錄。許多方法都可以用來解決這一問題。一種方法是,除了對單個區域的危險性圖進行檢驗外,還可以將不同區域的危險性圖聯合起來進行檢驗,這樣得出的統計結果可能更有意義。
在檢驗過程中,重要的是應該避免一次大地震發生后編制的新危險性圖引起的偏差,因為這一次大地震在早先的危險性圖中是沒有標注的。統計學家將這種事后對模型進行的修改稱作“德克薩斯神槍手策略”(類似于中國的“事后諸葛亮”——譯者注),即先在牛棚上打出一串槍眼,然后圍著這些槍眼畫出靶子。某些情況下,一幅新的危險性圖是否能夠預測未來事件、新圖比舊圖的質量究竟提高了多少,這些都需要相當長的一段時間來驗證。
假設檢驗是科學方法的核心。盡管有困難,但對產生地震危險性圖所用的方法進行持續、認真、客觀的檢驗很有必要。同時,這些危險性圖也應該呈獻給公眾和決策者,而且圖中應該包含對其不確定因素的明確討論。

圖2 華北地震歷史。圖中顯示地震活動遷移范圍極廣,以至于在2000年內未出現同一斷層區段破裂兩次的情況。實心圓代表每一小圖顯示的時間段內發生的地震位置;空心圓代表公元前780年至前一時間段末年(圖a中公元1303年)的地震位置。線條表示所選大地震的破裂長度[9]
編制地震危險性圖使用了多個關鍵假設,其中涉及到(1)大地震將在何時何地發生,(2)地震有多大,(3)其產生的地面運動如何。前兩個假設基于特征地震的復發概念,這種模型即使在“表現似乎很好”的地方——加州圣安德烈斯斷層上的帕克菲爾德——也未能成功[6]。地震歷史在某種程度上可能會起到引導作用,但與大地震的漫長而充滿變數的復發時間相比,通過儀器和古地震記錄獲得的地震歷史往往太短。在這種情況下,未來大地震的震級及其可能產生的震動幾乎不為人知。于是,日本的編圖人員沒有考慮到其東北海岸附近海域發生一次M9地震的可能性[7]。由于地震記錄的時間太短,所以最近發生的大地震也可以引起災害評估的偏差——大地震在圖中會產生高危險性“靶心”[8]。這些“靶心”可起誤導作用,尤其是在中陸地區,因為其地震活動的時空模式比板塊邊界的模式更不規則。例如,華北地區2000年的記錄顯示,大地震在分布范圍極廣的斷層系之間遷移,以至于在這一時段內還未發現大地震使同一斷層區段發生兩次破裂的情況(圖2)。由此,地震記錄的某個短期子集會使危險性評估產生偏差。
另一個問題是,大地震的概率究竟應該被假定為不隨時間的推移而改變還是應該被假定為隨時間的變化而變化。后一種假說認為地震的復發遵循地震輪回的規律,在平均復發間隔的前2/3的時間段內,預計地震發生的概率較低,而后來當推測此次地震已經逾期未發生時,則預計概率較高。這一地震重復假說頗具吸引力,也成為圖1中預計東海、東南海和南海地區具有高危險性的依據。然而,大地震發生的地方往往并非那些預期的地震空區。
地震危險性圖必然依賴于其編制者的假設。通過對同一地區的危險性圖進行比較,這種依賴性可以變得非常明了,因為在利用不同的假設對同一地區作出的危險性圖中,其預計的危險性可以相差3到4倍。這些差異顯示出某些不確定因素,說明對危險性圖的性能進行評估是至關重要的。
理想的危險性圖既不會低估危害而導致準備不足,也不會高估危害而導致資源濫用。我們希望對一代又一代危險性圖進行的客觀檢驗將有助于提高其性能。然而,危險性圖編制的水平也受到各種因素的制約。有些因素緣于知識的匱乏和地震過程固有的易變性。另一些因素則可能反映出這樣一個事實,即危險性圖的產生基于某些假說,如特征地震和/或地震重復模型。如果這些模型從根本上背離了實際上地震發生的非線性物理過程(這種情況的可能性很大),那么無論你對模型進行怎樣的調整,也不會產生接近理想的危險性圖。事情發展到這一地步似乎很令人氣餒,但事實極有可能就是如此。要摸清危險性圖的實際性能,客觀檢驗是唯一的手段。
譯自:Seismological Research Letters,September/October 2011,82(5):623-626
原題:Bad assumptions or bad luck:Why earthquake hazard maps need objective testing
(中國地震局地球物理研究所 左玉玲 譯)
(譯者電子信箱,左玉玲:yulingzuo@yahoo.com.cn)
[1]Gardner D.Future Babble:Why Expert Predictions Fail——and Why We Believe Them Anyway.McClelland &Stewart,Toronto,2010
[2]Kerr R.Seismic crystal ball proving mostly cloudy around the world.Science,2011,332:912-913
[3]Geller R J.Shake-up time for Japanese seismology.Nature,2011,472:407-409
[4]Moseley J B,O’Malley K,Petersen N J,et al.A controlled trial of arthroscopic surgery for osteoarthritis of the knee.New England Journal of Medicine,2002,347(2):81-88
[5]Stephenson D B.Use of the“Odds Ratio”for diagnosing forecast skill.Weather and Forecasting,2000,15:221-232
[6]Jackson D D,Kagan Y Y.The 2004Parkfield earthquake,the 1985prediction,and characteristic earthquakes:Lessons for the future.Bull.Seism.Soc.Am.,2006,96:S397-S409
[7]Stein S,Okal E.The size of the 2011Tohoku earthquake needn’t have been a surprise.Eos,2011,92:227-228
[8]Swafford L,Stein S.Limitations of the short earthquake record for seismicity and seismic hazard studies.In:Stein S and Mazzotti S(eds.),Continental Intraplate Earthquakes,Special Paper,2007,425:49-58.Geological Society of America,Boulder,Colorado
[9]Liu M,Stein S,Wang H.2000years of migrating earthquakes in north China:How earthquakes in mid-continents differ from those at plate boundaries.Lithosphere,2011,3(2):128-132
P315.7;
D;
10.3969/j.issn.0235-4975.2012.04.006
2011-09-22。(多數文獻稱M8.0——譯者注)發生在一個被評估為具有低危險性的斷層系上,而這種評估結果的依據就是近期地震活動稀少、滑移速率緩慢。另一個實例就是非洲與亞歐之間的會聚板塊邊界。1999年全球地震危險性圖(Global Seismic Hazard Map)給出的是50年超越概率10%的峰值地面加速度,其“靶心”瞄準了“明顯處于危險境地的”1980年阿爾及利亞阿斯南(El Asnam)M7.3地震的位置。而自那以后發生的迄今為止最大的兩次地震——2003年M6.8阿爾及利亞地震和2004年M6.4摩洛哥地震——都沒有發生在“靶心”地區或被指定為危險性水平很高的地區。同樣,2010年M7.1海地地震也發生在2001年圖中標示為危險性很低的斷層上,其產生的地面運動比圖中預測的要強烈得多。