朱 霞,張 戈,王 耕,黃學勇
遼寧師范大學 城市與環境學院,遼寧 大連 116029
文獻計量是圖書情報學的分支學科,主要以不同科學文獻的數量作為研究對象,通過數學與統計的方法來分析科學文獻的研究狀況和發展趨勢[1-2],是一種可以分析不同學科領域文獻外部特征信息的定量分析方法,研究文獻的數量變化、發展趨勢、結構分布,進而探討研究領域的重點、特征和規律,具有顯著的客觀性、定量化、直觀化的宏觀研究優勢[3-6]。
地質災害是指在自然或人為作用下形成的,對人們生命財產安全造成威脅并對地質環境造成破壞的現象[7-9],其中突發性地質災害是一種比其它自然災害更難預測和監控的災害,給人類造成的危害更大。近年來全球氣候變化,全球突發性強降雨增多,局部地質災害事件頻發;人類社會經濟的發展可能直接導致局部地質災害的發生。當前,以中國期刊全文數據庫為數據來源,以主題“文獻計量”和“地質災害”檢索全文與此相關的文獻,僅檢索到276篇相關文獻,其中部分文獻是通過文獻計量來分析地質災害中特殊的災種,比如滑坡、泥石流和地震等[10-11]。但使用文獻計量的方法來統計和分析地質災害的相關文獻較少,論文將使用文獻計量的方法來分析地質災害的研究現狀和趨勢,統計國內外地質災害文獻研究的熱點,分析地質災害研究側重于災前監測預報、災后救援治理、災種分析、災害分析方法、技術應用等方面,明確國內外研究的側重點,初步探索地質災害的研究熱點和趨勢,以期為更深層次的研究做鋪墊。
國內數據來源于中國期刊數據庫(CNKI),檢索主題為“地質災害”的相關文獻,由于在CKNI中搜索的以“地質災害”為主題的論文涉及到環境、礦業、交通運輸、測繪等諸多領域,所以將論文限制在地質方面;最終篩選出共計6 246篇(檢索時間為2018年10月18日)國內文獻。國外數據來源于WEB OF SCIENCE的WEB OF SCIENCETM核心合集,檢索主題為“geological hazard”,類型為article的相關文獻,最終篩選出共計3 165篇與地質災害相關的國外文獻。
將已選出的6 246篇國內文獻和3 165篇國外文獻分別導入Bibexcel軟件,分別得出國內和國外文獻的高頻關鍵詞,但兩者得出的關鍵詞都較多。為了更好的突出研究熱點,通過同義詞、近義詞合并減少不必要的重復。最終國內選取詞頻大于30的關鍵詞共56個,國外選取詞頻大于13的關鍵詞共55個。繼續利用Bibexcel軟件分別導出國內和國外兩個56×56和55×55的共詞矩陣。將兩個矩陣導入UciNet6軟件中分別生成##h文件,運用Netdraw軟件做出地質災害高頻關鍵詞共現網絡可視圖。
在CKNI上統計到的以“地質災害”為主題的關于國內地質災害文獻每年的發表數量如圖1所示。從柱狀圖可以看出文獻發表的數量大體上呈波動線性上升趨勢,尤其2008年汶川特大級地震引起受災區群發性地質災害頻發,統計顯示觸發的地質災害多達56 000處[12],但在2009年文獻發表數量才達到歷史最高,可能是受到了文獻發表滯后性的影響。

圖1 國內“地質災害”相關論文每年的發表數量Fig.1 Number of publications of domestic “geological disasters” related papers per year
國內文獻數量增長大致可以分為四個階段。(1)初步探索時期(1991—2001年),此期間許多年份發文量<2篇,發文量最多的2001年也僅有7篇,可能是對地質災害的開始初步探索,重視程度、研究深度都不夠高。(2)萌芽階段(2002—2009年),此階段每年的發表數量逐年增加,在2009年達到416篇,此階段增長83.2倍;特別是2008年汶川地震引起的地質災害問題引起了許多學者關注并對其進行研究分析,導致文獻數量猛增。(3)平穩階段(2010—2014年),這個階段文獻的發表數量相比2009年有所下降,但基本保持平穩的發表狀態,可能與這一期間基本沒有發生特重大地質災害事件有關。(4)波動增長階段(2015—2018年),相比較2014年,2015年發表數量突增,增長1.5倍,可能與2015年出臺的地質災害評估規范,提出了統一的評估技術標準和“十二五”期間國家開展以“查孕災背景、評災害風險”為目標的關于崩塌滑坡泥石流災害調查有關[13];2018年數據只截止到11月份,不能代表全年數據。
國外也大致分為四個不同的發展階段。(1)萌芽階段(1983—1992年),在此期間1991年發文最多也僅有10篇,國際上關于地質災害的文獻較少,此期間大部分年份發文量為0或1篇。(2)波動上升階段(1993—2011年),在此期間的發文量基本呈波動增加的趨勢,從1993年的21篇增長到2011年的159篇,增長7.5倍,可能與國際減災十年(1990—2000年)活動以及后續工作有關。(3)沉淀階段(2012—2014年),從2012年的230篇下降為2014年的182篇,雖然論文數量減少了,但這一階段發表文獻質量較之前有明顯提高,從注重數量逐漸向注重質量轉變。(4)加速增長階段(2015—2018年),2015年發表量為248篇到2017年是333篇,增長1.3倍;圖中所示2018年的數量只截止到11月份,不能代表全年發表數量,但是數量已經明顯超過了2016年。

圖2 國外“地質災害”相關論文每年的發表數量Fig.2 Number of published papers on foreign“geological hazards” each year
關鍵詞就是能概括文獻主旨的詞匯,具有高頻次的關鍵詞能代表一定的研究方向和熱點,關于某一研究出現的詞頻越多,說明該詞就是關鍵詞[4,14]。使用Bibexcel軟件統計國內文獻中關鍵詞出現的頻次,為了凸顯地質災害研究的現狀和熱點,篩選出詞頻大于30的關鍵詞共計73個,合并歸納其中的同義詞和近義詞,如:“WebGIS”和“地理信息系統”歸并為“GIS”,“防治對策”“防治”“防災減災”“對策”“措施”歸并為“防治措施”等,除去最高頻次的關鍵詞“地質災害”,將73個頻次大于30的關鍵詞最終合并為56個,結果如表1所示。

表1 國內“地質災害”相關文獻中高頻關鍵詞和頻次Table 1 High frequency keywords and frequency in the literature related to domestic “geological disasters”
由表1可以看出,國內關于地質災害研究的高頻次關鍵詞為“防治措施”,出現頻次高達3 122次,說明我國關于地質災害的研究主要集中在防治措施。次一級頻次的關鍵詞為:危險性評價(455次)、滑坡(347次)、分布規律(260次)和GIS(238次),其中滑坡災害是我國頻發度最高的地質災害,這與李媛等[15]對中國地質災害主要類型的研究相吻合,滑坡災害點和隱患點平均每年占全國災害總數的50%以上,是我國主要地質災害類型;進一步找尋滑坡災害點的分布規律繼而進行危險性評估,近年來運用GIS技術獲取和分析災情等一系列問題已經發展的相當成熟。
利用Bibexcel統計國外文獻中的關鍵詞頻次,選取詞頻大于14的關鍵詞共計66個,合并其中的同義詞和近義詞,如:“landslide(滑坡)”“landslides(滑坡)”合并為“landslide(滑坡)”,“earthquake(地震)”“seismicity(地震)”“earthquakes(地震)”歸并為“earthquake(地震)”,“geological hazard(地質災害)”“geological hazards(地質災害)”“geohazards(地質災害)”歸并為“geological hazards(地質災害)”將66個頻次大于14的關鍵詞最終合并為55個,結果如表2所示。

表2 國外“地質災害”相關文獻中高頻關鍵詞和頻次Table 2 High-frequency keywords and frequency in foreign literature related to “geological disasters”
可以看出,國外關于地質災害研究的高頻次關鍵詞為“landslide(滑坡)”,這說明國外的研究主要集中在滑坡這一地質災害類型。次一級頻次的關鍵詞為“seismic hazard(地震危害)”“earthquake(地震)”和“GIS”等,可以看出國外在地質災害研究中對地震災害的研究比較重視;對GIS技術的應用十分熟練和頻繁,在這一方面與我國具有一致性。
通過對國內外文獻中高頻關鍵詞的分析發現,對滑坡這一災害類型的研究是國內外共同的研究熱點,在國內文獻中出現的頻次為347次,國外文獻中出現的頻次是245次。國內外文獻中GIS的出現頻次都比較高,從不同的側面運用GIS對地質災害進行研究。美國的Earl E. Brabb在1986年最早將GIS應運于地質災害的研究與分析;1989年,Michael A. Finney 和Nancy R. Bain開始運用GIS對滑坡災害進行研究與分析[16]。我國對GIS的應用起步較晚,但經過近幾十年的發展,GIS在地質災害領域的研究中應用越來越廣泛、深入。
上述得出的國內外高頻關鍵詞在一定程度上能體現出關于地質災害研究的熱點,但是僅憑高頻關鍵詞在文獻中的重復率來定義研究熱點是不太準確的。利用Bibexcel軟件進一步對這些高頻關鍵詞進行分析,統計它們在6 246篇中文文獻和3 165篇外文文獻中的共現頻次,形成56×56和55×55兩個共詞矩陣,將其導入UcInet6軟件中繪制出高頻詞共現網絡可視圖,如圖3和圖4。每個節點代表一個關鍵詞,節點的大小代表的是關鍵詞出現頻次的高低,節點越大表示該關鍵詞與其它關鍵詞一起出現的頻次越高,節點越小則反之。節點間的連線代表兩個關鍵詞之間的共現情況,線條越粗代表兩詞在同一文獻中出現的頻次越高。
圖3所示的由56個高頻關鍵詞所組成的共現可視圖中,清晰的展現了高頻關鍵詞之間的交錯關系,突出重點關鍵詞如:位于關系圖中的高頻關鍵詞“危險性評估”“滑坡”“泥石流”“防治措施”基本位于關系圖的中心位置,節點較大,與其它關鍵詞的連線也較多,則說明“危險性評估”“滑坡”“泥石流”“防治措施”聯系緊密。同時也可以看出滑坡、崩塌和泥石流三者連線最粗,構成地質災害中的“鐵三角”關系。
國外文獻中的55個高頻關鍵詞構成了相互交錯的關系網絡,從圖4可以看出“landslide(滑坡)”節點最大,表明滑坡在國外文獻中與其它關鍵詞出現在同一篇文章中的次數最多,可以說明滑坡是國外研究的熱點。“earthquake(地震)”“GIS”節點僅次于滑坡,成為國外研究的次熱點。
由于檢索到的國內外相關文獻數量相差較多,國內外高頻關鍵詞共現頻次差距也較大,最終得出的高頻關鍵詞共現可視圖明顯看出國內共現密度高于國外。國內可視圖的密度較大,較難清晰的看出關鍵詞之間的關系,但國外共現可視圖就可以十分清晰的看出關鍵詞之間的關系。可視化分析得出國內連線最粗、關系最密切的是崩塌、滑坡、泥石流,出現頻次最多的是危險性評估。國外文獻中關鍵詞的聯系比較廣泛,比如,“landslide(滑坡)”和“susceptibility(易發性)”之間的連線很粗,“GIS”和“remote sensing(遙感)”及“frequency ratio(頻次)”之間的連線也較粗。

圖3 國內地質災害研究高頻詞共現可視圖Fig.3 Domestic geological disaster research high-frequency words co-occurrence view

圖4 國外地質災害研究高頻詞共現可視圖Fig.4 High-frequency words in foreign geological disasters
國外文獻中的55個高頻關鍵詞構成了相互交錯的關系網絡,從圖4可以看出“landslide(滑坡)”節點最大,表明滑坡在國外文獻中與其它關鍵詞出現在同一篇文章中的次數最多,可以說明滑坡是國外研究的熱點。“earthquake(地震)”“GIS”節點僅次于滑坡,成為國外研究的次熱點。
由于檢索到的國內外相關文獻數量相差較多,國內外高頻關鍵詞共現頻次差距也較大,最終得出的高頻關鍵詞共現可視圖明顯看出國內共現密度高于國外。國內可視圖的密度較大,較難清晰的看出關鍵詞之間的關系,但國外共現可視圖就可以十分清晰的看出關鍵詞之間的關系。可視化分析得出國內連線最粗、關系最密切的是崩塌、滑坡、泥石流,出現頻次最多的是危險性評估。國外文獻中關鍵詞的聯系比較廣泛,比如,“landslide(滑坡)”和“susceptibility(易發性)”之間的連線很粗,“GIS”和“remote sensing(遙感)”及“frequency ratio(頻次)”之間的連線也較粗。
聚類分析是一種將不同對象歸為相對同質的統計分析方法,相對同質的對象之間有一定的相關性[17-19],也就是將不同數據歸納到不同的類或簇的過程,同一類或簇中的數據會有很大的相似性[20]。以Bibexcel軟件產生的國內56×56相異矩陣和國外55×55相異矩陣為基礎,運用 SPSS軟件進行聚類分析,得出高頻關鍵詞群集如表3和表4所示。

表3 國內關鍵詞群集成員表Table 3 Domestic keyword cluster members
從表3可以看出,關鍵詞的聚類可以劃分為4個群集。群集1歸納了對地質災害研究的諸多方面,主要有成因分析、地質環境、發育趨勢、風險評估、防災減災、防治措施和GIS等關鍵詞,從不同的角度分析地質災害發生的原因以及防治措施。群集2主要研究崩塌、滑坡和泥石流,這三種類型的地質災害關系十分密切,構成“鐵三角關系”。崩塌滑坡產生的固體物質是泥石流的主要物質來源,在發生崩塌和滑坡之后遭遇強降雨,發生泥石流的概率將會大大增加,同時也突出崩塌、滑坡和泥石流是頻發度很高的三種地質災害類型。群集3主要研究地質災害的分布規律和發育特征,通過對規律的掌握針對性的防治地質災害的發生。群集4主要包括建設用地和危險性評估,突出人類開發建設土地與地質災害危險性的關系,不合理的開發建設用地容易誘發地質災害,增加人為災害發生的機率。人類對自然環境的開發力度越來越大,而不合理的開發利用土地已經引起了一系列的地質災害問題,更多專家學者已經注意到了問題的嚴重性,對它的危險性評估也越來越重視。

表4 國外關鍵詞群集成員Table 4 Foreign keyword cluster members
從表4可以看出,國外文獻關鍵詞的聚類可以劃分為3個群集。群集1歸納的內容比較龐雜,涉及了氣候變化、災害種類、數值模型等眾多領域;包含了地質災害發生頻率較高的國家意大利(Italy)、中國(China)、伊朗(Iran)和意大利中部(central Italy)、喜馬拉雅(Himalaya)等地區。群集2主要包含了主要災種滑坡(landslide)、獲取和分析地質災害的工具GIS和RS以及處理數據的方法邏輯回歸(logistic regression)。群集3僅有地震災害(seismic hazard),可能是地震災害易引發滑坡、崩塌、泥石流等次生災害,形成地震災害鏈,是地質災害中比較特殊的災害類型,對人民生命安全和社會經濟發展造成無法估量的損失。
從國內外關鍵詞的聚類分析可以看出國內外文獻關鍵詞歸類不一致。國內歸納的4個群集與國外歸納的3個群集,基本沒有相同的聚類群,這表明國內外對地質災害研究的區域對象、使用方法、研究機制、側重點等都有所不同。
(1)國內外文獻數量總體都呈上升趨勢增加,這與地質災害越來越嚴重以致成為社會經濟發展的重大影響因素有關;我國對地質災害的相關研究比國外起步較晚,國外對地質災害的研究始于上世紀70年代,而我國始于上世紀80年代后期;在聯合國“減災十年”(IDNDR)(1990—2000年)計劃之后,國內外文獻發表數量進入快速增長階段,我國的發表數量較高于國外。
(2)國內外研究熱點有所不同,國內側重對地質災害的危險評估和防治以及特殊地質災害崩滑流的研究;國外側重對特定地質災害類型發生機理的研究,特別是對滑坡和地震深層次研究;國內外研究的共同熱點是滑坡和GIS技術的應運, 滑坡是最頻發和災害較嚴重的地質災害類型,在我國,滑坡在地質災害點中所占比例可達到51%。國外對GIS的應運始于上世紀80年代末,我國起步較晚但發展迅速,特別是1994年成立“中國GIS協會”以來,GIS技術的應運更加廣泛和深入。
(3)國內外研究熱點有所轉移,國內目前的研究熱點從之前的災后治理逐漸轉向災前預防措施,災害危險性評價和預警預報成為今后研究的重點。國外的研究熱點從之前的災害評估轉向對特定的某一地質災害的研究,特別是對地震和滑坡的研究,在災后救治和重建方面需加強措施。
國內外對地質災害的研究熱點有所差異,研究側重點也不同。國外在深入研究災害點的發生區域、成因機理、防治措施的同時,利用現代GIS和RS等技術以及數學模型,重點篩查災害點的主要災害類型以及損失,已經建立了較完善的預報預警系統。目前國內學者對地質災害的危險評估和防治措施兩大方面研究較多,地質災害的評價從定性評價逐步轉向定量評價;從區域、風險特征、災害類型等方面通過數理模型方法進行更深層次的分析,利用GIS和RS等技術,易于獲取災情信息和及時處理災情。目前,我國的災害風險評估工作還處在不斷完善的過程中,在建立預報預警系統方面還待加快進展,注重對專業人才的培養,剖析地質災害對社會經濟的深層次影響,為我國經濟可持續發展道路清除障礙。