唐浩竣 李海萍? 陳文悅 唐家亮
(1 中國人民大學環境學院,北京 100872)
(2 中國地質大學(北京),北京 100083)
(3 山東省長島縣第一實驗學校,山東煙臺 265800)
土壤有機碳(SOC,soil organic carbon),是通過微生物作用所形成的腐殖質、動植物殘體和微生物體的合稱[1],是土壤養分轉化的核心,不僅表征土壤截留碳的能力,也反映了直接影響土壤肥力保持與提高的有機質含量。有機碳的減少間接導致有機質含量減少,從而引起土壤團粒結構松散、微生物減少及重金屬活化等問題,進而影響到農作物的產量與質量,因此,土壤有機碳儲量既是評價土壤肥力的一項重要指標,也是全球碳匯的重要組成之一。
科學知識圖譜是以知識域為對象,顯示科學知識的發展進程與結構關系的圖像,既是可視化的知識圖形,又是序列化的知識譜系,顯示了知識單元或知識群之間網絡、結構、互動、交叉、演化或衍生等諸多復雜關系[2]。知識圖譜分析通過分析文獻、科學家和關鍵詞等知識單元的相似性及其測度,從而分析、構建、繪制和顯示知識間的相互關系,并挖掘出其中所蘊含的新知識。
目前,知識圖譜分析軟件有十幾種,其中CiteSpace是基于科學計量學、數據可視化理論發展起來的一款引文可視化分析軟件。國內通過CiteSpace分析土壤有機碳研究文獻的成果漸增,如土地利用對土壤有機碳影響的熱點與進展分析[3],國外土地利用與碳排放知識圖譜分析[4],國外此類文章則較少。這些文獻計量研究大多局限于一種因素的影響研究,覆蓋領域有限。本文將以土壤有機碳為主題詞,使用知識圖譜分析工具,對合著國家、作者、機構、學科領域、文獻共被引網絡以及關鍵詞共現網絡等進行全面的可視化分析和文獻綜述,以反映土壤有機碳的最新研究進展。
文獻計量分析數據來自ISI Web of Science數據庫核心集,通過主題詞“soil organic carbon”進行檢索,時間跨度為1975—2018年,因只針對學術論文,故文獻類型為“article”,從檢索結果中篩選出與“土壤有機碳”相關的文獻共2 258篇(數據截至時間為2018年4月10日),命名為CiteSpace可識別的download_soil.txt,作為分析的數據基礎。由于Citespace軟件對CNKI數據庫的支持尚不完善,分析功能有限,因此,本文未將CNKI中文文獻納入分析數據中。
CiteSpace基于共引分析理論(co-citation)和尋徑網絡算法(pathFinder)對特定領域文獻集合進行計量,以探尋出科學領域演化的關鍵路徑及其知識拐點,并通過梳理關鍵文獻,量化文獻之間的相應特征,形成對學科演化潛在動力機制的分析和學科發展前沿的探測[2]。CiteSpace主要分為合作網絡分析(作者、國家、機構合作)、共現網絡分析(特征詞、關鍵詞、學科類別)和共被引分析(文獻、作者、期刊共被引)等功能模塊。
將檢索得到的數據處理后導入CiteSpace,將時間段(Time Slicing)設為1975—2018年,跨度(Year Per Slice)為1年,節點類型(Node Types)依次選擇國家(Country)、作者(Author)、機構(Institution),年被引頻次排名(Top N)為50,分別生成國家、作者和機構圖譜,并進行基本特征、合作特征、文獻共被引及關鍵詞共現等知識圖譜分析。
發文數量及其發表年份可反映研究專題的動態變化,對檢索結果進行統計制圖,見圖1。

圖1 文獻基本特征Fig. 1 Basic features of the literature
圖1 顯示,早期文獻可追溯至1986年,之前則寥寥無幾,總量上,2004年之前年平均發文量不足50篇,除2006、2011和2015年略有下降外,年平均發文數量整體呈上升趨勢,表明土壤有機碳研究逐漸成為熱點。
合作圖譜可識別出某研究領域的學者、國家或機構間的社會關系,既可為評價其學術影響力提供參考,也便于發現值得關注的學者和機構。
圖2的國別圖譜顯示,共有56個國家間具有不同程度的合作。
統計中介中心性較高的前10個國家,列于表1。
表1中的前三名是美國、澳大利亞和德國,最早發文年份均在2000年前,美國的中介中心性最高合作年份最早,除英、法外的其余國家最早發文年份均在2000年之后,中國發文年份較晚但合作頻數高于美國,且中介中心性較其余6個國家高,表明中國土壤有機碳的研究正逐步逼近甚至超過起步較早的英、法等國并快速發展。

圖2 國家合作特征Fig. 2 Network of co-authors’countries

表1 1975—2018年國別合作特征及頻次統計Table 1 Country Cooperation Features and Frequency Statistics of the period from 1975 to 2018
輸出的作者圖譜表明,土壤有機碳研究者分布廣泛且獨立性較強,并有小范圍合作。
選取中介中心性排名前40的作者,統計其文章頻數、中介中心性及最早合作年份等定量數據列于表2。
表2顯示,作者間聯系最緊密的是Coleman K,發文10篇,首發時間2007年,中介中心性0.28,其次是Li Y,發文8篇,2012年首發,中介中心性0.22,Lal R、van Wesemael B雖發文較多且起步早,但中介中心性較低,說明與其他作者的聯系較單一。中心性為0的Zhao Y C、Lozano Garcia B等僅專注于獨立研究。中國學者共30名,占75%,體現了我國學者的較高參與度,表明我國的土壤有機碳研究呈蓬勃發展之勢。

表2 1975—2018年作者合作特征及頻次統計Table 2 Author cooperation characteristics and frequency statistics of the period from 1975 to 2018
圖3的機構圖譜顯示,大學發文較多,科研機構較少,中國科學院與其他機構的合作次數最高,中介中心性也最高,表明其與外界合作頻繁且聯系密切。

圖3 機構合作特征Fig. 3 Network of co-authors’institutions
統計各機構發文數、首發年份和中介中心性, 并選取中心性排名前10的機構列于表3。

表3 1975—2018年機構合作特征及頻次統計Table 3 Institutional cooperation characteristics and frequency statistics of the period from 1975 to 2018
表3顯示,中國科學院中介中心性最高,遠高于排名第二的佛羅里達大學,盡管首次發文時間不算最早,但與其他機構的合作最為活躍。
將CiteSpace與谷歌地球結合,生成合作國家的地理空間分布網絡圖,直觀展示國家、作者、文章的地域分布關系,見圖4。

圖4 國家間合作的地理分布Fig. 4 Geographical distribution of cooperations among countries
圖4 顯示,土壤有機碳研究不僅集中于亞、歐和北美三大地區,且區域間的聯系也十分緊密,形成明顯的三足鼎立之勢,亞洲以中國為主要紐帶,歐洲以德國為中心,美國在北美占主導。連線的密集程度也顯示出澳洲的對外合作相對較弱。
學科共現分析可構建學科間的關聯網絡,揭示交叉學科間的內在聯系。圖5的學科共現圖譜顯示,共有45個節點,表明有45個學科相互交叉滲透,163條連線代表學科間的聯系,農業、土壤學、環境生態學與其他學科交叉廣泛,且環境生態學的中介中心性最高,交叉也最廣泛,農學、土壤學交叉次數較多但中介中心性不高,說明與其交叉的領域有限。

圖5 學科共現特征Fig. 5 Co-occurring subject categories
進一步統計各學科的共現次數、首次出現年份和 中介中心性,選取中心性排名前10的學科列于表4。

表4 1975—2018年學科共現特征及頻次統計Table 4 Co-occurrence characteristics and frequency statistics of the period from 1975 to 2018
學科共現顯示,土壤有機碳研究的學科分布主要集中在環境生態學、環境科學、農業綜合、農藝學、化學、農學和生態學等領域,除環境領域出現較晚外,其余學科均早于2000年,說明學科交叉時間久遠且復雜。
關鍵詞是文章主旨的精簡表達,代表了文章的主要研究內容,關鍵詞共現分析有利于識別研究主題及其演變。將節點類型選為關鍵詞,裁剪方式設為Path Finder(尋徑裁剪),得到關鍵詞共現圖譜,見圖6。
圖中共249個節點,大小反映關鍵詞出現頻次,最大的是“物質”(matter),其他依次為“封存”(sequestration)、“土壤有機碳”(soil organic carbon)、“氮”(nitrogen)、“動力學”(dynamics)、“管理”(management)、“存儲”(storage)、“土地利用”(land use)、“氣候變化”(climate change)和“耕作”(tillage)等,土壤有機碳出現頻次位居第三,是較重要的一個研究專題。
基于關鍵詞知識圖譜中的1 092條連線,梳理出土壤有機碳研究的兩個主要方向:
物質(matter)-轉換(turnover)-氮(nitrogen)-存儲(storage)-土壤有機碳(soil organic carbon)-封存(sequestration)-土地利用(land use)/氣候變化(climate change)。
物質(matter)-轉換(turnover)-氮(nitrogen)-微生物(microbe)-動力學(dynamics)-管理(management)-耕作(tillage)。
還識別出了兩個研究主題,一是土壤有機碳的存儲與含量研究,土壤物質與土壤碳的轉化以及如何對土壤有機碳進行長久封存。二是土壤有機碳的生物學研究,通過研究微生物對土壤物質的分解以掌握土壤有機碳的動態變化,為土壤管理提供參考。
時間演化分析基于年份呈現主要關鍵詞及其相互關系,在時間維度上探討研究主題的動態演化過程,利用時區劃分功能(Timezone)生成時區視圖,并可見三個明顯的時間節點,對其進行解讀和歸納,結果列于表5。
文獻的交叉引用反映了研究方向或主題間的密切程度,共被引分析可探究研究領域的重點專題及其發展過程,基于圖譜聚類算法進行自動聚類,可提取聚類主題詞。

圖6 關鍵詞共現圖譜特征Fig. 6 Keywords co-occurring spectral feature
其他設置同前,主題詞來源選擇t i t l e、abstract、author、keywords與keywords plus,節點選文獻交叉引用(citation reference),運行findcluster進行自動聚類,結果見圖7。
圖中的913個節點與2 764條連線構成了14個較大的群組,表明土壤有機碳研究集中性高且分支眾多。
對各群組進行分析,得到每個群組的專題和主要研究內容及其代表作者,列于表6。
進一步對各組的最高被引頻次進行統計分析,結果列于表7。
文獻共被引方面,Schmidt M W I的“Persistence of soil organic matter as an ecosystem property”被引次數高達107次,Davidson E A的“Temperature sensitivity of soil carbon decomposition and feedbacks to climate change”次之,Schmidt M W I、Laganiere J、Don A、Rumpel C等學者的文獻不僅相互交叉,也被大量引用,說明這些文獻不僅具有重大理論價值,也是重要的知識基礎。
上述結果表明,基于文獻計量分析的Citespace軟件在關鍵詞、作者、國家、共被引等知識圖譜分析和解讀方面有較好的表現,由于本文在數據獲取時將“soil organic carbon”作為整體進行檢索,得到的文獻數據有可能沒有完全覆蓋土壤有機碳的整個研究領域,致使分析結果存在一定程度的偏差。
此外,知識圖譜的繪制雖然可以較好地理解學科發展的狀態和機制,但僅根據檢索結果對圖譜進行分析必然存在一定的機械性,如果能夠配合領域專家的認證和解讀,結果將更為準確和客觀,同時,若要對專業知識進行歸納總結,并對發展中國家與發達國家之間的研究重點進行區分,則需要進行大量的原始文獻閱讀和判斷分析,而文獻計量分析目前還難以實現此項功能。

表5 基于時區視圖的關鍵詞動態變化及研究熱點趨勢特征Table 5 Keyword dynamic change based on time zone view and research hot spot trend features

圖7 文獻共被引圖譜Fig. 7 Document co-citation network
CiteSpace軟件是進行知識圖譜分析的有效工具,可以理清研究國家、作者及機構之間的合作關系,通過學科、關鍵詞共現分析與文獻共被引分析了解研究方向及前沿熱點。土壤有機碳研究經歷了1991—2002年的起步階段、2003—2012年的發展階段,以及2013年以來的穩定階段,并且涉及多個學科,學科交叉時間可追溯至20世紀90年代,其中農業、土壤、環境領域交叉較頻繁,大致可分為儲量研究和耕地管理兩個發展方向及14個主題,研究前沿集中在土壤有機碳儲量、礦物質施肥、分離穩定土、化學計量分析和殘積土方面。目前有56個國家間存在合作關系,中國雖起步較晚,但研究者眾多,發文數量也最高,中國科學院與外界的合作最緊密,是土壤有機碳領域科研的中堅力量。

表6 各群組主要研究內容及代表作者Table 6 Main research content and representative authors of each group

表7 各組群最高被引頻次Table 7 Highest citation frequency in each group