胡利勇
(中共廣東省委黨校圖書館,廣東廣州510053)
?
生活垃圾回收利用研究的趨勢和熱點問題
——基于論文關鍵詞共詞聚類的分析
胡利勇
(中共廣東省委黨校圖書館,廣東廣州510053)
以中國知網期刊全文數據庫為數據源,對主題為“生活垃圾回收利用”的論文進行檢索和分析,利用書目共現分析系統Bicomb2對論文的關鍵詞進行提取、統計,并生成共現矩陣,采用文獻計量學方法,確定這一主題論文的高頻關鍵詞,然后通過統計軟件SPSS和可視化工具Ucinet、NetDraw,對高頻關鍵詞進行社會關系網絡、共詞聚類和多維尺度分析,揭示當前生活垃圾回收利用研究發展趨勢和關注熱點。
文獻計量學;生活垃圾;回收利用;共詞分析;聚類分析
隨著社會經濟的不斷發展,人們生活質量逐漸提高,人口增長與城市化也帶來了生活垃圾的大量增加與種類的多樣化。生活垃圾的回收利用,是關乎每個人切實利益的大事,也越來越受到社會和學界的關注。在中國知網中檢索主題為“垃圾處理”的文獻,返回結果為4.7萬多篇,而且近10年來,幾乎每年都有3 000~4 000篇與垃圾處理相關的文獻,可見,垃圾處理這個主題受到了持續的關注。垃圾這個主題太過宏大,因此僅從“生活垃圾”這一角度,從已有文獻的脈絡中,尋找生活垃圾回收利用的研究趨勢和關注熱點。
1.1文獻來源
應用文獻計量學方法,對以“生活垃圾回收利用”為主題的文獻進行統計分析。利用中國知網期刊全文數據庫,采用高級檢索方式,跨庫選擇“期刊”、“博士”、“碩士”、“國際會議”、“國內會議”、“特色期刊”6個論文數據庫作為文獻來源庫,檢索條件設為主題同時包含“生活垃圾”和“回收利用”,采用精確檢索方式,總共檢索出889篇文獻。刪除供求、動態、科技速遞、信息集成、議程、簡訊、通知等消息型文章,共計876篇論文,這些論文總被引次數為4 924次,篇均被引次數為5.62次,被引次數最大為195次,零被引文獻352篇,占總數的40.18%;總共被下載239 979次,平均每篇被下載273.95次,其中,期刊論文723篇,博士學位論文13篇,碩士學位論文99篇,國際會議論文5篇,中國會議論文36篇;基金論文113篇,占19.62%。這些論文的h指數為32。
1.2研究方法和步驟
本研究主要利用Excel,Bicomb2,Ucinet,NetDraw 和SPSS等工具和軟件,對選取的生活垃圾回收利用876篇被引論文進行統計分析,具體方法和步驟如下。
(1)利用中國知網的參考文獻導出功能,選擇Notefirst方式,將樣本論文的題名、作者、關鍵詞等元數據導出為XML格式,并以文本(.txt)文件格式保存;
(2)采用書目共現分析系統Bicomb2軟件[1],提取樣本論文的關鍵要素并進行統計,導出為Excel格式文件,多方面分析和討論;
(3)利用文獻計量學方法,確定高頻關鍵詞,在Bicomb2中生成共現矩陣,并利用Ucinet軟件和Net-Draw工具,繪制核心關鍵詞知識圖譜;
(4)運用SPSS19軟件進行數據聚類分析,獲得聚類樹狀圖和相異系數矩陣的多維尺度圖[2];
(5)根據分析結果,總結生活垃圾回收利用領域學術研究的趨勢和熱點。
利用Bicomb2軟件,提取876篇論文的發表年份、關鍵詞信息,根據它們出現的頻次,借鑒普賴斯定律確定核心要素信息。年份出現頻次即當年發表的論文數量;關鍵詞出現頻次,即每個關鍵詞在論文關鍵詞中出現的總次數。
2.1年份分布統計
生活垃圾回收處理主題論文數量,呈現出逐年增多的態勢(圖1),表明這一主題的研究越來越受到關注和重視。2012和2013年論文數最多,分別為70篇和69篇,之后兩年略有減少。

圖1 生活垃圾回收利用主題文章年份分布圖
2.2關鍵詞統計分析
2.2.1關鍵詞抽取
抽取876篇高被引論文關鍵詞,共計得到2 297個不重復的關鍵詞,累計出現5 244次。頻次最多關鍵詞是“回收利用”,出現頻次314次,也就是說有314篇論文使用了“回收利用”這個關鍵詞;其次,是“生活垃圾”和“城市生活垃圾”,出現頻次分別為165次和136次。3個最高頻次關鍵詞累計占總頻次的11.73%,表明,這批文章的檢索結果切合主題。詞頻為1次的關鍵詞1 724個,由此可見,生活垃圾回收利用論文研究范圍相當寬泛。
2.2.2數據清洗
由于2 297個關鍵詞,去掉與主題完全相同的關鍵詞“生活垃圾”、“回收利用”、“固廢處理”、“垃圾”、“廢棄物”等,有些無具體意義,如現狀、問題、對策等,予以刪除,有許多意義趨同,需要經過合并同義詞、近義詞等處理。如把“分類回收”、“垃圾分類”、“垃圾分類收集”、“分類處理”、“細分類”等統一替換為“分類”。經過反復仔細的確認和篩查,最終得到關鍵詞1 837個,總詞頻為4 086次,頻次最高的關鍵詞是“分類”,出現212次,也就是說有212篇文章使用了與分類相關的詞作為論文的關鍵詞,詞頻為1的關鍵詞1 482個。
2.2.3確定高頻關鍵詞
文獻計量學中,普賴斯定律被用來確定高產和高影響力作者[3]。也可以利用普萊斯公式,確定核心關鍵詞最低頻次10.91,取整數11,即關鍵詞累計出現11次或以上的關鍵詞,作為核心關鍵詞,共得36個高頻關鍵詞(表1),占關鍵總數的1.96%,累計出現1 677次,占總頻次的41.04%。

表1 生活垃圾回收利用論文高頻關鍵詞
這36個高頻關鍵詞反映了生活垃圾回收利用的研究熱點,分析這些關鍵詞之間的關系,有助于確定生活垃圾回收利用近年來的發展脈絡、熱點前沿和發展方向[5]。共詞聚類正是通過選擇高頻詞來反映某個研究領域的知識結構,高頻詞代表了該詞在所有關鍵詞中出現頻次的貢獻值。
3.1社會網絡分析
分析生活垃圾回收利用領域的研究熱點,主要利用Bicomb2軟件得到論文的高頻關鍵詞共現矩陣,然后利用社會網絡分析軟件Ucinet6.0[6]和可視化繪圖工具NetDraw[7],繪制出基于中介中心度(Betweenness)分析和K-cores分析[10]的高頻關鍵詞社會網絡關系圖譜(圖2)。
圖2中圓形點代表高頻關鍵詞節點,節點越大,代表該節點在整個關鍵詞網絡中的作用越大,控制其他節點共現的能力也越強;節點之間的關系用實線連接,實線越粗,代表相互之間的關系越強[8]。K-cores分析則是通過顏色來區分關鍵詞在整個網絡中的核心程度,圓形節點表示節點關鍵詞在網絡中處于核心地位[9]。

圖2 高頻關鍵詞社會網絡關系圖譜
通過圖2,可以直觀地得到以下結論:(1)從節點大小來看,“填埋”、“焚燒”、“分類”圓形最大,且處于核心位置,是這個網絡中的核心;生活垃圾的處理方式依然是“填埋”和“焚燒”為主,“分類”是前提。(2)“塑料”、“資源化”、“循環經濟”、“環保”圓形次之,屬于這個網絡中的重點成員;與“減量化”、“產業化”、“無害化”、“市場化”相比,“資源化”處于更核心的位置,顯然是被更多提及和重視,是當前生活垃圾回收利用的主要研究方向。(3)通過K-cores分析,將從整個網絡分類,其中圓形節點占據圖中大部分位置,且處于中心區域,說明它們是生活垃圾回收利用領域的研究熱點,其他節點都圍繞這些熱點延伸拓展。
3.2聚類分析和多維尺度分析
為了更加直觀地描述生活垃圾回收利用高頻關鍵詞之間的距離和相似度,通過SPSS19的雙變量Pearson相關分析功能,把由Bicomb2提取出的高頻關鍵詞共現矩陣轉化為相關矩陣[10],然后在Excel中用“1”與相關矩陣全部數值相減,得到表示兩個關鍵詞間相異程度的相異矩陣(見表2),再用SPSS19對高頻關鍵詞進行系統聚類和多維尺度分析[11]。
3.2.1聚類分析
將關鍵詞相異矩陣導入SPSS19進行系統聚類分析[12],方法中選擇組間聯接,度量標準為區間“平均Euclidean距離”,繪制樹狀圖(圖3)。系統樹狀圖更直觀地顯示出了聚類的整個過程,上邊的橫軸方向,給出了各類別之間相對距離的大小[13]。
依據聚類結果,可將生活垃圾回收利用的研究分為4個主題。
(1)生活垃圾的最終處理研究。包括:以填埋、焚燒、堆肥為主要手段,厭氧發酵、厭氧消化等生物處理為輔助手段的垃圾處理研究;填埋場的選擇、填埋氣體的回收利用、填埋氣發電、填埋滲濾液的處理工藝等相關內容研究。

表2 高頻關鍵詞相異矩陣(部分)
(2)生活垃圾分類收集與資源化研究。包括:以垃圾分類方法、分類目錄、分類國際國內經驗、社區垃圾分類、源頭分類、分類垃圾桶、分類站、國內外分類經驗介紹等為主要研究內容的垃圾分類回收體系研究,以廢塑料、廢電池、廢玻璃、餐廚(廚余)垃圾、廢包裝等不同種類劃分的垃圾收運體系研究,以及可回收物和再生資源資源化的研究。
(3)垃圾污染防治及法律法規稅費措施研究。包括:一次性垃圾、重金屬、日光燈管等特殊垃圾回收研究;以污染防治、保護生態環境、保持生態平衡、生態補償、生態工業園區等為對象的可持續發展研究;垃圾處理的法律法規研究:立法研究、立法體系、立法規范、法律控制、地方性法規政策研究;垃圾收費:收費制度、政策、模式、標準、平臺的研究;環境稅、垃圾稅、排污稅、填埋稅、稅收辦法等稅收政策的研究。
(4)生活垃圾回收利用的目標和發展趨勢研究。減量化、資源化、無害化是生活垃圾目標,市場化和產業化是手段,最終要達到資源循環利用、發展循環型經濟的目的。
3.2.2多維尺度分析
多維尺度分析是研究對象之間的相似性或距離,將研究對象在一個低維(二維或三維)的空間形象地表示出來,進行聚類或維度分析的一種圖示法。將關鍵詞相異矩陣導入SPSS19進行“度量-多維尺度”分析,在距離中選擇形狀為“正對稱”,模型中度量水平選擇“區間”,度量模型為“Euclidean距離”,輸出得到圖4。

圖4 高頻關鍵詞多維尺度分析圖
依據分析的結果,可以直觀地看出,多維尺度分析圖對高頻關鍵詞主題的劃分,與樹狀聚類圖的分類基本一致,其特征都是局部相對集中,整體比較集中,與中心點間的距離都較近,熱點突出,局部熱點特征明顯。觀察圖4,把生活垃圾回收利用的熱點問題大致劃分為3個類團。
(1)位于坐標圖上方的是“垃圾分類研究類團”,其中,垃圾分類是該類團的研究熱點,塑料、餐廚、包裝、電池、玻璃等生活垃圾的回收利用是該類團的重點研究問題,可回收物和再生資源資源化是這個類團的新熱點。
(2)位于坐標圖右方中央的是“垃圾處理研究類團”,其中,焚燒、填埋、堆肥三大處理模式及其延伸內容是該類團的研究重點,有機垃圾、生物處理和生態環境保護是這個類團當前研究新熱點問題。
(3)位于坐標圖左下方的是“垃圾政策研究類團”。相比之下,該類團內部節點聯系松散,說明目前對該主題的研究還比較分散,由于該類團所處的位置可以預測,電子垃圾、重金屬污染、建筑垃圾、日光燈管、一次性等垃圾的細分處理,垃圾回收利用精細化的必然趨勢,為了保護生態而不得不做好污染防治,通過稅收、收費及市場化、產業化手段,達到生活垃圾減量化、無害化的目標,最終實現資源循環利用的可持續發展模式。生態保護和污染防治,是該類團的研究重點和熱點。
以上對生活垃圾回收利用論文的分析,在一定程度上揭示了這一領域的研究特征和熱點問題,但采用的方法可能還存在不少缺點,分析問題的角度還有很多不足之處。
(1)關于核心關鍵詞的確定。核心關鍵詞是研究重點,在選取核心關鍵詞的時候發現,生活垃圾回收利用這一主題還是太過寬泛,很多論文關鍵詞并不規范,尤其是早期發表的論文,有好多文章雖然被引用次數很多,但是卻沒有標注關鍵詞,因此無法提取其關鍵詞內容來做分析;在數據清洗過程中刪除了諸如對策、問題、現狀、研究等不能表達主題意義的關鍵詞,還有很多近義詞、同義詞,可謂精彩紛呈、眼花繚亂,因此在合并和刪除關鍵詞時,以主觀意識為主,錯漏難免,可能也會影響分析結果。建議學者在論文寫作確定關鍵詞時,能夠給出反映文章精髓的詞語,直扣主題,力求精準,盡量避免概念寬泛、萬象包羅。僅從核心關鍵詞來確定生活垃圾回收利用研究現狀和熱點,還是不夠全面。在搜集數據和撰寫論文過程中,筆者對論文作者、發文單位以及核心期刊等也做統計分析,從這些指標綜合來衡量學科主題發展,似乎更為科學。
(2)文獻統計分析過程中還發現,生活垃圾回收利用這一主題的論文,絕大多數是在研究城市,研究農村的也有,但是數量和比例都很小,更多文章在為“垃圾圍城”出謀劃策,卻少有人關注“垃圾圍村”的現象。從實際生活垃圾回收利用情況來看,城市在垃圾分類、垃圾回收、垃圾轉運、垃圾最后的填埋、焚燒等各個環節,都遠遠超過了農村,因此應該加強對農村生活垃圾回收利用的關注和研究。
(3)分析的論文樣本中,并沒有出現當前網絡新聞上頻頻提及的“互聯網+廢品回收”、二維碼垃圾袋等垃圾回收新熱點,網媒和報紙等對當前的熱點問題反映比較及時,但以消息報道為主,深入研究比較少,而期刊論文理論性更強,研究分析更加透徹嚴謹,因此,希望學者能對垃圾回收利用方面好的經驗做法和熱點問題做更深入研究,這有利于推動整個行業的發展。
(4)生活垃圾細分處理是必然趨勢,低值可回收物正是從生活垃圾中細分出來的,價值低,但有一定循環利用價值,容易被混入其他生活垃圾,對低值可回收物的資源化處理,是當前生活垃圾處理的難題之一,需要進一步研究和探討。
總之,生活垃圾回收利用未來研究的重點方向是針對這些熱點主題的研究:做好垃圾分類是垃圾回收利用的前提條件,針對不同種類的生活垃圾,應該采取不同的收運和處理辦法;目前生活垃圾回收后的主要處理手段是填埋、焚燒、堆肥,要通過生物處理、衛生填埋、填埋氣發電等手段,盡量減少對生態環境帶來的不利影響。生活垃圾要實現減量化、無害化、資源化的目標,需要有強有力的法律和法規作為保障,以稅費改革為措施,以市場化、產業化為紐帶,發展循環經濟,最終達到可持續發展。
[1]崔雷,劉偉,閆雷,等.文獻數據庫中書目信息共現挖掘系統的開發[J].現代圖書情報技術,2008(08):70-75.
[2]王佑鎂,陳慧斌.近十年我國電子書包研究熱點與發展趨勢——基于共詞矩陣的知識圖譜分析[J].中國電化教育,2014(05):4-10.
[3]邱均平.信息計量學[M].武漢:武漢大學出版社,2007:192-195.
[4]劉雪立,王兆軍.2004—2008年我國情報專題研究高被引論文的統計與分析[J].情報雜志,2010(01):64-67.
[5]侯海燕,劉則淵,欒春娟.基于知識圖譜的國際科學計量學研究前沿計量分析[J].科研管理,2009(01):164-170.
[6]卜彩麗.翻轉課堂的研究熱點、主題與發展趨勢解析——基于共詞分析的可視化研究[J].現代教育技術,2016(01):73-79.
[7]王運鋒,夏德宏,顏堯妹.社會網絡分析與可視化工具NetDraw的應用案例分析[J].現代教育技術,2008(04):85-89.
[8]肖明.知識圖譜工具使用指南[M].北京:中國鐵道出版社,2014:37-38.
[9]姜鑫.我國微博研究主題的共詞可視化分析[J].現代情報,2013 (11):108-113.
[10]羅應婷.SPSS統計分析從基礎到實踐[M].北京:電子工業出版社,2010:191-193.
[11]邱均平,楊思洛,王明芝.改革開放30年來我國情報學研究的回顧與展望(二)——情報學研究論文的作者分析[J].圖書情報研究,2009(02):8-13.
[12]安源.2000—2009年圖書館信息服務領域研究現狀分析——基于詞頻分析法和共詞分析法[J].情報科學,2012(06):873-878,892.
[13]賈麗艷,杜強.SPSS統計分析標準教程[M].北京:人民郵電出版社,2010(05):268.
Trends and hot topics in the research on domestic waste recycling and utilization —base on co-word and cluster analysis of paper's keywords
HU Liyong
(Library,Party School of Guangdong Committee of CCP,Guangzhou 510053,China)
According to the result of searching papers on the recycling and utilization of domestic waste in the China Academic Journal Network Publishing Database of CNKI,the keywords are extracted and a co-occurrence matrix is generated by Bicomb2.Using the bibliometrics methods,high frequency keywords of the papers are confirmed.Then social network analysis,co-word clustering and multidimensional scaling analysis are made by SPSS,Ucinet and NetDraw to reveal the developing conditions and hot topics in the field of domestic waste recycling and utilization.
Bibliometrics;domestic waste;recycling and utilization;co-word analysis;cluster analysis
X799.3
A
1674-0912(2016)07-0021-05
2016-05-24)
廣州城市管理研究聯盟2015年度課題“低價值可回收物的回收利用政策研究”(0018)
胡利勇(1980-),男,碩士,館員,中共廣東省委黨校(廣東行政學院)圖書館咨詢部主任。