黃少飛



關鍵詞:查收查引;SCIE引用;批量檢索;定制報告;Excel
摘 要:文獻的收錄與引用情況在一定程度上彰顯了該文獻的學術影響力,也是對其作者進行評價的重要依據之一,因此,快速精準地檢索出批量文獻的收錄與引用情況對后續學術評價工作的快速推進有著重要的意義。作者通過研究人工檢索步驟、流程、注意事項以及特殊情況與客戶要求等問題,應用Excel數據處理的功能,編寫出相應的處理程序,從而實現了自動、批量、精準的SCIE引用檢索工作。案例應用結果表明,該方法能夠快速完成SCIE引用的批量檢索,獲得總引用次數和他引次數,并能根據客戶要求打印定制報告。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2019)09-0102-04
圖書館查收查引服務主要包含兩部分內容,一是文獻的收錄和引用查證,二是期刊的影響因子和分區查證,其中文獻的收錄和引用查證工作量最大,而文獻的引用又有總引和他引的區別,通常采用手工逐篇檢索總引用,再逐個排除被引文獻的作者的方式,檢索數據和整理客戶所需要的查收查引報告。逐篇檢索引用的工作通常都是檢索人員的重復性機械勞動,特別是在工作量較大時,檢索人員的工作壓力也很大,這必然要求檢索人員挖掘檢索技巧以提高檢索效率。文獻的被引頻次代表的是文獻的學術影響力,引用查證強調了檢索的準確性,故查收查引服務是一項既要追求效率,又要追求質量的服務工作,如何高質高效地做好這項工作已成為一線查收檢索人員迫切需要關注的問題。
1 研究現狀
在追求高效地開展查收查引服務方面,目前已有部分機構和圖書館同行做了許多探索,如:中國科學院開發了查收查引報告自動生成系統[1],北京大學與中國高等教育文獻保障體系組織(CALIS)聯合開發了查收查引系統[2],山東大學圖書館也開發了查收查引系統[3]等。查收查引系統極大地提高了檢索效率,避免了檢索者大量的重復勞動。同時,一線檢索館員也摸索出一些利用計算機軟件輔助檢索的措施,提高了自身的檢索效率,如:樊亞芳等人提出了利用Excel的篩選功能和End Note Web、NoteExpress等軟件進行輔助檢索[4-6],這種利用工具輔助檢索的方式不需要經費投入,在一定程度上減少了檢索人員的重復勞動;蔣君、張玢等人設計了一個基于VBA函數的中文醫學引文查收查引工具[7],該工具能實現去重、統一一些中文文獻的引文格式和統計引用次數等功能,適合一線檢索人員使用。筆者也在從事查收查引服務工作時找到了一種可以批量處理SCIE引用檢索的方法,能根據客戶要求打印定制報告,緩解一線檢索人員的工作壓力。
2 思路與方法
鑒于日常檢索服務中SCIE引用檢索較多,且SCIE數據庫中的文獻方便導出、格式清楚,筆者選擇對SCIE引用做批量檢索方法的探索。本文將以實際案例為例,一步步闡釋如何使用該方法進行多篇文獻的SCIE引用批量檢索,并在最后以一定的格式自動輸出報告,其流程如圖1所示。
第一步:通過批量檢索SCIE收錄,導出所有數據,創建總被引文獻清單。檢索人員通過“作者+年份時間段”的檢索方式在SCIE數據庫基本檢索功能中進行粗略檢索,此時的檢索結果數大于等于委托人提交的文獻清單上的數量,然后對照清單挑選本次所需檢索的文獻,在符合要求的文獻前面的方格中打鉤,再點擊頁面中的“導出”按鈕,選擇“其他文件格式”,記錄內容選擇“全記錄”,文件格式選擇“制表符分隔(Win,UTF-8)”,最后點擊“導出”按鈕,此時導出的是一個txt格式的文本文檔。檢索人員需要另外新建一個Excel工作表,點擊工作表中的“數據”,選擇“自文本”,導入前面的文本文檔,即可獲得被收錄文獻的詳細記錄,包括所有文獻的作者、標題、刊名、出版年卷期、DOI和入藏號等信息。
值得注意的是,批量檢索收錄時常會存在漏檢現象,陳偉認為漏檢的文章可以通過“篇名專業詞+作者姓+合作者姓”這種檢索策略補齊被收錄論文列表[8]。在第一步操作中補全總被引文獻清單非常重要,因為后續的引用檢索數據均要依據此工作表中的文獻信息,所以在第一步中需要完善委托人文獻清單以保證收錄數據的質量。檢索人員通過對比核實,找到漏檢文獻,再按照上述方法將檢索結果合并到一個工作表中。
第二步:通過總被引文獻工作表中的入藏號(WOS號)進行批量檢索,創建引文報告,導出多篇被引文獻的總施引文獻數據并創建總施引文獻清單。檢索人員復制總被引用文獻工作表中入藏號,在數據庫高級檢索功能中用入藏號編輯檢索式“UT=( )”進行多篇批量檢索,下面的數據庫只選擇“SCIE”,點擊“檢索”后在網頁下方的檢索結果中會顯示一個數字,表示檢索出多少條記錄,點擊此數字,網頁將轉至文獻被收錄的頁面,在此頁面點擊“創建引文報告”,在彈出的新網頁中點擊“施引文獻”下方的數字,就會顯示所有被引文獻的總施引文獻記錄;在網頁左邊選項“Web of Science 索引”中只選擇SCIE數據庫,點擊“精煉”后,頁面將顯示來自SCIE數據庫的總施引文獻記錄,再次點擊“打印”即可導出總施引文獻記錄與引用的參考文獻,最后按照第一步的方法,在上面的Excel文件中創建一個新的工作表,導入數據后獲得所有總施引文獻的詳細信息,也就是總施引文獻清單。
由于總施引文獻清單中有一列CR信息,即文獻的參考文獻記錄,而每一條參考文獻都有DOI號,DOI號是數字對象的唯一標識符,具有唯一性,故保證了引用查證的準確性。另外,總被引文獻清單工作表中被引文獻也有一列DOI號,其特性也給引用檢索提供了可能性與準確性。
第三步:檢索人員通過Excel“視圖”選項中的“宏”編寫3個函數,分別快速顯示每篇被引文獻的總引用次數、排除委托人自己文章的他引次數和排除文獻所有合作者文章的他引次數,此操作中的關鍵技術在于模擬傳統手工查找方式比對兩個文獻清單中的DOI號是否一致及兩個文獻清單中的作者姓名是否出現,然后創建SCIE總引和他引統計表,快速顯示每篇被引文獻對應的總引次數和兩種他引次數。
第四步:由相關人員根據客戶要求,編寫相應程序,按一定的格式自動輸出報告。
3 方法實踐
筆者以蘇友峰委托檢索的被SCIE收錄的10篇文獻為例演示檢索過程。本次檢索委托人是蘇友峰,檢索要求是SCIE他引次數,檢索時間是2019年06月08日,委托人根據合同以Word文件形式提供自己的文獻清單。
第一步:通過輸入“作者(Su,Youfeng)+年份時間段(2012—2015)”在SCIE數據庫的基本檢索功能中進行粗略檢索,再對照蘇友峰提供的文獻清單挑選本次所需檢索的文獻,在符合要求的文獻前的方格中打鉤,按圖2—4所示的操作導出txt格式的文本文檔,再把此文檔導入Excel工作表,獲得文獻清單對應的總被引文獻清單。
第二步:復制總被引文獻清單中的WOS號,如圖5所示,在數據庫高級檢索中編輯檢索式“UT=
(WOS:000367284600013ORWOS:000360501800007
OR WOS:000356746500026OR WOS:00035116680
0003OR WOS:000344376300014OR WOS:0003356
28300005OR WOS:000326553300020OR WOS:000
319307100002OR WOS:000318542200015OR WOS:000312510000019)”,進行多篇批量檢索,下面的數據庫只選擇“SCIE”,時間跨度可以選擇“所有年份”,點擊“檢索”后在網頁下方的檢索結果中點擊數字“10”,轉至圖6所示的文獻被收錄的頁面,在此頁面點擊“創建引文報告”,在彈出的新網頁中點擊施引文獻的數字“369”,如圖7所示。新出現的頁面顯示10篇被引文獻的施引文獻共245條,這是因為時間顯示的記錄與福州大學圖書館購買的數據庫相關,即此頁面只會顯示出本館已經購買的數據庫中的施引文獻記錄。當前頁面左列下方的“Web of? Science索引”中只選擇SCIE數據庫,如圖8所示,點擊“精煉”后,頁面顯示來自SCIE數據庫的總施引文獻記錄243條,最后點擊“打印”即可導出總施引文獻記錄與引用的參考文獻,另可按照第一步的方法在上面的Excel文件中創建一個新的工作表,導入數據后即可獲得所有施引文獻的詳細信息。
第三步:通過Excel中“宏”選項編寫3個函數,分別快速顯示每篇被引文獻的總引用次數、排除委托人自己文章的他引次數和排除文獻所有合作者文章的他引次數,操作如圖9—12所示。
第四步:根據所出報告格式,利用SCIE總引、他引統計表中的結果進行調整,把需要輸出的內容從兩個文獻清單中取出,自動輸出報告,如圖13所示。
日常查收查引SCIE引用檢索的報告處理一般有兩種方式:第一種情況是委托人只需要看到引用次數,檢索人員只需復制SCIE總引、他引統計表中的數字即可完成,在復制數字時需要特別注意表格中的“原文行號”列要與兩種他引數據一一對應,以免弄錯。第二種情況是委托人需要看到自己的文獻具體被哪些文獻引用,檢索人員按“思路與方法”中的第四步進行操作即可完成。
4 結論
本研究得出以下三條結論:一是本文所示方法集合了人工檢索和軟件輔助檢索的優勢,提高了查收查引SCIE引用檢索服務的效率和準確度,檢索員不用再像以前一樣逐篇檢索被引文獻的SCIE引用次數,也不用像以前一樣逐個排除不符合條件的作者,且被引文獻篇數越多節約時間就越多。筆者建議被引文獻在10篇以上的采用此辦法進行操作,可以提高工作效率,但如果被引文獻只有1篇或2篇,還是采用逐篇檢索更加快捷。二是本文所示方法更適合一線查收查引檢索人員,因為此方法方便快捷,無須安裝程序,通過簡單的函數公式編寫即可完成SCIE引用批量檢索,不需要進行專業培訓,也不需要具備較多的編程方面的知識,函數公式編寫一次后可以重復使用,更能滿足查收查引崗位的需求。三是本文所示檢索思路也可以擴展到其他數據庫的引用檢索實踐中,如Web of Science平臺中的數據記錄完整,其中的SSCI、CPCI-S、ESCI等數據庫也可以運用此檢索思路。
5 結語
筆者應用EXCEL數據處理的功能,模擬人工檢索流程編寫出相應的處理程序,從而實現了自動、批量、精準的SCIE引用檢索。此檢索方法的研究雖是在SCI數據庫導出數據的基礎上進行的,但其流程與方法也可以推廣到其他數據庫,只是導出的數據格式有所不同,因此要在后續的工作中實現其對所有數據庫的適用,從而建立起一套高效、全面的檢索系統。
參考文獻:
[1] 王學勤,郝丹,鄭菲,等.“查收查引報告自動生成系統”應用實踐研究[J].圖書情報工作,2014(16):131-137.
[2] 馬芳珍,李峰,季梵,等.對CALIS查收查引系統的測試和應用效果評價[J].大學圖書館學報,2016(2):97-102.
[3] 師曉青,尉江星.基于JPS的在線查收、查引和查新檢索系統的設計與實現:以山東大學(威海)為例[J].現代情報,2014(3):131-134,138.
[4] 樊亞芳,陳鍇.利用Excel和EndNote Web提高論文查收查引工作效率[J].圖書館雜志,2013(1):32-34,60.
[5] 樊亞芳.利用文獻管理軟件提高論文查收查引工作效率的實踐與應用[J].高校圖書館工作,2017(2):63-66.
[6] 張雪娟,樊亞芳.NoteExpress在論文查收查引工作中的應用[J].情報探索,2017(6):45-49.
[7] 蔣君,張玢,梅梅,等.論文查收查引工具設計與應用[J].醫學信息學雜志,2018(6):61-72.
[8] 陳偉,蘇婉瑩,周琴.基于批量處理構建查收查引報告工作流程[J].現代情報,2018(4):130-134.
(編校:崔 萌)