

摘? 要:信息時代如何在海量信息中找到所需信息非常重要,而如何尋找自己研究方向中具有參考意義的重要文獻,以及篩選出含金量高的論文,是一名優秀的科研工作者所必需的一項技能。文章通過論述搜尋主題為“Trajectory Data”的論文時積累的經驗,列舉了檢索和篩選中文文獻與英文文獻的方法,最后總結全文,并對如何進行特定主題的文獻檢索的方法進行初步探討。
關鍵詞:文獻檢索;檢索方法;篩選文獻
中圖分類號: TP391.1? ? ?文獻標識碼:A 文章編號:2096-4706(2020)06-0007-03
Abstract:In the information age,it is very important to find the information needed in the massive information. How to find the important literature with reference significance in their own research direction,and how to select the paper with high gold content,is a necessary skill for an excellent scientific research worker. By discussing the accumulated experience in searching for papers with the theme of “Trajectory Data”,this paper enumerates the methods of searching and selecting Chinese and English literature,and finally summarizes the full text,and makes a preliminary discussion on how to search for literature with a specific theme.
Keywords:literature search;search method;screening literature
0? 引? 言
文獻檢索是信息檢索中的一個部分,主要在科學研究方面用處很大。進行文獻檢索,檢索者要根據自己所需文獻的主題,借助國內外各大中英文數據庫以及各種搜索引擎尋找自己所需要的含金量高的論文等資料。大部分本科生對文獻信息資源的重要性沒有充足的認識,需要一種經由實踐總結出來的高效尋找重要文獻的方法,針對該問題的探討也對提高本科生獲取信息的能力具有十分重要的意義。
本文擬從筆者自身檢索主題為“Trajectory Data”這一主題的重要文獻這一較有代表性的活動入手,分別對尋找中文文獻的過程及所用方法和尋找英文文獻的過程及所用方法進行敘述,然后從中總結出高效檢索特定主題的文獻的方法,最后就其檢索文獻所得結果的科學性與準確性進行探討。
為了保證文中所提方法的準確性,作者首先總結了“文獻檢索與論文寫作”這門課程上自己所學習到的檢索方法,而后通過CNKI平臺,在其論文數據庫中進行檢索,檢索時采用的中文關鍵字為“文獻檢索”,對于檢索出的論文,通過人工審查的方式移除掉與所探討問題相關度不高的文章,從中挑選出幾篇有代表性和實用價值的文章進行閱讀后,按照從中歸納總結的方法,加上已有的知識與經驗,最終選擇出與該問題相關的高質量論文共3篇(截止到2019年10月)來作為撰寫這篇論文的參考文獻。
本文第1節對進行特定主題的文獻檢索過程中選擇目標論文的兩個參考點進行列舉,對評判論文含金量的幾個因素進行列舉分析,并對其中3個重要因素(相關度、引用量和下載量)以及為什么選擇這三項指標作為評判標準進行分析闡述。第2節對進行中文文獻檢索的過程進行具體說明與總結。第3節對進行英文文獻檢索的過程進行闡述和說明。第4節綜合第2節和第3節所敘述的在中文數據庫和外文數據庫查找文獻的過程,對文獻檢索方法進行總結,并對如何進行行之有效的文獻檢索進行初步探討。
1? 特定主題的文獻檢索過程中選擇目標論文的參考點
1.1? 時效性
計算機專業的前沿技術更新換代非常快,因而除了極其具有里程碑式意義的文章外,首先應該選擇發表時間不是很長的論文,這樣我們才能對研究方向的相關前沿動態有更加深刻的理解,并從中掌握大量自己所需的、對自己有所啟發的信息,或得到更多對于自己的研究更有價值的論證依據。正如本文所要論述的中文論文和英文論文的檢索,進行篩選得到的目標論文都是近三年的論文。
1.2? 含金量
一篇論文的含金量主要從三個方面來進行考量:相關度、引用量和下載量。
相關度是文獻檢索過程中最需要把控的一個指標,如果檢索結果與所尋找的主題間的相關性很低,那么這樣的檢索結果是沒有意義的。以“Trajectory Data”這個主題為例,在CNKI數據庫中進行搜索時,搜索結果中出現的《金屬板材數控單點漸進成形加工軌跡優化研究》等論文就是無效的。
引用量是評價一篇論文含金量的一個相對客觀的指標。雖然可能受發表時間影響,但如果一篇論文的引用量較高,說明其中所敘寫的研究成果價值很高并經得起科學的檢驗與推敲,后來的研究者們可以借由論文中的結論進行更加深入的研究。在實際的文獻檢索過程中,論文的引用量也是占比重最大的一個參考因素。
下載量相比較引用量來講,其科學性與信服度要差一些,因為下載量對論文來講無法說明其對其他人進行研究所起到的幫助性作用,但如果下載量極其高,某種程度上說明其可能是最前沿的研究,且下載量與被引用次數在大多數情況下是呈現正比關系的,因而可以將下載量作為進行結果篩選時的一個非主要因素。
2? 中文論文的檢索
在進行文獻檢索前,我們需要對要去檢索的主題有明確的認識和理解,即明確主題究竟是什么。因此我們首先要分析主題,抓住待檢索文章主題的本質,掌握代表課題內容的主題概念及其相關事物,然后依據關鍵詞來選定相應的檢索工具,并從中選定檢索標識,確定檢索方式。在百度百科上搜索Trajectory Data的對應中文翻譯“軌跡數據”,得到了軌跡數據的定義,隨后開始進行論文的檢索。我們使用知網來進行中文文獻的檢索。
進入CNKI,選擇“高級檢索”-“期刊”,在“主題”的搜索框中輸入“Trajectory Data”,檢索時間選擇從2016年到2019年,來源類別中選擇“SCI來源期刊”和“EI來源期刊”,如圖1所示,因為選擇的期刊水平越高,其收錄的論文水平相對越高,越容易找到具有高參考價值和高含金量的論文。一切條件都輸入后進行檢索。在新的界面得到檢索結果后,在“排序”一欄選擇“相關度”,而后通過引用量與下載量進行篩選,對引用量和下載量較高的篇目,通過瀏覽篇名、查看摘要、在線閱讀全文等人工審查方式,選擇出與相關主題最貼近的論文,作為目標檢索結果的一部分。
進行文獻檢索的過程中筆者使用了順序篩選法與追溯法兩種方法。順序篩選即通過上文所提的人工查找和人工審查的方式,對檢索結果進行逐一篩選,得到目標文獻清單。而追溯法即通過一篇文章的參考文獻,得到在時間范圍內的其他與主題相關的參考文獻,緊接著通過得到的論文的參考文獻繼續尋找與主題相關的參考文獻,如此往復,得到一系列目標文獻。順序篩選法借助現在在線的搜索工具,能根據限定條件快速得到所需文獻,操作迅速簡單,得到目標文獻的準確性與含金量相對較高,適合短期的、時間限定較緊的文獻檢索。追溯法容易尋找到偏向綜述性的文章資料,這些資料往往已經對某一種問題或某一類問題進行了一定的歸納和總結,所以這些資料能夠節約查找、通讀原始文獻的時間。追溯法適合在現有論文較少的條件下使用,適合初次進行文獻檢索時使用。因為通過這種方式尋找到的論文多為被作為參考文獻的論文,其相關度和含金量均有所保障,并且一定程度上在所屬主題的領域中是具有指導意義的文章,有很高的參考價值。
由于CNKI本身具有強大的條件檢索和篩選能力,在作者輸入上文中的一系列條件后,其得到的結果根據相關度降序排列后,高引用量和高下載量的文章同樣也在搜索結果靠前的部分,因而筆者在進行中文論文的檢索時只用了順序篩選法。
通過上述方法,筆者選擇了15篇與“Trajectory Data”有關的中文論文,至此中文文獻檢索的工作圓滿完成。
3? 英文文獻的檢索
目前外文數據庫里,在計算機科學領域,比較有名的有ACM數據庫、Engineering Village數據庫(EI數據庫)、Springer出版社、IEEE數據庫、SCI數據庫等。在進行英文論文的檢索過程中,直接使用順序篩選法或者追溯法,在ACM數據庫中的檢索中或許還能找出一些根據第一節中所描述的判斷方法所篩選出來的相對而言含金量高的文章,但在諸如Springer數據庫、EI數據庫等數據庫中進行搜索時,根據相關度進行排序后,許多論文的引用量和下載量不會那么明顯地顯示出來,這時就不能單獨采用其中的某一種方法,所進行的文獻檢索也顯得不那么行之有效。
而對于英文論文,初涉文獻檢索的人很難在短時間內根據文章內容判斷其含金量,在這種情況下,筆者采用分段法進行英文論文的檢索。所謂分段法,就是將順序篩選法和追溯法交替使用,即一方面利用外文數據庫檢索平臺經過輸入一系列篩選條件后,得到的結果經過篩選后作為目標論文的一部分,一方面根據已得到的目標論文最后所附的參考文獻進行追溯,得到在相應時間范圍內的具有參考意義的論文。通過分段法進行文獻檢索時,我們不必對每一篇文章都了解得十分詳細,只需根據一定的指標篩選出少量的目標論文,而后視需要根據已有論文不斷追溯論文,進而不斷擴充目標論文集合,從而獲得足夠的文獻資料。
分段法的操作過程如下:以ACM Digital Library為例,進入到ACM數據庫新平臺,在其主頁的搜索欄下點擊“Advanced Search”,在新界面中“Search Within”的“Anywhere”后填寫“Trajectory Data”,在“Publication Date”一欄中選擇“Custom range”,然后日期填寫從2016年10月到2019年10月,點擊“Search”得到搜索結果。ACM數據庫默認按Relevance(相關度)進行排序,每一篇文章的引用量和下載量一目了然。通過瀏覽搜索結果篩選出其中引用量和下載量相對較高的幾篇文章,而后查看已得到的文章,獲得其參考文獻內容,再度進入數據庫中進行查找,如圖2所示。例如我們通過順序篩選得到了一篇名為“A Cloud-Based Trajectory Data Management System”的文章,查看文章的References(參考文獻)部分,其中的“Queryingassive trajectories by path on the cloud”這篇論文與“Trajectory Data”相關度很高,因此將其納入目標論文中,并對這篇文章重復上述方法繼續進行檢索,如此經過幾次循環,我們便能得到我們所需要的目標論文集。
通過上述方法,筆者共選擇了15篇與“Trajectory Data”有關的英文論文,至此英文文獻檢索的工作也順利完成。
4? 結? 論
在給定主題為“Trajectory Data”的情況下,通過在中文數據庫進行中文論文的文獻檢索和在外文數據庫中進行英文文獻的檢索,筆者共采用了三種方法:順序篩選法、追溯法和分段法。
順序篩查法主要通過由近及遠的順序,基于在線搜索平臺,輸入一定的限制條件后,由評判論文含金量的三個因素(相關度、引用量和下載量)進行篩選,得到所要尋找的目標論文。這種方法在進行中文數據庫中的文獻檢索里較為適用,其操作簡單,得到的結果建立在一定的較為科學的依據上,得到結果的速度快、成效好。
追溯法主要是通過已有文章的參考文獻,獲取與已有同主題論文內容相近且更加具有參考價值的論文。這種方式本質上是一種遞歸,通過不斷在參考文獻中尋找論文可以得到更具有參考性的論文,但重復次數取決于限定的論文發表時間段的長度。
分段法則是上述兩種方法交替進行,一方面借助在線檢索平臺,一方面借助已有文章,得到的結果更多且更具有可信度。
因此在筆者看來,采用分段法更有利于進行特定主題的文獻檢索。隨著信息時代文獻資料的爆炸式增長,在線檢索平臺逐漸取代紙質檢索工具,進行高效的文獻檢索成了每一位大學生所應具備的一項技能。文獻檢索與利用是大學生進行科研活動的基礎,因此好的文獻檢索方法就顯得尤為重要。
參考文獻:
[1] 劉沖.論大學生畢業論文寫作中的文獻檢索與利用 [J].赤峰學院學報(自然科學版),2016,32(23):178-180.
[2] 吳江艷,王海燕.文獻檢索與利用能力培養研究 [J].出國與就業(就業版),2012(6):234-235.
作者簡介:馮禹隆(1999.08-),男,漢族,山西夏縣人,本科,學士學位,研究方向:計算機軟件開發。