●倪寧兵,孫汝杰,郭宏偉
會議文獻(Con ference Literature),是指在專業學術會議文獻上交流或發表的論文、報告及其他有關資料。它能反映出一門學科、一個專業的研究水平和最新成果,而且許多重大發現住往首先在學術會議上公諸于眾,所以會議文獻是了解世界各國科技發展水平和動向的重要信息源。[1]為更好地利用會議文獻,現在世界各國都研發了各種會議文獻檢索工具或建立會議文獻數據庫,如國內CNKI的中國重要會議全文數據庫、萬方的中國學術會議論文全文數據庫、中國學術會議在線;國外的《科技會議錄索引》(ISTP)、《ISIP roceedings》等等。其中中國重要會議論文全文數據庫和中國學術會議論文全文數據庫是兩大具有一定影響的中文會議全文數據庫。筆者以上海應用學院圖書館所購鏡像站應用實踐為例,對這兩個會議全文數據庫進行了比較分析,明晰其特點,疏理其脈絡,以便于用戶更好地了解和更有效地利用這兩個數據庫,也有助于圖書館資源的配置和優化。
《中國重要會議論文全文數據庫》(以下簡稱《CNKI》)重點收錄1999年以來(部分重點會議文獻回溯至1953年)中國科協系統及國家二級以上的學會、協會,高校、科研院所,政府機關舉辦的重要會議以及在國內召開的國際會議上發表的文獻。《中國學術會議論文全文數據庫》(以下簡稱《萬方》)是國內最具權威性的學術會議論文全文數據庫,收錄了1998年至今的國家一級學會在國內組織召開的全國性學術會議,是目前國內收錄會議數量最多、學科覆蓋最廣的數據庫,[1]是掌握國內學術會議動態必不可少的權威資源。
兩大數據庫各自論文收錄數量、收錄年限、采集的資料來源、更新周期、瀏覽方式、學科范圍等信息(見表 1)。

表1 《CNKI》與《萬方》收錄情況比較
從表1中可以看到《萬方》收錄的會議論文數量比《CNKI》收錄的會議論文數量多一些。但《萬方》收錄數量中某些論文只有文摘,不能進行全文下載,雖然這部分占全庫的比例極小;而《CNKI》收錄的會議論文都可以全文下載。總的來說,這兩大數據庫收錄范圍都比較廣,數據范圍覆蓋自然科學、工程技術、農林、醫學等所有領域,無論從收錄年限還是文獻數量來看,顯示這兩個都具有一定影響且較權威性的學術會議論文全文數據庫。
檢索界面是否友好,會影響到數據庫吸引力和讀者使用的深度。《CNKI》秉承了其CNKI知識庫的統一格式和界面布局,[2]界面內容多,功能豐富,安排合理緊湊提供了“文獻檢索”“會議導航”“論文集導航”“主辦單位導航”等不同的導航服務,滿足用戶的個性化需求,用戶根據輸入控制條件和檢索控制條件的選擇可以完成自主檢索。
《萬方》界面直觀友好,簡潔明了,但安排比較松散。數據庫界面上提供了“普通檢索”“高級檢索”“學術會議分類檢索”“會議主辦單位”等服務。兩者都有在線幫助或操作指南,都有專門關于會議數據庫使用方法的詳細說明。
檢索功能是指檢索系統在用戶界面上提供給用戶的基本功能,它與系統的檢索技術是緊密結合的。[3]筆者對兩個數據庫的分類導航、檢索入口、檢索方式、限制檢索等方面進行了比較。

表2 分類導航比較
在按行業學科分類導航和按主辦單位分類導航方面,《CNKI》與《萬方》基本類似,但也各有特色。在行業學科分類導航的類目設置上《CNKI》有10個大類,大類下再分 168個專題(小類),且有會議導航和論文集導航兩種不同途徑,不同類目設置適應了不同讀者需求。《萬方》有 20個大類,點擊學科類目后顯示會議名稱,繼續點擊瀏覽論文全文,還可以通過會議年份進行交叉選擇,最后確定所需要的會議論文。按主辦單位分類導航兩者基本類似,《CNKI》由8個類目組成,而《萬方》設為 12個類目,顯得更全面。

表3 檢索入口比較
對數據庫來說檢索入口非常重要,會議論文更是如此。兩者都有題名、作者、正文、摘要、出版者等檢索入口,但《CNKI》還有主編、出版單位、會議地點、ISSN、ISBN等入口,其檢索入口比較豐富,有利于讀者更多的選擇。

表4 檢索方式比較
兩者都有普通檢索、高級檢索、專業檢索等方式,而《CNKI》還有科研基金檢索、句子檢索、來源會議檢索等。《萬方》則有經典檢索。其中專業檢索適合于對檢索知識有較好掌握的讀者,能提高查全率和查準率。相比而言,《CNKI》檢索方式多樣,個性化服務特出。

表5 限制檢索比較
限制檢索能使檢索結果更接近讀者需求,提高檢索的檢準率。[4]兩者都有邏輯組配和導航限制,而《CNKI》還有年限、會議級別、語種類型等限制方式,《萬方》有無全文等限制功能。相比較而言,《CNKI》限制檢索功能更豐富和強大。
檢索結果輸出功能是評價數據庫系統人機接口的非常重要的指標,也是用戶比較關注的。兩個數據庫檢索結果輸出與處理比較,如表6所示。

表6 檢索結果輸出與處理比較
從輸出功能來看,兩個數據庫均具有顯示、下載、存盤等多種輸出功能,沒有顯著的區別。兩個數據庫都以不同的形式顯示不同的超連接。
在檢索結果排序方面,兩者都可以按相關度和時間排序,但在時間排序方面,《CNKI》按照年份可以升或降排序,而《萬方》只能降序。在每頁顯示記錄條數方面,《CNKI》每頁能顯示10條、20條、50條三種記錄,而《萬方》也有10條、20條、30條三種選擇,兩者都可以根據需要很方便地調整。
《CNKI》采用兩種格式,一種是CAJ格式,需要用CAJ全文閱覽器閱讀,網站上提供下載;另一種為國際通用的PDF格式,能夠滿足信息交換。《萬方》只采用PDF格式,簡單方便。
從總體上來說,在輸出結果方面,《CNKI》的顯示形式更人性化,具體條目顯示內容更多,相關查詢鏈接更豐富,但《萬方》在某個方面也有一定的特色,顯示形式較個性化。

圖《CNKI》與《萬方》收錄論文篇數(2006-2011年)
為了比較兩個數據庫在文獻檢索時的查全情況和數據更新情況,筆者檢索了兩庫的論文收錄情況(2006-2011年),并在關鍵詞、論文作者和論文作者三個字段中任意選取了幾個檢索詞進行檢索,并使用不同檢索策略,檢索結果如圖及表7所示。

表7 檢索實例比較
從上圖顯示,《CNKI》與《萬方》在2006-2010收錄的論文數量相差不多,《萬方》稍微多一點。根據表7我們可以看出,在選取的若干個檢索詞中,《CNKI》與《萬方》檢索的結果不同,《CNKI》有 6個檢索詞的檢出結果高于《萬方》,而《萬方》有7個檢索詞的檢出結果高于《CNKI》,這與兩庫的收藏重點各有不同有關,但總體上《萬方》略多一些,查全率更高些,這似乎與前面論文收錄總量的對比相一致。另外《萬方》中沒有“作者單位”這一檢索字段,因此無法檢索。表明《萬方》的檢索字段沒有《CNKI》豐富,有待于今后作一些改進。
通過上述對兩大中文全文數據庫的比較,可以看出兩庫各具特色,各有所長。
(1)兩大數據庫收錄會議論文的年限相差不多,收錄的學科范圍也大致相同,基本覆蓋了自然科學和人文社會的各個領域。《萬方》的會議論文收錄數量略高于《CNKI》,但《CNKI》其論文回溯年限比《萬方》長。在收錄文獻的特色上,《CNKI》和《萬方》都偏重于理工科方面,尤其《萬方》更加明顯。
(2)《CNKI》檢索結果中顯示被引頻次、下載頻次等顯示文獻的引用情況,從側面揭示文獻的被參考情況,便于追溯知識源頭,掌握其發展脈絡。同時還有中英文擴展檢索,正文等文獻網絡圖,提供了匹配度選擇(精確與模糊兩種方式)、詞頻限制功能等特色,而《萬方》沒有提供以上這些選擇。《萬方》檢索結果有經典論文優先(是指被引用次數比較多,或者文章發表在檔次比較高的雜志上的、有價值的文獻排在前面)、相關度優先與最新論文優先三種排序,優先排序是檢索結果頁面提供的特色功能。另外《萬方》檢索結果中顯示論文的相關博文,可點擊查看,這是《萬方》的特色之一,是非常新穎和實用的。
(3)更新速度還有待提高。從更新程度來說,《CNKI》比《萬方》的更新周期要短。《CNKI》采用每日更新,而《萬方》不能達到每日更新,有時要1個月才更新。但兩者和一些國外數據庫在更新時效方面相比都顯得慢,希望能進一步提高。因為文獻更新的及時性是影響用戶選擇的一個重要因素,更新周期太長,不利于用戶檢索到最新的信息。
(4)鑒于兩個數據庫收藏數量與內容不同,收藏重點也不相同,當然兩庫之間的文章有交叉重復現象,但兩庫還可實現資源交叉互補。如果經費允許,可以同時購買,或者對自己所需的文理工學科分別從兩家購入,實現優勢互補,為用戶檢索會議文獻提供更多地方便。
[1]鄧富民.文獻檢索與論文寫作[M].北京:經濟管理出版社,2010(8):149-155.
[2]劉萍,孫汝杰.兩個博碩士學位論文數據庫之比較 [J].圖書情報工作,2005(11):110-112.
[3]王群.中國兩大博碩士論文全文數據庫比較研究[J].情報科學,2006(1):65-68.
[4]李志明.我國兩大年鑒全文數據庫比較研究[J].圖書館學研究,2009(1):66-69.