靳光明
[摘 要]跨入信息時代以來,中國的數據庫研究不斷取得進步和發展,從20世紀90年代以來,中國逐漸形成了以CNKI、萬方數據庫、維普數據庫為主的三大數據庫。因此,文章首先簡單介紹了數據庫的內涵,以及CNKI、萬方數據庫、維普數據庫這三大數據庫的發展情況。而后對三大數據庫的特點進行了對比分析。最后對中國數據建設現狀做出了簡單分析。
[關鍵詞]CNKI;萬方數據庫;維普數據庫;數據建設
[DOI]10.13939/j.cnki.zgsc.2017.15.299
1 數據庫的內涵及CNKI、萬方、維普數據庫簡述
1.1 數據庫的內涵
數據庫產生于20世紀五六十年代,到20世紀90年代后取得了較大的發展,功能從儲存、管理數據,發展到了根據用戶需要而進行各種數據管理的程度。所謂數據庫,即能將數據以一定的方式存儲起來,所有客戶都可以共享這些數據資料。
在當下的社會之中,數據庫的應用范圍極其廣泛,各單位都建有或簡單或復雜的數據庫。例如,學校會建立數據庫以儲存教師和學生的相應的信息,發布校方的官方新聞消息。與此同時,師生都可以通過他們自己的編號和密碼進入數據庫,搜索和下載自己需要的資源。并且,學校的數據庫簡單容易操作,資源也實現了共享,而且資源安全可靠,并有專人維護等。由此可見,人們在生活之中都會直接或者間接地與數據庫接觸,數據庫廣泛地存在于人們的生活之中。
從20世紀80年代以來,國內的電子期刊數據庫迅速發展,逐漸形成了以CNKI、萬方、維普數據庫為主的三大數據庫。這三大數據庫各具特色。
1.2 CNKI、萬方、維普數據庫簡述
CNKI、萬方數據庫、維普數據庫是我國的三大數據庫。它們在不同的時間發展起來,也各具特色。
“CNKI”是“China National Knowledge Infrastructure”的簡稱,即“中國知識基礎設施工程”,也就是當下學術界使用范圍非常廣泛的中國知網。CNKI是由清華大學和清華同方共同發起并由清華大學直接領導的一項知識項目工程,CNKI在1995年正式立項,在1999年,CNKI所發行的學術期刊從光盤版本實現了網絡化。CNKI收錄期刊、報紙、優秀學位論文、會議文件等,所囊括的范圍極其廣泛。據資料統計,CNKI所收錄的期刊和文獻的完整率都高于99.9%。
萬方數據庫由萬方數據公司所開發,也是和CNKI齊名的專業的學術數據庫。數據庫分為中文版本和英文版本,所收納的期刊包括理科、工科、醫學類和人文科學類的期刊全文,據資料統計,共包括70多個類目,4529種科技類的期刊。萬方數據庫以網絡為主要平臺,為其用戶提供了豐富的數據資料,為中國學術收錄工作做出了巨大的貢獻。
維普數據庫由重慶維普資訊公司所開發。從2000年建立以來,維普數據庫綜合整理了中國國內館藏的外文期刊,以及互聯網之上的外文期刊。維普數據庫使得其用戶在同一數據庫之中就能找到中國館藏和互聯網之上的外文期刊,用戶不用再耗費精力四處查找資料。既幫助用戶節省了他們的時間,又為用戶開拓了廣泛的閱讀空間。
CNKI、萬方數據庫、維普數據庫分別以其先進的理念,跟隨時代發展步伐。為廣大用戶提供了海量的學術資源,便利了用戶的材料搜索渠道,拓寬了用戶的學術資源視野。
2 CNKI、萬方、維普數據庫的特點對比分析
CNKI、萬方數據庫、維普數據庫都具有非常強大的數據資料收錄功能。但是,具體來說,各數據庫既有相同之處,又都有自己的特點。
首先,CNKI、萬方、維普數據庫有許多相同之處。具體體現在三個方面。第一,在檢索方式上,CNKI、萬方數據庫、維普數據庫都可以按照“題名”“關鍵詞”“摘要”“作者”“作者單位”的方式進行檢索。第二,在收錄內容方面,都收錄了較為全面的中文期刊,為廣大用戶提供了豐富的學術資源。第三,在用戶群體方面,三大數據庫的主要用戶一般都是高等院校的學生,以碩士研究生、博士研究生群體居多。
其次,CNKI、萬方、維普數據庫各有優勢。也正因為如此,CNKI、萬方、維普數據庫也有許多的不同之處。可從收錄范圍、瀏覽清晰度,以及收錄時間三方面進行比較。
從收錄范圍來看,CNKI的地位是不可動搖的。具體來說,CNKI的優勢主要體現在以下四個方面。
第一,在檢索方式上,雖然都可以按照用戶的需求進行檢索,但是CNKI有分類檢索、初級檢索、高級檢索和專業檢索這四種方式,并且每次檢索以后,可以在其檢索結果中進行二次檢索,這個操作步驟可以進行無數遍,直至檢索結果為零。
第二,在收費方式方面,CNKI的收費方式最為靈活,維普數據庫的收費方式較為靈活,而萬方數據庫的收費方式相較于CNKI、維普數據庫來說則欠缺靈活性,且萬方數據庫和維普數據庫的收費相較于CNKI來說,相對較貴。
第三,在收錄的學科范圍方面,CNKI最為全面,而萬方數據庫次之,維普數據庫的收錄范圍相較于CNKI、萬方來說則相對不夠全面。CNKI所包含的范圍幾乎是囊括了所有學科。維普數據庫所收錄的內容主要包括自然科學、農業科學、醫藥衛生、經濟管理,以及教育科學和圖書情報,但是,近幾年以來,維普數據庫所收錄的醫藥衛生方面的內容幾乎沒有再更新了。而萬方數據庫所搜集的東西則主要包括理科、工科、醫學、農學和人文類學科的內容。
第四,在期刊來源、引文數量以及更新速度方面,也使CNKI具有更強的優勢。在期刊來源上,屬于CNKI的來源最多,據資料統計,CNKI包括了6000多種期刊來源,而維普數據庫只有5000多種,萬方數據庫則僅有3000多種。在引文數量方面,CNKI有790多萬篇,而萬方數據庫只有490多萬篇,維普數據庫則僅有140多萬篇。在更新速度上,CNKI的更新速度是最快的,CNKI基本上保持了每日更新的速度,而維普數據庫是半個月才更新一次,萬方數據庫則是一個月才更新一次。
而從數據庫的瀏覽清晰度比較,則屬于萬方數據庫的瀏覽清晰度最高,其閱讀模式主要采用PDF格式,上傳的清晰度非常高,就像在閱覽紙質版一樣。而CNKI采用的是PDF、CAJ的瀏覽器,必須下載相關的瀏覽器才可以進行閱讀,相對來說,清晰度沒有萬方數據庫的高。而維普數據庫文檔的清晰度相對萬方和CNKI來說,則較差。
從收錄時間來看,則是維普的收錄時間最早,它收錄了從1990年開始以后的相關數據資料。CNKI所收錄的內容是從1994年開始的,萬方數據庫則是從2001年開始。
由此綜合來看,屬于CNKI的使用范圍更為廣泛。無論是在收費方式,還是在期刊來源、引文數量、更新速度上,以及所囊括的學科范圍上,CNKI都具有更多的優勢。對學生群體來說,一般都是使用CNKI進行資料查詢。
3 中國數據建設現狀
首先,就數據建設成就來說,從20世紀90年代以來,我國的數據建設取得了豐碩的發展成果。據資料統計,2009年,我國的各類數據中心和機房總數量為519990個,在2012時,數量已經達到約540777個。并且在21世紀初,逐漸形成了以CNKI、萬方和維普為主的三大專業的學術期刊收錄數據庫。在2016年,在貴州省建立了國家級別的大數據中心,是我國的數據建設事業大跨步發展的實踐證明。
其次,數據建設的發展還存在三方面的阻礙因素:第一,數據建設的法律法規不完善;第二,數據共享觀念的缺失;第三,數據平臺建設存在重心偏移傾向。
總之,我國數據建設還處于發展階段,有極大的開發空間。但在數據建設發展過程中,要注重解決當下存在的問題,例如,完善相關的法律法規,培養數據共享觀念,平衡數據平臺建設的重心等。只有充分利用當前數據建設的發展成果并解決了當下存在的問題,才能使我國數據建設邁上更高的臺階。
參考文獻:
李金蘭.CNKI、萬方、維普資源比較分析[J].情報探索,2011(4).