萬文娟 吳 高
(廣西師范大學圖書館 廣西桂林 541004)
機構知識庫是伴隨著開放存取的發展而興起的一種學術交流與資源共享的新模式,作為開放存取的重要“綠色通道”之一,已逐漸成為開放存取運動的主角。2003年2月,香港科技大學機構倉儲的構建拉開了我國建設機構知識庫的序幕。經過8年多的發展,我國機構知識庫建設取得了一定的成績。截止到2012年1月1日,OpenDOAR共收錄2164個機構知識庫,我國包括港澳臺地區共91個機構知識庫,機構知識庫總量僅次于美國、英國、德國、日本,位居世界第五位〔1〕。然而,根據西班牙賽博計量學實驗室2011年7月公布的《世界機構典藏系統排名》顯示,在世界排名前1000位的機構知識庫中,我國僅有39個機構知識庫上榜〔2〕。《世界機構典藏系統排名》是以規模、可見度、內容豐富性、學術性為評價指標對機構知識庫進行的綜合排名,這四個指標均屬于內容建設范疇,可見我國機構知識庫內容建設形勢不容樂觀,整體水平較低。內容建設是機構知識庫構建的重點與關鍵,內容的量與質已成為影響其可持續發展的最大障礙。本文著重對我國機構知識庫內容建設現狀進行調查研究,分析其存在的問題及成因,并提出相應對策,以期為我國機構知識庫內容建設起到借鑒參考作用。
從整體上看,我國機構知識庫內容建設有了一定程度的發展,已取得了一定的成績,尤其是港臺地區的機構知識庫。但與國外發達國家機構知識庫內容建設現狀相比,我國機構知識庫內容建設還處于一個起步發展階段,內容的量與質有著很大的提升空間,目前主要存在以下五個問題。
機構知識庫資源數量的多少通常被作為衡量一個機構知識庫成功與否的重要指標之一,對其使用價值影響重大。世界排名第一的美國國家航空航天局資助的天體物理數據系統(The SAO/NASA Astrophysics Data System,ADS)記錄總數超過920萬條〔3〕。美國機構知識庫平均記錄數為43760條,澳大利亞機構知識庫平均記錄數為31240條,西班牙機構知識庫平均記錄數為17728條,日本機構知識庫平均記錄數為14236條〔4〕。然而我國機構知識庫資源數量總體十分匱乏,只有少數機構知識庫的資源數量較大,臺灣大學機構典藏是目前中國資源最為豐富的機構知識庫,也只有181701條記錄〔5〕。我國極少數機構知識庫的資源總量超過2萬條,并且幾乎都是港臺地區的機構知識庫,大陸地區機構知識庫的資源更為稀少,資源總量超過1萬條的只有6個機構知識庫,分別為中國西部環境與生態科學知識積累平臺、廈門大學學術典藏庫、中國科學院大連化學物理研究所機構倉儲系統、中國科學院高能物理研究所機構知識倉儲系統、中國科學院力學研究所機構知識庫、中國科學院半導體研究所機構知識庫。大多數機構知識庫的記錄總數不超過5000條,有的甚至還不到100條,如浙江大學機構知識庫記錄總數11條、上海交通大學機構倉儲數據庫記錄總數90條。
機構知識庫資源應包括已經出版的資源,也包括尚未出版的灰色資源。據OpenDOAR統計,國外機構知識庫收錄的文獻類型有12種,且包括許多尚未出版的資源,如多媒體視聽資料、學習資料、數據庫、軟件、專利等〔6〕。在我國,學位論文庫在高校機構知識庫中占有一定的比重,如香港大學論文在線、國立中央大學圖書館碩博士學位論文系統等,學位論文庫以學位論文為收錄對象,形式和內容較為單一。雖然我國機構知識庫大多數屬于綜合性機構知識庫,收錄資源類型種類較多,但收錄尚未出版資源的比例很小,大多數是已經出版的文獻,且以期刊論文、學位論文、會議論文、工作報告等為主,圖片、視頻等多媒體資源比較少,資源類型有待多元化。以中國科學院國家科學圖書館機構知識庫為例,截止到2012年1月1日,其記錄總量為3967條,其中期刊論文3065條、會議論文239條、研究報告225條、演示報告158條、其他280 條,所占比例分別為 77%、6%、6%、4%、7%〔7〕。
機構知識庫資源更新是否及時決定機構知識庫資源數量能否持續積累。對于高校學位論文庫而言,資源更新的數量與本校碩博士畢業生的數量密切相關。由于一般高校都明文規定畢業生只有同時提交學位論文紙質版和電子版后方可畢業,因此學位論文庫資源更新相對穩定。但更新頻率不高,更新時間主要集中在每年畢業時間前后。對于綜合性機構知識庫而言,資源更新則不同。由于大多數機構知識庫對資源提交不做強制要求,資源更新毫無保障。經過調查發現,中國科學院科研院所機構知識庫更新頻率最高,尤其是中國科學院力學研究所機構知識庫資源更新頻率為1274.5條/月〔8〕。而高校其他綜合性機構知識庫資源更新十分緩慢,甚至毫無更新,以香港城市大學機構知識庫為例,筆者分別于2012年1月1日和2012年2月20日瀏覽其主頁,其記錄總量都是3047條,毫無變化。
我國絕大多數機構知識庫資源全文獲取率較低,包括建設機構知識庫較為成功的臺灣地區,這大大制約了機構知識庫學術交流與資源共享的實質功能。大多數臺灣地區機構知識庫主頁都標明了資源的總筆數與全文筆數。筆者進入OpenDOAR收錄的48個臺灣地區機構知識庫主頁用全文筆數/總筆數計算全文獲取率發現,全文獲取率低于10%的機構知識庫有兩個,分別為東華大學機構典藏全文獲取率4%、國立聯合大學機構典藏系統全文獲取率4.6%。此外,嘉義大學機構典藏全文獲取率也僅為12.3%,16個機構知識庫的全文獲取率低于50%,僅14個機構知識庫的全文獲取率高于90%。臺灣地區機構知識庫資源的全文獲取率尚且如此之低,我國其他機構知識庫的全文獲取率就可想而知了。
如前文所述,根據《世界機構典藏系統排名》顯示,目前在世界排名前1000位的機構知識庫中,我國僅有39個機構知識庫上榜,其中臺灣地區33個,香港地區4個,大陸地區僅2個,分別為廈門大學學術典藏庫排名第236位、中國科學院力學研究所機構知識庫排名第883位。雖然我國臺灣地區機構知識庫內容建設水平較高,不僅資源數量多,而且質量高、影響力大,但我國大陸地區機構知識庫資源質量整體水平很低,尤其是高校機構知識庫資源的完整性、正確性、學術性、權威性、創新性等都有待于提高。
意識是實踐的先導,開放存取理念在我國還尚未深入人心,無論宏觀的國家層面、中觀的機構層面以及微觀的個人層面,對開放存取的認識都遠遠落后于國外。我國機構知識庫建設缺乏社群參與的基礎,尤其是一些擁有大量學術資源的科研人員還尚未認識到機構知識庫的價值。一項對中國科學院部分科研院所科研人員對機構知識庫認知程度的調查表明,53.3%的用戶選擇“從未聽說”,33.3%的用戶選擇“不常使用”,10.6%的用戶選擇“從未使用”,僅2.6%的用戶選擇“經常使用”〔9〕。由于對絕大多數科研人員而言,開放存取還是個新鮮事物,這導致科研人員自存儲意愿不強,對機構知識庫建設參與度低,極少愿意或主動向機構知識庫提交資源。社會開放存取意識薄弱,必然導致機構知識庫資源數量過少、質量不高,這是制約機構知識庫內容建設的一大瓶頸。
政策是機構知識庫成長的宏觀環境,國外機構知識庫資源數量的增長、質量的提高,在很大程度上得益于國家政策及相關研究的大力支持,例如美國國家科學院、美國國家自然科學基金會的開放存取政策、美國國會通過的《公共獲取科學法案》等都有力地推動了機構知識庫的建設和發展〔10〕。開放存取作為一種新生事物,是由學術界發起的,我國還沒有正式的關于機構知識庫建設的國家政策或機構內的政策,而且我國信息資源公共政策水平較低,效率較差,這就缺乏建設機構知識庫的政策指導,從而影響機構知識庫的發展,特別是影響到機構知識庫內容建設的規范性、系統性〔11〕。尤其是當前高校科研成果評價政策并未將在機構知識庫上提交的論文作為科研成果統計,而僅將在何種期刊上發表論文作為科研績效評價的重要依據,這關系到學者職位的晉升、相關業績的評價和科研成果的認定。缺乏國家宏觀政策、科研評價激勵政策等的支持,機構知識庫要吸引數量多、質量高的內容資源,其難度就可想而知了。
這里所說的建設主體錯位主要是針對我國大陸地區而言的,香港、臺灣地區的機構知識庫大多數都由高校構建。香港大學、香港科技大學、香港中文大學、香港城市大學、香港理工大學、香港教育學院等都擁有自己的機構知識庫,截止到2012年1月1日,臺灣學術機構典藏TAIR共有124個高校參與,包括53所一般大學、63所技術職業院校,記錄總數達1289577條〔12〕。而我國大陸地區的機構知識庫大多數都由中國科學院構建,OpenDOAR收錄大陸機構知識庫共26個,其中中科院的機構知識庫22個,ROAR收錄大陸機構知識庫共76個,其中中科院的機構知識庫66個〔13〕。高校是國家教學和科研的中堅力量,我國大陸地區設有普通高等學校2305所〔14〕,而擁有機構知識庫的卻只有廈門大學、浙江大學、福建師范大學、北京科技大學、中國農業大學等10余所高校。大陸地區近99%高校的學術科研成果尚未成為機構知識庫保存的對象,這必然會嚴重影響機構知識庫內容建設水平。
機構知識庫存儲的是智力產品,智力產品本身存在版權歸屬問題。然而,我國現有版權制度較不完善,版權保護存在諸多漏洞,為避免所存儲資源的版權侵權風險,很多機構知識庫構建者不對外開放或只開放部分已存儲的資源,資源的全文獲取受到了極大的限制。例如,嘉南大學機構典藏將所收藏資源的訪問權限設為3種:(1)完全公開,不需登錄即可全文下載;(2)校內公開,校內網絡才可全文下載;(3)不公開,無法下載全文〔15〕。廈門大學學術典藏庫在其版權申明中明確規定:本學術典藏庫中所有內容均由廈門大學師生整理提交而成,未經允許,不得大量下載或鏡像使用〔16〕。資源版權保護過度在一定程度上影響了自由獲取的可行性,使得大量學術資源讓普通用戶望塵莫及。
傳統的學術交流模式有一系列的質量控制機制和評價指標體系來確保質量,如專家評審和同行評審制度,與傳統的信息交流模式相比,開放存取還未形成一個比較系統的、普遍適用的質量控制機制。機構知識庫的資源存儲采用的是自存檔方式,用戶可以不受限制地上傳論文,對于自存檔方式,同行評議不作強制要求。自存檔極少進行同行評議程序,尤其是尚未發表的科研論文及其元數據等灰色資源,只須受到學術機構知識庫系統的簡單審核便可迅速被用戶瀏覽和檢索利用,這就導致了自存儲資源學術質量的參差不齊,資源質量得不到有效控制。此外,從提交者角度來說,很多學者很大程度上都會選擇那些具備良好聲譽的期刊,而不愿意把自己的科研成果提交到“魚龍混雜”的機構知識庫中,這必然導致機構知識庫資源數量和質量方面都沒有保障。
要增強社會開放存取意識,宣傳推廣是關鍵。目前已有證據顯示自存檔可以提高學術成果的使用率、被引率和影響力,根據一份實證研究成果的結論,學術機構工作人員向機構知識庫提交一篇論文的時間大約為10分鐘,而每篇論文10分鐘的時間投資能夠獲得在論文被引頻次、下載頻次和閱讀方面至少200%的回報〔17〕。圖書館和科研機構應該充當開放存取理念宣傳的主力軍,通過展覽、海報、宣傳冊、講座培訓、網站專題、會議等多種途徑在學術界大力宣傳機構知識庫的意義、作用及提交程序等。條件允許的情況下,可邀請特定學術聯盟或本機構的著名專家學者提供內容,發揮其“明星效應”,以此影響學術機構的其他工作人員,使機構知識庫建設得到政府機構、大學、圖書館、科研人員、基金會、出版機構等相關機構和人員的理解、支持和認可,不斷增強學者和公眾的開放存取意識和責任感,讓更多人不僅僅作為開放存取的使用者,而且成為開放存取資源的提供者。我國大陸地區在加大對開放存取特別是機構知識庫的宣傳上可以借鑒臺灣地區的成功經驗,臺灣高校利用“種子學校”概念,大力宣傳和推廣種子學校建置機構知識庫的經驗,該宣傳策略使臺灣地區機構知識庫實踐從重點突破到大面積復制再到最后的全面覆蓋僅經歷了三年,不僅節省了大量的人力、物力、資金、時間成本,也為后期TAIR的一體化奠定了堅實的基礎〔18〕。
完善合理的存繳政策是解決機構知識庫資源收集困難的根本保障,從性質上來看存繳政策主要包括強制性、激勵性政策兩種。目前和相當長的一段時間內,尤其是在機構知識庫內容建設初期,存繳政策應以強制性政策為主,采取一定程度的強制來保障機構知識庫資源數量持續累積,如愛爾蘭的科學工程與技術研究理事會要求所資助的研究論文在初次出版的6個月內能夠在OA知識庫中自由獲取〔19〕;美國國家衛生研究院NIH強制的公共獲取政策要求受NIH資助開展研究而產出的經同行評審的最終版本論文全文在期刊發表后,至多12個月內均應通過PubMed Central提供免費在線利用與檢索〔20〕。但隨著開放存取的日益成熟,存繳政策應逐步向自愿性方向發展,從強制性轉向激勵性與導向性。
學者很多時候并不是不愿意讓別人共享自己的研究成果,而是缺乏一種驅動力來激發自己存儲的熱情,所以在應用強制性政策的同時要輔以多種激勵政策,存繳若一味強制會適得其反,引發學者們的抗拒逆反情緒。將機構知識庫中的資源納入科研考核評價體系和職稱評價體系、協助提交成果的出版、設置瀏覽下載量排行榜等都是很好的激勵方法。例如,中國科學院力學研究所機構知識庫規定,所內作者的論文統一通過IMECH-IR系統進行提交,作為年終考核績效和晉職的依據〔21〕;香港科技大學把教職工向機構知識庫遞交作為個人學術出版過程的一部分,并與香港研究資助局合作資助出版或發表遞交在機構知識庫中的預印本文檔〔22〕;香港科技大學機構倉儲從2004年10月開始,在主頁上都列出每個月開放存取次數最多的20篇文獻〔23〕。只有通過激勵才能真正持續調動科研工作者自發提交資源的積極性。
從國外已有的機構知識庫建設實踐中可以發現,大多數成功的機構知識庫都是由圖書館,特別是大學圖書館來領導并運行管理的。在澳大利亞,澳大利亞國立大學、南昆士蘭大學、墨爾本大學、悉尼大學等大學圖書館均是機構知識庫的創建者。在美國,90%的高校都擁有自己的機構知識庫〔24〕。CNI2005年關于機構知識庫在美國的發展現狀的調查也指出:大學圖書館成為研究型大學創建機構知識庫的領軍人〔25〕。我國大陸地區高校數量眾多,擁有39所“985工程”大學以及112所“211工程”大學,這些高校師資力量雄厚,擁有大量較高學術價值的期刊論文、碩博學位論文、會議論文、研究報告、教學課件等原生數字信息,完全擁有構建機構知識庫的實力。大學圖書館可以并且應該在機構知識庫建設過程中發揮主導作用,國外以及港臺地區的高校機構知識庫也為我國大陸地區高校機構知識庫的構建起著很好的導向與借鑒作用。我們要在政策機制、技術開發、資金支持等方面給予高校機構知識庫成長的良好環境,充分發揮高校的作用,著力構建一定數量的高校機構知識庫,將機構知識庫內容建設水平推向一個新的高度。
如何遵守知識產權法規,如何平衡權利人(作者)的權益和公眾(用戶)的利益,做到既能維護作者合法權益,又能保證公眾信息獲取權,這是確保機構知識庫資源可用性必須解決的一大難題。機構知識庫資源的免費自由獲取往往需要通過版權人的授權許可,推行許可協議是目前平衡資源提交者、機構知識庫、資源獲取者三者利益的主要協調機制,機構知識庫應根據版權法規和本機構資源收錄政策,制定機構與資源提交者、機構與資源獲取者的版權協議,合理配置各方的權利與義務,減少資源版權侵權風險。作者和版權所有人可通過許可協議讓渡部分版權給用戶,使得所有用戶具有免費、不被更改、全球和永久使用其作品的權利,作者保留作品完整權、署名權等部分權利,用戶使用機構知識庫資源時必須注明作者的姓名、作品名稱和作品出處等版權信息〔26〕。只有從版權政策上對機構知識庫資源的使用實施靈活合理保護而非過度保護,更多高質量的學術資源才能最大程度地被自由存取。
加強質量控制關鍵是建立一個包括學術質量和元數據質量在內的質量控制機制。質量控制機制應注重全面性,在資源元數據質量控制方面,可通過設置元數據元素表、制定元數據著錄規范、采用從列表框中選擇數據、設計自動檢測系統等方法來確保元數據的正確性、一致性、完整性、唯一性和有效性〔27〕。在資源的學術質量控制方面可采用以下方法:(1)對資源提交者的限定。并非任何人的任何作品都可提交到機構知識庫中,必須對提交者的身份、專業背景等進行規范。例如QUT ePrints明確規定:注冊QUT的用戶只能是本機構的教職員工和研究生〔28〕。(2)對資源提交程序的限定。為保證資源的規范性、系統性,要在機構知識庫主頁的明顯位置對資源提交程序做出說明,提交方法可以多樣化。例如香港理工大學機構知識庫提供3種提交途徑:進入香港理工大學機構知識庫主頁網上提交、將科研成果通過郵件發給香港理工大學機構知識庫工作人員、與所在院系的學科館員聯系〔29〕。(3)對資源進行同行評審具體步驟的限定。可通過電子郵件、在線評論、寄發紙質版等途徑聘請優秀的編輯和專家對成果進行評審,借助評審專家的評審及修改指導意見,對預印本質量不斷進行修改完善。例如崑山科技大學機構典藏規定:一份資料要由三人審閱,只有至少獲得二人認可才可以典藏至機構知識庫中〔30〕。(4)對資源學科范圍、文獻類型、文獻格式、文獻內容的限定。應該根據機構的性質、機構知識庫建設的目的等對資源的學科范圍、類型、格式等作通盤考慮。(5)對資源建設效果的評價指標、評價方法、評價流程、評價人員、評價頻率的限定等。建立一套科學、合理、實用的質量評價體系,為機構知識庫內容資源前期的質量控制以及后期的質量評價提供決策參考。
(來稿時間:2012年5月)
1.Search or Browse for Repositories.〔2012-01-01〕.http://www.opendoar.org/find.php?format=charts
2.Ranking Web of World Repositories.〔2012-01-01〕.http://repositories.webometrics.info/toprep_inst.asp
3.The SAO/NASA Astrophysics Data System.〔2012-01-01〕.http://adsabs.harvard.edu/
4.萬文娟,吳高.國內外機構知識庫建設現狀比較研究.國家圖書館學刊,2010(4):31-35
5.臺灣大學機構典藏.〔2012-01-01〕.http://ntur.lib.ntu.edu.tw/
6.Most Frequent Content Types.〔2012-01-01〕.http://www.opendoar.org/find.php?format=charts
7.中國科學院國家科學圖書館機構知識庫.〔2012-01-01〕.http://ir.las.ac.cn/
8.趙迎光,曾蘇.國內機構知識庫發展現狀與對策研究.情報雜志,2011(1):42-46
9.韓珂,祝忠明.科研機構對機構知識倉儲認知和服務需求調查分析.現代圖書情報技術,2008(3):12-17
10.何林.美國機構知識庫發展現狀對我國發展機構知識庫的啟示.圖書館論壇,2008(3):101-103,148
11.郭淑艷,王東艷.機構知識庫構建研究.圖書館學研究,2007(5):9-12
12.臺灣學術機構典藏.〔2012-01-01〕.http://tair.org.tw/
13.Registry of Open Access Repositories.〔2012-01-01〕.http://roar.eprints.org/
14.普通高等學校校數.〔2012-01-01〕.http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s4960/201012/113594.html
15.嘉南大學機構典藏.〔2012-01-01〕.http://ir.chna.edu.tw/
16.廈門大學學術典藏庫.〔2012-01-01〕.http://dspace.xmu.edu.cn/dspace/
17.Leslie Carr,Stevan Harnad.Keystroke Economy:A Study of the Time and Effort Involved in Self-Archiving.〔2012-01-01〕.http://eprints.ecs.soton.ac.uk/10688/1/Keystroke Costing-publicdraft1.pdf
18.張巧娜,孟雪梅.臺灣地區高校機構庫的建置發展與啟示.圖書與情報,2010(3):11-14,68
19.Jingfeng Xia.A Comparison of Subject and Institutional Repositories in Self-archiving Practices.The Journal of Academic Librarianship,2008(8):489-495
20.First U.S Public Access Policy Made Permanent.〔2012-01-01〕.http://www.taxpayeraccess.org/issues/nih/first-us-public-access-policy-made-permanent.shtml
21.力學所機構知識庫(IMECH-IR)開通通知.〔2012-01-01〕.http://tszc.imech.ac.cn/info/detail.asp?infono=12533
22.余豐民.大學機構知識庫資源建設對策研究.浙江樹人大學學報,2010(3):93-95
23.TOP 20 Most Accessed Documents.〔2012-01-01〕.http://repository.ust.hk/dspace/top20.jsp
24.喬歡,姜穎.機構知識庫內容建設現狀及思考.圖書館工作與研究,2011(12):67-70
25.吳常青,葛曉凡.機構知識庫建設與大學圖書館服務體系新拓展.情報探索,2008(7):10-12
26.陳東韻,黃如花.開放存取信息資源的知識產權保護現狀.圖書情報工作,2008(12):17-19
27.郎慶華.學術機構庫自存儲資源的質量控制策略探析.情報雜志,2009(2):179-183
28.蔡迎春.分布式機構庫的質量控制.圖書情報工作,2008(7):44-47
29.香港理工大學機構知識庫.〔2012-01-01〕.http://repository.lib.polyu.edu.hk/jspui/
30.張云瑾.臺灣地區機構知識庫建設特點及其啟示.福建師范大學學報(哲社版),2010(4):56-59