摘要:開放存取成為趨勢,國外機構庫發展迅速,我國發展緩慢。文章從開放存取、知識產權、資源收集等方面剖析我國機構庫建設面臨的困難,并給出對策。此外,分析了在新條件下,圖書館所面臨的機遇和挑戰。
關鍵詞:機構知識庫 圖書館 資源收集 質量控制 IR
中圖分類號:G250.74 文獻標識碼:A
文章編號:1004-4914(2009)10-013-03
開放存取(Open Access,簡稱OA)是國際科技界、學術界、出版界、信息傳播界為推動科研成果利用網絡自由傳播而發起的運動。近來出版機構的兼并和商業化,期刊價格大幅提高,阻礙了學術交流和科研發展。幸運的是網絡技術不斷成熟,web應用日益廣泛,通過網絡開放存取,學術成果可以無障礙地進行傳播,任何研究人員可以跨越時間和空間的限制免費獲取和使用學術成果。而現在圖書館討論的熱點機構庫,則是圖書館界開放存取的主角。{1}
對于機構庫,迄今為止仍沒有一個統一的定義。比較普遍的定義是:機構庫(Intutitional Repository),是以搜集、組織、存儲學術機構(大學、大學共同體等)相關數字知識資源為主要任務,并將其中絕大部分資源對任何網絡用戶免費開放的知識庫。{2}機構庫采用了開放存取的理念,機構內的智力成果進行數字保存,對資源進行全面的整合,提高資源的利用效率和社會影響力,促進學術發展和社會進步。機構庫可以存在于特定的機構之內,亦可以在機構之間實現共享,甚至實現全球機構資源共享。機構庫仍處在新生階段,比較大的事件是:2000年惠普公司斥資1800萬美元,與麻省理工學院(Massachusetts institution of technology, MIT)合作開發DSpace;2001年,俄亥俄州立大學的行政官員和該館館長布蘭寧(Joseph J.Branin)在探頭開發遠程教育體系時,提出建立俄亥俄州立大學知識庫,以保存該校師生員工的數字資源,這也成為機構庫最初的雛形。{3}而2002年Dspace的正式面世,推動力機構庫的蓬勃發展,許多機構使用Dspace作為平臺,建立了自己的機構庫。在世界范圍內,機構庫如雨后春筍,迅猛發展。根據著名機構庫登記機構Registry of Open Access Repositories(ROAR)的統計結果顯示:截至2008年9月,在此機構全球機構庫已經增加至1145個。
一、國內機構庫發展現狀
國外機構庫的蓬勃發展,而我國機構庫發展較為遲緩。現正處于摸索探討階段,真正的實施應用發展還不夠。比較有名的是:我國香港科技大學圖書館機構庫(HKUST),{4}它于2003年2月正式啟用,一次性批量收錄了首批105計算機科學技術報告。到2006年9月此機構庫已經收錄了42個不同學術部門的2369份資料,其中包括預印本,技術報告、工作文件、會議論文、期刊文章、演講、書籍章節、專利、論文和博士學位等,機構庫中資源格式大多為PDF和PPT格式。2005年9月至2006年8月期間,這些學術資源就被檢索使用了69000多次。其中一份關于香港學生怎么學英語的研究資料,更是一個月的下載次數就達到了800次。
在國內,其它的機構庫還有,例如:圖書館情報學開放文庫、中國預印本服務系統、奇跡文庫等。這些機構庫規模都比較小,無論從資源的數量和質量上都難有保證,沒有真正實現開放存取的目的。國內機構庫發展,還有很長度路要走。
二、國內機構庫發展存在的問題及解決策略
借鑒國外機構庫的發展史和成功實施經驗,結合我國的國情特點。機構庫在我國發展緩慢是有其原因的。我國機構庫的建設發展面臨著以下幾大難問題:對開放存取認識不足,缺乏相關政策及法律支持;資源收集范圍問題;資源收集模式問題;涉及的知識產權問題;機構庫資源內容質量控制問題等。以下筆者就每個問題作具體分析,并給出解決策略。
1.對開放存取認識不足,缺乏相關政策及法律支持開放存取(Open Access 或OA)起始于20世紀90年代,是以削弱出版社的權勢,恢復研究成果的公共品性質而發起的,是美國研究圖書館協會為了對抗學術信息流通危機和高價商業性學術期刊而使用的一個概念。{5}開放存取采取“作者付費出版,讀者免費使用”的網絡出版模式,因其具有出版成本的經濟性、信息傳播的時效性、獲取使用的便捷性、成果擴展的廣泛性等多方面的優勢,得到了世界各國的廣泛認同和諸多研究人員的推崇。
與傳統出版模式相比,開放存取的信息發布過程簡便、時效性強,利于編輯、作者和審稿人之間的互動;開放存取迎合了科研人員對于信息即時性、復合性和多元性的需求。{6}開放存取在我國發展比較緩慢,關于開放獲取的研究時間也不是很長。沒有自己相應的法律體系和政策,研究也多為借鑒國外的現有成果,開放獲取的理念還沒有深入人心,對于科研人員和大學生而言,觀念仍比較傳統,對于機構知識庫還相當陌生,對于開放獲取了解到也甚少。出版商大多要求在獲得論文印刷版版權的同時獲得電子版(包括網絡、光盤)版權的授權,也不允許作者將論文放于網絡上,部分期刊同時聲明不接收已經在網絡上公開的論文來稿。由此可見,開放存取的理念在我國還沒有真正深入人心。
可喜的是我國在開放存取這條路上雖然起步較晚,但也在實踐中有了初步嘗試,引起了學術界的密切關注。例如,2002年“中國科學數據共享”會議上,徐冠華和孫鴻烈等院士就提出了切實改變我國傳統的科學數據占有觀念,打破信息壁壘,實現科學數據合理公開存取的倡議;2003 年1月,中科院文獻情報中心張曉林博士參加了匈牙利舉辦的“開放獲取與促進學術出版”國際研討會;2004年5月,全國人大副委員長中科院院長路永祥和自然科學基金委員會主任陳宜瑜在北京分別代表各自機構簽署《柏林宣言》(The Berlin Declaration),以推動全球科學家共享網絡資源;在實踐項目上,2004年3月15日開通的中國預印本服務系統(http :PPprep. net.gov.conPeprint) 建立以來引起了較大的影響,很多新的學術研究在上面傳播,利于學術爭鳴。同時具有交流速度快,可靠性較高等特點。
這些實踐都說明我國圖書情報界和科研工作者在這方面進行了不懈的研究。我國要促進機構庫的發展,首先必須從開放存取著手,從以下兩個方向作為突破口。
首先,機構庫的發展必須注重學術信息渠道的暢通和“免費”的問題。而以圖書情報界為主的信息服務機構如何利用因特網最大程度地促進信息自由,是國際圖聯強烈關注的內容。所以我國機構庫的建設必須注重在網絡環境下學術信息渠道的暢通和“免費”的實現。國內最早的導航系統是北大2000年發布的西文電子期刊導航,但檢索功能、服務功能和管理功能都不夠完善。鑒于我國在網絡相關發展的不足,我們有必要借鑒國外的導航系統——TDNET,SERIAIS SOLUTION,EBSCOHOST EJS等,逐漸制作與完善自己的導航軟件。在開放存取的道路上,必須注重在網絡環境下的實現,爭取早日與國際接軌。
其次,我國應該盡早從大局上著手,從政策和法律上對開放存取提供支持。我國的信息主管部門,應統籌規劃,協調圖書館界和其他相關機構,共同討論開放存取模式在我國的實現,盡早出臺相關政策,完善法律環境。
2.資源收集范圍問題。機構庫的建立,必須有資源數量的保證。機構庫原則上要全面收錄各種有用的資源。機構庫建成之后,所面臨的最大挑戰是內容獲取。調查顯示,盡管機構庫采取了各種措施以鼓勵機構成員參與其中,但資源提交率(Submission Rate)仍徘徊在一個較低的水平,{7}機構庫的內容獲取問題始終是困擾機構庫發展的一大難題。機構庫收錄范圍范圍影響著機構庫的發展方向及質量,在一開始,就必須重視機構庫收錄范圍問題。
第一,確定哪些內容需收錄,哪些要摒棄。對于機構庫而已,盡量做到收錄全面的有用資源。但是,在實施中研究成果眾多,必須加以分析本身的特色和文化,確定機構庫的建設目的,明確哪些成果可予以收錄, 哪些不能收錄,并給出便于操作的指導性意見。學術機構的智力產出也并非只有學術研究成果,還有大量的非研究性成果, 如機構的行政文件、重要活動的紀錄、課堂教學所產生的成果等等。自Raym Crow提出機構庫的必要組成之一為學術內容(Scholarly Content)以來,由于學術成果開放獲取的理念的廣泛傳播,導致學術界過分關注機構庫保存和傳播學術機構研究成果這項功能,而忽視了機構庫作為支持機構教育、學習的功能。值得注意的是,機構庫的先導——俄亥俄州立大學知識庫其初衷是為了建立一個遠程教育體系, 并非為實現學術機構研究成果的保存和開放獲取。
第二,誰的研究成果可以被收錄。機構成員的角色形形色色,以大學為例, 其成員包括教師、專職研究人員、研究生、本科生、行政人員等。機構庫并不是誰的研究成果都收錄,必須保證一定的研究成果價值。機構庫建設人員必須明確地給出規定,哪些人員的智力成果可以被收錄。實踐中,往往只有教師、專職研究員及研究生的成果才被許可。而本科生的成果、其他的一般不收錄。但也有很多機構例外,如香港城市大學機構庫, 規定本科生的年終項目及獲獎作品也可被收錄其中。{8}誰的研究成果可以被收錄,主要是從研究成果質量角度考慮,所以不同機構在建設機構庫的過程中,必須從自身時間情況出發,不能盲從。必要時也可以采用例外原則,保證最新最有價值的成果能在機構庫中體現。
第三,機構庫收錄何種類型的資源。機構庫存貯的是電子資源,就必須考慮到資源的格式類型,既要能滿足資源的多種需要,亦要想通用格式標準靠攏。一般而言,機構庫必須支持大部分的通用格式,并能支持一定的資源容量。但在具體實踐中可收錄的資源多種多樣,它可能包括: 預印本(Pre-prints)、后印本(Post-prints)、會議論文、教學材料、學生課程報告、學位論文、項目數據資料、計算機軟件、圖像、非靜態的資源(如影像、聲音文件)等等。機構庫建設者必須從自身的時間情況和通用標準結合考慮,作出相應格式類型規定:如文本資料應選擇何種格式?是microsoft word還是pdf擬或是latex?對于圖像應選擇何種格式?是bmp還是jpg格式等。對于資源容量的大小,考慮到現在數據存貯硬件的飛速發展和以后資源的高質量要求,盡量提供大容量空間。
3.資源收集模式的選擇。機構庫的發展建設,必須要考慮資源收集模式。機構庫要長期地可持續發展,必須保持機構庫的更新,這就和資源收集模式選擇有關。對于資源的收集,可采取的模式有三種,即分布式模式、半分布式和集中式。{9}
分布式模式類似于自存檔(Self-archiving)。特指不經過中間媒介,由資源提供者自己或者委托特定對象,進行資源的存檔。
集中式是指由機構庫指定的人或組織負責資源的上傳。這個限制性比較明顯,只有特定的人和組織擁有存檔權利,且多有機構庫指定負責。
半分布式,是介于分布式和集中式之間的一種模式,是指由機構內的各個單位分別負責協助本單位的資源提供者上傳并管理研究成果。資源提供者將資源提交給本單位負責人,單位負責人集中錄入資源元數據并提交資源。這種模式采取專人提交資源的方式,有利于提高辦事效率, 同時有利于避免分布式模式所出現的元數據不準確的現象。
我國在發展機構庫的過程中,機構庫建設者可根據機構的實際情況,適當地選擇其一或選擇組合模式進行資源的收集。一般而言,如果機構規模較大,宜采用分布式或半分布式;反之,則以集中式為好。機構庫的成熟度也與模式的選擇有著重要的關聯。機構庫建設初始階段,宜采用集中式;當逐步成熟之后,可以嘗試著由集中式向分布式過渡。
4.涉及的知識產權問題。機構庫發展的一個巨大挑戰就是知識產權問題。開放存取本省就強調一個免費的問題。怎么樣盡可能地免費,又不觸犯相關法律——這就必須處理好機構庫中的版權問題。不處理好這個問題,開放存取和機構庫的功能及優點都無法提起。因此在發展機構庫的伊始,我們就要積極協調,從政策法律問題上加以重視,并借鑒國外的相關經驗和成功。
2000年HP斥資與MIT聯合開發機構庫軟件平臺DSpace拉開了機構庫建設的序幕,從此機構庫得到了出版界、圖書館界、教育界等眾多學者的關注。各國紛紛開展機構庫的理論研究和實踐,出現一些專門針對機構庫的版權問題的研究項目。
Science Commons:Scholars Copyright Project 2006年6月,科學共同體Science Commons (SC)正式啟動了學者版權項目。該項目主要包括兩個方面:Open Access Law Program——開放獲取法律期刊原則、開放獲取法律學者聲明、開放獲取出版協議,提供了一系列的文件來幫助法律領域出版的開放獲取,從而為其他學科的開放提供向導;另一個是Science Commons Addendum——提供了三種層次的作者附錄協議(author addenda):CC1.0 Addendum(署名——非商業用途)、Publish Addendum(出版之日就開放獲取)和Delay Addendum(出版后6個月開放獲取)。這些附錄協議體現了作者對自己文章的版權爭取的呼聲,有利于改變出版社一統全局的現狀。目前,SC正在致力于以計算機軟件的形式來幫助作者自動添加這些版權協議。{1}
RoMEO(Rights Metadata for Open archiving) 在英國的聯合信息系統委員會(JISC)的資助下,該項目從2002年8月到2003年7月調查了英國學術團體自存儲的版權問題。
機構庫的一個重要使命就是允許對機構庫的知識資源開放存取以促進學術交流,這就需要知識資源的版權人以許可證的方式將他所希望的部分版權賦予用戶。因此,機構庫的建設者至少應該起草兩個許可協議:一個是機構與資源提供者之間的存儲許可證;另一個就是資源提供者與資源利用者之間的知識共享協議。
首先,許可協議的制定必須尊重已有的權利,不得侵犯已有的權利。如項目研究成果等的版權本來就屬于機構,作者就不能隨意制定CC。開放內容許可協議必須從機構的版權政策出發,區別清不同類型的版權歸屬,并爭取在技術應用平臺上進行實現。
其次,許可協議不能和現有法律相沖突,應該相輔相成,讓法律規范向有利于機構庫的方向發展。開放存取,必須以承認版權法為前提,沒有法律的支持,一切都無法實現。如果沒有法律規范和相應的責任承擔機制,許可協議很可能會被不法分子所利用。
我國在發展機構庫的過程中必須了解到,雖然機構庫的版權許可協議要依各個機構自身的版權規定而定,但目標都是一樣的——促進學術交流,提高機構的影響力。一個清楚明確的版權許可協議不僅可以讓資源提供者放心地將知識資源放在機構庫中,而且也可以讓資源的利用者毫無顧慮地利用機構庫寶貴的學術資源,有效地促進學術交流和文化傳播。
5.機構庫資源內容質量控制問題。機構庫在建設起步的最大問題是資源的收集問題——即前面討論的收錄范圍和收錄模式問題。但在以后的發展過程中,更要做好質量控制保證。機構庫內容的質量影響到機構庫作用的發揮。對機構庫內容的質量進行嚴格的控制, 是保證機構庫得以良性發展的重要手段。
我國在機構庫的長遠發展中必須從預先控制、過程控制和事后控制三方面著手,切實搞好機構庫的內容質量控制。
預先控制主要指在機構庫建設者,通過發布相關規范文件,促使作者對要提交的成果進行質量控制。預先控制主要包括:對作者身份的及專業背景的限定;對權限口令的限制;對資源類型格式限制;對資源元數據格式控制;對知識產權和系統功能的解釋說明等。機構庫應廣泛地對這些規范進行宣傳,讓涉及的成員都能對此有所了解。宣傳的方式可以多種多樣:可以在機構庫主頁張貼通告;亦可采取傳單方式宣傳。預先控制是源頭控制,也是一種比較淺的控制。
過程控制主要指在存檔過程時,系統給出實時反饋信息,達到對資源內容的質量控制。這個要求機構庫建設者,要全面充分考慮各種情況,并給出相應的操作提示和修改意見。過程控制主要體現在對元數據的控制,當盡量減少作者手工輸入的項目,如對于國別、語言、學科分類、資源類型、格式等較規范化的項目,盡量采用從列表框中選擇數據的方法。對于一些非規范化的項目,如姓名、資源中文名稱、英文名稱、關鍵詞、資源描述等宜采用示例并結合字段控件等形式進行同步控制。
事后控制主要指資源以及錄入機構庫以后,采取的一系列質量控制措施。事前控制主要以元數據控制為主,而事后控制主要以內容控制為主。事后控制涉及范圍很廣,可以是作者本人、機構庫管理員,亦可以是讀者。如存在攻擊他人的言論、數據有重復之嫌,格式不夠規范等,管理者可以對作者給出強制性或非強制性的意見。此外,機構庫中資源下載統計和分析,以及讀者的評論,都可以作為有效的質量控制方式。值得提出的是,由于時候控制涉及到資源的修改,所以必須慎重地進行。修改方式有覆蓋和并行模式。大部分情況下,建議采取并行模式,保留歷史版本和信息,且客觀反映資源成果的發展變化。
三、機構庫給圖書館帶來的機遇和挑戰
圖書館在學術發展、知識積累及社會發展進步中扮演著舉足輕重的角色,在機構庫發展的同時,必須考慮圖書館新的機遇和挑戰。
現代高新技術迅猛發展,從開放存取運動到信息共享空間再到機構庫,圖書館受到了前所未有的挑戰,但是我們亦到了圖書館新的發展契機。問題是如何抓住機遇,充分利用現代技術來發展自己的事業。
1.在新的條件下,圖書館的存在仍然是必要的。隨著網絡的不斷發展和人們獲取信息習慣的變化,上網閱讀很有可能成為人們學習的主要方式。但到目前為止,到館閱讀仍大于上網閱讀的頻率,因此圖書館仍有著網絡不可取代的特異性。{10}因為圖書館通過其服務行為,能夠滿足讀者查找資料的需要, 促進讀者的娛樂、教育、科研、經濟等一系列創造價值活動的形成,完善和改善,帶動并影響著社會精神文明和物質文明的實現, 所以說圖書館仍將繼續存在,圖書館永遠是人們交流信息和經驗的最佳場所。
2.圖書館確實面臨著巨大挑戰。機構庫發展給圖書館提出的挑戰主要體現在,一方面是機構庫基于開放的理念,利用各種現代信息技術以及OpenURL、OAI-PHM等一系列開放標準,在短時間內迅速形成相當規模,并朝著全球共享的知識庫的方向發展;另一方面是圖書館由于各方面的原因一直在變革的問題上猶豫不決、徘徊不前,機構庫的發展給圖書館在信息服務、學術交流中的地位帶來了強有力的挑戰,一旦圖書館不再思變革,即使調整自己的位置,體現出自身具有的優勢,本已受到出版商、信息服務商沖擊的圖書館很有可能面對前所未有的危機。
3.機構庫亦帶來了巨大的機遇。機構庫的出現和不斷發展,有利于減少期刊出版商都壟斷,在一定程度上遏制期刊價格上漲的勢頭,緩解圖書館經費短缺的壓力,同時可以趁機提示圖書館的自主能力,減少對傳統出版業的依賴性,拓寬圖書館的發展空間。此外,機構庫中還包含大量傳統期刊所沒有的學術資源,圖書館如果能將機構庫與傳統學術體系相結合,不僅有利于擴大館藏范圍,還能促進圖書館服務水平的提高,更好為讀者提供全面而優質的服務。
4.圖書館的的應對策略。圖書館必須調整定位,尋求新的發展空間。同時,更要積極和新的技術結合,應該采取更加開放的態度,積極與網絡工程師合作,利用適應互聯網的先進技術及現有成果, 更好地為知識資源管理與服務提供技術及環境支撐。{11}一方面,要整合資源,義不容辭。圖書館擁有豐富的信息資源無疑是網絡中的寶貴資源,但無需的信息只會讓用戶淹沒在信息的海洋中而無法找到所需信息,機構庫的出現讓圖書館認識到整合信息資源的重要意義,同時圖書館經費短缺壓力大減少,使得圖書館有更多的人力、財力、物力進行資源的整合,為圖書館提高信息水平奠定基礎。另一方面,要積極參與機構庫的建設,實現互助互贏。當前,圖書館在數字圖書館的研究和實踐中,有很多思路和機構庫不謀而合。因此,圖書館應積極參與IR的建設,利用其在信息組織、信息標引等方面的專業優勢及數字圖書館建設中的經驗教訓,參與IR的建設,還可以學到最新的信息技術,全新的信息服務模式,促進圖書館的創新,提高整體服務水平。
四、結束語
正如聯想集團CEO張后啟先生所說, 一個知識庫和一個垃圾庫之間只有一步之遙。我國機構庫在建設中數量固然重要,但更要注意質量的保證。在構建中,必須處理好上述提及的種種問題。這樣保質保量的機構庫,才能起到它應有的作用。事物發展道路是曲折的,前途是光明的。我國在公開存取新技術上已經落后了國外一大段,所以我們更要借鑒國外的成功經驗,踏踏實實,逐步解決遇到的問題。圖書館在其中扮演著重要角色,圖書館要正視機遇和挑戰,調整定位,主動配合,積極參與,為我國機構庫的建設作出應有貢獻。
注釋:
{1}張俊玲.機構知識庫建設中存在的問題及對策[J].湖湘論壇, 2007(3):60—61
{2}董文鴛,袁順波.聚焦學術機構知識的中心:機構庫(Institutional Repository)探析.圖書館雜志,2005,24(8),51-55,59
{3}Sally A.Rogers.Developing an Institutional Knowledge Bank at Ohio State University:From Concept to Action Plan.Libraries and Academy,2003,3(1):125-136
{4}Ki-Tat Lam,Diana L.H.Chan.Building an institutionalrepository:sharing experiences at the HKUST Library.OCLC SystemsServices Vol.23 No.3,2007,pp.310-323
{5}喬冬梅.國外學術交流開放存取發展綜述[J].圖書情報工作,2004 (11)
{6}查麗華.開放存取——開啟學術信息交流的快捷之門[J].國家圖書館學刊,2007(1)
{7}Leslie Chan.Supporting and enhancing scholarship in thedigital age:The role of open-access institutional repositories[EB/OL].http://eprints.rclis.org/archive/00002590/01/Chan_CJC_IR.p df,2006-05-20
{8}Run run shaw library.About CityU institutional repository[EB/OL].http://www.cityu.edu.hk/lib/digital/ir/about.htm,2006-05-12
{9}郭少友.機構庫建設的若干問題研究.中國圖書館學報,2006(1)
{10}張靜琳.Google還是圖書館.21世紀經濟報道[EB/OL].[2006210216].http://media.esms.com.cnP21sjjjP309yuandan/Content/dir/sy
2101htm
{11}吳建中.圖書館VS機構庫——圖書館發展戰略的再思考[J].中國圖書館學報,2004(5):528
(作者為上海大學國際工商學院情報學研究生 上海 200444)
(責編:若佳)