吳群
(南京工程學院 圖書館,江蘇 南京 211167)
高校機構知識庫構架探究
吳群
(南京工程學院 圖書館,江蘇 南京 211167)
機構知識庫是學術研究機構依托互聯網而建成的一種學術文獻數據庫,文章分析了高校建立機構知識庫的意義及優勢,并就如何構建高校機構知識庫進行探討。
機構知識庫;開放存取
1.機構知識庫的概念
機構知識庫(IR,Institutional Repository)是基于開放存取(OA,Open Access)的理念,學術研究機構依托互聯網將本機構成員所產生的各種數字化內容進行收集、整理、組織、標識、索引,以開放性和互操作性為原則,實現對數字學術資源的永久保存和廣泛傳播而運行的一種信息資源管理和服務系統。美國SPARC資深顧問Raym Crow則認為機構知識庫是收集并保存單個或數個大學、科研機構知識資源的數字化資源集合。[1]筆者認為,機構知識庫是以網絡為依托,以收集、整理、保存、檢索和提供利用為目的,以本機構成員在工作過程中所創造的各種數字化產品為內容的學術文獻數據庫。
2.機構知識庫的特點
(1)機構性。IR的建設主體和收藏的地域界限是特定的機構,即它的建立和運行是以機構為軸心和主線的,在這一點上區別于學科或專題的知識庫。這里的機構既可以是實體的,如一個大學或研究機構,也可以是虛擬的,如虛擬聯合實驗室等。
(2)多樣性。由于許多IR僅提供一個學術信息交流平臺,對其中具體交流的信息只有內容質量或格式上的限制,而沒有形式方面的限制,所以IR收藏的資源類型多樣,有正式發表的學術著作,也有尚未發表的預印本;有人文社會科學的內容,也有自然科學的內容。[2]從出版的形式上看,IR主要包括機構內產生的科學成果如:學術報告、技術報告、工作報告、學術論文、會議論文、多媒體和視聽資料、課程資料、教學課件、實驗數據等。
(3)互操作性和開放性。這也是機構庫的優越性,要保證與其他機構知識庫之間的互操作,保證知識庫中的內容能夠被機構之外的用戶方便地訪問和使用,并且能夠有效地存取其他機構的知識庫的內容。
(4)積累性和永久性。IR中所收錄的知識資源是長期保存且不斷累積的,這就保障了IR資源的完整性與系統性,并可永久獲取,IR以此來實現知識的記憶與傳承。
除了以上四點之外,數字化與網絡化、內容的學術性、綜合性與動態性、社區驅動與聚集等也是機構庫的獨特表現。
1.有效捕獲并永久保存數字化學術資源
高校教師與科研人員普遍運用計算機處理各種信息,從而產生了大量的原生數字化學術知識產品,它們是各高校和科研機構重要的學術資源。而這些學術資源大都保存在個人或者院系的電腦上,個人電腦的存儲容量有限,這些原生數字信息資源就會隨著時間的流逝而丟失。隨著計算機存儲技術的發展,若干年后,可能不為新的軟件支持,因此,需要為這些原生數字信息資源提供一個永久保存的安全場所。另外,把分散的學術資源有效集中起來,把不同格式的數據按照統一標準格式進行加工整理、集中存儲、統一管理,為以后用戶方便快捷地利用奠定基礎。
2.實現學術資源的開放獲取
在校園聯網的環境下,利用高校IR中豐富的教學信息資源可以提升教學效果。學生可以利用IR中的課件進行學習,教師可以通過IR進行交流,完善教學課件和教學方法。由于各高校之間、各院系之間、各教研室、實驗室的物理位置和科研活動的相互獨立,造成彼此對相互之間的研究情況和研究成果互不了解,在教學、科研的溝通與交流上存在障礙。構建IR可將各高校、各院系、各教研室、實驗室、個體研究者的相關資料和學術研究成果存儲下來,在一個共用的網絡平臺上發布,同時提供無障礙瀏覽與檢索,這樣可以進一步促進相互間的學術交流,提高教學質量和科研水平。
3.擴大機構的影響力,提升知名度
IR不僅可促進學術交流,促進學術機構教學、科研水平的提升,更為重要的是,它能展示學術機構的綜合實力,集中反映學術機構的科研水平,展示其在科學研究、技術應用、教育教學、經濟和社會發展等方面的成就,這些學術成果可以通過互聯網免費下載,提高學術成果的被引用率,從而提升這個機構的知名度。[3]對于想要提高影響力的高校來說,建立IR無疑是一個好辦法。
1.利用校內的網絡資源
校園網是一個具有寬帶通路和交互功能的專業性局域網,具有教學、科研、管理和通訊等功能,它使我國高等教育管理向智能化方向發展。目前我國的高校校園網已成為了國家信息網絡的重要組成部分,在學術信息資源、人力資源、研發能力等方面具有明顯的優勢。[4]
高校的IR一般都設在校園的局域網內,便于高校的科研人員向本機構提交學術研究成果以及在知識庫內瀏覽、下載學術信息。
2.利用高校豐富的智力產品
高校不但是一個培養高級人才的機構,還是一個學術研發中心。高校內產生的大量原生數字化學術知識產品,例如:已發表或未發表的期刊論文、學位論文、會議論文、科技報告、數據庫、重要學術會議的演示文稿、科研項目數據資料及具有學術價值的多媒體資料等,這些都是高校重要的學術資源。但是,這些學術資源還分散在廣大教學和科研人員手中,沒有得到系統、完整的保存,學術交流和應用狀況也不盡如人意。通過建立高校IR,能為系統、完整地保存這些學術資源提供一個安全場所,完整展示其學術研究成果,并能給本校乃至全球的用戶提供一個交流與溝通的平臺。
3.利用高校圖書館豐富的數字化信息資源收集管理的經驗
高校圖書館員具有熟練的專業技術和獨特的專業服務意識,特別是在高校數字圖書館的建設中積累了豐富的經驗,最適合承擔IR的建設及對其內容實施長期保存的工作,能夠最有效地對知識信息進行組織、加工、發布,其元數據標引、各種資源的整合、各類型文獻信息的檢索和發布均已形成了規范。其與數據庫提供商形成的長期的、全面的良性合作關系,有利于資源的整合和應用。
1.前期準備工作
首先,要考察已經構建IR的高校,學習他們成功的方法和經驗,針對本機構特點進行需求分析,并調查所在高校當前學術論著、作品的發表和存儲方式,計算機網絡及其IT設備資源狀況。其次,在全面掌握相關情況的前提下,要制定嚴密科學的IR建設規劃。在規劃中,要確立一支高水準的建設管理團隊,主要包括:領導者、用戶服務人員、系統技術人員、法律咨詢人員。領導者主要負責項目的推進以及任務的合理分配工作;用戶服務人員主要負責與用戶的溝通和技術支持,特別是對IR內容提供者的技術支持,主要包括IR系統的用戶管理、用戶培訓(包括圖書館員、IR內容提供者和終端用戶的培訓)、協調管理IR內容的提交等;系統技術人員主要負責IR系統的技術方面的工作,主要包括IR系統開發、各種技術問題的管理、系統技術培訓等;法律咨詢人員主要負責解決IR建設中的法律問題。[5]最后,要根據IR的建設規劃明確資金的落實,要取得學校領導和相關職能部門(教務處、科研處、研究生處等)的理解和支持,以保證IR建設的順利進行。
2.內容建設
建設IR的重點和難點就是內容建設,主要包括信息資源的收集,即內容獲取將是困擾機構庫發展的最大難題,科研人員與教師的參與是成功的關鍵。這就需要我們從以下幾個方面來著手,使IR的內容建設及質量控制有所保障。
(1)廣泛宣傳
目前國內大部分用戶對IR還不甚了解,即使是對IR有所了解的人,同樣存在各種疑慮。因此,有必要積極宣傳,使教師與科研人員提高對IR的認知度和認可度。如荷蘭的“科學奶酪”項目,就是為了提升高校教職工對機構知識庫的參與和認同。我們的具體做法可如下:高校可在校園網首頁設立專欄,使用戶在訪問校園網站時即可了解到相關知識,也可在日常的用戶培訓、文獻檢索課中介紹有影響力的IR及其使用方法。
(2)內容來源保障
加拿大的M.Kathleen Shearer指出:“資源提供者的輸入行為和機構知識庫的利用率是決定機構知識庫成功的兩個重要因素”,[6]可見內容的來源是機構知識庫內容建設的重點之一,筆者認為可通過以下三個政策措施使內容的來源有所保障。
1)實施強制提交政策。通過科研處、研究生院等主要學術成果產出單位出臺相關強制提交政策:如研究生院可規定所有研究生必須向IR提交學位論文,科研處可規定所有科研人員及工作人員必須按時將科研成果及業務工作資料及時交到IR,所有科研項目結題必須向IR提交課題成果等。強制政策是在建設IR最初階段最為直接、有效的一種方式。比如,丹麥要求大學將其科學出版物都提交到丹麥的“國家科研數據庫”中;比利時的機構倉儲的倡導者向國會議員建議讓IR成為權威機構決定給大學不同投資的唯一參考標準。
2)實施協助提交政策。主要應用在學術機構內部,存儲管理機構收集到作者的知識成果并跟作者直接聯系,獲得作者的許可,由機構代為把作者的知識成果上傳到IR,包括知識成果的整理、格式的轉換、提交的程序完成等。
3)實施自愿提交政策。用戶通過“自存檔”形式將自己的研究成果通過IR提交平臺,提交到本機構知識庫,并且對研究成果進行元數據標引。可以自由地向庫里提交自己有價值的學術成果,并可以免費在庫中檢索和下載其他用戶的文章,也可以對文章發表自己的看法。
(3)內容質量保障
在構建IR過程中為了避免毫無價值的信息混入機構知識庫中,影響IR主體的參與,必須建立包括內容質量和元數據質量在內的IR質量控制機制,并對不同類型的信息資源有不同的質量評定方法。如在院系中選擇學科專家組成審查小組進行實質內容審查。建立校內成果專家評審或同行評議制度,確保IR的學術質量。
(4)數據標準化保障
標準規范是IR建設的生命,IR建設者應根據不同提交方式設專人(學科館員、院系聯絡人)審查元數據,并完善提交表單設計,如可增設分類表和主題詞表鏈接、實時給出反饋信息和修正建議等。
3.構建工具及技術
根據國際組織OSI(Open Society Institute)提供的一份指南,目前比較成熟的IR軟件主要有DSpace、Eprints、Fedora等。這些軟件都可以免費下載、升級和重新分發,并且嚴格遵循OAI元數據收割協議OAI-PMH2.0版。[7]
DSpace是一個開放源碼的軟件平臺,由麻省理工學院圖書館(MIT)和惠普實驗室(HP)聯合開發,最新版本為DSpace1.2。DSpace的代碼均用Java語言編寫,可以運行于所有UNIX系統,采用對象—關系型數據庫管理系統PostgreSOL管理相關數據,使用DC元數據標準,且具有完備的元數據體系,包括管理元數據、結構元數據和描述元數據。DSpace有三個界面,分別服務于系統管理員、資源提交者和查找信息的終端用戶,具有很強的靈活性和可定制性。目前已有51個國家的307家機構使用DSpace系統。我國廈門大學圖書館、浙江大學圖書館、香港大學等機構正在使用該系統構建自己的IR。
Eprints是最早的IR構建工具,也是第一個遵循OAI協議的IR軟件,由英國南安普頓大學開發,最新版本為Eprints2.3。Eprints代碼用Perl語言編寫,運行于Linux、GNU或Solaris系統,采用MySQL數據庫管理系統,它的元數據格式也是DC。Eprints可自動完成提交資源的完整性檢驗,并備有緩沖區,使提交的資源在正式進入知識庫前受到編輯的檢驗。目前已有248個知識庫使用Eprints軟件,Eprints成為眾多IR軟件系統中使用最多、分布最廣的軟件。
Fedora系統由弗吉尼亞大學和康奈爾大學共同開發實施,當前版本為Fedora TM2.0。Fedora代碼是用Java語言編寫, 運行于 Windows2000、NT、XP、Solaris和 Linux系統,也是采用MySQL數據庫管理系統。Fedora的內容均是使用元數據編碼與傳輸標準 (METS)的擴展版本存儲的,每個對象都有一個DC記錄,可以供OAI收割器獲取元數據。
[1]李楓林,趙雪芹,胡吉明.機構知識庫:開放獲取的有效實現形式[J].情報雜志,2007(6).
[2]薛青林.國內機構知識庫建設的問題和對策[J].圖書館建設,2009(5).
[3]袁順波,董文鴛,李賓.西方機構庫研究的現狀及啟示[J].圖書館雜志,2006(8).
[4]楊勇,張建中.機構知識庫的構建與高校圖書館的工作創新[J].圖書館理論與實踐,2009(1).
[5]連書勤,熊莉君.試論如何構建高校機構知識庫[J].科技廣場,2009(6).
[6]宛玲,蘇娜,厲志紅.大學機構知識庫組織管理問題研究[J].圖書情報工作,2008(4).
[7]徐速.機構知識庫[J].圖書館理論與實踐,2008(1).
(編輯:金冉)
G258.6
A
1673-8454(2011)05-0030-03