□張軼雯 韋成府 崔海媛
?
北京大學圖書館學位論文系統建設的新探索
□張軼雯 韋成府 崔海媛
以讀者需求作為根本導向一直是北京大學圖書館的技術發展路線,該文介紹了始于2001年的學位論文數字化建設:包括2600多篇燕京大學論文,3萬多篇2000年以來的北京大學碩士、博士研究生學位論文全文,旨在從學位論文發布流程、知識產權保護、傳統借閱和開放獲取服務、用戶統一管理、結合OPAC技術等方面闡述北京大學圖書館學位論文系統建設的新探索,以期為國內外同行提供借鑒。
學位論文 學位論文系統 知識產權保護 開放獲取 創新服務 高校圖書館
隨著網絡技術的發展,互聯網已經成為人們獲取知識和交流信息的重要渠道。學位論文電子版的使用與保存比印刷版更方便、更快捷。本文對中國大陸高校學位論文工作的現狀進行了分析,并以北京大學圖書館為例闡述了學位論文的工作流程,以及學位論文系統建設的新探索。
2000年以來,高校圖書館相繼開始通過互聯網提交電子版學位論文,并建設了學位論文全文數據庫。經過十幾年的發展,學位論文初期工作中出現的一些問題基本上都得到了解決,并逐漸規范、趨于成熟。但是隨著信息技術的不斷發展,學位論文工作中又出現了一些新問題,主要體現在以下幾個方面:
1.1 電子版學位論文的上傳格式問題
2003年,CALIS對全國高校圖書館的學位論文工作進行了調查,調查顯示,圖書館要求學位論文電子版提交的格式有4種:DOC、PDF、WPS和LATEX[1]。隨著個人電腦的普及和計算機技術突飛猛進的發展,越來越多的人開始使用Microsoft Office的文件編輯器,隨著Microsoft Office的不斷升級,DOCX格式文件成了新的主流的電子學位論文提交格式之一。同時,越來越多的人注重自己的版權而選擇pdf作為提交電子版學位論文的格式,PDF生成的版本頻繁升級,也產生了新的文件格式。因此,學位論文系統應及時支持新文件格式的提交,并解決加密、發布等相關問題,確保學位論文工作能夠順利進行。
1.2 學位論文的版權問題
在這個信息大爆炸的時代,互聯網拉近了人與人之間的距離,成為了人們獲取各種信息的主要來源,由此信息似乎變得十分“廉價”。隨著時代的發展,版權意識開始逐漸進入到社會的方方面面。學位論文作為高校獨一無二的重要學術資源之一,特別是民國時期的手稿,如燕京大學學位論文,則更加珍貴。因此,如何獲取學位論文全文,為教學科研所用,同時又保護學位論文的版權,成了學位論文建設的重點之一。
1.3 開放獲取問題
隨著互聯網在各個領域的發展壯大,已經成為了一個重要發展方向,越來越多的實驗數據、灰色文獻等非正式出版的學術資源在網上公開。學位論文作為高校圖書館的重要資源,具有較高學術性和傳承性,利用網絡技術和計算機技術,及時、全面地揭示學位論文的學術價值和貢獻,實現開放獲取,成為必然。涉及到保密和版權等問題,學位論文的全文獲取仍然是比較難以突破的瓶頸,實現學位論文的開放獲取成為高校圖書館今后的奮斗目標。
2.1 北京大學學位論文系統的工作流程
北京大學圖書館對學位論文電子版的收集工作已經開展了十幾年了,平均每年學位論文的提交量為3200篇左右,并持續增長。由最初的軟盤收集、光盤存儲方式變為通過學位論文提交系統收集,按年進行歸檔,以服務器備份的方式進行學位論文收集和長期保存。目前的具體工作流程如圖1所示。畢業生首先登錄北京大學圖書館學位論文提交系統進行在線的元數據錄入和電子版學位論文的提交,提交后由圖書館的審核老師對提交內容進行審核,接下來收繳紙本論文,進行編目,然后開展全文數字加工和發布工作。上述工作完成后,還需將發布平臺的數據轉換為marc導入本館的OPAC系統中,提供檢索服務。最后,每年將學位論文進行備份歸檔、長期保存。

圖1 北京大學學位論文提交至保存的工作流程圖
2.2 北京大學學位論文庫的知識產權保護
北京大學圖書館通過系統的數字版權保護(Digital Rights Management,DRM)技術和政策兩個方面來對學位論文進行版權保護。對于紙質版學位論文采取了“到館閱讀、部分復制”的版權維護方式;對電子版學位論文采取了“論文加密、校內全文、校外部分”的版權維護方式:用戶在校園網IP范圍內訪問“北京大學學位論文庫”獲取全文,不在范圍內的則可以閱讀每篇論文的前16頁。“北京大學學位論文庫”將電子版學位論文轉換為CEB格式后再發布,采用DRM隨機密鑰對數字內容進行加密,隨機密鑰由服務器保存和管理,客戶端必須得到授權后才能使用數字內容,實現了對CEB格式文件的控制,包括展示權利(如顯示、打印等)、傳輸權利(借閱)和使用權利(如摘錄),防止數字內容的非法復制。在實踐中發現,政策定制和技術手段相結合,不僅使學位論文資源得到了有效使用,同時也實現了版權保護。
2.3 北京大學學位論文庫的開放獲取
北京大學圖書館自2000年開始收集學位論文電子版,并建立了北京大學學位論文庫,結合CALIS學位論文項目,對項目的參建館開放了北京大學學位論文庫的元數據,以及每篇論文的前16頁內容,并提供館際互借服務。但由于學位論文的原創性和獨特性,學位論文全文庫的建設是在共享資源的同時,對其進行了一定的版權保護,有限制地實現了開放獲取,也為今后能夠完全實現開放獲取奠定了基礎。
為給讀者提供更加合理便捷的服務,在學位論文系統建設與服務過程中,北京大學圖書館通過技術與服務創新,不斷改進學位論文服務。
3.1 學位論文電子版提交文件格式的擴展性
目前,本館使用的是自主開發的方正Tasi系統。使用過程中,筆者發現系統對學位論文電子版文件的處理存在格式兼容問題。雖然DOCX格式的文件可以被轉換為DOC格式,但是部分轉換后的文件包含了一定的錯誤信息,導致在審核時不能通過,給學生順利畢業帶來了一定延誤。同時在對轉換后的文件進行加密時成功的幾率也比較低。為了在最大程度上減少因提交文件格式而造成不能及時通過審核這一問題,升級后的提交系統中支持了DOCX格式和生成版本為1.4以上的PDF格式電子版學位論文的提交。為了保障電子版學位論文的及時發布,采取了“線下轉換”這種折中方式,流程如圖2所示。首先通過腳本獲取待轉換論文的信息,將結果保存至excel表中,包括論文的源路徑、轉換的目標路徑、論文在數據庫中的PaperID,然后在excel表中生成拷貝文件的bat腳本;第二步,執行第一步中的bat腳本,將服務器上的電子版學位論文拷貝到本地計算機,同時每一條數據都生成兩個job文件(一個前16頁job文件,一個全文job文件);第三步,在本地執行job文件來對電子版學位論文進行批量格式轉換和前16頁的生成工作;第四步,將格式轉換后的全文和前16頁文件復制到服務器相應的目錄;第五步,更新轉換成功的論文在數據庫中的信息。

圖2 線下轉換流程
通過“線下轉換”這一方式,及時將數據發布到學位論文全文庫中,保障了相關工作的順利進行,使讀者用戶能夠盡快獲得學位論文全文。
3.2 燕京大學學位論文的管理與服務
燕京大學是中國近代著名的教會大學之一,在1952年全國高等院系調整中并入北京大學。燕京大學的辦學歷史雖然不長,但是培養了大批精英人才,保存下了許多珍貴的學士和碩士論文,大部分為手稿,更不乏當代名家的手跡,具有很高的學術研究價值和收藏價值。北京大學圖書館于2010年將燕京大學學位論文作為特色資源劃到特藏部,按其分類排架特點分配了館藏號,對最初的編目卡片也給予了妥善整理和保管[2],并完成了大部分論文的編目和數字化,建立了燕京大學學位論文特色庫。燕京大學學位論文采取方正DESI系統進行元數據編目及掃描后的加密,發布在方正Apabi數字資源平臺上。作為珍貴特藏資源,燕京大學學位論文可在北京大學校園IP范圍內閱讀全文,若不在校園IP范圍內則僅能查看元數據。
3.3 與OPAC系統、發現系統相整合
在學位論文數據庫的建設初期,我們就考慮到將其與聯機目錄檢索系統的數據整合,從而自主開發了marc數據轉換工具,成功地將轉換后的marc數據導入OPAC系統,并逐年增加。用戶可以通過OPAC一站式檢索,更方便地獲取學位論文。下一代資源發現與獲取系統已經得到我國高校圖書館的重視,北京大學圖書館作為中國大陸第一家使用Summon發現系統的高校圖書館,已經對本館的多種資源進行了數據優化和整合,其中就包括多個自建的數字特藏和館藏書目數據[3]。目前,用戶可以通過“未名學術搜索”檢索北京大學學位論文的元數據。近期,還嘗試將燕京大學學位論文的數據與“未名學術搜索”整合。
3.4 統一用戶管理與畢業離校系統
學位論文電子版的提交是畢業生在畢業前必須進行的環節。電子版學位論文在提交后必須經過審核并通過后才能畢業。以往畢業生離校,需要轉單,即到學校多個部門現場辦理手續,并蓋章為證。由于受場地限制和其他方面的原因,往往離校手續的辦理集中在最后一周,給圖書館學位論文的審核工作和學位論文提交系統都造成了較大壓力。同時在畢業離校的整個期間,畢業數據不能及時共享,容易出現紕漏。為改變這種情況,畢業生離校由傳統的轉單方式變為使用畢業離校系統辦理離校手續,在明確的流程指導下完成辦理。在離校系統的建設過程中,圖書館提供了學位論文狀態查詢的相關接口,并與學校IAAA認證相結合,學生可通過校園卡賬戶登錄離校系統,查詢學位論文的審核情況。同時,圖書館也可在離校系統的后臺查看全部畢業生的學位論文提交情況及審核狀態,隨時關注學位論文提交工作的進展,為畢業生提供方便、高效、一站式的離校服務,加強學校各相關部門的信息共享和工作配合,使畢業離校工作更為規范、有效和有序,促進學校管理質量和服務水平的提高。
3.5 建設機構知識庫的嘗試
隨著開放獲取的理念被越來越多的科研機構所認可,機構知識庫作為開放獲取的模式之一處于迅速發展之中。2011年, CALIS管理中心與北京大學圖書館聯合開展的中國大陸高校圖書館機構知識庫建設現狀的調研結果顯示,我國大陸高校的機構知識庫建設在認識理念、政策支持、技術平臺、標準規范等各方面都較為薄弱,需加速發展[4]。北京大學圖書館于2013年7月正式發布了“北京大學機構知識庫(Beta版)”,其作為北京大學學術研究的基礎設置,為北京大學教師、科研人員和學生的學術研究和學術交流提供系列服務,包括存檔、管理、發布、檢索和開放共享。學位論文作為具有較高參考價值的科研學術資源,應該在機構知識庫中實現開放獲取,我們已開始對學位論文的開放獲取做準備。即在對各分館進行調研和與學位論文工作相關部門討論的基礎上,使用北京大學機構知識庫系統來收集、揭示本科學位論文。
北京大學圖書館的學位論文數字化建設已經開展了十幾年,形成了較為成熟的工作流程、數據規范和服務,取得了一些顯著的成效,對于由于技術不斷發展而產生的新問題也能夠及時有效地解決,保障學位論文的利用。然而,學位論文系統仍存在一些值得改進的地方:1)學位論文數據的發布存在一定時間的滯后,不能及時地為教學科研提供服務,今后將在工作流程上不斷改進;2)將北京大學學位論文庫與移動閱讀技術結合,讓用戶能夠使用移動端在線閱讀學位論文全文;3)鑒于學位論文涉及保密和版權等問題,現階段完全開放各高校學位論文的時機還不夠成熟,實現開放獲取是今后努力的方向。
1 張學宏.論高校圖書館電子版學位論文的保存與管理工作——以北京大學圖書館為例[J].圖書情報工作,2005, 49(5):113-115
2 張麗靜.燕京大學學位論文的印本收藏與特色庫建設[J].圖書館建設,2011(6):39-40,56
3 朱本軍,聶華.對下一代圖書館界面的探索與實踐[J].大學圖書館學報,2010(4):5-9
4 聶華,韋成府,崔海媛. CALIS機構知識庫:建設與推廣,反思與展望[J].中國圖書館學報,2013(2):46-52
The Innovation and Application of Peking University Library Dissertation System
Zhang Yiwen Wei Chengfu Cui Haiyuan
With reader’s demand as the first consideration, Peking University Library is committed to enhance user experience always. This paper firstly gives a brief introduction of the construction of digital dissertations collection from 2001, which includes Yenching University dissertations and the Peking University dissertations in full text. Secondly, it describes the past, present and the future dissertation work in details. Finally, it addresses the issues of intellectual property protection, traditional lending services, open access, and unified user management in the process of electronic dissertations publishing, with Hope to provide reference for domestic and foreign counterparts.
Dissertations; Dissertation System; Intellectual Property Protection; Open Access; Innovative services; University Library
北京大學圖書館,北京,100871
2014年7月11日
*通訊作者:張軼雯,ORCID:0000-0002-4633-4095,zhangyw@lib.pku.edu.cn。