陳利華 常 紅
(山東工商學院圖書館,山東 煙臺 264005)
山東工商學院原名中國煤炭經濟學院,建校20余載一直致力于煤炭經濟和山東半島經濟的研究,目前形成了“管理學科見長,煤炭經濟研究見強,半島經濟研究見優”的學科特色與研究優勢。現有煤炭經濟研究院、半島經濟研究院兩個省級科研人文社會科學研究基地,伴隨著低碳經濟、半島藍色經濟區、環渤海經濟圈的發展,相關信息需求持續增加。圖書館根據學校特色服務需要和自身資源優勢,借鑒其他高校特色數據庫建設和使用經驗,以煤炭經濟研究院和半島經濟研究院的研究成果為積淀,整合煤炭經濟和半島經濟相關數字資源,建立面向用戶的特色資源服務平臺。2011年5月以“煤炭經濟特色文獻庫”和“山東半島經濟特色文獻庫”為題,成功獲批教育部“211”工程高等文獻保障系統(CALIS)三期“專題特色數據庫”子項目立項(指導性項目)。
特色數據庫的建庫目的是為了服務煤炭經濟和山東半島經濟的研究,服務于學科建設。在此項目未立項之前,也就是2008~2011年的4年間,圖書館已經與兩家研究院以及相關學者達成共識,準備自建特色數據庫。圖書館多次邀請兩家研究院的專家、相關學科帶頭人及教授學者進行探討交流,特別針對特色庫建設中的資源采集、資源涵蓋和發展方向及資源共享進行了詳細的研討。預期建設項目涉及的文獻類型包括電子圖書、論文、統計數據、專欄述評、法規標準、圖像資源、音頻、視頻資源(含課件)等。
首先籌建了煤炭經濟和半島經濟紙質特色文庫。煤炭經濟研究文獻采集以煤炭工業經濟、資源與生態環境、資源利用與評價、煤炭企業安全、煤炭企業人力資源管理、可持續能源等重點且研究成果豐富的研究方向為主,延伸至低碳經濟及能源經濟的其他研究方向;山東半島經濟研究文獻采集從半島城市群與產業發展、半島區域經濟評價與規劃、半島區域生態與可持續發展、半島區域社會發展等方向延伸至藍色經濟、環渤海經濟圈等研究方向,還采集了經濟皮書系列(皮書、研究報告、發展報告等),中國煤炭工業、中國能源及半島區域城市的統計年鑒等,重視收集煤炭經濟和半島經濟相關的研究數據、內部資料、會議資料,加大力度向校內外老師校友征集煤炭經濟、半島經濟相關紙質文獻(包括教師專著、編著、譯著、教材等;教師校級及以上科研項目課題成果;學術報告及科研成果報告等)。同時購買了部分與煤炭經濟和半島經濟相關的電子資源數據庫,“煤炭數字圖書館暨安全生產數字圖書館”和“方略學科導航”,其中以雷速公司的方略學科導航為平臺,雙方共建煤炭經濟和半島經濟學科導航[1],這樣,從紙質和電子資源兩方面,同時進行特色庫的建設,見圖1。

圖1 特色庫資源來源
建庫之初,項目組選派了相關人員,前往北京、天津、江蘇、安徽等高校圖書館進行特色庫建設的專題考察,特別針對數據庫軟件平臺的選用、建庫經驗及數據庫合理有效使用進行調研。經CALIS認證的系統有北京拓爾思的TRS、清華同方的TPI、北大方正的DESI、快威、義華、中數創新和杭州麥達等[2],這些系統各具特色且都能很好地完成數據庫的各項任務。最初圖書館傾向于使用TPI系統,在對比了方正DESI各個操作模塊后,認為DESI系統的數據管理、資源加工、任務審核及發布功能操作簡單且效率很高,更符合建設本館這樣的以文字信息為主的數據量大的數據庫,圖書館的服務器及計算機也足以滿足其系統的軟件運行環境及服務端和客戶端的要求,無須另外添加設備,又因為方正DESI是CALIS三期推薦使用的通用系統,CALIS中心分別在各省中心提供特色庫系統,進行資源的加工、管理、發布及數據遷移,保障了其系統支持和技術支持,因此圖書館最終采用了DESI通用系統V4.1版,作為制作特色數據庫的平臺。
2011年6月初,項目組選派成員參加了CALIS管理中心組織的CALIS三期特色庫DESI通用系統專業技術培訓,中心統一了特色庫系統的安裝使用、建庫基本流程及建庫標準規范。系統管理員使用DESI系統創建子庫時,選擇服務端“新建數據庫”選項,系統會自動生成一個庫結構標識,特別值得注意的是,這個標識 字段作為數據庫的檢索項,是數據庫的重要組成部分,直接影響數據庫的使用效果。每創建一個DESI子庫,系統自動生成6個公有字段:題名、責任者、主題關鍵詞、摘要、年份、出版者。公有字段為系統默認的統一檢索字段,不能隨便刪除。管理員還應根據數據庫的檢索需要設定自定義字段,以補充公有字段的不足,例如網絡資訊子庫不適合設定分類字段,論文子庫需要有會議名稱,外文期刊子庫要提供鏈接等,應根據每個子庫的要求進行增減。字段名稱都可以修改,因此在建庫時,字段名稱的設置參考了CNKI、維普、萬方、EI、SCI等多個數據庫,盡量使設置的字段名稱適合使用者的檢索習慣,同時讓所建的各個子庫的字段相對一致,以方便資源平臺的統一檢索。 構建好數據庫的基本結構,完成發布設置,就面臨數據資源的上載問題。在決定建庫時,圖書館就已經開始了基礎數據的收集和整理,先易后難,最先做的是從相關的原生數字資源(包括電子圖書、期刊、論文等)進行數據遷移。收集數據時檢索式的確定非常重要,其關系到數據庫內容的整體完整和對研究領域的服務幫助。通過確定檢索式進行數據挑選,再把導出的TXT文件轉化成EXCEL表,在EXCEL表中進行查重和數據處理后,整理出一批批的元數據,把其中需要下載的數據帶領學生進行下載,從而完成數據庫元數據和全文的搜集工作。項目組經過反復試驗,用EXCEL整理元數據,并成功將元數據及相對應的PDF格式全文按照設定的路徑成批導入系統。DESI系統可以將導入的PDF、WORD、WPS、數字圖像等自動轉換成德賽系統特有的完全保真的中文電子書CEB格式。 DESI系統支持多個并發用戶同時進行數據操作,因此,必須要進行用戶管理。進入系統管理主界面管理樹中點擊“用戶→制作用戶”,設置系統管理員和普通用戶,進行用戶名、密碼和權限的設置,一般普通用戶只局限于“資源加工”模塊中的格式轉換、目錄制作、元數據標引、多媒體鏈接和分類。系統管理員點擊“資源管理”中的“任務管理”,可以分別將子庫中的任務分配給普通用戶,以便進行資源加工。 任務分配后就可以進入資源加工模塊,在資源加工過程中,可以新建任務、格式轉換、元數據標引、分類、目錄制作和多媒體鏈接操作。DESI系統也可以針對個別任務進行添加、掃描任務、拆分、合并、批量轉換等。批量導入的源文件首先要“格式轉換”成CEB格式,再進行元數據標引。操作中元數據的標引完全按照《CALIS專題特色數據庫描述元數據規范》中所規定的書目信息、網絡資源信息等元數據規范進行。因為是導入的元數據,所以標引過程中就要認真核查導入字段內容,補足遺漏,以確保每個字段信息的準確完整,標引過程中可以點擊“保存”隨時對錄入任務進行保存。如果設定了分類字段,則要切換到“分類”選項,對文章進行分類選擇。最后“保存”“提交”完成錄入工作。 數據審核和資源發布模塊一般由系統管理員操作。如果子庫設置為需經過審核通過才能發布的數據,就必須先進行數據審核。在未審核任務中,內容合法、標引正確的點擊“文件正確”完成審核,而對未通過審核的任務,要逐一進行檢查,指定原因并重新整理,根據錯誤原因修正數據或重新錄入,以保證整個數據庫內容的完整。數據審核通過后,即可進行發布。DESI系統支持兩種發布方式:數字資源平臺和本地,為了避免數字資源平臺出現故障而數據丟失,一般是先選擇“本地”方式發布,將資源發布到本地服務器上,對資源進行備份后,再將本地資源發布到數字資源平臺。這樣,讀者就可以通過CALIS統一數字平臺對特色數據庫進行訪問檢索。整個德賽系統業務流程如圖2所示。 圖2 德賽系統業務流程 2012年6月,由山東工商學院圖書館承建的“煤炭經濟特色文獻數據庫”及“山東半島經濟特色文獻數據庫”數據收割提供元數據4萬余條,其中含全文兩萬余條。經CALIS三期特色庫子項目驗收專家評審驗收合格,其中“煤炭經濟特色文獻數據庫”榮獲鼓勵獎。CALIS三期特色庫項目214個子項目共驗收合格162個,驗收合格率為75%。獲得獎勵子項目73個,獲獎比例為34%。數據庫的成功驗收極大地鼓舞了項目組老師的工作熱情,也堅定了研究院的老師們和校領導對特色數據庫的認可與支持。 學科特色庫的后期維護和改善對于其可持續發展來說是至為關鍵的[3]。因此圖書館必須重視并加強數據庫利用情況的反饋,構想在數據庫主頁上增設“日志分析”“讀者留言”“文獻點擊率”等模塊,分析研究人員和讀者使用情況及需求,更好地服務于學校的教學科研。圖書館在保證現有資源類型數據年度更新的基礎上,還將新增統計數據子庫和視頻子庫,進一步充實相關印本館藏,加大對煤炭經濟和山東半島經濟研究相關科研成果等非正式出版物的收集力度,努力使特色數據庫對學校煤炭經濟研究院、半島經濟研究院的學科建設、學校教學科研發揮更大的推動作用,同時為煤炭行業、半島地區的發展、人才培養和學術研究提供一個信息獲取與交流平臺。 [1]常紅.特色館藏戰略規劃的實踐與思考——以山東工商學院圖書館為例[J].圖書館,2013(1):132-134. [2] 王會麗.CALIS專題特色數據庫建設中的元數據研究[J].情報雜志,2009(2):72-75. [3] 鄂麗君.高校圖書館學科特色數據庫建設的現狀、問題與對策[J].國家圖書館學刊,2011(1):53-55,68.3.2 字段設定
3.3 數據上載
3.4 任務分配
3.5 資源加工
3.6 數據審核和資源發布

4 特色數據庫建設的后期維護