◎黃秋萍 吳 銳 鄧芳芳

目前,查收查引已經成為大多數高校圖書館學科服務的基礎服務工作,根據查收查引的服務方式主要分為以下幾類。
一是通過自主開發或購買的商業化查收查引系統開展服務。袁浩等學者指出清華大學、中國科學院文獻情報中心、北京大學、北京郵電大學、武漢大學等重點知名高校和研究所通過自建或合作建設的方式開發了查收查引系統,在很大程度上節約了人力物力,提高了查收查引的工作效率。但是大多數系統平臺只具備電子化在線委托、辦理進度查詢、網上支付費用、報告下載等功能,只能算半自動化、半人工的工作模式。
二是利用文獻管理軟件、數據分析軟件、機構知識庫等工具開發查收查引軟件。張雪娟、樊亞芳等學者提出用Note Express等文獻管理軟件輔助人工檢索的方法完成查收查引工作,極大地減少了重復性操作步驟,提高了工作效率和服務質量。劉艷民等學者開發出了基于機構知識庫CSpace的查收查引功能模塊,可達到95%的收錄引用準確率,能有效滿足高峰期用戶的檢索需求。這類軟件雖優化了人工檢索的流程,但仍需以郵件的方式接受檢索委托,處理委托的實時性和反饋結果的便捷性不佳,有的需要機構知識庫的支撐才能實現。
三是許多地方高校由于經費不足、人員有限等因素仍然沿用傳統的人工查收查引方法。委托人需要到圖書館現場填寫查收查引委托或在線下載并填寫查收查引委托表,然后將其發至檢索人員郵箱,由檢索人員在數據庫中對委托項目逐條檢索并人工生成報告后,再以電話或者郵件方式通知委托人領取檢索證明。
綜上所述,各高校圖書館采用的查收查引服務方式不盡相同,在服務過程中不同程度地存在各種問題。一是委托檢索流程煩瑣,服務效率低。委托檢索步驟繁多,占用了委托人過多的時間與精力,另外,檢索人員需要在多個數據庫中進行檢索和比對,多次反復檢索,容易導致工作人員身心疲憊。二是檢索數據難以保存和管理,多年累積的檢索數據得不到有效保存和管理,檢索最終成為一次性勞動。三是委托高峰期人手嚴重不足。在每年的科研工作量考核、科研獎勵、職稱評聘、聘期考核期往往出現委托高峰,檢索人員工作量激增,檢索耗時較長。針對以上問題,研究開發出便捷高效的查收查引服務平臺對地方高校圖書館來說尤為迫切。
華東交通大學圖書館為了提高查收查引工作效率,積極轉變查收查引服務工作思路,優化傳統檢索工作流程,將原來觸發性的常規工作轉變為有規律的周期性工作,將等待用戶上門委托的被動式服務轉變為不受時空限制、提供自助檢索和檢索證明下載的主動式服務。
華東交通大學圖書館利用現代化信息技術,采用JSP編程技術和SQL Server數據庫搭建基于B/S結構的非結構化文檔管理的查收查引服務平臺。平臺以論文索引自建數據庫為核心,整合多個數據庫的論文收錄引用數據,提供多種途徑的檢索,并管理論文檢索證明文檔,支持網頁動態發布,實現權限分級管理,包括數據存取模塊、內容管理模塊、數據加工模塊、資源檢索模塊、信息發布模塊等。整個平臺的運行流程從內容管理模塊創建論文索引自建數據庫開始,對用戶角色、資源權限及資源相關配置進行統一管理,由數據加工模塊對論文索引元數據進行導入、整編、標引、分類、檢查、入庫等一系列處理,其中包括非結構化檢索證明文檔的存儲管理,進而在資源檢索模塊對平臺的多種檢索途徑和檢索導航進行設置,再通過信息發布模塊將查收查引服務平臺呈現在web上,并配合資源檢索模塊實現論文索引信息的檢索功能,以上所有平臺業務模塊與底層數據庫之間的數據傳輸與交互均在數據存取模塊的支持下完成。查收查引服務平臺建設分為論文索引數據資源化與自建庫平臺建設兩個階段,圖1展示了查收查引服務平臺的建設方案框架。

圖1 查收查引服務平臺建設方案框架(作者自繪)
查收查引服務平臺建設的第一階段是將來源于SCI、SSCI、EI、CPCI等數據庫的論文索引原始數據資源化,包括論文索引元數據設計、數據采集、數據處理等三個過程,為自建數據庫的元數據存儲做準備。
元數據設計是任何資源數據庫建設首要考慮的問題,主要目的在于建立規范的資源建設標準和數據采集方案,確保資源建設的科學性、合理性和穩定性。根據不同數據庫中論文索引數據的內容特征,結合查收查引服務中檢索結果的實際需要,確定自建數據庫中論文索引元數據的所有必要字段及其數據類型。建設查收查引服務平臺的主要目的是實現論文自助檢索和檢索證明的自助下載,因此論文索引元數據必須包含非結構化文檔數字對象格式的檢索證明下載字段。與此同時,為了保證檢索證明的唯一性和真實性,便于檢索證明的批量生成和加工上傳,論文索引元數據還應該包含檢索證明編號字段,保證其與檢索證明電子文檔中的證明編號一一對應。
論文索引原始數據主要來源于SCI、SSCI、EI、CPCI等數據庫,現以SCI和EI論文為例介紹原始數據的采集過程。從Web of Science和Engineering Village數據庫平臺中,通過作者單位、發表年份等關鍵詞檢索出科研人員可能需要委托檢索的SCI和EI論文,利用數據庫平臺的批量導出功能下載論文索引原始數據。由于兩大數據庫平臺對導出的論文條目有數量限制,檢索人員可以采取分年度導出再合并到單個Excel工作表的方式對原始數據進行整理。在采集論文索引原始數據的過程中,必須保證采集數據的原始性、真實性、完整性。
在采集的論文索引原始數據基礎上,按照論文索引元數據設計的字段標準,篩選剔除掉非必要字段,將原始數據必要字段處理為符合標準要求的數據內容,最終生成規范的論文檢索證明文檔。論文索引元數據處理主要分為以下四個步驟。(1)添加檢索證明唯一性編號。按照預先制定的編號規則對每條論文索引數據進行唯一性編號,以形成一條完整的自建庫論文索引元數據。(2)批量生成檢索證明。為了提高檢索證明電子文檔的生成效率,利用Word軟件將論文索引元數據導入檢索證明統一模板,由此批量合并生成含有所有元數據的檢索證明。(3)拆分出獨立的檢索證明。為了保證每篇論文都有獨立的檢索證明可供下載,必須將合并后的文檔拆分成以檢索證明編號為文件名的單獨Word文檔。(4)復核并加密PDF證明文檔。對于已經生成的檢索證明內容需要再次進行人工復核和格式上的微調,以保證檢索結果的完整性、準確性和證明文檔整體的美觀性。為了避免檢索證明的內容被復制和篡改,同時防止電子印章和檢索人員簽名圖片被惡意盜用,需要將證明電子文檔轉換并加密為PDF格式。
論文索引原始數據的采集及元數據的處理流程如圖2所示,論文索引元數據處理完畢即實現了論文索引數據資源化,再通過論文索引自建庫平臺中的數據加工完成元數據入庫及檢索證明上傳,便形成了查收查引服務平臺的數據基礎。

圖2 論文索引原始數據采集及元數據處理流程圖(以SCI、EI論文為例)(作者自繪)
論文索引數據資源化為論文索引自建庫平臺建設提供了數據支撐。現對論文索引自建庫平臺具體功能的實現做進一步闡述。
數據存取模塊的功能是實現穩定、高效的數據存取,建立業務邏輯與底層數據庫之間的交互,以提高平臺的運行性能。數據存取模塊遵循SOA架構標準,采用基于JDBC規范的標準接口,利用基于組件模型的編程方法,使用SQLServer數據庫與JAVA設計模式進行開發,以實現數據導入、數據更新、數字對象存儲、數據信息提取、數據庫備份等功能。論文索引自建庫平臺的數字資源包括論文索引元數據、加工數據、檢索證明數字對象。其中,元數據、加工數據存儲于結構化數據庫中,檢索證明數字對象存儲于文件存儲系統中。為了滿足文件存儲系統的易用性和兼容性要求,采用NFS/CIFS協議的存儲方案解決平臺非結構化文檔數字對象的統一存儲、管理和共享問題,以保證數據的一致性和安全性。
內容管理模塊可以實現自建數據庫的信息管理、用戶角色管理、資源權限管理、分類導航管理、文檔數字對象管理等功能。(1)自建數據庫的信息管理包含創建、刪除、修改數據庫,配置數據庫名稱、基本信息、數據庫文件保存路徑等功能。(2)將用戶角色和資源權限管理相結合,實現對資源的安全管理,如不同用戶對資源有不同的訪問級別。(3)分類導航管理可根據實際需要設置學科、發文年份、索引類別等分類導航,對已標引的資源實現自動分類。(4)文檔數字對象管理是系統管理員根據實際需求,對數字對象進行重新命名,如保留原文件名或將上傳的文件名改為以時間序列命名,必須保證文件名的唯一性。
數據加工模塊主要是通過對導入的論文索引元數據與檢索證明數字對象進行整編、標引、分類、檢查、入庫加工,建立元數據與檢索證明文檔一一對應的關系,以提供多種類型分類導航和多種途徑檢索的功能。利用JSP開發技術實現基于web界面的數據解決方案,其中包含批量導入論文索引元數據,上傳檢索證明數字對象,按學科類別、發文年份、索引類別標引和分類,檢查數據一致性,審核入庫等步驟。
資源檢索模塊是查收查引服務平臺的重要部分,是用戶能否有效利用平臺的關鍵。資源檢索模塊的工作原理是用戶在前端web界面輸入關鍵詞或設置檢索條件,由后端程序根據檢索設置自動生成SQL語句檢索式,在數據庫中執行查詢語句,將檢索結果傳遞到前端界面。資源檢索模塊可配置不同檢索方式,支持多導航輔助檢索,也可進行各類型數據庫的統一跨庫檢索。
信息發布模塊是查收查引服務平臺對外服務的窗口,實現了自建數據庫在網頁上發布的各種信息配置管理,其建設遵循標準的OpenURL、Z39.50、Portlet、SAML、Web Services等協議,包含定制多種發布風格,設置檢索字段、概覽字段、細覽字段的格式,支持多種導航等功能,為用戶提供集檢索、瀏覽、下載等于一體的Web綜合性門戶網站。
華東交通大學圖書館利用現代化信息技術搭建的高校圖書館查收查引服務平臺,具有方便易用、檢索高效、下載快捷、管理規范、發布靈活、更新及時等特點,不僅極大地提高了查收查引工作的效率,而且改進了傳統查收查引服務模式的不足,是一次從被動服務到主動服務的轉變和創新實踐,能使用戶隨時隨地進行自助檢索和下載檢索證明。
通過大力宣傳和推廣查收查引服務新平臺,用戶逐漸接受和習慣了自助檢索和下載的新模式。查收查引服務平臺在華東交通大學圖書館正常運行一年,研究發現高校師生委托人工查收查引的數量大幅減少,相比去年同期減少了50%。用戶對查收查引服務新模式的便利性、時效性、準確性都給予了充分肯定,此舉進一步提升了圖書館查收查引服務的用戶滿意度,也為其他想要優化檢索工作流程、提高檢索工作效率的地方高校圖書館的查收查引服務工作提供了參考和借鑒。