王 霞
(中國社會科學院圖書館,北京 100732)
ALEPH500系統是以色列Ex Libris Ltd.公司開發的功能完整的圖書館自動化集成系統,提供了當今網絡環境下圖書館知識服務所需要的信息基礎架構,可以適應各種類型和規模的圖書館的需要——從擁有較少資源的小型圖書館到擁有數以百萬級館藏的大型圖書館和圖書館聯合組織。ALEPH500系統支持多文種、Unicode 4.0以上和SuperCJK超大規模漢字大字符集,支持多MARC格式的處理,提供強大的資源共享能力、完全的系統連通性以及與第三方系統的無縫協調工作能力。模塊化的組件設計使用戶可以靈活“裁減”以實現圖書館的本地化需求。ALEPH500系統采用先進技術和管理理念,使圖書館的各項業務流程得到了優化,同時為圖書館業務格局的重組提供了很好的基礎。
目前,ALEPH500圖書館自動化系統的用戶包括中國國家圖書館、英國國家圖書館、日本國會圖書館、俄羅斯國家圖書館、美國哈佛大學、美國麻省理工學院、英國牛津大學等全球大型國家圖書館及世界著名的頂級大學圖書館。根據最新統計報告,ALEPH500系統是同類軟件系統中全球用戶數最多的圖書館自動化系統,目前全球有2500多家用戶,近兩年新增主要用戶包括俄羅斯國家圖書館、日本國會圖書館、英國牛津大學圖書館等;我國現有32家用戶,ALEPH500系統已經成為國內擁有最多圖書館用戶的自動化軟件。
中國社會科學院圖書館(以下簡稱“本館”)系統是我國社會科學領域中歷史悠久、收藏豐富的國家級研究型圖書館系統,目前藏書總量達500余萬冊,涉及古今中外,覆蓋哲學、社會科學及人文科學的所有分支學科,包括了文物古籍、圖書報刊、聲像資料和電子資源等多種類型。
本館采取“總館—分館—所館(資料室)”三級保障模式,由1個總館、5個專業分館、9個所級圖書館組成,分布在北京不同的位置,為全院50多家單位和研究所人員提供圖書借閱服務。總分館模式通常是在一個城市或一個地區中設一個總館或中心館,其他館作為這個總館的分館,總館對分館的人、財、物實行統一管理,分館是總館派出的一個機構,專門從事讀者服務工作。總分館之間有高度統一的協調管理、嚴格完整的組織體系和事業發展統籌規劃,且嚴格按照服務人口的數量設立圖書館服務網點[1]。分館一般指一個較大的圖書館系統的附屬單位,設立于特定(購買或租用)的房舍或場所,在此空間內可以獨立運作,擁有足夠的館藏供讀者閱覽,由專職人員負責管理,同時依照既定時間有規律地開放給公眾使用[2]。
本館已應用自動化系統17年左右,先后使用“丹誠”系統和ECO系統。ECO系統是韓國ECO公司與本館在2003年合作開發的圖書館自動化集成系統,該系統根據本館的工作模式進行了本地化功能開發,使本館的工作邁上新臺階,初步形成了全院圖書館統一自動化管理。隨著信息技術、網絡技術的發展,圖書館自動化系統也在不斷地更新換代,更加開放與靈活,功能更加強大,系統穩定性更好。而ECO系統已經跟不上時代發展的步伐,不能滿足本館日益增長的業務需求及全院圖書館總分館模式,在很多方面都存在著較大的局限性。基于此,本館于2011年12月引進ALEPH500系統,目前已經完成系統遷移。
“一所圖書館在實現自動化時,主要力量應放在系統工程的組織實施上”[3],因此系統實施的成功與否,既是當前圖書館自動化亟待解決的實踐問題,也是業界普遍關注的重要課題[4]。圖書館自動化系統的實施,是一項復雜的系統工程,同時也是經常性的工作。
本館由多個圖書館組成,各館的數據格式不統一,在很多方面難免有些差別,如條碼號規則、數據規范、表達方式等,而且數據量大,在數劇遷移時會存在很大難度。而為了實現全院圖書館自動化系統統一應用,在保證全院圖書館順利應用新系統開展日常業務工作的基礎上,還要實現“總館——分館——所館(資料室)”三級圖書館模式,這就給系統設置和參數配置造成一定難度。由于各館都有獨特之處,所以需要根據各自特點進行個性化設置方能滿足業務需求。
本館已經歷過幾代圖書館自動化系統的使用,現大部分館的數據已經遷移到ECO系統中,只有部分館的數據仍存儲在其他系統中。同時ECO系統在全院圖書館開展了應用,對各館的本地化設置也有了一定的積累,對新系統的數據遷移、參數配置和本地化設置工作帶來一定的便利性。在人力資源方面,本館各業務部門骨干以年輕人居多,計算機操作水平較高,接受新系統能力較強,這也是系統實現順利遷移的一大優勢。
數據遷移是將歷史數據進行清洗、轉換,并裝載到新系統中的過程。數據遷移適用于一套舊系統切換到另一套新系統,或多套舊系統切換到同一套新系統時,需要將舊系統中的歷史數據轉換到新系統中的情況。數據遷移的質量不僅是新系統成功上線的重要前提,也是新系統穩定運行的有力保障[5]。
在ECO系統時代,本館總館使用ECO系統,部分分館使用其他自動化集成系統,如丹誠系統、金盤系統、文津系統。在數據量方面,ECO系統里有約150種、250萬條書目數據,非ECO系統有約25萬條書目數據。而2008年開始使用ALEPH500系統的大型圖書館,其數據遷移量基本都超過100萬,因此,相對于這些圖書館,本館的數據遷移量是比較大的。
根據實際情況,本館數據遷移采用兩步走的方法:首先將ECO系統中的數據遷移到ALEPH500系統中,待ALEPH500系統穩定運行后再將非ECO系統的數據遷移到ALEPH500系統。
①ECO數據遷移
圖書館數據主要包括館藏書目數據、采購數據、流通數據、期刊數據等,如果將每種數據都完整移植到ALEPH500系統中,不僅會大大增加數據分析、數據轉換的難度,同時也會使數據轉換的時間延長,難以保證系統實施的進度。數據導入情況見表1。

表1 數據導入情況說明
②非ECO數據遷移
筆者所提到的非ECO數據,只限于館藏書目數據。使用ECO系統時,一些所館已經將部分數據導入ECO系統,但仍有大部分數據存在各館的自動化系統中或數據只在各館自動化系統中更新。為此,我們制定兩種方式:①從ALEPH500系統中將有非ECO數據的所館的書目數據全部刪除,由所館將本館全部館藏數據重新導入ALEPH系統;②所館提供非ECO數據的臨界點,只導入非ECO數據。由于多數所館無法提供非ECO數據的臨界點,為了保證ALEPH500系統中數據的完整性,我們采取:能提供非ECO數據臨界點的所館,只導入非ECO數據;不能提供臨界點的所館,將ALEPH500系統中已有數據全部刪除后再將本館全部館藏書目數據導入ALEPH500系統。
社科院圖書館雖然采用不同系統,但書目數據均符合ISO2709的標準格式,只在自定義館藏字段會存在一些差異,而館藏數據字段只起到標識書目館藏地的作用,不影響書目自身的數據及數據質量,因此我們只轉入書目的基本數據(9字段以前的字段),館藏字段(9字段)忽略不轉,從而保證所有書目數據格式統一。
本館在書目數據是否查重的問題上有兩種意見:①所有數據均不查重,直接導入ALEPH500系統中,但會造成大量的重復數據;②所有導入數據必須查重才能導入ALEPH500系統中,這需要制定準確的查重條件。書目數據導入自動化系統時,必須要與館藏書目數據進行查重,查重條件的設定必須非常準確。同一本書由于編目員不同可能會導致書目數據有一些差異(形成“相似書目”),如果查重條件過于精確,相似書目不能與館藏數據匹配從而成為新書目,會造成大量的書目數據冗余,給書目管理、數據管理和讀者檢索都會造成一定的困擾;如果不精確,則可能造成相似書目均與館藏數據匹配,此時需要人工干預才能最終確定是否與館藏數目相同,大大增加了工作量。
非ECO的流通數據均不導入ALEPH500系統中。對于用非ECO系統進行流通的所館,均采取兩個系統并行的模式:在舊系統中還書,在新系統中借書,直至舊系統中所借圖書全部還清。
①分館設置
本館所有書庫均有獨立的流通臺,因此在ALEPH500系統中,本館所有書庫均設為分館,而其他所館整體設為分館,分館所轄書庫設為分館下的館藏地。如圖1所示。

圖1 分館模式
②書目庫設置
ALEPH中有6種類型的庫:書目庫(BIB)、管理庫(ADM)、館藏庫(HOL)、規范庫(AUT)、館際互借庫(ILL)、課程閱讀庫(CR)。在社科院圖書館中,一條書目記錄(BIB)對應多個單冊記錄,每個單冊記錄都有各自的館藏地(HOL),單冊記錄存于管理庫(ADM),ADM記錄和HOL記錄都是通過內部鏈接指向BIB記錄。由于書目數據沒有規范化,規范庫(AUT)暫時不投入使用。如圖2所示。

圖2 書目庫設置
參數設置是圖書館自動化系統的核心部分,正確地根據本館實際情況搭建工作環境是系統實施期間的重要工作,不僅能保證系統實施的順利進行,也對系統正式運行提供保障。
ALEPH500系統與ECO系統區別之一就是靈活的參數表管理機制,主要區別:
ALEPH500系統的參數表存于PC SERVER上,參數調入調出不需要與數據庫交互,減輕數據庫的負擔。ECO系統的參數存于數據庫中,參數的調入調出都需要和數據庫交互,在操作大批量數據的情況下,可能在一定程度上增加數據庫負擔;ALEPH500系統的參數表是文本格式,便于系統管理,而且可以設置復雜的參數表,能夠根據本館實際情況調整參數表從而滿足用戶的需求,增加系統的靈活性和可定制性。ECO系統中,數據表只能存儲簡單的參數表,復雜的參數表只能在程序和腳本里控制,用戶的需求只能通過修改程序來實現,沒有ALEPH500系統參數表模式方便。如圖3所示。

圖3 ALEPH500系統參數模式
ALEPH500系統參數表對不同的模塊分別做定制,從使用目的分為功能性參數表和界面顯示參數表兩大類。不同的書目庫配備獨立的參數表,參數表的存放位置從物理上嚴格區分,避免各書目庫參數表的混淆。
系統實施初期,本館參考了中山大學圖書館的參數配置,供院館各業務部門來完善修改。比起盲目地提交部門參數表,這種方式更容易接受并能快速地形成本館參數表。
在參數表維護中,需要注意以下幾點:
①參數表修改后必須重啟PCSERVER,新參數表才能生效;
②編目模塊所有參數表(可編分館、可編字段、編目字段校驗等)修改后都需要重新建立編目包;
③流通服務期間,不建議修改參數表,否則會造成系統瞬間混亂;
④修改參數表時,建議從服務器上下載參數表在本地修改后再上傳到服務器,以免影響系統的正常運行;
⑤系統管理員做參數調試時,可以使用DEBUG模式:重新開啟端口做參數配置的調試、測試,不會影響正常服務端口上的工作。
權限設置面向工作人員設置,包括兩部分:ALEPH客戶端和ALEPH WEB綜合服務系統。
①ALEPH客戶端
客戶端賬號主要包括編目級別、編目員權限、流通忽略級別、功能權限、預算權限、訂購單位權限、單冊管理等,其中編目級別用來控制編目人員的編目權限,高級別編目員可以修改低級別編目員的編目數據,同級別編目員可以互相修改編目數據,低級別編目員不能修改高級別編目員審定后的數據。本館編目級別共設 5 級:00,01,10,20,40;編目員權限控制編目員可編目的字段;流通忽略級別用來控制是否可以忽略讀者限制外借的情況(圖書過期、違章等),從而使該讀者暫時可以外借。這里需要說明的是,只有當讀者同時具有可被忽略的權限時,有忽略權限的工作人員才能進行忽略操作;功能權限控制工作人員在客戶端界面可以操作的具體功能;預算權限控制采購人員可以支配的預算;訂購單位權限控制采購人員可以訂購圖書館的分館書目;單冊管理權限控制本館只能修改本館單冊數據,防止誤刪、修改別館數據。

圖4 縱向編目

圖5 橫向編目
社科院圖書館共設立15個分館,很多工作人員的工作權限相同,采用功能代理機制可以將相同工作權限設成一個功能代理,將該功能代理賦予工作人員。如果工作權限需要修改,則只需要修改該代理的權限,而不必修改所有人員的權限。采用功能代理機制大大減少了賬號管理的成本,既縮短賬號維護的時間,也使賬號維護更加方便。
②Web綜合服務
Web綜合服務需要賬號登錄的系統包括:APSM(專著采訪擬定系統)、ASSM(期刊采訪擬定系統)、AOMS(訂單管理系統)、AIMS(單冊管理系統)、APMS(讀者管理系統),登錄賬號與客戶端賬號保持一致,其中,管理員要在APSM、ASSM中將客戶端賬號綁定后才能登錄系統,而AOMS、AIMS、APMS系統可以直接用客戶端賬號登錄。
在ECO系統的數據轉入ALEPH500系統的過程中出現了書目條碼號重復的情況,約有近18萬種書目條碼重復,涉及40多萬個單冊。條碼號重復主要包括館際間條碼號重復、館內條碼號重復兩種情況。其中館際條碼號重復主要原因是在ECO系統中,全院圖書館條碼號規則不統一,各圖書館自行采用條碼號規則;館內條碼號重復主要原因是在舊書回編過程中,由于數據量大、時間緊造成的。在ECO系統中,條碼號重復并沒有給日常工作帶來困擾,但在ALEPH500系統中,條碼號是單冊的唯一標識,是不允許重復的,如果條碼號重復,可能會出現如下問題:
①在借還書界面,掃入重復條碼號只能隨機調出某一條單冊,可能與讀者所借的書不符合;
②在編目界面,掃入重復條碼號只能隨機調出某一條數據,可能與想要的數據不一致;
③在單冊管理界面,修改單冊時,因為不能通過條碼重復校驗,將不能保存修改信息;
④通過單冊條碼范圍批處理可能會出錯。
由于條碼重復的數據量巨大,無法在很短的時間內完成條碼號修改,為了不延誤系統實施的進度,對館際間的重復條碼號采取修改程序的方法,使重復的條碼號可以調出正確的數據,同時制定全院圖書館條碼號規則,從根本上杜絕重復條碼號;對館內的重復條碼號,只能手工修改。
程序修改的方法:
增加參數表文件tab_staff_inst,將工作人員的賬號與分館綁定,工作人員只能修改其所屬分館的數據,解決了館際間條碼號重復的問題。增加參數表文件不需要修改程序,充分體現出ALEPH系統參數表對個性化需求的靈活處理。
ECO系統中的讀者數據包括院館讀者數據和各所館讀者數據,這樣讀者可能就會有一人多卡的情況。見表2。

表2 讀者數據導入情況
研究生院圖書館是社科院圖書館的分館之一。該館于2011年實施金盤圖書館自動化集成系統,經過一年多時間目前已經正式運行。該館同時與金盤公司合作開發了綜合性的管理系統:門戶網站、一卡通系統、自助借還、機房管理系統等,數據以及相關信息都存入金盤系統。從經費和后續開發角度來說,圖書館自動化集成系統從金盤系統換成ALEPH500系統是近幾年內不能實現的。因此研究生院圖書館繼續使用金盤系統,將該館書目數據導入ALEPH系統中供讀者檢索,但不能在ALEPH500系統中流通。這涉及數據同步的問題,在這里不討論。
在使用自動化系統初期,本館一批外文書采用CNMARC格式編目,約兩萬條。在原ECO系統中,由于中西文數據都存放于一個庫中,CNMARC和USMARC格式的通用不影響編目、檢索的正常運行。ALEPH500系統中西文庫是分開的,數據遷移時將根據編目格式將CNMARC格式的書放入中文庫,USMARC格式的書放入西文庫,因此這批CNMARC編目的西文書放入中文庫(SKY01庫)。由于ALEPH500系統中書目檢索和查重首先依據所屬書庫,因此給讀者檢索和采訪人員的書目查重造成很大的影響,導致書目檢索不到或者購買重復的書。
因此,在數據轉換期間,我們對這批兩萬條的數據做了從CNMARC到USMARC的格式轉換,書目記錄從SKY01庫移到SKY09庫,同時將館藏、單冊記錄也移植到SKY09庫中新的記錄下。
在原ECO系統中,我們采用自定義905字段來存放書目的館藏地信息,如圖6所示。

圖6 905字段
為了和原ECO系統館藏地表示方法保持一致,在ALEPH500系統中,我們開通了館藏庫(holding庫,SKY60庫),每個館藏地對應一個館藏庫,用852字段來表示館藏地信息,如圖7所示。

圖7 825字段

表3 852字段和905字段對應關系
數據轉換時,我們按照上述規則將905字段轉換生成館藏庫的852字段,使用ALEPH500后,編目員編輯創建館藏記錄時,也遵守此編目規則。
在系統實施初期,總館和公司合作制定出系統實施的整體計劃表,詳細列出所有工作進度,包括每個任務的完成時間、實施方、材料準備等,在系統實施中嚴格按照計劃表執行,對系統實施起到很好的監督和督促作用。系統實施期間,雙方要及時溝通并根據實際情況調整計劃表和告知所有參與人員。
成立系統實施執行小組和數據管理小組,小組由各業務部門骨干組成,在系統實施過程中承擔本部門技術支持的角色,充分發揮骨干的作用,使系統管理員能有更多的時間和精力解決實施過程中更重要的問題。
系統實施采用多種技術支持方式:電話、E-mail、自動化實施QQ群、自動化實施論壇等,及時解決實施中遇到的問題。
系統實施初期,遇到的故障多是相同或相似的,及時將每次的故障及解決方案詳細記錄下來,可以使系統管理員在解決同種故障時減少處理時間、提高處理效率,保障系統實施順利進行。
系統實施中,本館經歷3次數據遷移,3次數據核查。每次數據遷移時,公司技術人員都會提交數據轉換結果由本館確認無誤后再做數據導入,可以避免將一些明顯的錯誤數據導入系統。對每次導入數據,本館都組織各業務部門和網絡系統部的人員按照書目的系統號范圍進行核查,同時會有一定的交叉,確保數據核查的完整性和正確性。
本館分館較多,在規模、人員水平上存在很大差異,各館同時應用ALEPH500系統是不現實也是不可取的。本館采取三步實施的策略,總館規模最大、業務應用最全、人員水平相對較高、接受新系統的能力較強,因此第一步在總館開展ALEPH500系統的應用,待系統運行穩定后再向其他分館推廣。與總館同時使用ECO系統的分館都具備使用大型圖書館自動化系統的經驗和能力,作為第二批應用ALEPH500系統的分館,其余分館最后應用ALEPH500系統。先應用的分館在熟練地使用新系統后,還能夠幫助其他分館快速應用新系統,保證新系統在全院的順利推廣。
系統實施是新系統順利運行的重要階段和保障,系統實施的成功與否直接影響到新系統的正常運行。在本館ALEPH500系統實施過程中,數據遷移、系統設置、參數配置、權限設置、系統本地化是重要組成部分,它們的設置是否正確、是否符合本館特點是系統實施能否成功的重要保障。任何圖書館在自動化系統實施過程中都要根據自身實際情況來做這些工作,方能保障系統實施的順利進行和正常運行。
[1] 蘇州圖書館總分館介紹[EB/OL].[2010-06-03].http://www.szlib.com/ServiceGuide/MasterLibrary.aspx.
[2] 嘉興市圖書館[EB/OL].[2010-06-03].http://ww.jxlib.com/open.aspx.
[3] 陳源燕,王雅麗.我國圖書館自動化的現狀與展望[J].黑龍江圖書館,1988(4).
[4] 周存芝.我國高校圖書館自動化系統實施的成功之路[J].大學圖書情報學刊,1994(2).
[5] 郭金旭,丁浩.數據遷移在證券分析系統中的應用研究[J].武漢理工大學學報:信息與管理工程版,2008(4).