張 婷
(廣州美術學院圖書館,廣東 廣州 510006)
隨著圖書館數字化建設的深入發展,各高校圖書館結合各自的學科特色、館藏特色及地域特色,積極參與特色數據庫建設,對館藏的特色資源進行分類整理和數字化加工,以拓展圖書館的服務功能。
廣州美術學院是扎根于嶺南的唯一一所高等藝術類本科院校,“傳承嶺南文化,弘揚和繼承發展嶺南文化”是學院師生教學研究的特色和重點之一;學校圖書館不僅收藏了較為豐富的嶺南民間工藝方面的著作和圖冊,而且一直注重搜集和整理相關的各類資料。為了更好地傳承和推廣嶺南民間工藝,2011年開始,廣州美術學院圖書館以中央財政支持地方高校項目“數字化美術與設計文獻資源服務體系建設”為契機,開始對嶺南民間工藝進行系統的資料搜集、整理和研究,著手建設嶺南工藝美術專題研究數據庫。
嶺南工藝美術源于明代廣州民間“廣彩”,盛于清代的石灣微雕,傳承嶺南文化“先進性、革新性”的精神,并自成一體,成為嶺南文化中獨有的一部分。嶺南工藝美術以傳統民間手工藝品為主,包括廣州的三雕一彩一繡(牙雕、玉雕、木雕、廣彩、粵繡)、楓溪陶瓷、石灣公仔、佛山剪紙、肇慶端硯等,這些無不包含著獨特的藝術個性,體現出豐富的嶺南文化內涵。嶺南工藝美術具有重要的歷史、藝術和科學價值,對傳承嶺南民族文化血脈、繼承和弘揚民族精神有著重要的作用。
我們期望通過本項目的實施及成果推廣,能讓社會更好地了解傳統的嶺南工藝,感受嶺南傳統工藝奇思妙想的靈感和巧奪天工的技藝,了解這些終身從藝的實踐者、藝人、工藝美術家,更希望能借此促進社會對傳統工藝的重視和傳承。
特色數據庫建設是一項繁瑣浩大的工程,從數據庫框架的設計到建設內容的策劃,從用戶界面設計到數據篩選與加工,從數據的著錄規范到驗收發布,都需要投入大量的精力和時間,而且每一步都需經過細細斟酌和反復修改才得以確定。
數據庫的框架設計至關重要,只有搭建好框架,才能進一步著手建設工作。嶺南工藝美術專題數據庫既包括文字資料還包含大量的圖片資源。依據資料的類型劃分,將底層庫分為電子圖書庫、圖片庫、期刊論文庫、人物庫、媒體報道庫、網絡資源庫、專業名詞庫等7個子庫。
數據庫橫向分類的一級類目包括工藝美術作品、工藝美術家、專題研究論著、工藝美術詞匯和網絡資源,其中專題研究論著又細分為著作、期刊論文和媒體報道等二級類目。同時,本數據庫還采用了縱向專題分類樹的形式,將工藝美術分為民間刺繡、民間雕刻、民間剪紙、民間陶瓷、民間彩扎、民間繪畫與年畫、硯刻等類目,使每一個橫向類目的內容同時按縱向分類樹進行分類聚合。

圖1 嶺南工藝美術專題研究數據庫橫向類目

圖2 嶺南工藝美術專題研究數據庫縱向類目
數據庫最終實現的功能也需在搭建框架時一并考慮,數據的組織方法是僅供在線瀏覽還是可供下載,圖片的呈現方式、縮放功能,是否提供全文跨庫檢索等,都需經過深思熟慮、反復斟酌。嶺南工藝美術專題研究數據庫采用“縱向目錄——傳統民間藝術分類法”和“橫向目錄——專題分類”來揭示資源內容,可衍變出的資源組織方式和搜索角度靈活多樣;提供了條目檢索和全文檢索及逐條記錄瀏覽方式,期刊論文及媒體報道提供了在線瀏覽和下載功能;電子圖書提供了在線瀏覽功能,部分直接鏈接至超星電子圖書界面。所有工藝美術作品圖片均可通過高清度展示,實現全圖縮放、細節縮放、特定權限高清下載等功能,充分滿足讀者的各種個性化服務需求,形成大眾讀者的欣賞交流平臺,可支持專業人員閱讀、鑒賞和學習。
美觀、友好的用戶界面決定了數據庫能否吸引用戶使用以及功能能否完全實現,數據庫主頁面的設計需同時兼顧頁面的美觀實用和簡潔明了,從數據庫主頁的色調、分類布局到封面頁和首頁的設計,以及數據庫列表的顯示模板,都要經過建庫者與設計師的多次討論磨合、反復修改。嶺南工藝美術專題數據庫的導航條和標題文字采用與廣州美術學院主頁相同的深紅色調,導航條下面的左邊是用戶檢索,可實現跨庫的全文檢索,中間顯示工藝美術分類及專題研究,右邊顯示兩幅不斷變換的嶺南工藝美術圖片,整個界面簡潔清晰,主題突出。
資料收集和篩選決定了數據庫建設的質量。嶺南工藝美術涉及范圍較廣,較為出色的傳統工藝包括粵繡(廣繡和潮繡)、潮州木雕、楓溪陶瓷、石灣公仔、佛山剪紙、肇慶端硯、廣州牙雕、玉雕、灰塑等,相關圖片及文字資料的查找分別以這些傳統工藝名詞作為主題詞進行檢索。通過本校圖書館收集或購買紙質資源或電子資源,同時進行網絡資源收集或相關的展覽收集。資料的查找類型與7個子庫相對應,分別為文獻著作、圖片、期刊論文、工藝美術家資料、網絡資源、專業詞匯等。
①電子圖書庫:電子圖書庫是為了將嶺南工藝美術相關的著作集中整合,供研究者使用。館藏的相關著作進行掃描數字化加工,已購買的超星電子圖書則直接鏈接到超星數字圖書館平臺,整合有用的數字資源。
②圖片庫:圖片庫是為了以直觀的形式集中展示嶺南民間工藝美術作品的精美,資料的收集從館藏圖冊著手,查找嶺南工藝美術圖片,進行對比篩選后,挑選出質量較高且具代表性的圖片進行掃描數字化。
③人物庫:通過《工藝美術家詞典》等百科全書,挑選出嶺南工藝美術家的資料,通過ORC識別系統對藝術家簡介進行數字化,并通過作品集、著作、網絡等載體收集工藝美術家的照片,由人物簡介、照片及所獲榮譽等字段形成人物庫。
④期刊論文庫:利用嶺南工藝美術及其具體的嶺南工藝類目作為檢索詞,如“端硯”“石灣公仔”“廣彩”“粵繡”等,通過CNKI、維普等期刊全文數據庫進行檢索與篩選,下載到本地計算機進行組織整理。
⑤媒體報道庫:媒體報道庫是通過報紙、網絡等媒介,收集對嶺南工藝美術及工藝美術家進行報道、研究、評論的文章。
⑥網絡資源庫:搜羅與嶺南工藝美術相關的網站,對其進行簡單的描述和評價,集中展現,為研究者提供有用的專題網絡導航。
⑦專業名詞庫:工藝美術詞匯是以《英漢·漢英工藝美術造型藝術詞匯》為藍本,篩選了4000多條工藝美術詞匯,作為簡單的英漢對照參考工具。
由于數據的加工、組織和整理需要耗費大量的人力及物力,為了更好地完成數據庫的建設,以“數字化美術與設計文獻資源服務體系”建設項目為契機,數據庫的數字化加工與元數據標引外包給中標公司,數字化加工包括紙質圖書的批量掃描及OCR識別處理,圖片的掃描、裁剪、對比度和亮度調節等。元數據標引主要是針對圖片資源的字段標引和媒體報道的字段標引,電子圖書可直接導入Marc數據,期刊論文則直接引用CNKI的數據。
中標公司采用的是漢能的DIPS文獻處理系統。DIPS系統以全文檢索技術為核心,集成了信息資源的采集挖掘、加工整理、數據庫建設管理、內容發布與檢索利用等功能,能夠滿足大容量數據及多用戶并發的要求。它有多種入庫方式,如傳統的數據加工服務器、DIPS入庫文件、DIPS-BS以及SQL轉DIPS等。SQL轉DIPS工具因操作簡單、易于使用且功能全面,故使用范圍最廣。
SQL2DIPS工具支持Excel、Access、SQL Server、Oracle等常用的數據存儲格式。嶺南工藝美術專題研究數據庫采用Excel進行數據存儲。
在Excel中著錄數據應符合數據規范,首先要確定的是必備字段,按CALIS要求的必備字段是“標題、語種、權限管理、學科、資源類型”,各個子庫可以有差異,著錄時必備字段不能為空。著錄自定義分類時,要確認分類名稱與用戶頁面的名稱是否一致,這關系到能否進行相關字段關聯。若著錄數據有對象文件,要確保對象文件與Excel表著錄的名稱完全一致(特別注意特殊符號、半角/全角、空格),否則會出現無法關聯的情況。
在Excel中錄入標引數據后,使用SQL轉DISP工具進行數據入庫。數據入庫后,要把相應的對象文件上傳至服務器指定的文件夾中。普通的資源對象如DOC、PDF、視頻文件、網頁文件等,只需把這些文件放至指定的文件夾即可;圖片資源對象通常分為三至五級,首先就要轉換圖片大小格式,然后把圖片放在對應的文件夾中。
在發布數據之前,需要將數據進行多次的驗收修改,將出錯率降至最低。與普通的數據庫相比,圖片庫更容易出現無法顯示圖片、圖片與名稱不相符、圖片信息著錄錯誤等問題。圖片的驗收,首先要從源文件夾中的圖片開始篩查,確定圖片及命名無誤后,再核對Excel著錄表的標引是否有問題,圖片路徑著錄是否有誤。對于擁有幾千張甚至幾萬張圖片的數據庫來說,驗收是至關重要且繁瑣的階段,為了避免圖片“張冠李戴”,最后的驗收不容忽視。
經過多次驗收后,才能將數據庫正式發布,按不同的讀者層開放不同級別的圖片,一般的讀者可提供小圖瀏覽功能;校內的讀者可提供大圖瀏覽功能;個別需要下載使用高清圖片的讀者,需向圖書館提出申請。
為了保持元數據庫規范在功能、格式、數據結構、語法等方面的一致性,以及數據庫共享,本數據庫的建設參照了CALIS的《專門數字對象描述元數據規范設計指南》《期刊論文描述元數據著錄規則》《電子圖書描述元數據著錄規則》《學位論文描述元數據著錄規則》及《音頻資料描述元數據著錄規則》,并設計了《廣州美術學院圖書館藝術圖像元數據著錄規范》,讓元數據著錄有據可依,更加規范化。
在著錄的過程中,如遇多個關鍵詞,要用半角分號連接;而自定義分類是與網頁中的縱向分類導航相關的,要先明確使用中文還是編碼,并且保證每一條著錄數據的準確性;正文、資源對象、路徑等著錄字段要保持與文件名完全一致,否則無法關聯。
在數據庫的驗收過程中,發現了不少與元數據著錄不準確相關的問題。比較有代表性的如下:①圖片“無法顯示”。圖片無法顯示的原因,大部分是文件名與資源對象或路徑字段著錄不一致,導致無法關聯。還有小部分是著錄的元數據沒有相匹配的圖片資源,或是相應級別的圖片資源缺失,以致無法正常顯示。②論文“無法打開”或是顯示出錯。論文出錯的問題,一部分是因為元數據著錄不完全一致,另一部分是因為論文原文遺漏,以致無法正常打開。③人物庫的段落顯示格式不一致。因為在Excel中著錄,無法對文本進行格式的編排,文字換行需用代碼
表示。如果使用不準確,則會出現段落不清的現象。另外,還有文字校對工作也是重要環節,應盡量避免錯字、少字、多字等低級錯誤的發生。
為了避免因著作及畫冊數字化引起的知識產權問題,在每個數據庫的首頁,我們都將顯示一段文字,表明此數據庫所有內容僅限于本校校園網內師生學習和交流使用。
2006年7月1日開始施行的《信息網絡傳播權保護條例》第七條規定,圖書館、檔案館、紀念館、博物館、美術館等可以不經著作權人許可,通過信息網絡向本館館舍內服務對象提供本館收藏的合法出版的數字作品和依法為陳列或者保存版本的需要以數字化形式復制的作品,不向其支付報酬,但不得直接或者間接獲得經濟利益。當事人另有約定的除外。由此可知,圖書館對本館收藏的這些出版物進行數字化形式復制,僅限校內師生學習和交流,不獲得任何經濟利益,是在法律允許的范圍內,并不存在侵權問題。
自建特色數據庫的持續發展建設與后期維護是最容易忽略的問題。很多特色數據庫都是以某個項目為依托建設起來的,項目完成以后數據庫的建設就停滯下來,沒有進行更新和維護。為了讓特色數據庫有持續發展的前景,應該與時俱進,不斷地補充和完善內容。除了增加一些相關的圖片、電子書以外,還應跟進論文、媒體報道的發展,對于網絡資源鏈接,也要及時更新最新的相關信息,去除死鏈接等。
數據庫的建設往往都是外包給公司加工處理,一次性大批量地建設;在沒有后續項目資金的情況下,數據庫的后期維護與建設只能依靠圖書館的工作人員。從補充資料的收集、數字化加工、數據著錄到數據整理、驗收入庫等各個流程都需要圖書館員親自完成,對技術及人員投入的要求都較高。在建庫初期,就要將這些流程都熟知于心,且有足夠的人力投入,才能實現可持續發展。
[1]陳曉.基于DIPS的高校圖書館特色數據庫建設[J].情報探索,2008(7):50-51.
[2]鄧娉.廣州體育信息資源專題數據庫建設與實踐[J].圖書館學研究,2011(5):26-29.
[3]楊艷紅.海南本土文化特色數據庫建設研究——以“瓊臺書院”特色數據庫建設為例[J].圖書館學研究,2013(8):32-35.
[4]樊予英.對我國高校圖書館特色數據庫建設的思考——以“交通運輸工程信息門戶網站”為例[J].圖書館建設,2009(2):29-31,34.
[5]胡朝明,劉茜.高校圖書館紡織服裝特色資源庫建設現狀分析[J].圖書館工作與研究,2010(2):67-70.
[6]李雪芬.基于內容的圖像數據庫本體構建探究——以中國美術學院藝術圖像數據庫為例[J].圖書館雜志,2011(4):63-65.
[7]李佳軍.論“吉林西部草原文化網特色數據庫”建設實踐[J].圖書館學研究,2013(14):24-26.