黃惠烽
(四川民族學院 圖書館,四川 康定 626001)
“康”在藏語中是“邊地”的意思,傳統意義上習慣把四川的甘孜州、西藏的昌都地區、青海的玉樹州和云南的迪慶州這一大片藏區統稱為“康”,而“巴”在藏語是“人”的意思。康巴地區地理構造特殊,它地處青藏高原東部,是西藏與內地聯系的紐帶,是內地通往邊疆的橋梁。康巴地區以藏民族為主,其多民族相互交融的一個多民族地區,這里的人們在長期的生產和生活中形成了世界上少有的民族走廊,由此衍生的康巴文化也因此成為了世界上獨特的文化。
康巴文獻是康巴文化的重要載體,它對康巴地區的社會形態、歷史研究、族源研究、宗教研究、藏醫藥研究以及康巴地區人們的生產生活等方面的研究都有著舉足輕重的作用。康巴文獻的載體多種多樣,包括書寫載體、刻鑄載體和普通印刷載體。其中書寫載體包括線裝本、木簡和樹皮書等;刻鑄載體主要依靠專門工具在石頭、木材上刻上文獻,這種文獻在康巴地區的民間較為流行,它多采用瑪尼石、紅木、花梨木和紫檀木等為材料;印刷載體多采用普通紙、藏紙、布料和紗藏綢等。除記載文獻外康巴文獻還包括口碑文獻,口碑文獻在康巴地區也廣泛存在,如民間流行的格薩爾民間故事、藏族祭祀文獻、彝族民間故事等。另外康巴文獻還包括現代的圖片文獻、視頻文獻、音頻文獻等。在眾多的康巴文獻中不乏一些珍貴的文獻資料,其中包括有《甘珠爾》《丹珠爾》《吐蕃王統世系明鑒》《薩迦世系史》《文成公主》《郎薩姑娘》《洛德旺波文集》等多種珍貴藏文文獻;有《平定兩金川方略》《西藏佛教四種》《西藏奏疏》《有泰駐藏日記》《西康建省記》等古籍線裝書;有康巴地區各州志、各縣的縣志、民歌唱詞、《西藏唐卡繪畫大全》和藏民族繪畫精品圖集、《格薩爾文庫》和《格薩爾學集成》以及格薩爾研究文集等重點文獻資料。這些珍貴的文獻資料既反映了康巴地區人們在長期生產生活的狀況,又反映了在漫長的歷史進程中康巴人所創造的成就和在歷史中的貢獻。但是在長期的保存和翻閱中,很多康巴文獻由于受溫度、濕度等環境因素的影響,還有其他一些諸如蚊、蟲、蟻、鼠等不利因素的影響,很多珍貴的康巴文獻出現了一些變形和缺損的情況;還有一些康巴文獻已成為孤本和善本;另外一方面,在康巴地區民間廣泛流傳的一些口碑文獻隨著時間的推移也出現了嚴重的流失和消亡。如果任由這些情況繼續延續,將會造成大量康巴文獻的流失。因此如何整理、保護和搶救這些珍貴的康巴文獻已經成為我們重要而又緊迫的課題。四川民族學院作為康巴地區唯一一所高校,學院非常重視康巴文獻的收集和保護,學院于2005年成立了康巴文獻館,多年來學院多渠道、多形式地廣泛收集康巴文獻資料,目前康巴文獻館共有藏書4萬多冊,涉及到康巴地區的政治、經濟、文學、藝術、教育、科技、歷史、宗教、民俗和民風等漢藏文獻資料和音像資料。學院除了加大力度收集和整理康巴文獻外,還構想通過建立康巴文獻特色數據庫,從而讓康巴文獻通過網絡加速傳播,使康巴文化得到進一步發展和發揚。
目前而言,無論是國內還是國外,最流行的保護文獻方法就是通過計算機技術把文獻進行數字化,并通過網絡和各種通信設備把數字化后的文獻資料進行傳播。為此,我們可以通過建立康巴文獻數據庫平臺,把收集的康巴文獻資料進行分類儲存,讀者可以通過需要進行分類檢索和全文查閱。康巴文獻資料的收集可以緊緊依托四川民族學院康巴文獻館、圖書館和康巴地區的各藏經院,除此以外學院還需多方收集康巴地區的其他文獻,如口頭文獻、石刻文獻、木刻文獻、紙質圖書、雕版印刷圖書、康巴文化音像資料和圖像資料等。音像、視頻、圖片等資料可以通過適當的處理后直接實現數字化,而紙質類的其他文獻資料的數字化基本上有兩種途徑,一是鍵盤輸入的方式,另一種是非鍵盤輸入的方式。鍵盤輸入的方式主要是把文檔資料直接轉化為文本格式,康巴文獻中主要有漢文和藏文兩種文字,目前這兩種文字都能輕松實現文字的輸入,但是缺點是費時費力。如果文獻中大量出現公式、圖表、圖片等信息就不能通過此種方式輸入。另一種輸入方式就是非鍵盤的輸入,這種方式主要依托數碼相機和掃描儀來完成,目前國內外的文獻數字化主要通過這種方式來完成。當文獻數字化后就可以考慮著手構建特色數據庫平臺,而數據庫平臺可以掛靠圖書館網站,讀者就可以做到足不出戶的通過圖書館網站進行相應的數據查詢。
建立數據庫平臺是文獻數字化的關鍵步驟,構建數據庫平臺之前程序員首先要給該平臺進行一個合理的定位,也就是前期的調研準備工作。調研工作可廣泛征求讀者的意見,要先預測該平臺的使用人數,要確定數據庫的規模是屬于大型還是中小型。數據庫平臺合理定位后將首先考慮使用何種開發工具。目前常用的有ASP、VB、VC、PB、JAVA等開發程序,不同的開發軟件各有優缺點,要考慮所使用的開發軟件在面向對象特性、跨平臺特性、組件和網絡開發技術的支持等。其次要考慮使用哪種數據庫軟件,數據庫軟件的選擇要依據使用人數和整個平臺的規模而定,一般而言大型數據庫可以選擇Oracle、Db2,而中大型數據庫 可以選擇sybase、informix、Sqlserver等,小型數據庫可以選擇access、sybase sql anywhere、dbf、execl等。如果平臺使用人數在萬人左右的高校使用Sqlserver即可,如考慮多校共享等情況可考慮使用Oracle。數據庫平臺的構建模塊應該包含用戶管理、管理員管理、資源上傳、資源壓縮、資源審核、資源管理、資源發布和統計報表等。數據庫的框架設計要力求做到醒目、完備,欄目也應該一目了然,它可以包括各類檢索,如文本檢索、圖片檢索、視頻檢索、音頻檢索等。程序設計者在著手編程前應先征求讀者對檢索的要求,要預先合理安排好檢索的策略,同時要考慮好變量的使用,因為合理的變量使用會很大程度上提高程序的性能。
當數據庫網站平臺建好后,如果數據庫平臺使用頻率較高,可以考慮把數據庫平臺用單獨的服務器進行安裝,通過申請專門的域名進行發布,也可以在相應的圖書館網站進行掛靠鏈接。但是無論采用哪種形式,數據庫網站的主界面都應突顯康巴地區別具一格的民族特色,能讓讀者感受到廣博、深厚的康巴文化底蘊。
當數據庫平臺建成后,最重要和繁雜的任務是如何充實數據庫的資源。數據庫的資源包括文本資源、圖片資源、視頻資源、音頻資源等。對資源的收集需要嚴格把關,圖書資料的收集要注重頁面的完整性,如果圖書中出現有缺頁或頁面破損的情況,一般不收集;音頻資源要求聲音較清晰;視頻資料要求視頻畫面清晰;圖片資料要求圖片分辨率較高,分辨率一般不低于150像素。無論是哪種形式的資源,在入庫前都需要對其進行數字化處理,要把數字化后的信息進行規范分類,并實現數據庫的有效管理。
數字資源經過處理后需要導入到數據庫中,在數據導入前應在數據庫中先進行資源文件夾的分類構建,如建立文本資源庫、圖片資源庫、音頻資源庫和視頻資源庫等。數據的導入在平臺設計前應考慮多種方式的導入,如可分為單個資源導入和批量資源導入等。
數據庫平臺完成后,程序員需要對平臺進行嚴格的測試。首先要檢查各個鏈接是否有錯誤,網頁的腳本是否正確,文本、圖片、音頻、視頻等顯示是否正確。一般來說,網站的測試包括網頁測試、本地站點測試、用戶測試和負載測試等。其中網頁測試和本地站點測試很多程序員都能做到,而用戶測試和負載測試往往被忽略。用戶測試就是把做好的網站交給用戶進行測試和評價,主要包括網站的模塊、網站的風格、網頁的布局等是否符合用戶的需求,當然我們在開始做網站前要先跟用戶進行溝通,從而清楚的了解用戶的需求,避免在用戶測試后對網站作太大的修改。而負載測試就是安排多個用戶、長時間的對網站進行同時訪問,通過負載測試我們可以基本判斷網站的訪問速度及客戶訪問網站時的CPU、內存等資源的使用情況。
當網站驗收后就可以進行發布網站。目前最流行的發布方式是采用IIS或Apache等服務器軟件進行發布,具體采用哪種軟件發布主要根據網站的開發平臺及網站的屬性等進行選擇。網站的發布過程基本類似,首先是安裝IIS組件或Apache等軟件,然后是對服務器進行基本設置。以上兩步設置好后就可以在電腦IE欄輸入網址或電腦IP,這樣讀者即可訪問數據庫的Web站點。
如果說網站的建設是一項繁重的工程,那么網站的維護和更新就是一項長期的工程。一個功能完備、安全性能高的網站需要定期和不定期的進行維護和更新,只有這樣網站才能吸引更多的讀者和增加訪問量,網站才能具有生命力。網站的維護主要包括網站安全維護、服務器軟硬件的維護、數據庫的維護以及內容的調整、更新等。
雖然建立康巴文獻特色數據庫是一項長期而又艱巨的任務,但是它是有效保存、保護和搶救康巴文獻的有效途徑。建立康巴文獻特色數據庫既是康巴文化建設的需要,同時又是康巴地區圖書館信息服務的重要組成部分。建成后的康巴文獻特色數據庫必將大力推進康巴學的發展和康巴文化的發揚,它將為康巴地區的政治、經濟發展提供更優質的信息服務。
[1]孫力.藏文古籍文獻數據庫系統建設的探討[J].情報雜志,2006(7):143-146.
[2]何建新.對高校特色數據庫建設的探討[J].現代情報,2005(9):75-77.
[3]魏京學.建設特色數據庫 為西部服務開發服務[J].江西圖書館學刊,2004(4):17-18.
[4]王淑玲.試論民族文獻的價值與利用[J].情報資料工作,1999(6):41-42.
[5]鞠紅耘.西部地區地方文獻特色化建設研究[J].圖書館學研究,2004(10):54-55.
[6]包和平,王學艷.中國少數民族文獻數字化建設研究[J].情報方法,2002(2):32-34.