卡斯木江·卡米爾丁
新疆喀什特區圖書館維吾爾文史資源庫建設構想
卡斯木江·卡米爾丁
論文從新疆少數民族特色數字資源庫建設的背景和現狀,在喀什建立維吾爾文史資源庫的必要性,以及建立維吾爾文史資源庫在計算機技術上的可行性等方面,對新疆喀什特區維吾爾文史資源庫建設構想進行了探討。
維吾爾族文史資源庫新疆喀什特區
2010年,第一次中央新疆工作座談會召開以來,在全國援疆的發展模式下,新疆公共圖書館實現了跨躍式發展,各地州及各縣市的公共圖書館事業都有了長足發展,無論是館舍、硬件設備和計算機網絡,還是系統軟件、人員素質、培訓學習和領導水平等各項指標都上了一個大的臺階,很多地方都建立了現代化的新館。但隨著新疆公共圖書館事業基礎設施和硬件設備的改善,其軟件建設和資源建設方面的不足也暴露出來。新疆不僅缺少少數民族語言的地方特色數據庫,連中文的地方數據庫資源也極度缺乏,在這方面進一步拉開了與東部地區的差距,使得“數字鴻溝”的問題日漸突出。而作為新疆政治、經濟和文化發展極為重要的維吾爾族相關文史專題資源,到目前也沒有專門的資源庫。雖然新疆大學有一個地方文獻數據庫,但僅收錄了部分維吾爾文史資源的內容,而且其服務對象也僅限于本校師生,故不予探討。由于在喀什建立維吾爾文史資源庫的資金、技術和背景條件均已比較成熟,因此,應盡早將其列入喀什地區圖書館發展的議事日程,以推動新疆少數民族特色資源庫的建設進程。
目前,新疆維吾爾自治區圖書館已擁有(主要是購買)的數字文獻資源有CNKI系列數據庫、博看網暢銷期刊數據庫、萬方數據知識服務平臺、國研數據庫、中數圖電子圖書等8個數據庫。共享工程首先要實現的是資源共享,但適合本地區的資源不能單靠共享工程國家中心來提供。新疆公共圖書館系統以自治區圖書館和全國文化信息資源共享中心新疆分中心為依托,建立了不少地方特色的數字資源[1]。在自建的這些資源中,視頻資源和多媒體資源占到90%以上。近年來建成的資源庫主要有:代號“千里馬”的視頻資源庫,是文化部全國文化信息資源建設管理中心向各省級分中心下發的15批約8TB容量的移動硬盤視頻資源;農牧區實用技術庫,以廣大農牧區群眾易于接受的視頻方式,以多種語言形式,全方位地介紹農牧區的種植、養殖、防病、防災技術,以及農機器械保養維修和市場營銷的最新信息;少數民族愛國主義題材影視庫,收集新疆電視臺、有線廣播電視臺、天山電影制片廠等譯制的維吾爾、哈薩克語影視劇1833部集,全疆各譯制部門共譯制維吾爾、哈薩克、蒙古、柯爾克孜語影視劇2968部集;少數民族表演藝術庫,內容有享譽中外和獨具民族特色的少數民族表演藝術形式,包括十二木卡姆、頂碗舞、達瓦孜(走鋼絲),以及其他民間曲藝和舞臺?。环俏镔|文化遺產庫,以視頻、音頻和圖片等形式展現新疆非物質文化遺產深厚的底蘊,其中有名列中國三大史詩的《瑪納斯》和《江格爾》;少數民族少兒“雙語”及基礎教育庫,以合作建設為主,從幼兒教育抓起,以視頻方式進行遠程教育,內容生動活潑,寓教于樂,旨在提高全疆各族兒童的“雙語”水平及其他各項綜合教育水平;新疆風光資源庫,收錄新疆各地雄偉壯麗的美麗風景。上述7個資源庫的建設,雖然少數民族語言文字為主的資源占到60%以上,但基本上是以視頻資源和譯制內容為主的資源,在資源類型上存在著嚴重的不足之處。雖然總量很大,但是無法滿足新疆各族群眾對維吾爾文化歷史方面資源的需求。由上述可知,新疆公共圖書館系統一直沒有建立一個關于維吾爾文史的專題數據庫,這遠遠不能滿足新疆當前政治、經濟和文化建設的需要,因此,開展這項工作顯得迫在眉睫。
2.1喀什特區經濟發展的迫切需要
喀什是中國的西大門,下轄喀什市和11縣,面積16.2萬平方公里,接近廣東省,人口400萬,有維吾爾族、漢族等31個民族,其中維吾爾族占90%,漢族占8%,其他少數民族占2%,是多民族聚居的地區。2010年5月,中央決定在喀什設立特區,使之成為國家第6個經濟特區,同時也是中國內陸首個經濟特區,力爭使喀什特區成為我國“一帶一路”并重對外開放的重要節點,成為我國向西開放的重要窗口,同時也是我國西部最具活力和投資價值的特區。為此,在確定對口支援新疆的19個省市中,山東、上海、廣東和深圳4省市對口支援喀什地區。同時,由于南疆三地州均為國家級貧困地區,面積較大,人口占全疆總人口近30%,其中少數民族人口占93%,同時該地區還是與國內外恐怖、分裂和極端主義斗爭的主戰場,是抵制國際恐怖勢力滲透的前沿陣地,因此,加快喀什經濟開發區的建設和發展,進而引領南疆三地州的發展,對于民族、社會和國家都具有重要意義。在此基礎上,建設維吾爾文史資源庫對喀什特區及南疆地區的經濟發展,政治穩定和文化建設也具有重要意義[2]。
2.2喀什維吾爾文史資源的需要
維吾爾文化的兩部重要作品《福樂智慧》和《突厥語大詞典》都出自喀什人之手,研究這兩部書已經成為一門顯學,在國內外有著較大的影響,僅研究這兩部書的論文數量就非常龐大,每年都會舉辦相關的論文研討會。如果再加上其他文獻,例如《烏古斯可汗傳》《樂師傳》《阿曼尼莎汗》《新疆五十年》《蘇圖克·布格拉汗》等,在新疆內外都有大量的讀者。新中國成立后,自治區累計用維吾爾、哈薩克、蒙古、柯爾克孜、錫伯等少數民族文字出版圖書2.19萬種,其中維吾爾文占了非常大的比例。此外,喀什地區各公共圖書館都有著數量不等的大量地方文獻入藏,而喀什地區民宗委、政協、文化館和文管所等單位也保存了大量的維吾爾文史資源,其中包括不少稀有的察合臺文文獻[3]。這些都有待通過建立維吾爾文史資源庫的形式,滿足新疆地區文化建設的需要,為新疆大開發、新疆經濟建設及新疆各民族的團結安定做出應有的貢獻。
2.3保護維吾爾文化遺產的需要
作為歷史的見證,喀什地區各類型圖書館全部建立了收藏少數民族文字文獻的民文書庫,它們與漢文書庫一起共同構成了自治區具有民族特色的圖書館文獻資源體系,為各民族讀者提供了豐富的精神食糧。而新疆各地民間也有大量的古代及近代維吾爾文獻以地方文獻的形式分別保存在新疆各地的圖書館中。這些文獻內容豐富,版本珍貴,部分文獻散存于民間面臨著失傳的危險。所以,在新疆喀什建立維吾爾文史專題資源庫是非常必要的,可以有效地保護維吾爾族的文化遺產[4],因為紙質文獻尤其是古代的紙質文獻隨著時間歲月的磨蝕,非常容易損壞,這不僅不利于文獻的保存,更不利于讀者的使用。將維吾爾文獻進行數字化處理可以有效地降低珍貴古籍文獻資料的損壞進程,同時更便于讀者的閱讀利用。由于數字化文獻十分有利于文獻資源的檢索、查詢、利用、傳輸和存儲,因而維吾爾文史資源庫的建立可以有效地提高維吾爾文獻的利用率,為讀者閱讀使用和相關研究者的工作創造便利條件,從而在維吾爾文獻的有效保護、使用和傳播等方面都具有重要的意義。
新疆經濟的跨躍式發展為新疆建立各類數據資源庫提供了充足的資金保障。同時,隨著計算機網絡技術和互聯網技術的不斷發展,少數民族計算機技術也在不斷進步,并為圖書館建設數字化文獻資源提供了技術保障。過去因為種種技術原因遲遲無法建立各種地方特色數據庫,而現在因為新技術的出現,維吾爾文史資源庫建設的技術瓶頸已被克服。
3.1XML與Unicode對西部少數民族文獻的支持
XML(ExtensibLe Markup Language)作為網絡環境下的國際標準通用標記語言的一個子集和實用標準,給處理維吾爾和漢語多語種帶來了方便,其多級嵌套可以置標不同層次少數民族文字的子宇段,方便系統平臺根據嵌套的不同語言而采取不同的處理方式,使瀏覽器能識別和查看從右到左的Web頁面,圖書館自動化軟件也可以直接使用[5]。XML及其子集HTML均采用UTF-8為標準字集,支持在采用XML標準的各種品牌瀏覽器上顯示任何地區的文字網頁。國際Unicode協會于2003年8月27日發布的Unicodc4.0版本,為所有維吾爾、哈薩克、柯爾克孜文字符都分配了相應的Unicode編碼,使得全球的語言字符編碼標準得到統一。中國國內適用于少數民族文字的機讀目錄和數據庫也得到全面發展[6],支持多語種少數民族文字的圖書館管理軟件也在不斷面世。例如,現在做為新疆公共圖書館主流自動化軟件的interlib圖創系統,就是支持UNICODE4.0標準的。截止2013年11月,unicode編碼的最新版本已經升級到6.3版。
3.2都柏林核心元數據在少數民族文獻中的應用
圖書館自動化的元數據MARC是將數據、數據結構、索引包羅在一起的不完全的元數據?,F代幾種元數據只包含元素,結構由UTU或Shama描述,因此簡捷明快。目前,國內多采用都柏林核心元數據DublinCore MetaDate,至今元數據已經被翻譯成18種語言。由于只有可選擇且可重復的15個元素,所以給西部圖書館特別是開發少數民族文字的圖書館自動化帶來了新思路。因為不必將少數民族文字的特點同冗長、繁瑣的傳統編目規則去謀合,根據向上兼容的規則,只須在出現少數民族文字的元素上加上語言方向和字體修飾屬性,同時發展本地化的元素限定修飾詞即可,最后在摸索中發現,關于本地化都柏林元數據的翻譯可以借鑒阿拉伯語都柏林元數據標準。
3.3數據庫中維吾爾文存儲和顯示問題
3.3.1存儲問題
數據庫采用支持Unicode5.0的Ora cle10g數據庫,并將語言屬性定義為NLS-LANG=SIMPLIFIED CHINESE_CHINA.AL32UTF8(界面語言:簡體中文,地區:大陸地區,支持所有語言的UTF-8字符集編碼),這樣就可以支持存儲中文、英文、維吾爾文(U-nicode標準)。Oracle數據庫的AL32UTF8字符集選項實現了機讀目錄字符集和數據庫字符集都統一到GB13000,這等同于ISO10646的Unicode字符集標準。
3.3.2顯示問題
ISO10646與Unicode組織字符集標準統一化基于Unicode 標準的UTF-8編碼格式,從數據庫服務器讀取存儲UTF-8的編碼,通過JDBC數據庫接口,仍然以UTF-8的格式傳輸到應用服務器上,最終傳輸到讀者客戶端。如此一來,將不再存在轉換問題,當然也就不會再出現亂碼的字符集問題。
3.4維吾爾文在數據庫中的排序問題
Unicode標準雖然解決了維吾爾文編碼問題,但是在支持Unicode的系統中,系統對維吾爾文進行排序時,是按阿拉伯文字母的順序進行排序,這不符合維吾爾文字母表的順序[7]。在數據庫中對維吾爾文進行排序時,數據庫提供的排序功能是按照維吾爾字母在編碼集中的編碼順序進行排列,而不是按照維吾爾字母表的順序進行排序,不利于讀者利用,對于數字圖書館來說是非常嚴重的缺陷。通過在維吾爾文字母與ASCⅡ碼之間建立一個對應轉換表,這個問題方才得以解決。即通過將維吾爾文字母轉換為ASCⅡ代碼進行排序,利用系統提供的排序功能速度非常快。而查詢到的結果則通過這個對應表再進行一次轉換,轉換成維吾爾文字母的方式顯示給使用者。同時,在數據庫中增加一個字段,即保存維吾爾文關鍵字的ASCⅡ代碼,可以通過代碼直接查詢,通過動態鏈接庫DLL及ActiveX(OCX)控件的方式實現。這樣一來,就實現和解決了純維吾爾文在數據庫中的排序和檢索問題。
[1]全國文化信息資源共享工程新疆分中心資源[EB/OL].[2014-11-12].http://www.xjlib.org/000001950009000 1_1.html.
[2]秦玲.對免費開放時代喀什地區圖書館困境與出路的思考[J].西域圖書館論壇,2012(1):1-4.
[3]葉金鳳,古力帕力.國內外察合臺文文獻的收藏及研究現狀[J].黑龍江史志,2011(21):40-41.
[4]張玉祥,廖肇羽,陳曉艷.論維吾爾族非物質文化遺產檔案式保護[J].蘭臺世界,2014(5):86-87.
[5]王曙光.新疆文化共享工程少數民族語言資源譯制的實踐與體會[J].圖書館理論與實踐,2010(11):101-103.
[6]王小林,陳軍.基于異構網絡的西部少數民族文獻聯合數據庫建設[J].圖書與情報,2014(2):44-47.
[7]伊馬木·達吾提,葛洪偉.維吾爾文數據庫排序軟件的設計與實現[J].新疆教育學院學報,2007,23(4):130-132.
卡斯木江·卡米爾丁喀什地區圖書館館員。新疆喀什,844000。
Construction Conception of Uighur Cultural and Historical Resource Database in Library of Kashi SAR Xinjiang
Kasimujang·Kamierding
This paper discusses the construction conception of Uighur cultural and historical resource database in library of Kashi SAR Xinjiang,including the background and current status of the featured digital resource database construction in Xinjiang minority,the necessity of Uighur history repository established in Kashi,the feasibility of Uighur cultural and historical resources database establishment in computer technology.
Uighur.Cultural and Historical Resource Database.Kashi SAR Xinjiang.
G250.74
(2014-12-15編校:方瑋)