丁寧寧

摘要:本文通過對回族文化信息資源“既寬泛又零散”的基本特征的詳細闡釋,指出在回族文化信息資源數字化建設的前期準備中,傳統的文獻目錄學方法在類似民族特色信息資源的建設中,顯得更為重要,它構成了數字化建設的基礎鏈條。最后初步提出回族文化信息資源數字化整合建設的基本框架和實現路徑。
Abstract: Through the detailed explanation of the basic characteristics of the Hui cultural information resources, which are "wide and scattered", this paper points out that in the preliminary preparation of the digital construction of Hui cultural information resources, the traditional bibliographic method is more important in the construction of information resources with similar ethnic characteristics and it constitutes the basic chain of digital construction. Finally, the basic framework and implementation path of the digital integration construction of Hui cultural information resources are put forward.
關鍵詞:回族;文化信息資源;數字化建設
Key words: Hui nationality;cultural information resources;digital construction
中圖分類號:G250.7 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2019)20-0218-04
0 ?引言
中國是一個多民族國家。在中國漫長的歷史發展過程中,各個民族共同創造了璀璨的中華文明,也形成了中華文明多元化的格局。回族,是中華民族大家庭中的一員,屬于中國55個少數民族之一,自她的先民們開始活躍于古老的絲綢之路開始,到她在廣袤的中國大地上形成和發展,至今已有一千多年的歷史,積累了豐富的、具有自己民族傳統和民族特色的民族文化信息資源。但迄今為止,倘沒有一個內容完整、使用便捷的回族文化信息資源數字化平臺。
今天,隨著網絡數字化、多媒體信息化技術的日趨發展和普及,黨和政府高度重視對民族文化遺產的保護和資源共享。在這個背景下,將回族文化信息資源進行整理和開發,挖掘揭示其精華,對促進民族團結,推動經濟發展,增強民族自信心和凝聚力,都具有重要現實意義。基于此,本文就回族信息數字化建設的若干問題作出闡述,提出初步構想。
1 ?對回族文化信息資源基本特征的認知
所謂“回族文化信息資源”,是指與回族有關的所有信息,它們主要是報刊、圖書、檔案、資料、銘刻、口碑等文字記錄,也包括文物、遺址等型物和音像、圖片等載體。著名歷史學家白壽彝先生曾說:“正像回族居住的分散一樣,回族的歷史資料也非常分散。過去我們寫過一些東西,但寫不出充實的內容,資料上的困難是其重要原因之一”①。這段話實際上概括了回族文化信息資源“既寬泛又零散”的基本特征,筆者在此僅以自己的認知,對這一特征做一個初步梳理。
回族文化信息資源寬泛和分散的基本特征,以多樣化、碎片化形態呈現,我們重點應把握以下幾個方面:
1.1 回族文化信息資源主要蘊藏于漢文典籍 ?這是因為,一方面回族一直是以漢語、漢字為本族的通用語言和通用文字;另一方面是長期以來回族的“不被認識”。“中國歷史上歷朝歷代,未對回族作跟蹤記錄”②,所以回族文化信息資源大多數散見于我國浩如煙海的文獻典籍之中,獲取它猶如大海撈針。白壽彝先生有《回族人物志》多卷,每卷之后均有“附錄”,就是從各類文獻典籍中輯錄、鉤沉的回族人物之碑傳題跋遺文,筆者粗略統計,涉及古代文獻三百余種,有書目、有輯錄、有摘編,其所下之功可見一斑。
1.2 地域分布是回族文化信息資源的必然狀態 ?眾所周知,回族是“大分散,小集中”的居住格局。在祖國遼闊的疆域上,回族與各兄弟民族雜居且相對聚居,從北域之黑龍江、到南國之海南島,從寶島臺灣到西域新疆,都有回族居住和繁衍,都留下她們生活的歷史和文化記錄,都分布著關于她們的信息資源。因此,回族文化信息資源數字化建設,并非一地一隅可以完成。對各地域分布的回族文化信息資源,應重點關注回族的諺語、詩文、歌謠、傳說、革命斗爭史詩等口碑信息資源,以及仍大量散落于民間的碑碣、墓志,現存的古跡遺址等等,隨著時間流逝,這些資源而可能會逐步喪失或損毀,需要我們下大力氣去抓緊搶救。
1.3 回族文化信息資源還散見于其他諸多民族的記載之中 ?長期以來,對回族族源乃至歷史在認識上存在錯誤,有認為回紇為回族的族源,也有認為回族由突厥轉化而形成,加之中國信仰伊斯蘭教的民族有維吾爾、哈薩克、保安、撒拉等十個民族,歷史上人們往往將她們相混淆。另外,在蒙古史料中還有元朝時蒙古王阿難答率眾皈依伊斯蘭教的記載,而元朝正是回族形成的重要時期。因此,對于其她民族中關于回族文化這些信息資源的收集,同樣需要加以關注并耗費大量的精力。
1.4 多文種是回族文化信息資源的又一分布狀態 ?外國對中國回族的關注雖然很少,但卻早有記載。晚清學者洪鈞撰《元史譯文證補》,是最早介紹外國人記載中國的文獻,書中引用了大量波斯人拉施特《史集》、法國人多桑《蒙古史》、伊朗人費志尼《世界征服者史》中的史料,這些外國的著述中有大量內容涉及蒙古人對穆斯林的政策、蒙古人皈依穆斯林、回回人在元代的政治地位和生存情況等史料,令國人大開眼界。《世界征服者史》、《史集》、《多桑·蒙古史》后來都有中譯本,為我們研究中外關系史及回族文化,提供了極有價值的珍貴信息。20世紀初,中國學者張星烺編注《中西交通史料匯編》多卷,書中多次提及《蘇萊曼東游記》一書所記述的阿拉伯穆斯林來華人數日趨增多,當時的中國政府給予來華穆斯林居住區自行管理自內部事務的權力等情況。《蘇萊曼東游記》后來被中華書局譯出并被列為中外關系史名著之一。
自上一世紀末至本世紀初,隨著改革開放的深入和中國在世界的影響日趨擴大,國人也能夠更多了解到外國人對中國回族的研究成果。2008年由回族學者丁克家、馬雪峰編輯出版的《世界視野中的回族》一書,是我們掌握回族文化信息資源的重要參考文獻,為我們提供了大量海外有關回族文化的信息資源。
1.5 民族文化和宗教文化交織,是我們進行回族文化信息資源建設中應特別處理的問題 ?在回族的形成過程中,伊斯蘭教曾經在其民族共同心理狀態和風俗習慣等方面產生過重要影響,因此回族與伊斯蘭教有著密不可分的關系,這也導致在相當長的時期內人們將回族和伊斯蘭教相互混淆,甚至在認識上存在諸多錯誤,在進行回族文化信息資源建設時,我們必須注重處理好這一問題。筆者以為:第一、民族是有著共同的語言、地域、經濟生活和心理素質的人類共同體。宗教則是一種意識形態,就回族而言,伊斯蘭教信仰只能說是回族整體共同心理的因素之一,而不是其共同心理的全部,因此民族文化和宗教文化是不應混為一談的。第二、對于漢文涉及伊斯蘭文化、伊斯蘭經典的相關文字,我們也不能把其排斥于回族文化信息資源之外,比如回族經學家王岱輿、馬注、劉智等人,其著述主要是用儒家學說詮釋伊斯蘭教義,反映了伊斯蘭教通過回族這一載體、在中國特定的文化環境下而中國化的現實。再如,舊時所說“回教”,實際主要是說回族,這些都需要我們予以正確的把握。
2 ?回族文化信息資源數字化的前期工作
許多人認為,在數字化技術高度發展、通過數字模式實現對信息資源控制已經成為主流的今天,人們長期依賴的傳統信息資源控制方法已經過時。在實際工作中,圖書館的信息服務與傳統書目參考方式也普遍出現了顯而易見的脫節狀況。但是,從我們近年所進行的信息資源數字化實踐看,傳統的文獻目錄學方法在類似民族特色信息資源的建設中,卻顯得更為重要,它構成了數字化建設的基礎鏈條。
2.1 調查和遴選工作 ?調查工作包括對信息資源的分布和類型、數字化的現狀、用戶的需求等多方面進行調查。這樣可以做到數據庫建設的科學、合理規劃并為合作共建打好基礎。遴選的范圍,大致應包括以下幾個方面:①散見于漢文及相關民族文獻中的信息;②相關的學術、專業會議文獻及學位論文;③口碑資料和檔案性資料;④譜牒、碑刻、圖片、文物、遺址等特種信息;⑤外文的、包括國外回族的相關記述和研究成果;⑥其它相關的信息,如:非物質文化遺產。
2.2 資源采集工作 ?這方面工作的途徑和方法,大體有:①自采自建。這需要組織自身的人力、物力和財力,在充分的信息資源調查基礎上,通過輯錄、征集、采購、制作等途徑獲得所需的資源。這些資源應該具有自主知識產權、他處難以獲得、載體多樣等特點。它們可能是從文獻中鉤沉的只言片語,也可能是針對實物制做的圖片記錄或音視頻記錄;②異購。就是購買已有的成果或者知識產權,再按照數字模式的要求進行必須的傳統模式梳理、篩選和標注;③網絡獲取。網絡上的信息資源豐富異常,我們往往可以有意外的收獲。但就回族文化信息資源來說,網絡的資源同樣是分而散無序的,需要我們搜索和下載時的耐心,更需要我們對下載來的資源梳理、編排;④實地采集。它包括口碑資源,也包括金石、碑刻、文物、遺存等實物資源,我們在此前已經說過,這是最難但又是最能獲取第一手信息資源的途徑,需要采集人員與回族文化研究的專業人員溝通和配合,更需要有專心致志、棄而不舍的敬業精神。
2.3 驗收和登記工作 ?對回族文化信息資源的驗收和登記工作,主要是為了對已經獲取的信息資源實施有效的財產保管,也是為采集工作提供查重依據,還可以為信息資源的數字化工作提供工作依據。驗收和登記時應詳細注明信息資源的來源、價格、載體形態、單元數量(冊、頁、幅、條、GB等)以及序號。
2.4 分類、提要、摘錄、輯佚等工作 ?盡管數字化平臺可以完全實現信息資源基本特征的自動生成,但在數字化之前,對信息資源進行科學分類仍然十分必要。這是因為,已經數字化的信息資源元數據,作為數據源還需要保存,而且采集來的信息資源也并非全部是全文數字化,還有提要、摘錄等多種形式。另外,在對回族文化信息資源進行科學分類的同時,應依據數據平臺的組織架構對信息資源做出載體形態類分,并根據已經確定好的資源等級標準標明該資源的等級,為該資源是否數字化以及數字化程度(全文、摘要或題錄)提供人工標引。
3 ?回族文化信息資源數字化的基本框架和實現路徑
信息資源的數字化,就是“全面搜集各種載體相關信息,將這些相關信息整合規范到一個系統中,統一在同一檢索平臺。可以進行目錄檢索、分類檢索、主題檢索和全文檢索,實現讀者網上輕松閱讀和下載”③。
由于資源數字化的技術工作主要應與合作商共同研討展開,這里,筆者僅從甲方(委托方)角度就一些基本問題做初步闡述。
3.1 資源數字化的參考標準和規范
在技術發展和進步日新月異的今天,新的標準和規范層出不窮。但一個成熟的數字化平臺應該保持其標準和規范的相對穩定。因此,我們必須從實用性、可持續性以及市場認同度等多方面對數字化的標準和規范進行反復考量,必須遵守W3C、ISO、GB相應的標準和規范,同時應當參考我國《數字圖書館標準和規范建設》、《CALIS建設標準和規范》以及相關的計算機、網絡、安全、信息、軟件設計等的標準規范。如:在數字化系統表現層,可采用我國字符編碼方面的主要國家標準GB2312/GB18030;采用URI統一資源標識符,對所有標識互聯網資源的地址和名稱的通用集合,采用Z39.84(DOI語法)標識數字環境中的內容對象;采用用于網絡資源描述的DC,用于傳統出版物描述的CNMARC中文圖書機讀目錄格式,以及用于靜止圖象的技術元數據Z39.87數據字典等多種元數據規范。
另外,回族文化信息資源數字化平臺的檢索服務標準對于實現數字資源間的交互非常關鍵,應采用目前已經被廣泛使用的OAI(Open Archives Initiative)用于元數據收割的開放檔案主動協議,用于實現資源對象調用獲取的Z39.88(OpenURL)對外開放鏈接協議,用于全國元數據聯合編目系統、圖書館自動化系統、館際圖書館系統之間數據對接、共享的Z39.50信息檢索協議等。
3.2 回族文化信息資源數字化平臺的架構,包括組織編排架構和技術系統架構
①組織編排架構——回族文化信息資源數字化平臺集成多種形態信息資源的數字化格式,即:文本格式和圖(影像)格式;全文格式和文摘、提要格式;視頻格式和音頻格式;動態格式和靜態格式等。據此,初步設想將資源組織編排為三大子庫:
1)文獻分庫——包括古籍、圖書、報刊文章以及輯錄文字。該分庫又分全文數據、提要和文摘數據和題錄(索引)數據三個子庫。
全文數據庫應選擇具有學術價值、史料價值、使用價值且內容豐富、富有代表性的文獻,以滿足用戶多層次的需求為目的,應包括文獻的書名(篇名)、作者、正文、圖像、參考文獻及摘要、關鍵詞等數據,用戶可通過多種途徑檢索到文獻的全文內容。
有相當部分回族文化信息資源內容并不需要做成全文數據,有許多信息資源,僅需輯錄一書中的某段文字或對某相關文獻的摘要、提要,對此,平臺應顯示其出處和版本等信息,以便用戶需要時能找到原文獻。
對于那些即無須錄入全文又不便輯錄、文摘或提要的資源,則以題錄方式反映即可。為便于用戶查找獲取原始資源,題錄式數據須注明具體的出處或收藏。對于音視頻以及圖片、碑刻、遺存、實物等資源,也需要做出題錄來幫助用戶從中獲知更詳細的信息。另外,對于暫時無法獲取的文獻資源,通過題錄加以反映,也不失為好的辦法。
2)音視頻資源子庫——包括各地攝制的回族歷史、文化、生活片,回族花兒歌曲,回族著名藝術家的技藝片等。
3)圖片子庫——包括回族服飾、遺物遺存、回族墓穴圖片,也包括各地、各朝代與回族相關的建筑遺址、碑拓圖片等。
②技術系統架構——該架構首先應該滿足用戶瀏覽、查閱數據的需求;其次要考慮到資源量的擴容;還要對平臺的所有資源進行數據注冊管理、備份保存、知識產權保護、平臺維護、平臺安全等多方面的綜合考慮,初步設計回族文化信息資源數字化平臺以J2EE平臺的多層體系結構為依據,采用Spring MVC的開發框架,使系統具有MVC三層結構且每層的功能相對獨立,每層之間留有標準接口,能方便進行系統接入與管理。(圖1)
1)服務層或終端層:負責前臺的內容展現。如接受檢索請求,為用戶提供檢索服務等。在實際實現過程中,采用Microsoft SQL Server 2008,Apache Tomcat做為Web應用服務器,快速搭建高效的B/S(瀏覽器/服務器)系統進行多層體系結構的系統接入與管理。2)數據層或系統層:負責平臺數據庫的數據實體存儲及增、刪、改等基本業務管理。3)應用層:負責實現平臺系統各功能并對數據層的業務邏輯封裝。(圖2)
3.3 數字化平臺的系統功能
我們將數字化平臺的系統功能按照工作性質劃分為:數據加工和編輯、系統服務、資源管理。
①數字資源加工和編輯——包括對前期已經完成技術分析的回族文化信息資源的數字化加工、數據著錄(編目)入庫以及元數據的生成和標引。還包括對系統外相關數字資源、元數據的收集、生成和標引。
1)回族信息資源的數字化加工:針對不同資源類型,數字化方式也會不同,平臺的資源數字化加工功能必須支持紙本文獻的掃描OCR文字識別;支持自定義分類體系,自動生成若干導航樹;支持規范檔及用戶自定義詞表等。
2)數據著錄(編目)與入庫:由編輯人員根據不同需求對元數據進行標題、關鍵詞、作者、出版信息等元素進行增刪、修改、簡繁級別描述等編輯操作。平臺系統可支持國內外各種元數據標準,并能滿足自定義方案;支持MARC、XML、TRS、關系數據庫等多種格式文件導入導出;數據編目入庫時,系統支持逐條入庫和批量入庫等。
3)元數據標準:主要是為保證平臺數據的正確性、一致性、完整性、唯一性和有效性,如支持業界國際標準以及CALIS標準;底層數據支持XML格式;同時支持全文檢索與元數據查詢方式等等。
②系統服務——主要包括多媒體資源的調度、發布、交換(XML格式)、資源檢索和瀏覽等。
1)資源調度:主要是對資源的存儲、發布環境進行統一調度,實現資源共享、多級分布式海量存儲與無縫檢索。
2)資源發布和審核:資源發布和審核:對已經數字化了的信息資源,在經過標準化處理后應及時上傳、存儲。但對擬發布供讀者檢索瀏覽的資源,還應設置一定的權限控制和審核標準,以確保資源在發布之前經過嚴格的審核,避免發生數據錯誤、版權問題等等。
3)資源檢索功能:資源發布是為了讓用戶瀏覽使用,為了方便用戶,這一功能應提供標題、作者、內容、關鍵字、關鍵詞等多種檢索途徑,支持海量數據的檢索,并能靈活定制檢索條件及結果展現字段,為用戶提供一站式高效、準確、個性化搜索服務。
再者,要根據回族文化信息資源的特點并按照用戶的需求或習慣設計必要的瀏覽和檢索界面,包括網頁和欄目,每一個網頁、欄目下的資源,均通過關鍵字或關鍵詞有條理地展示在用戶面前。
③資源管理——主要是資源數據的安全保護問題。資源數據的安全保護,主要涉及信息數據的安全保護和知識產權保護兩個方面。
關于信息數據的安全保護,回族文化信息數字化平臺采用SAML安全技術對信息訪問進行控制,確保用戶統一授權管理,保持用戶信息在各系統中的一致性,保障整個系統的安全訪問;同時采用完全備份、差分備份、增量備份三種不同的備份和恢復策略,確保數據安全備份;實時監控數據庫存儲空間使用情況和數據的訪問操作情況,設置緊急情況預警。
關于知識產權保護,目前我們收集整理到的回族文化資料還未能全部解決版權問題,且基于對自身已有知識產權的保護,回族文化資料不可能完全開放供用戶下載保存,因此需要通過用戶認證對資源知識產權保護提供安全控制,形成有效的內、外部用戶訪問策略。平臺設計主要采用對用戶IP進行控制的方式實現知識產權保護。其原理是,在著錄數據時先對有知識產權限制的文獻資料進行標引,當用戶想要訪問這些信息時,系統會對用戶的IP地址進行判斷:內網用戶即開放信息,外網用戶則屏蔽信息,以此達到保護知識產權的目的。另外,對于多媒體資料的傳播,由于流媒體具有實時播放和知識產權保護的優點,因此,對這類資料設計采用流媒體技術在線播放,同時要求系統在提供資源的全文閱讀和媒體播放等應用的同時,應在瀏覽器端實現防打印、防拷貝等技術以增強系統安全性。
注釋:
①白壽彝:《回族人物志·元代》,銀川:寧夏人民出版社,1985年。
②楊懷中:《回族文化散論》,銀川:寧夏人民出版社,2012年,第879頁。
③楊婭娟:《基于方正DESI系統的回族歷史文化特色數據庫建設研究》,《大學圖書館情報學刊》,2015年第2期,第39-42頁。
參考文獻:
[1]白壽彝.回族人物志(1-4冊)[M].銀川:寧夏人民出版社,1985-1994.
[2]楊懷中.回族史論稿[M].銀川:寧夏人民出版社,1991.
[3]楊懷中.余振貴.伊斯蘭與中國文化[M].銀川:寧夏人民出版社,1995.
[4]楊懷中.回族文獻散論(上、中、下)[M].銀川:寧夏人民出版社,2012.
[5]丁克家,馬雪峰.世界視野中的回族[M].銀川:寧夏人民出版社,2008.
[6]楊懷中.回族文化散論[M].銀川:寧夏人民出版社,2012.
[7]趙悅,申曉娟,胡潔,李丹.數字圖書館推廣工程標準規范體系建設規劃與實踐[J].國家圖書館學刊,2012(5):46-53.
[8]林琳.全球化語境下的回族認同[J].回族研究,2015(2):40-44.
[9]馮云.民族地區公共圖書館特色數據庫建設現狀調查分析——以我國民族八省區為例[J].山東圖書館學刊,2017(4):38-43.
[10]寧夏圖書館特色庫資源[EB/OL].[2017-5-28].http://www.nxlib.cn/node/403.jspx.
[11]CALIS三期特色庫標準規范[EB/OL].[2017-6-29].http://202.114.65.58/portal/portal/media-type/html/group/whuguest/page/area_spec_change5_3.psml.