
摘 要:本文基于《中國民歌集成·甘肅卷》中裕固族民歌的采集背景、具體內容和完成質量的分析,闡明了“集成”是裕固族民歌數據庫建設中基礎數據源的不二選擇,并立足于大數據時代數據庫的“數字人文”思維剖析了裕固族民歌數據庫建成對其傳統人文領域研究的可能性與意義。
關鍵詞:裕固族民歌;數據庫;數字人文
數據庫在大數據與數字人文的助推下正悄無聲息地成為傳統音樂文化研究的新思路、新方法。這種“數理”優勢正在強力驅動音樂文化領域的各類數據庫建設及其數據信息技術的迅猛發展。在保護非物質文化遺產和弘揚中華傳統文化的浪潮中,人口較少民族的傳統音樂文化數據庫建設更顯得迫在眉睫。裕固族作為中國唯一且甘肅省獨有的人口較少的民族,因其文字的缺失,一代代裕固人自覺或不自覺地將自己民族獨特的文化基因符號深深地刻在了一首首民歌中,幾百年來口耳相傳得以延續。建立裕固族民歌數據庫對其傳統音樂文化儲存、保護、傳承與相關科研的意義是不言而喻的。
總體來講,民歌數據庫建設包含民歌數據內容與數據表達兩大部分,一般情況下,音樂學者負責民歌數據的來源、質量和行業規范。而數據表達部分則多由信息技術領域的專家完成或主導。
1 裕固民歌的歷史集成
音樂文本的基礎數據源應該是裕固族民歌數據庫建設的首要問題,它直接影響到數據庫的準確性與可靠性。一般來講,可靠性最高的是第一手資料,但是對于裕固族這樣只有語言沒有文字的人口較少的民族來講,其民歌流傳基本依靠口耳相傳,沒有了文字符號,語言幾乎成了唯一的傳續紐帶。但隨著現代文明對裕固人原有文化語境的“改造”,裕固后人的母語繼承鏈條被不斷消解,加之生活方式、審美取向、價值判斷與其母語文化的漸行漸遠,以至現在能用本民族語言演唱傳統裕固族傳統民歌的人越來越少,曲目的流失愈加嚴重。此種狀況下,采集到的民歌資源不管是數量還是質量都與其黃金時代相去甚遠。所以,裕固民歌數據中,音樂本體部分主要數據來源就不得不考慮其歷史文獻。對裕固民歌的系統搜集和整理工作始于20世紀50年代,筆者以為其中最優版本是1986年完成的《中國民間歌曲集成·甘肅卷》(下文簡稱《集成》)中收錄的裕固民歌部分。《集成》完成于20紀80年代的改革開放伊始,當時對于西部經濟欠發達地區的甘肅肅南裕固族自治縣來講,其生活習俗及包括民歌在內的文化生態都更接近其“原生”狀態。更重要的是《集成》工作雖成于1986年,但卻始于20世紀60年代,最終在集大成者杜亞雄先生的《裕固族民歌精選》246首的基礎上完成。
1986完成的《集成》中共收錄95首裕固族民歌,分西部(堯乎爾)和東部(恩格爾)兩大部分,這種分法基于分布區域和演唱語言。實際上裕固族人講西部裕固語、東部裕固語、漢語和藏語4種語言。從理論上來講,裕固民歌也可用這4種演唱語言來分類。但事實上,除了單獨用這4種語言演唱的民歌外,還有用其中的2種或3種語言混合演唱的情況,且這種現象變得越來越普遍。一般認為,純粹用裕固語演唱的民歌屬于本民族的傳統民歌裕固民歌,與其他民族語言混合演唱的屬于較晚出現的“新民歌”。從這個角度來講,裕固民歌又可以分為傳統民歌和新民歌兩部分,這里又牽扯到現代裕固人的語言結構問題,要想直接區分傳統民歌與新民歌已非易事。
再者,《集成》中將西部(堯乎爾)民歌按題材分敘事歌類、婚禮歌類等11類,共70首;東部(恩格爾)民歌分敘事歌類、贊頌歌類等7類,共25首(詳見表1)。這些民歌在2017年出版的《甘肅民族民間歌曲全集》中再版,并將當時原班人馬采集而未入編的32首民歌補錄其中,使曲目達127首。前后兩個版本區別有二:其一,原有題材分類的文字表述皆冠之以“長調”或“短調”民歌體裁形式加以區分,并整合了部分題材分類。例如,將“集成”中“催眠歌類”“學步歌類”“送葬歌類”“也赫哲歌類”這4類并為“短調·習俗歌”類,終使西部裕固民歌題材分類由原來的11類調整為7類,而裕固族東部民歌直接以長調、短調和少年這3類體裁區分。其二,1986年《集成》中對每一首民歌的唱詞不但標注了漢語翻譯,而且對演唱的裕固語言進行了國際音標注音。而2017《甘肅民族民間歌曲全集》中刪去了演唱裕固語的國際音標注音部分,這樣做的具體初衷是什么不得而知,但作為裕固族民歌數據庫建設來講,必是要將國際音標注音錄入其中的,對于體裁與體裁的分類也理應如此,同一首民歌的兩種甚至多種體裁表述或歸屬都應遵循歷史文獻原貌。因為如果不明了選取對象的多種表達方式,在提取數據時就會出現各種漏選,基于數據庫研究的準確性自然會令人質疑。[1]
要補充的是,除1986版的《中國民間集成·甘肅卷》和2017年的《甘肅民族民間歌曲全集》之外,2000年的《中國歌謠集成·甘肅卷》中收錄了55首裕固族民歌的漢語譯詞。值得注意的是,其中并沒有按東部裕固族和西部裕固族進行區分,直接以“勞動歌”“時政歌”“婚禮歌”“情歌”“生活歌”“歷史歌”這6個題材分類編錄。雖然每首歌謠都沒有樂譜,但從采錄信息來看,當時都是留有錄音的。所以對于數據庫建設來說,這部歌謠集在提供漢譯唱詞和題材分類版本的同時,也提供了錄音資源的寶貴線索,同時也是1986年民歌集成的重要旁證。
2 裕固民歌數據資源的收集和處理
系統收集處理不同來源的數據資源是裕固民歌數據庫建設的重要環節。這一階段要將裕固族民歌樂譜、圖片、圖書、論文、地方志等紙質資料,經整理、篩選、分類、匯總等程序后再通過翻拍、掃描、OCR、輸入等手段形成電子文本。就樂譜來講,以“集成”和《甘肅民族民間歌曲全集》為基礎,搜集整理50年代至今已出版和未出版的各類裕固民歌曲詞文本,如《裕固族民歌選》《中國少數民族民歌肅南裕固族自治縣卷》《裕固之歌》《裕固族民間歌謠、諺語卷》《裕固族文藝作品選》等文獻中的相關內容。通過篩選與甄別,按數據庫對樂譜文獻的標準進行規范修訂。譬如,目前文獻中的譜曲皆為簡譜,這就需要在保留原稿的同時按照國際規范將所有曲譜譯制線譜版本一并錄入。此外,唱詞部分也需按照1986年《集成》的思路,保留國際音標注音與漢語翻譯兩部分內容,除了原件掃描,國際音標部分可由語言學者校對后再行錄入。再者,《集成》中民歌演唱者的個人信息僅有姓名一項,其他信息記錄不全,那些缺失的身份信息對裕固民歌數據庫和相關的人文研究來說是極具價值的,所以對有處落實的此類信息要做到最大限度的考證和追加。樂譜之外,相關的歷史文獻、專著及各類學術成果等文獻的搜集整理和錄入也要做到詳盡、客觀和準確,已出版和發表的可實現與相關文獻數據平臺的合作共享,如超星圖書、中國知網、萬方數據等。要強調的是,除對歷史文獻的查漏補缺外,更重要的是當下的第一手數據資料的獲取,尤其是現有傳承人及民歌手的個人及演唱資料的多媒體錄存。總的來講,數據的錄入要做到現有資料能力和手段范圍內的“窮盡”。
作為民歌數據庫建設,音像是最能體現音樂數據庫本質與特色的資源類型,這種重要性來自兩個方面:一是對于像裕固族民歌這樣沒有文字的民族的“歌聲”來講,音像留存的價值遠遠高于樂譜;二是音樂數據庫的信息技術已經逐步實現基于“聲音”的高級分析、比對和檢索,這就要求數據庫中音像格式資源的完整和準確。慶幸的是,雖然60年代民歌《集成》工作開展初期,錄音設備的匱乏使相當數量的民歌采集都未曾錄音,但80年代對裕固民歌進行系統采集時,錄音機已經基本可以滿足采錄的需要。盡管硬件、操作以及“機器”對民歌手帶來的額外壓力等因素造成了不少錄音效果的缺憾,但這些錄音卻已是裕固民歌數據庫建設及相關人文研究最珍貴的聲音史料。
3 裕固族民歌數據庫的人文應用
民歌數據庫的建成必然會干預傳統音樂人文研究領域的理論與方法,改變傳統音樂保護、傳承和研究的思維范式。數據信息技術的不斷進步扭轉了傳統音樂人文研究中取證數據的搜集與處理方式,促使傳統音樂人文領域研究中數據歸納演繹的“多點”型人工篩查、分析、對比等操作范式向大數據時代“密集”型數據取證的數字人文(Digital Humanities)自動勘探與量化分析的靠攏與轉變。這種數據手段在引發傳統人文研究更多可能性的同時,回過頭來可在定性與定量基礎之上實現對已有研究成果的印證與擴充。
裕固民歌數據庫建設對其不同來源資料高度集合的數字典藏(Digital Archive)過程本身就是驅動其史料積累和相關問題研究的內在動力。數據庫中來自不同的時空的聲音與文字,不斷地累積形成的歷史文獻“堆”,以什么樣的標準和方式來甄別,以什么樣的邏輯方式來架構,這個過程本身就需要嚴謹的論證。通過數據資料的勘探(Date Mining)處理,歷史文獻之間潛在的關聯逐漸浮現。這樣的數據資料就不再是簡單的“堆放”式儲存,而是可以進行高級檢索的活態數字人文資源。
傳統音樂人文研究的主要動機來自某些偶然的發現,學者們通常會將這些偶然的暗示進行“大膽假設”,然后根據論證的需要來搜尋有力證據進行“小心求證”。這些用來驗證假設的支撐材料的搜集與取舍不可避免地摻雜了主觀成分,如此的操作流程難免會有損論證的客觀性。而基于數據庫的數字人文可以有效規避這種主觀因素,它可以將研究對象所有能搜集到的材料不分“你我”進行分析、比對,最終以數據關系呈現客觀事實。譬如,不少學者試圖通過裕固族民歌來考證其族源,恰好《西志哈志》《我們來自西志哈志》《路上的歌》等裕固敘述民歌中似乎隱含著某些有價值的信息。直接的有用信息來自唱詞,所以主要學術成果大多來自語言學和歷史學的相關領域。誠然,借助語義的明確指向,語言學的研究似乎更直接,但作為民歌的研究離開了音樂部分的話語總是所有缺失的。音樂學家杜亞雄先生2006年發表于《新疆藝術學院學報》的《裕固西部民歌和維吾爾南疆木卡姆比較研究》,是從音樂角度論證此問題的重要學術文章。全文從兩地民歌典型的調式、體裁、篇幅、節奏節拍、旋律發展手法等幾個方面論證了二者“差異點遠遠超過它們之間的共同點”的事實,[2] 并借助相關史料剖析了造成這種結果的歷史原因。類似的研究成果可利用數據庫進行佐證,借助數字人文的數據庫可以在更大范圍內回避取證的典型性問題,因為不典型情形的發現必須保證對數據資源的最大化占有和對海量數據的分析手段和能力。如果已經實現裕固族、維吾爾族、蒙古族甚至藏族民歌數據的建成和對接,利用數據庫與數字人文就可能按需實現共享數據庫內音樂形態、結構、時空分布等方面的量化分析與比對。再通過對量化結果的客觀描述來呈現兩種或多種民歌文化之間的真實狀態。而這樣規模龐大、關系復雜的數據分析不借助數據庫和數字人文手段是很難實現的。
再如,學界對裕固民歌與匈牙利民歌關系考證的相關課題,也可運用數據庫與數字人文。因為作為史實判斷的數據支撐須有一定數量的積累,尤其是在實證手段很難施展或者有可能失效的人文領域,更要盡可能在考察對象所在范圍之內甚至周邊,做到舉證數量的足夠多和足夠廣。離開了因果關系的必然性,舉證數量的多少或許直接決定了論證結果的可靠性。如果為數不多的裕固族和匈牙利民歌有某些相似或者相近特征,是不能充分說明二者聯系的必然性的。因為這種相似性除了“同根相似”的可能性之外,或許是“不謀而合”的“獨立成長的結果”。[3]但如果借助數據庫的手段與方法進行“密集”數據信息的數字人文分析與提取的話,得出的結論就會更加可靠。筆者以為,多數情況下,數據和論證結果之間的關系正如馬賽克和成像清晰度之間的關系一樣,單位面積內馬賽克數量越密集,所集成的圖像顯現就越清晰。理雖如此,但具體操作過程中如何應用數據庫設計提取論證所需要的數據信息是有一定難度的。蔡際洲和向文的《長江流域“巴蜀—荊楚”音樂文化區劃問題——運用音樂數據庫資料進行實證性研究的嘗試》一文,嘗試“運用數據庫中的音調數據進行地理分布狀態的考察”,并應用地理學界GIS技術生成田哥音調的地理分布專題圖,最終得出“重慶—鄂西”田歌音調的共性與差異性規律。[4]文章對220首田歌音調中的10種三音列各自的總時值進行了分類統計與分析比對,涉及113個市、縣、區、鄉行政區劃范圍,如此繁復的數據分析離開了數據庫是很難完成的。基于數據庫的大數據實現了對遠超個人能力范圍的海量數據的全樣本的分析處理,“全面、完整、客觀地刻畫了研究對象,較之以往更有龐大的數據支撐,大數據具有大而全的超凡特性,縮小了人文學科研究中的不確定性”。[5]
4 結語
裕固族民歌數據庫的建設可最大限度地將不同時空中有關裕固族民歌的歷史文獻、樂譜、音像、圖書、期刊論文等資源高度集合成結構化的數字典藏。在數據庫建設過程中,對于數據來源、版本和質量的甄別、選取與架構直接決定著數據庫的準確性與全面性。數據庫的質量又直接影響基于數據庫內容研究成果的可靠性。
大數據和云計算時代的來臨,使得裕固民歌數據庫的建設直接與“大規模數據分析”和“人文計算”相融合,并以“后來者”的姿態規避之前同類數據庫建設的“前車之鑒”。它的建成將引發裕固民歌研究領域有更多可能性的同時,對其傳統人文研究進行“旁敲側擊”,為音樂人文研究增添量化色彩。
需要注意的是,在大多情況下,依托于數據庫的大數據手段介入音樂人文研究中,只能是傳統人文研究的輔助與拓展,數據本屬“理”的范疇,而人文永遠離不開“情”的左右,人文研究中不乏合情而又不合理的人文關懷。
參考文獻:
[1] 陳佩輝.人文數據庫建設中人文學者何為——以《全宋文》墓志銘親屬信息提取為例[J].圖書館論壇,2019.
[2] 杜亞雄.裕固族西部民歌和維吾爾族南疆木卡姆比較研究[J].新疆藝術學院報,2006(4):1-5.
[3] 馮文慈.中外音樂交流史[M].人民音樂出版社,2013:8.
[4] 蔡際洲,向文.長江流域“巴蜀—荊楚”音樂文化區劃問題——運用音樂數據庫進行實證性研究的嘗試?[J].中國音樂學,2017(1):100-109.
[5] 歐陽劍.大數據視域下人文學科的數字人文研究[J].圖書館雜志,2018(10):61-69.
[6] 甘肅省民族音樂集成編輯辦公室.中國民間歌曲集成·甘肅卷? 裕固、東鄉、保安、撒拉、土族卷[Z]. 1986.
[7] 甘肅省文化藝術檔案館,周永利.甘肅民族民間歌曲全集(第3卷)[M].甘肅文化出版社,2017.
[8] 周鴻德,賀衛光,候曉琴.裕固族傳統民歌研究現狀及發展問題[J].西北民族大學學報(哲學社會科學版),2009(06):115-121.
[9] 中國民間文學集成全國編輯委員會,中國民間文學集成甘肅卷編輯委員會.中國民謠集(甘肅卷)[M].中國ISBN中心出版社,2000.
作者簡介:張鵬遠(1979—),男,甘肅隴南人,碩士,副教授,研究方向:聲樂演唱與教學,中國傳統音樂。