○ 丁旭東
自2014年“全國首屆音樂口述歷史學術研討會”舉辦以來,音樂口述史在我國音樂學界受到較為普遍的關注,成為一個相對活躍的學術領域。期間,中國音樂學院率先開設了“音樂口述史研究方法系列課程”(2014年至今);由筆者擔任導師的音樂口述史研究方向的研究生開始招生(2016年至今);第二屆與第三屆音樂口述史學術研討會順利舉辦(北京、湛江,2017、2018年);全國音樂口述史學會成立(2018年);至少六個部級或國家級的音樂口述史類課題立項;十余部音樂口述史圖書作品出版;數十篇碩博學位論文以及百余篇音樂口述史方向的期刊論文發表。正如筆者拙文《一個亟待興起的新學科——全國首屆音樂口述歷史學術研討會概述與簡評》①丁旭東:《一個亟待興起的新學科——全國首屆音樂口述歷史學術研討會概述與簡評》,《人民音樂》,2015年,第3期,第66-67頁。所期盼的那樣,音樂口述史作為一門新的學科領域正亟待形成。
如何建構一門學科?有學者指出,定義一門學科要重點考慮四個方面:完整的概念群落、相對穩定的研究領域、若干相互競爭的理論、屬于自己學科的研究方法②張康之:《公共管理學學科建構的過程與依據》,《內蒙古社會科學》(漢文版),2018年,第4期,第62-71頁。。雖然這一說法還存在商榷的學術空間,但有一點已成為學界共識,即必須擁有“學科”研究方法論體系,因為只有如此,“領域內”的學術成果才能持續、可靠地輸出。
目前,我國研究音樂口述史方法論的學術成果主要有三類。一類是“制作音樂口述史”方法,如梁茂春教授的《“口述音樂史”方法八則》③梁茂春、鄭依萌:《“口述音樂史”方法八則——2017年11月30日梁茂春教授在中國音樂學院講學記要》,《天津音樂學院學報》,2018年,第2期,第25-45頁。、拙文《“口述音樂史”學術實踐的六個操作關鍵》④丁旭東:《“口述音樂史”學術實踐的六個操作關鍵》,《中國音樂》,2018年,第1期,第159-171頁。等;一類是利用“音樂口述史”輔助其他學科領域進行研究的方法,如臧藝兵的《我們也活過:以口述史為證——論口述史在音樂學領域的運用》⑤臧藝兵:《我們也活過:以口述史為證——論口述史在音樂學領域的運用》,《天津音樂學院學報》,2017年,第1期,第24-29頁。、齊琨的《顛覆抑或延續——關于徽州樂人階層變遷的口述與文獻研究》⑥齊琨:《顛覆抑或延續——關于徽州樂人階層變遷的口述與文獻研究(上)》,《黃鐘》,2010年,第3期,第139-148頁。等;一類是探索具有學科特質的音樂口述史“理論型”研究方法,如拙文《口述音樂史學研究的三個路向——兼論三種研究模式的建構與利用及其意義”》⑦丁旭東:《口述音樂史學研究的三個路向——兼論三種研究模式的建構與利用及其意義》,《云南藝術學院學報》,2018年,第2期,第20-32頁。等。
在西方,音樂口述史發軔于美國,最早可追溯到1969年。⑧第一個音樂口述史項目為美國音樂口述史家薇薇安·帕麗絲(Vivian Perlis)所做的美國現代音樂作曲家查爾斯·艾夫斯(Charles Ives)口述歷史。該作品成書發表于1974年。見Perlis V.Charles Ives remembered: An Oral History.Publisher: University of Illinois Press, 1974.但“美國‘口述音樂史'注重的不是理論探究而是實踐。其最核心的是音樂家訪談(口述音樂史料的采集)、口述史料整理、數字化與共享型口述音樂史料庫建設”⑨丁旭東:《“口述音樂史”學術實踐的六個操作關鍵》,《中國音樂》,2018年,第1期,第159-171頁。。雖然有一些應用音樂口述史輔助其他學術研究方法論的論文,如Oral History:A Popular Research Technique That Can Work in Music Classes(《口述史:一種可應用于音樂課堂的流行音樂研究方法》)⑩Young, Amanda.Oral History: A Popular Research Technique That Can Work in Music Classes.Music Educators Journal, 1980, 67(3): 52.等,但在本體方法論研究上,西方學術界目前還幾乎處于空白。當然,大口述史學界的情況并非如此,近年來相關的學術研究成果已經開始涌現,如Data Analysis in Oral History:A New Approach In Historical Research(《口述史資料分析:歷史研究的新方法》)?Firouzkouhi M , Zargham-Boroujeni A.Data analysis in oral history: A New Approach In Historical Research.Iranian journal of nursing and midwifery research, 2015, 20(2): 161-164.等。音樂口述史研究能否借鑒大口述史的本體方法論研究成果,也構建出一個相應的研究方法?
對此,筆者曾在拙文《口述音樂史學研究的三個路向——兼論三種研究模式的建構與利用及其意義”》?丁旭東:《口述音樂史學研究的三個路向——兼論三種研究模式的建構與利用及其意義》,《云南藝術學院學報》,2018年,第2期,第20-32頁。提出一些不成熟的假說構想,本文將通過原理探討、示例演示與分析對其完善,正式提出音樂口述史的大數據研究法暨音樂口述史語料庫分析法。
所謂音樂口述史語料庫分析法,在筆者看來就是根據一定的研究目的,對音樂口述資料數據庫中的有關文本資料(通常是口述訪談的文字抄本)進行信息整合重組構建成音樂口述史語料庫后,運用語料庫分析軟件(如 Wordsmith Tools、Textalyser、AntConc等)中的程序(“語境共現檢索工具”“詞頻列表檢索工具”“關鍵詞檢索工具”等)進行數據信息處理(目標信息檢索、提取、統計分析等),從而客觀發現其中的內隱真實及研究對象中不易察覺或容易忽略的關系。音樂口述史語料庫分析法是語言學語料庫分析法的遷移應用,是“數據挖掘”(Data Mining)的手段之一,是音樂口述史的大數據研究的一種方法,其在音樂口述史研究中具有廣闊應用前景。
“音樂口述史語料庫分析法”的提出有兩大主因。
“大史學”發展的學術浪潮,促進了音樂史學的發展。在這股蓬勃發展的學術潮流中,“口述歷史”的興起也直接帶動了音樂口述史的誕生。由此,運用主觀的口述資料,借鑒計量學等跨學科的研究方法探討音樂口述史的學術研究范式也成為一種必然。
此外,科技的高速發展開啟了新問題的研究思路,并帶給學術研究極大便利。通過大數據的采集、分析、挖掘來發現事實背后的深層原因、內在關系要素已經成為公認的高效、可靠、科學的研究方法或問題解決辦法。如,語料庫語言學對語言、語言交際及語言學習的行為規律研究等,為“音樂口述史語料庫分析法”的出現提供了技術準備和借鑒的可能。
音樂口述史既是部門史學或專門史學又是新史學的一個組成部分。音樂口述史研究方法論的提出恰逢其時,契合了新史學大發展的時代潮流。不僅如此,新史學注重多層次、寬領域、多角度地認識歷史,拙文《“口述音樂史”的概念內涵與分類》認為,“音樂口述史”的特性之一是“多維性……可以做成一種邏輯鏈條相對完整的、多面多層次信息的‘立體音樂史'”。?丁旭東:《再論“口述音樂史”的概念內涵與分類——基于與梁茂春教授的對話》,《江漢學術》,2017年,第6期,第69-77頁。可見,即使從學術特性上來考察,音樂口述史也是和新史學相契合的。
其次,說說和大數據研究的關系。大數據研究要具備最基本的四個條件:1.海量數據;2.采集數據能力;3.處理與分析數據的工具;4.被學術界認可的大數據研究方法。對于前兩個條件,“音樂口述史”無疑是具備的。筆者和梁茂春教授曾探討過這一問題,“一個人就是一個圖書館,而且這個‘圖書館里'的資料非常有‘彈性',似乎有發掘不盡的信息材料。他可以告訴我們‘發生了什么',也可告訴我們‘為什么發生'”?丁旭東:《談談口述音樂史的幾個問題——基于與梁茂春教授的對話》,《黃鐘》,2017年,第3期,第22-31頁。,如果一個人閱歷豐富,那他就是一座館藏豐富的“圖書館”,如果一個人創造或見證了一段歷史,那他就是藏有這段歷史記憶文獻的“圖書館”,歷史當事人或見證人離世,那保有這段歷史記憶文獻的“圖書館”也就消失了,所以,音樂口述歷史的核心使命之一就是搶救、采集“歷史當事人”記憶中的珍貴文獻。對于后兩個條件,語料庫語言學從20世紀60年代發軔,至今已有近60年的學科發展史,其已從最初的詞性分析,擴展到話語分析、語言教學、詞典編撰和人工智能等領域。從某種程度上來說,“音樂口述史語料庫分析法”只是語料庫語言學研究方法體系的延伸或學科應用而已。
此外,在當前音樂口述史學術勃興的學術語境下,要從本質上實現學科化發展,成為音樂口述史學,建構自己的學科方法論知識系統也是必經之路,所以我們認為,“音樂口述史語料庫分析法”作為一種大數據研究法,其產生不僅是自身學術發展的亟需,也是時代學術發展的必然與應然。
我們從三方面探討一下音樂口述史語料庫分析法的內在原理。
學術求真,所謂“真”,即真理,是“客觀事物及其規律在人們意識中的正確反映”?董大年主編:《現代漢語分類大詞典》,上海:上海辭書出版社,2007年,第463頁。,不正確的反映是謬誤,所以,學術求真就是探求事物的本來面目,探求事物隱含其中的內在規律。這個道理和我們音樂口述史研究中探求的“表象下的內隱之真”的道理是相通的。這就是“求真通理”的基本內涵。
如何求真?
如啟蒙主義的核心宗旨之一是“去除愚昧”,何為愚昧?愚昧就是不明事理,事理在人的頭腦中被遮蔽,所以要明之,即“去蔽”之。胡塞爾精神現象學所主張的就是把人頭腦中的各種先入之間“懸置”起來,以解除精神的蒙蔽狀態,目的是“去蔽”;存在主義哲學家馬丁·海德格爾(1889-1976)把“真理”解釋為“去蔽狀態”。由此可見,求真的過程就是“去掉遮蔽”的過程,也是本文所言的求得“表象下內隱之真”的過程。因為真理有的兩種基本狀態,一種是被澄明的狀態,就是我們通常在教科書中所學的學科理論、學科規律性知識,如概念定義、定理等。這些知識毋須我們探求,只需要認知、理解和掌握即可。另外,仍有許多真理體現在紛雜的表象之下,是人們尚未完全明確或未知的狀態,即遮蔽或內隱的狀態。對于這種未完全明晰或未被澄明的真理,是學術研究的目的所在。因此,我們說,求得“表象下的內隱之真”與“去蔽”求真實則同理。
該理論與音樂口述史有何關聯?
這需要我們明確一下“音樂口述史”的幾個相關問題。
通常我們在書店看到冠以“音樂口述史”的圖書是“音樂口述史作品”,不是音樂口述史。目前,關于音樂口述歷史尚無一個確切定義,主要理解有三種:1.音樂口述歷史是以錄音、錄像、訪談的方式搜集口傳音樂記憶以及具有音樂歷史意義的個人觀點。2.音樂口述歷史是以錄音機、錄像機等作為工具,通過深度訪談來記述人們口述所得的具有保存價值和迄今尚未得到的原始音樂資料。3.音樂口述歷史是面對歷史在場者關于音樂歷史的詢問和調查,包含著對他們口頭音樂故事的記錄。總體而言,目前主要是把音樂口述史作為一種獲取音樂口述資料的方法來理解的。
“音樂口述資料”不能稱之為史料,因為只有這些資料可以被音樂史學研究利用并具有可靠性品質,才可稱得上“音樂口述史料”。音樂口述史料屬于“口述史料”或“口碑史料”,其與文獻史料、實物史料并稱為史學研究的三大史料類型,是發現和解釋歷史的依據。
為什么音樂口述史料能夠解釋歷史呢?
因為這三種史料都具有“真”的品質,如果不真就不可謂史料。這種“真”史料存在何處?存在口述資料、文獻資料、實物資料三大資料類型之中。換言之,這三大類型的資料中既含“真”也含“非真”,其可稱之為“內隱有真的表象”。當然,其中也很可能可能有假的成分。
這樣我們就能析出“音樂口述史”與“求真之理”的關系了:通過口述訪談獲取的“音樂口述資料”,通過相關學術工具或方法去除其中偽的遮蔽,求得真,便達到其學術研究之目的。這就是“求真通理”,也就是音樂口述史資料研究與學術求真之間的內在相通的道理。
“迭”在詞典中一般解釋為“屢次”“反復”。“迭語”就是反復說出意思相同或內容可以相互佐證、補證的互文之語。“去蔽”,就是可以去掉遮蔽,澄明真理。
“迭語”為何能夠“去蔽”?
這個問題要從真理的兩個維度來探討。
1.第一維度:“顯在的客觀事實”,包括時間、地點、人物、事件,總起來說就是“是什么”一類的問題。
王國維提出“二重證據法”:“吾輩生于今日,幸于紙上之材料外,更得地下之新材料。由此種材料,我輩固得據以補正紙上之材料……此二重證據法”(《古史新證總論》,1925年);陳寅恪更是將此法予以發揚,提出“新二重證據法”:“一曰:取地下之實物與紙上之遺文相互釋證……二曰:取異族之故書與吾國之舊籍互相補正……三曰:取外來之觀念與固有之材料互相參證”(《王靜安先生遺書序》,1934年)?筆者之所以說是陳寅恪提出的是“新二重證據法”。這一點連陳寅恪也未必承認,因為他在該文中直接言明,自己所言是在歸納王氏的治史方法。但實際上,三證之中,后兩種,王國維雖行之,但未言之。故筆者認為陳氏對王氏之方法有發揚,可謂之“新”。。
這些方法,在當今學界看來已為常識,但在當時的學術語境下卻是“石破天驚”。
相對于前清已經形成傳統的以“乾嘉學派”為代表的中國歷史學術而言,“王”“陳”之法做到了兩點。
一是回到原始。即回到原始的史料中去。二是“史料”證史。這里的“史料”當然是原始史料,而絕非乾嘉學派那種以典辨經的考據。
找到原始文獻,如原始檔案、原始書信、原始節目單、原始報刊報道等等,基本都能直接還原出“顯在的客觀事實”,根本不需要其他類型史料的多此一舉的介入。由是,“王”“陳”倡導的“二重證據法”在治史中就沒有什么價值了嗎?不是的,對于古史研究,其甚為必要。舉例來說,先秦典籍多為漢人所恢復,所以造成先秦原始文獻缺失的問題。這時一味取信漢人加工恢復后的一手文獻,難免有誤。所以,需要王國維所說的“地下之新材料(原始史料)補正之”;需要陳寅恪所言的其他史料釋證、補證、參證。為何?簡言之,古史治史所以采用二重證據法,是因其原始文獻史料不足也。
基于這一思考,我們認為,對于現當代音樂史研究,尤其是偏向精英史學的藝術音樂史而言,要還原客觀史實,可利用的原始文獻史料是相對充足的,這時“口述史料”其實并不具有太大的學術利用的空間,即使能夠顯現出一定的價值,也是查缺補漏、拾遺鉤沉,即梁茂春所言的非主流的邊角研究?同注⑦。。
但人類歷史上,除了“秦始皇史”——官史,還應有“孟姜女史”——民史。“孟姜女”時代,她的歷史只存在于“口傳”文本中。“口傳”文本表現為口頭傳說、口頭文學,并不客觀、可靠,即使司馬遷利用口頭文本撰寫出《五帝本紀》,我們也不能認定那是史實,只能理解為具有真實因子的歷史傳說。從某種程度上來說,沒有記錄沒有發生,有可靠的歷史記錄才有可靠歷史的形成。正是因為錄音技術的發展與普遍應用所以才催生了“口述歷史”。
面對記錄下來的口述資料如何才能去偽存真?其原理就是“迭語去蔽”。
迭語,前文已經介紹,是重復、互補、相互佐證的言說之語。
當然,歷史屬于過去,歷史真實不可能重現,只能去證明。
證明歷史真實之學問稱為“證據學”。證據學“是從‘如何發現事實真相'的角度出發,研究如何有效地收集、審査和判斷證據”?陳瑞華:《從“證據學”走向“證據法學”》,《法商研究》,2006年,第3期,第85頁。。
在判斷證據的證據力問題上,其有諸多原則,其中包括:“直接言詞原則”“原生證據優于派生證據”原則、“證據鏈優于單個證據”?馬國賢、樊玉成:《行政訴訟證據規則精解——規范解釋、文書樣式與問題答析》,北京:中國法制出版社,2005年,第336-342頁。原則等。由此可見,口述資料即口頭證據作為“原生”的“直接言詞”,用于事實真相的證明完全是可能的,需要的,但在利用時要把握住證據力原則,具體而言,主要有三點。
(1)與“直接言辭”相關之原則
“歷史在場者”作為受訪人的口述直言,雖然可以作為有力的事實證據,但“直接言辭原則要求證人負有接受當事人的直接的言辭辯論和質證的義務”?何家弘、劉品新:《證據法學》,北京:法律出版社,2004年,第82-85頁。,也就是說,在口述訪談中受訪人的口述資料要作為更加有力的事實證據,采訪人必須要借助其所掌握的相關信息對受訪人所言內容進行“質問”,即對質或辯論。這種“質問”,可以在訪談過程中進行,也可以通過另一種變通方式,即在訪談開始或結束時,告知受訪人要做到“所言內容屬實,言責自負”,并把這些話語寫進訪談后的“口述資料授權使用協議書”中,之后,再將“口述訪談”請受訪人過目、修正并簽字。通過這種明示和暗示的方式“質問”,也才讓口述材料更具有證明力。
(2)與“原生證據”相關之原則
所謂“原生證據”,又稱原始證據,即“直接來源于原始出處的證據”。派生證據指的是“在原始證據的基礎上經過復制、復印、轉傳、轉述等方式生成的證據”?同注?,第336-342、342頁。。
這兩種證據可以對應兩種“口述資料”形態,一種是“口述歷史”的,由歷史當事人、親歷者,或親見、親聞的在場人的口述資料構成;一種是“口傳歷史”的,是非歷史在場人所言的轉述性或再述性資料。相較之下,前者更具有原生性,是和“歷史檔案”“歷史實物”“歷史圖片”等原生文獻一樣,都具有強證據力的文獻資料。在音樂口述史實踐規范中,強調受訪人的“歷史在場”,其內在的邏輯判斷前提即出于原生證據原則。
(3)“證據鏈”優于“單個證據”原則
所謂證據鏈,指的是“一系列客觀事實與物件所形成的證明鏈條”?這一說法并非規范表述,雖然諸多律師等都如是說。,本質是“數個種類不同、內容一致的證據”?同注?,第336-342、342頁。。
就證據鏈本身而言,其主要由三大要素構成:①鏈節。鏈節是指構成證據鏈本身的單個證據。每個證據都應當具有證據資格和一定的證明力。②內容關系。鏈節的內容必須反映出待證問題事實。③邏輯關系。各鏈節之間能夠在邏輯上一致,符合邏輯定律的檢驗。?同注?,第336-342、342頁。
在這一表述中,部分內容需要我們復闡:
何為“數個種類不同的證據”?詞典解釋,“形態上有不同特點為種”,“相似事物的綜合為類”,由此可見,不同受訪人或同一受訪人在不同時期的對于同一問題而進行的“口述證言”,屬于同類不同種的“證據”。其中不同種是彰顯口述資料證據力的重要一面。對此,筆者曾撰文指出,“按照口述歷史的學術規范,受訪人應該是各種類型的人,而非一人。各類受訪人中最關鍵的。其中占據權重最大的是受訪音樂家(當事人);其次是與其有緊密關系的各類‘三親'(親歷、親見、親聞)人,如同事、親人、學生等”。?同注④。現在看來,僅僅如此還不夠,對于重要的問題,對同一當事人,還要在不同的時間進行多次詢問,也就是說,口述資料要形成“證據鏈”,就要由多人多次的訪談材料構成。
何為“鏈”呢?從前面闡述可見,就是證據之間的存在邏輯的一致性、內容的統一性或證據材料的互參互證互補性,也就是本文所言的“迭言”。有了“迭言”證據,口述證據就可以和他種類的證據形成證據鏈,“去蔽”得真。
2.第二個維度:“潛在的本質真實”,包括內在規律、內在成因、內在聯系等等,總起來說是“為什么”一類的問題。
19世紀末至今的西方新史學是向“內部”“深度”拓展的史學類型,具有顯著的方法論特征,因為,它們要呈現的不再僅僅是客觀實在歷史事實,而且也包括“潛在的本質真實”。如結構史學關注無意識深層結構,計量史學關注因素相關與數理模型,心理歷史學關注集體心態與個體精神等等,莫不如是。
新史學理論及其漸為主流化的學術實踐強有力地實證了我們在音樂口述歷史研究中追求“潛在的本質真實”(包括心理真實)的學術價值及其史學實踐中的實存,但我們還是要追問:新史學理論和“迭語去蔽”有何關聯呢?
從新史學理論來看,我們可以得到啟示很多,筆者管窺之見如下:
在結構史學理論中,其中有喬姆斯基“深層結構理論”。如果我們對其表述內容反向推理,可得:當不同的句子進行同樣意義的表達的時候,其所體現的就是“深層結構”,也就是“潛在的本質真實”。同理,如果我們面對海量的“在場受訪人”口述資料的時候,如果其中有許多話語說法不同,但意思相同,我們通過“迭語”可以獲得“內隱真實”;通過“迭語頻次”統計與排序,可了解受訪人的核心觀念指向;通過對高頻次“迭語”概念化、范疇化編碼?運用的是社會學研究中的扎根理論,即通過對原始資料的概念化、范疇化編碼與系統分析歸納得到理論認識。與歸納推理,可以析出口述資料的受訪人的系統觀念,亦即其“潛在的本質真實”。同時,也會規避口述訪談中常見的不切真實的即興性話語。
計量史學理論與實踐給我們的啟示是:運用計算機的相關軟件對口述資料的“迭語”進行大數據分析,具有方法上的科學性和可操作性,可以得到有說服力的論斷——“潛在的本質真實”。心理歷史學的理論,如“集體無意識”“個體的意識與潛意識”“個體心理與時代、環境及社會關系相關論”等為我們認識和解讀多樣化表達的“迭語”開拓了思考的維度與文化空間,為結構性與整體性把握和理解歷史的“潛在的本質真實”提供了理論線索或理論憑依。
再完美的理論不能訴諸實踐,也只能淪為空洞的言說。如何析出歷史的“本來面目”,前文我們分為兩個方面進行了論述。其一,如何呈現“顯在的客觀事實”,在文字、圖片與實物文獻論據不足的情況下,我們將考慮采用“口述論據”,通過科學規范的程序,遵循相應論據學原則,通過訪談獲得合法、有效、有證明力的口述資料后,再通過“迭語去蔽”——“證據鏈”方法呈現事實。其二,對于呈現“潛在的本質真實”問題,我們闡述了新史學諸流派所秉承的基本原理。但在操作層面上,其實踐理路或技術路線依然不夠清晰,下面,我們復探討之。
在筆者看來,語料庫分析法是一種有效的科學的大數據分析法。貫徹其原理,在實踐操作中要把握好兩大關鍵。
1.建構高質量的論題語料庫
所謂“論題語料庫”,即研究者根據研究論題或問題而構建的語料庫。其語料庫的內容是與論題具有相關性和論據性的語料。要提醒的是,“論題語料庫”并不僅限于口述資料類型,也可以包括各種可以轉化為文字描述的其他類型資料。不同類型資料可以構建出不同類型的語料庫。如:對電子音樂作曲家張小夫的藝術觀念進行考察,以此為論題建構語料庫。
“建構”的步驟主要有二:
第一步:借用社會心理學家G.H.米德(George Herbert Mead,1863-1931)的“自我”理論以及C.H.·庫利(Charles Horton Cooley,1864-1929)的“鏡中我”理論,衍生出“自視之他”與“他視之他”(如張小夫本人的自我認知與他人對張小夫的看法)的理論框架。“他視之他”包括“媒介之他”(媒體視野中的張小夫)以及“同行之他”(同行眼中的張小夫),進一步可衍化為自視之他的藝術美學觀與媒介之中他的藝術美學觀或同行評價中他的藝術美學觀。然后,我們可以在同一論題下,搜集材料籌建至少兩個具有可比性的語料庫(如張小夫自視其藝術美學觀語料庫與媒介視野中他的藝術美學觀語料庫)。
第二步:建立高質量的論題語料庫。如何做到?筆者認為應做到四個原則。
(1)資料的多樣性。
以“自視之他”的語料庫為例,其必然以他的口述資料為主,當然,不拒絕他的口述自傳、私人書信等材料。僅此不夠,對于口述資料而言,還要做到“多次”“多時”,甚至“多人”訪問。這一做法的依據就是“迭語去蔽”。
(2)資料的互文性。
“互文”,也叫互辭,原是古詩文中常采用的一種修辭方法,基本釋義是“參互成文,含而見文”。其遷移到口述訪談上,就是受訪者所言的內容要形成互相呼應,互相闡發,互相補充的關系。
(3)“題”“料”的同一性。
即資料與論題相關或與意旨相符。道理顯然,如果我們把語料庫的主題名稱理解成論文的論題,那么語料庫中的語料就是論據材料,如果“論據”與論題無關,就不能回應論題,推理出合邏輯的論斷。所以,必須做到題料同一。
(4)資料的完備性。
即,資料要將論題涉及的內容充分體現,做到“言盡”,因為語料庫分析法分析得出的論斷直接取決于“語料庫”資料,資料不全,結論必然片面。
2.掌握語料庫分析技術
語料庫分析是靠計算機分析軟件進行的,所以必須掌握相關的軟件使用技術。目前,語料庫分析軟件有許多,如WordSmith Tools是一個在Window下運行,用來觀測文字在文本中表現的功能強大的綜合軟件包。它共包含WordList(詞頻列表檢索工具)、Concord(語境共現檢索工具)、KeyWords(關鍵詞檢索工具)、Splitter(文本分割工具)、Text Converter(文本替換工具)、View(文本瀏覽工具)等六個程序,其中前面三個程序是主要的文本檢索工具,后面三個程序屬于輔助性工具。WordList工具可以將語料庫中所有語詞按照頻次高低依次析出,與論題相關且頻次最高的關鍵詞,是把握題旨的核心要點所在。其原理是“迭語去蔽”原則的應用。Concord工具可以析出關鍵詞所在的語句,藉此可以了解其言語的語境。通過搭配的語境分析,可以掌握話語的言說語境以及相關要素,從而更全面把握“潛在的本質真實”。這是“深層話語結構”理論的操作應用。
隨著現代計算機技術的不斷發展,語料庫分析工具也越來越多,大數據挖掘技術也越來越強大,比如關聯分析、聚類分析、分類分析、異常分析、特異群組分析和演變分析等均可實現,且已應用在商業與政府決策中。可以說,大數據分析在未來史學學術研究應用中,具有廣闊無垠的發展空間。
前文已講,現在常用的語料庫分析軟件和分析技術路線有多種,但一般都是多種軟件配合使用,如趙雪教授學術團隊做的《口述史、民族志、新聞訪談話題的對比——基于詞共現網絡的分析》研究中,使用了Python、Bibexcel(2016版)和Ucinet(6.0版)三個軟件?趙雪、王莉:《口述史、民族志、新聞訪談話題的對比——基于詞共現網絡的分析》,《云南藝術學院學報》,2018年,第2期,第13-19頁。。其中用Python程序,利用Jieba開源分詞組件,分別對語料進行詞頻統計,實現關鍵詞抽取;借助Bibexcel軟件得出關鍵詞的詞共現矩陣 ;最后使用Ucinet軟件,將詞共現矩陣轉化為詞共現網絡。
不過,這一技術路線的操作,對研究者編程與操作技術要求較高,不容易被一般使用者掌握。
下面筆者以“張小夫口述資料庫”的部分內容分析為例,介紹一條更為簡便易學的語料庫分析技術,其學術應用過程主要分為三個階段。
準備工作主要有四點:1.對張小夫進行深入系統的訪談,采集相關口述資料,進行抄本轉化后獲得張小夫口述資料庫(包括張小夫學習音樂動因研究語料)。2.準備分詞系統軟件工具,如中國傳媒大學“傳媒語言語料庫在線分詞標注系統”(其為在線分詞應用系統,網址:http://ling.cuc.edu.cn/cucseg/)3.準備語料庫檢索分析工具:AntConc軟件。4.準備結構制圖軟件,如XMind。
主要語料庫技術分析過程包括以下五步:
1.構建論題語料庫
從“張小夫口述資料庫”(全部口述訪談抄本內容)中遴選出以“張小夫生命史”為主題的口述訪談語料(部分口述訪談抄本內容),并從中遴選出談及其從啟蒙到走上音樂學習道路的相關內容(張小夫學習音樂動因語料),再將內容整合、轉化為純文本TXT.格式文件,構建成“張小夫學習音樂動因研究”論題語料庫。如圖1所示:

圖1 構建論題語料庫
2.分詞標注
運用分詞系統工具將“論題語料庫”內容進行分詞標注。如圖2所示:

圖2 對論題語料進行分詞標注
3.詞頻統計分析
將已分詞的語料導入語料庫檢索分析工具(AntConc)進行詞頻統計分析(Word List)選出相關高頻關鍵詞。如圖3所示:

圖3 “張小夫學習音樂動因研究語料庫”排在前四的高頻詞
從圖3可見,“張小夫學習音樂動因研究語料庫”中“音樂語匯”排在前四位的分別是“音樂、二胡、歌、樂器”。這說明張小夫早期的音樂學習一定與這四個方面有更多相關性,其中包括動機相關。這四個高頻詞即為把握論題的關鍵詞。
4.“高頻詞”語境搭配分析
通過Concordance對高頻詞的“語境搭配”進行分析,分別得到四個“高頻詞”(關鍵詞)的上下文索引(KWIC?KWIC,Key Word in Context縮寫,題內關鍵詞索引,又稱上下文關鍵詞索引。),見圖4-01、4-02。

圖4-01 “音樂”——KWIC

圖4-02 “二胡”“歌”“樂器”——KWIC
5.制作高頻詞“語境搭配”矩陣表
根據“關鍵詞”的上下文索引(KWIC)運用思維導圖工具XMind列出“促因”矩陣表。見下表1。

表1 “張小夫學習音樂動因”矩陣圖
借鑒運用質性研究中的扎根理論,對語料庫分析得出的資料進行編碼、歸類、比較,可獲得相關結論或具有解釋性的理論。具體,將“張小夫學習音樂動因”矩陣表中列出的原因,逐條貼概念標簽,如出生于音樂家庭,貼上標簽:家庭環境;音樂感覺挺好,貼上標簽:個人音樂稟賦……;然后進行同屬(范疇)歸類與三級編碼,如“家庭環境”歸類到“環境”再歸類到“外因”,等等,可獲得“歸因類屬結構圖”。見下圖5。

圖5 張小夫學習音樂歸因類屬結構圖
通過圖5可見,張小夫走上音樂道路有兩大主要原因:外因包括家庭因素以及在此基礎上帶來的良好的社會環境(音樂文化環境)。內因主要在于個人對音樂的興趣、音樂稟賦以及在此基礎上帶來的學習快樂——大腦獎賞機制形成。
通過以上個案分析,我們得出結論:要培養一位像張小夫一樣的作曲家,最重要的要素在于家庭環境、個人稟賦、興趣與早期音樂教育。
綜上,本文探討了三個問題。一是概念界定及提出其背景問題。簡單地說,音樂口述史語料庫分析法就是以音樂口述資料為語料建構語料庫,通過數據挖據技術為手段,從而發現資料表象下的“內隱真實”。這是一種大數據研究法。這種方法之所以能夠在音樂口述史研究中得到應用,主要有四個原因:新史學發展的潮流;時代技術條件的準備;音樂口述史的大數據特性;音樂口述史尋求學科性發展的期待。二是音樂口述史語料庫分析方法的原理問題。這一部分,筆者提出了兩個概念:“顯現的客觀事實”與“表象下的內隱之真”。本文認為兩者是“真理”的兩重內涵,前者是傳統史學的追求,后者是新史學探討的要義。音樂口述史作為新史學的子類型,可以借鑒其他類型新史學。簡言之,就是“深層結構”即為“內隱之真”,“迭語去蔽”則可透表見真。三是操作方法問題。通過示例,實證了音樂口述史語料庫分析法的學術應用可行性并演示了學術操作的基本程序。具體而言,分為六步:1.確定學術論題,建構論題語料庫;2.分詞標注;3.詞頻統計與分析;4.對析出的關鍵語詞進行語境搭配分析;5.列因素矩陣表;6.借鑒扎根理論貼標簽(概念、范疇與關系),歸納出類屬關系結構圖,得出結論(“內隱之真”),形成解釋性理論。當然,在此基礎上還可以通過比較進行更加深入的理論探討與結論再闡。
筆者提出并建構的音樂口述史語料庫分析法只是一種音樂口述史大數據研究方法,其歸旨就是將大量散布的歷史材料聚合起來,通過數理技術手段分析出其中的“內隱之真”——內在規律與潛在理論。但實際上大數據分析研究工具諸多,利用不同的工具可以探索出不同的學術操作路徑。
事實上,本文“解剖麻雀”所示范的“語料庫分析法”只是一個框架性的方法體系,其仍有較大的學術完善空間,如前文我們提出的“自視之他”與“他視之他”理論,就可以分別建構兩個同一論題的語料庫,通過對兩個語料庫分析得出的結論進行比較,從而發現藝術家自我意識與他者認識之間的同異與相差,繼而更深入全面地了解藝術家的思想和他們的作品。再如,本文示例屬于音樂史學中的個案研究。這一研究方法還可以應用到“音樂流派”研究中去,即對代表性的“新潮音樂”創作者,分別進行“藝術觀念”的訪談,最后,把所有的口述材料聚合成一個大的語料庫,通過語料庫分析,就可以得出“新潮音樂”家們藝術觀念之共性,等等。
最后,贅言一句,本文示例僅僅是為了介紹音樂口述史語料庫方法的技術路線或操作流程,并沒有對示范論題進行價值評估,實際上,在真正學術工作中,“真問題”的選擇是至關重要的一環,其對研究結果的價值高低具有直接決定性作用,切忌小覷。