
內(nèi)容摘要:“數(shù)字史學”是歷史學科運用計算機技術(shù)開展研究、教學與出版的新型學術(shù)組織模式,其創(chuàng)新性、跨學科、合作性的特征符合當下出版史深化發(fā)展的內(nèi)在需求。“數(shù)字史學”現(xiàn)階段的實踐可從材料、技術(shù)及方法論上為出版史研究提供新的發(fā)展路徑:開拓數(shù)字時代的出版史料整理方式,依據(jù)紙本史料的編排邏輯開發(fā)檢索型和專題型出版史料數(shù)據(jù)庫;同時,結(jié)合歷史地理信息學和群體傳記學的相關(guān)理論,運用GIS、關(guān)聯(lián)數(shù)據(jù)、可視化等技術(shù)工具開展空間研究和社會網(wǎng)絡(luò)研究,挖掘潛藏于出版史料中的時空信息和社會關(guān)系,發(fā)現(xiàn)長時段、綜合性的現(xiàn)象及規(guī)律,在出版人物、出版群體及出版環(huán)境等研究方向上有所創(chuàng)新。在新技術(shù)和新理論的推動下,學界有望在“數(shù)字史學”領(lǐng)域建構(gòu)“數(shù)字出版史學”,為出版史的學術(shù)實踐創(chuàng)設(shè)更具創(chuàng)造力和生產(chǎn)力的數(shù)字研究空間,開拓中國出版史研究的新境界。
關(guān)鍵詞: 數(shù)字史學;出版史;史料數(shù)據(jù)庫;空間分析;社會網(wǎng)絡(luò)分析
課題:國家社科基金重大項目“中國出版學學術(shù)史文獻整理、研究和資料庫建設(shè)”子課題“作為學科的新時代出版學研究”(編號:21amp;ZD321)
DOI:10.3969/j.issn.2095-0330.2024.05.001
數(shù)字技術(shù)與人文學科的深度融合塑造了“數(shù)字人文”這一新型學術(shù)組織模式和跨學科合作形式,它改變了知識生產(chǎn)和知識分享的規(guī)則,也為人文學科帶來了新的思想活力和方法靈感。從歷史學科的視角對“數(shù)字人文”進行界定,我們可將其視作數(shù)據(jù)科學在歷史研究中的應用,由此,其可進一步衍生出“數(shù)字史學”這一分支。目前,“數(shù)字史學”在國內(nèi)吸引了一批歷史學者圍繞其展開理論探討和實踐探索,它已不僅是一種供學者查詢和檢索的技術(shù)手段,更象征著一種傳統(tǒng)治學方式與數(shù)字技術(shù)關(guān)聯(lián)融通的開放態(tài)度。
開放外向的學科結(jié)構(gòu)可以激發(fā)出版史研究的內(nèi)在活力。在“數(shù)字史學”引發(fā)的學術(shù)熱潮和學科變革中,出版史研究如何擇善而從,提取、吸收可供參照的方法和理論,為深化出版史學科發(fā)展注入技術(shù)動力,是一個值得深思的問題。因此,本文立足于國內(nèi)“數(shù)字史學”和出版史研究的發(fā)展現(xiàn)狀,借鑒相鄰學科的實踐經(jīng)驗,從史料整理、技術(shù)工具和研究方法論3個層面論證出版史研究借重“數(shù)字史學”的合理路徑。
一、“數(shù)字史學”:技術(shù)催生史學變革
20世紀60年代,計量史學的興起被視為數(shù)字史學的先聲。1997年,美國弗吉尼亞大學(Universityof Virginia)成立“弗吉尼亞數(shù)字史學中心”(Virginia Center for Digital History),正式提出“Digital History”。2013年,周兵在國內(nèi)引入“數(shù)字史學”概念,指代運用數(shù)字媒體和工具展開的歷史學實踐、演示、分析和研究。
整體而言,“數(shù)字史學”為歷史文獻的存儲和歷史問題的分析搭建起不同于以往的數(shù)字環(huán)境,在史學領(lǐng)域帶來3個層面的革新。一是建成多種綜合型和專題型歷史文獻數(shù)據(jù)庫,為學者整理與檢索史料提供便捷的數(shù)字化服務。二是提供綜合分析的數(shù)字平臺,支持學者運用算法模型、計算系統(tǒng)對海量史料進行數(shù)據(jù)化處理和可視化呈現(xiàn),開拓史料解讀的多維視角。如今,“數(shù)字史學”緊隨環(huán)境史、新文化史等新興史學的發(fā)展趨勢,不斷推進變革的深度,逐漸走向第3層面的革新——嘗試建構(gòu)解釋框架,迎來范式轉(zhuǎn)換,展現(xiàn)現(xiàn)代技術(shù)對傳統(tǒng)歷史學科的深刻影響力和塑造力。王濤指出,“數(shù)字史學”作為“解釋框架”的一種可能性在于:其通過發(fā)現(xiàn)和分析事物之間的鏈接來解釋歷史的演進,尤其是挖掘那些隱藏在海量史料中,通過傳統(tǒng)查閱手段難以發(fā)掘的潛在因果關(guān)系。這種“鏈接”的思維在中國歷代人物傳記資料庫(以下簡稱“CBDB”)的建設(shè)和使用過程中已漸有體現(xiàn)。該數(shù)據(jù)庫是結(jié)合關(guān)聯(lián)數(shù)據(jù)技術(shù),開展群體傳記學研究的平臺典范,能夠幫助學者探尋研究對象的職業(yè)走向、親屬關(guān)系和社會交往網(wǎng)絡(luò)。以北宋時期的歐陽修和龐籍為例,二人的關(guān)系在史料中鮮有提及,但是當與二人有關(guān)的墓志銘、傳記等資料被錄入CBDB后,CBDB利用系統(tǒng)的數(shù)據(jù)編排技術(shù)便能快速發(fā)現(xiàn)二人的親屬關(guān)系以及歐陽修的其他數(shù)百個血親姻親。近年來,史學界運用這個數(shù)據(jù)庫開展了多項學術(shù)實踐,例如探討唐宋政治精英的聯(lián)姻網(wǎng)絡(luò)、宋元地方家族的學術(shù)交往、中國佛教史上的關(guān)鍵人物、近代中國官僚體制內(nèi)部的權(quán)力分配等,研究涉及政治史、社會史、宗教史等多個領(lǐng)域。
隨著不同歷史子學科嘗試邁入“ 數(shù)字軌道”,出版史自身的學科屬性和研究取徑是否也應吸收“數(shù)字史學”激起的學術(shù)思潮,進入“數(shù)字史學”的觀照空間之中?答案應該是肯定的。目前已有學者從學理層面探討過出版史與數(shù)字技術(shù)的結(jié)合。周蔚華在論述出版史研究的方法論時提及大數(shù)據(jù)分析技術(shù)可以為出版史研究提供十分有用的輔助工具:“有了大數(shù)據(jù)分析技術(shù),我們就可以對海量的、長時間段的出版史料進行跨時空、多角度、綜合性分析,極大地提升出版史研究的科學性。”姜有為則論證過利用大數(shù)據(jù)技術(shù)開展清末科學翻譯出版史研究的優(yōu)勢,認為大數(shù)據(jù)的運用將有助于創(chuàng)新科學出版史的研究方法,提高科學出版史的人文關(guān)懷價值。
出版史研究雖以過去的出版活動為研究對象,但也不能因此忽視現(xiàn)代數(shù)字技術(shù)重塑研究范式的可能性。馬克·布洛赫(Marc Bloch)曾言:“古今之間的關(guān)系是雙向的,對現(xiàn)實一無所知的人,要了解歷史也必定徒勞無功。”同時,“數(shù)字史學”作為一種新型史學研究形態(tài),依托于信息技術(shù),鼓勵歷史學者打破學科界限和話語壟斷,在歷史研究中實現(xiàn)開放性、去中心化和跨學科合作,這正好吻合了當下出版史學科尋求研究創(chuàng)新、完善學科結(jié)構(gòu)、實現(xiàn)文理相融的發(fā)展需求。那么,“數(shù)字史學”能為中國出版史的研究創(chuàng)新帶來哪些可能性?對此,筆者將基于數(shù)字技術(shù)推動史學變革的3個層面,進一步探討能與中國出版史研究相互契合的技術(shù)軌道和方法論路徑。
二、基于史料存儲的數(shù)字化建設(shè)
中國史學界自古有為書籍編目、制作索引和工具書、整理和匯編地方著述的學術(shù)傳統(tǒng),史學研究衍生出藝文志、類書、志書這一類文獻,形成了以“辨章學術(shù),考鏡源流”為學問的目錄學。20世紀初期,胡適、傅斯年、陳垣等學者呼吁開展史料的搜尋與整理工作。1 9 2 9年,陳垣在燕京大學作題為“中國史料亟待整理”的演講,提及近代西方印書、打字機械的發(fā)達,指出唯有替代讀書的機器還沒有發(fā)明出來。陳垣認為:“我們雖然不能以機器代替我們讀書,我們盡可以改良讀書的方法,整理研究的材料,使以最經(jīng)濟的時間得最高效能,正如我們中國現(xiàn)在雖然不能全筑起鐵路來,盡可以先修成公路馬路一樣。”這番言論表明了一位歷史學家在國家陷于技術(shù)窘境之時對機械技術(shù)的憧憬,其希望通過整理史料來改良讀書方法,提升治學能效。陳垣將當時的史料整理工作比喻成“修建公路馬路”。如今百年將過,隨著數(shù)字技術(shù)的飛速發(fā)展,我們能夠在整理研究材料的范疇中實現(xiàn)陳垣曾經(jīng)設(shè)想過的“鐵路愿景”——建設(shè)歷史數(shù)據(jù)庫(堪稱“數(shù)字高鐵”)。
可見,歷史文獻的數(shù)字化存儲其實與傳統(tǒng)的史學觀念和治學思路一脈相承,只是在方法上有進一步的改良,人工編排進化為人機合作。申斌和楊培娜指出,典藏檢索型數(shù)據(jù)庫便是依照實證史學的傳統(tǒng)和紙本史料的整理習慣設(shè)計開發(fā)的,例如以中華書局點校本“二十四史”為文獻來源建設(shè)的中華經(jīng)典古籍庫,還有收錄了中國歷代總志、通志、府州志和縣志的中國數(shù)字方志庫,等等。
出版史的研究工作者對于利用數(shù)據(jù)庫檢索文獻定然不會陌生。吳永貴在編著《民國圖書出版史編年:1912—1949》時便是采取了傳統(tǒng)查閱與數(shù)字檢索相結(jié)合的方式開展文獻輯錄工作。“本成果史料之所以會做到比前人更加豐富、精確,實大大得益于現(xiàn)代網(wǎng)絡(luò)檢索手段提供的強大技術(shù)支持。”范軍在編纂《中國出版文化史研究書錄》時,也充分利用了數(shù)字技術(shù)與網(wǎng)絡(luò)資源。從學者的親身實踐中,我們可以看到現(xiàn)代技術(shù)在出版史料整理工作中發(fā)揮的具體功能:一是提升史料檢索的效率;二是擴大史料的查閱范圍,挖掘新史料和稀缺史料;三是實現(xiàn)多種史料文本的比對,提升史料的精確性,輔助史實的考據(jù)。
但是,出版史學界目前尚未形成服務于自身的獨立數(shù)據(jù)庫,學者開展研究往往需要借助其他大型綜合數(shù)據(jù)庫或者相鄰學科的數(shù)據(jù)庫,在這個過程中難免會出現(xiàn)檢索字段的不匹配或者史料的遺漏。因此,隨著“數(shù)字史學”不斷推進和完善歷史數(shù)據(jù)庫的建設(shè),出版史學界應當進一步設(shè)計符合自身研究取徑、切合出版史料整理邏輯的數(shù)據(jù)庫,如此既能為學者提供更多精準的、專業(yè)的知識服務,亦能呼應出版史料學的發(fā)展,這是完善出版史學科結(jié)構(gòu)的必然要求。具體的建設(shè)路徑可以參鑒兩種類型數(shù)據(jù)庫的設(shè)計思路,一種是依托紙本史料編排邏輯而打造的檢索型數(shù)據(jù)庫,另一種則是根據(jù)具體研究主題而設(shè)計的專題型數(shù)據(jù)庫。
(一)建設(shè)檢索型出版史料數(shù)據(jù)庫
保管、分析、編輯和建模是數(shù)字人文的核心基礎(chǔ)活動。保管即資料的存儲,范圍可涵蓋檔案、館藏紙本、資源庫等文字資料。歷史數(shù)據(jù)庫在研發(fā)初期以存儲史料、索引文獻為目標,研發(fā)者結(jié)合文獻類型及學科領(lǐng)域?qū)κ妨线M行數(shù)字化編排,進而建成基礎(chǔ)的檢索型數(shù)據(jù)庫。例如為文獻學研究提供服務的大成古籍庫,主要收錄南宋至民國時期正式出版過的書籍文獻;上海圖書館依靠豐富的文獻館藏打造的“全國報刊索引”線上平臺,既涵蓋了《晚清期刊全文數(shù)據(jù)庫(1833—1911)》《民國時期期刊全文數(shù)據(jù)庫(1911—1949)》等全文庫,也設(shè)有《晚清期刊篇名數(shù)據(jù)庫(1833—1911)》《現(xiàn)刊索引數(shù)據(jù)庫(1833年至今)》等索引庫。
檢索型數(shù)據(jù)庫的開發(fā)流程相對簡單,設(shè)計邏輯一般是直接收錄版本質(zhì)量較高的紙本文獻,將其影印和進行數(shù)字化呈現(xiàn),并按照一定的學科分類方法進行編排和整合。于出版史學科而言,傳統(tǒng)的紙質(zhì)史料整理工作已經(jīng)取得一批成果。張靜廬于20世紀50年代整理和輯注了《中國近現(xiàn)代出版史料》(全7編8冊);21世紀初,宋原放主編,汪家熔、方厚樞、陳江等輯注了《中國出版史料》(全10冊,后有補編多冊);2008年,北京圖書館出版社出版《民國出版發(fā)行史料匯編》(全20冊,另有補編20余冊);2013年,吳永貴主編了《民國時期出版史料匯編》(全22冊);等等。下一步,結(jié)合“數(shù)字史學”的史料整理方法,出版史學界可嘗試將已匯編成型的出版史料叢刊進行數(shù)字化處理,搭建高質(zhì)量、檢索型的出版史料數(shù)據(jù)庫,依照紙本史料的整理體裁和分類方式進一步細分出文本型數(shù)據(jù)庫、圖文型數(shù)據(jù)庫和圖像型數(shù)據(jù)庫,將出版史料的紙質(zhì)出版和數(shù)字出版相結(jié)合,形成線上線下一體化的知識服務體系。
(二)建設(shè)專題型出版史料數(shù)據(jù)庫
專題型數(shù)據(jù)庫依據(jù)一定的研究旨趣和選題需求重新整合史料,其搜集形式體現(xiàn)出更為明確的主題性,能夠提升檢索的精準度,其編排邏輯也能在一定程度上延展研究思路。在社會經(jīng)濟史領(lǐng)域,王業(yè)鍵帶領(lǐng)的團隊自20世紀90年代開始建設(shè)清代糧價數(shù)據(jù)庫,該數(shù)據(jù)庫現(xiàn)已成為經(jīng)濟史研究的基礎(chǔ)數(shù)字設(shè)施;前文提及的CBDB收錄了52萬多位中國古代人物的歷史文獻,為群體傳記學及相關(guān)人物研究提供了數(shù)據(jù)支持和分析平臺;另有中國社會科學院近代史研究所主持建設(shè)的“抗日戰(zhàn)爭與近代中日關(guān)系文獻數(shù)據(jù)平臺”,以抗日戰(zhàn)爭的相關(guān)文獻為搜集主題,服務于抗日戰(zhàn)爭史、近代中日關(guān)系史的研究。
出版史學界可借鑒這種專題型數(shù)據(jù)庫的設(shè)計思路,在建設(shè)檢索型數(shù)據(jù)庫的基礎(chǔ)上,進一步編排和整合出版家的傳記、書信集、作品集、年譜等類型史料,依據(jù)人物研究的史料需求優(yōu)化數(shù)據(jù)庫建設(shè),創(chuàng)建以人物為主題的出版家數(shù)據(jù)庫;或聯(lián)合一些歷史悠久的大型出版企業(yè),開發(fā)以出版機構(gòu)為主題的民國出版企業(yè)數(shù)據(jù)庫。
在推進出版史料數(shù)字化的過程中,還需注意3個問題:
第一,增強“設(shè)計”的自覺意識。設(shè)計是一種利用文化、社會、經(jīng)濟和技術(shù)約束而進行的創(chuàng)造性實踐。在從事數(shù)據(jù)庫的開發(fā)時,設(shè)計不僅是一項技術(shù)工作,同樣也是一種思維方式。出版史研究者應嘗試從數(shù)據(jù)庫的使用者轉(zhuǎn)變?yōu)樵O(shè)計者,積極參與數(shù)字研究空間的研發(fā):一方面,要結(jié)合研究選題提出明確的研發(fā)思路;另一方面,要掌握相關(guān)領(lǐng)域的共同術(shù)語,成為主導數(shù)據(jù)庫“工程圖”的思維設(shè)計師,與技術(shù)設(shè)計師達成高效合作。
第二,培養(yǎng)專業(yè)的史料學理論素養(yǎng)。參與開發(fā)史料數(shù)據(jù)庫的工作者對于史料的理解和掌握,會直接影響到數(shù)據(jù)庫的呈現(xiàn)形態(tài)和實際質(zhì)量。因此有學者認為,數(shù)據(jù)庫建設(shè)的第一步并非數(shù)字技術(shù)的介入,而是對史料的文獻學研究,以及對相關(guān)研究問題的總體把握。而在做好出版史料發(fā)掘、整理和刊刻的基礎(chǔ)上,重視出版史料學的建設(shè)也是深化中國出版史研究的一個重要著力點。
第三,認清史料形式對研究思維的影響。羅杰·夏蒂埃(Roger Chartier)在看待書籍的技術(shù)變革時采用了一種辯證的觀點。他認為,人類歷史上的思維形象和智力活動與傳統(tǒng)的紙本形式緊密相連,而文本的數(shù)字化則意味著這種形象與活動的疏離。“每一種形式,每一種載體,每一種傳播和接受文字的結(jié)構(gòu)都會深深影響其用法和闡釋。”而史料的不同形式亦會影響學者對具體問題的分析思路和闡釋角度。因此,既要推進史料的數(shù)字化進程,也不可舍棄對紙質(zhì)史料的傳統(tǒng)整理工作,只有將兩種路徑相結(jié)合,才能最大程度發(fā)揮史料的應用價值。
三、基于海量文獻的可視化分析
在史料存儲實現(xiàn)數(shù)字化后,只有運用技術(shù)工具對史料進行綜合分析,尋找新的研究問題與解讀視角,才能迎來“數(shù)字史學”的第二層革新。計算分析的過程通常會結(jié)合可視化呈現(xiàn),這使分析結(jié)果更為形象易讀。如今,知識圖譜、關(guān)聯(lián)數(shù)據(jù)、GIS(地理信息系統(tǒng))等信息技術(shù)正不斷深入“數(shù)字史學”領(lǐng)域,為出版史研究提供了一些可供參考的技術(shù)工具和分析平臺。空間分析和社會網(wǎng)絡(luò)分析理論能進一步延展出版史研究的思路與視角,從方法論的角度促成出版史研究的“去熟悉化”。
(一)空間分析:挖掘出版史研究中隱藏的時空信息
GIS技術(shù)具備采集、存儲、管理、運算和分析地理信息的強大功能,常被用于歷史問題中涉及時空信息的挖掘,歷史地理信息學也因此成為跨學科合作的范例。歷史地理信息化的理論支點來源于沃爾多·R.托布勒(Waldo R. Tobler)提出的“地理學第一定律”:任何事物都是相互聯(lián)系的,相鄰事物之間的聯(lián)系更為緊密。地理空間的相互影響說明了歷史研究中時空信息的特殊意義。學者在引入地理信息科學、統(tǒng)計學的研究方法后,再運用GIS技術(shù)將原來分散在文本中的時空信息進行整合和可視化。例如李明杰和楊璐嘉以明代雕版印刷的古籍版本資源為目標對象,運用GIS技術(shù)和相關(guān)的組件對象平臺設(shè)計了明代古籍版刻信息數(shù)據(jù)庫,呈現(xiàn)了明代古籍版刻的空間分布情況及時空變遷的信息。
在書籍史領(lǐng)域,歷史地理信息化和空間分析具有廣闊的研究前景。歷史上書籍的生產(chǎn)、刻印、傳播與收藏常會涉及地理空間的轉(zhuǎn)移和變遷。包筠雅(Cynthia Joanne Brokaw)在考察清末民初福建四堡的書籍貿(mào)易史時,發(fā)現(xiàn)出版商人會雇用一些流動的刻印工匠。戴思哲(Joseph Dennis)在探究明代地方志的刊印時亦發(fā)現(xiàn)了同樣的現(xiàn)象。北京、邯鄲、江西、南京、建陽及一些江南地區(qū)的刻工經(jīng)常活躍于本省及外地的方志出版業(yè)中,他們的工作區(qū)域是動態(tài)的,連接著不同的城市,涉及不同的地理位置,人們?nèi)魧@些信息進行統(tǒng)計和分析,就有可能辨認出一些從前鮮為人知的區(qū)域性刊印中心。羅寶川使用地方志數(shù)字研究工具LoGaRT生成了清代官學藏書樓地理信息的可視化圖景,探究其空間分布的特征及成因。楊璐嘉運用文化地理學的相關(guān)理論,借助GIS可視化技術(shù)分析古代私家藏書樓的地理空間數(shù)據(jù),從宏觀層面對藏書史的時空分布特征予以總結(jié)和補充。
中國出版史研究亦可嘗試運用數(shù)字技術(shù)對涉及地理信息和空間演變的出版機構(gòu)、出版事件進行史實的考證和可視化呈現(xiàn)。例如在研究亞東圖書館時,朱莉等結(jié)合文獻記載使用無人機等現(xiàn)代技術(shù)考證了亞東圖書館編輯所與發(fā)行所的舊址。陳思航也使用搜索引擎、AI人臉識別等技術(shù)手段進行史料搜集和史實考據(jù)。
(二)網(wǎng)絡(luò)分析:探尋出版史研究中潛在的因果關(guān)系
紙本文獻通過計算機數(shù)據(jù)化處理后,便具備了“原子化”的特性。不同于紙本文獻一旦編排出版就無法調(diào)整,數(shù)位化后的資料能將文獻中的原始脈絡(luò)進行重組,進而產(chǎn)生多重脈絡(luò)。這時,關(guān)聯(lián)數(shù)據(jù)技術(shù)便有了用武之地。關(guān)聯(lián)數(shù)據(jù)技術(shù)的優(yōu)勢在于將零散的、異構(gòu)的數(shù)據(jù)進行關(guān)聯(lián)組織,展示數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,為進一步面向內(nèi)容和知識的挖掘奠定基礎(chǔ)。研究者通過關(guān)聯(lián)數(shù)據(jù)技術(shù)重組史料脈絡(luò),便有可能編織出在傳統(tǒng)紙本中難以尋覓到的某一事件或人物關(guān)系網(wǎng)絡(luò),進而發(fā)現(xiàn)新的歷史現(xiàn)象。
關(guān)聯(lián)數(shù)據(jù)技術(shù)與社會網(wǎng)絡(luò)分析法的結(jié)合是“數(shù)字史學”開展的又一項學術(shù)實踐。社會網(wǎng)絡(luò)分析結(jié)合了心理學和社會人類學的學科特點,在研究中重視人際關(guān)系和社會結(jié)構(gòu)的探討,為群體研究提供了理論支持,從而延伸出“群體傳記學”(Prosopography)這一研究領(lǐng)域。群體傳記學一般采取歸納法,傳記學家在明確有待研究的目標群體后,收集關(guān)于這個群體的統(tǒng)一觀測數(shù)據(jù),例如生卒年、家庭背景、教育背景、職業(yè)情況等,再通過數(shù)據(jù)分析對目標群體的相關(guān)特征進行概括。李中清(James Lee)—康文林(Cameron Campbell)研究團隊依托民國時期大學的學籍檔案和學生名冊搭建了民國大學生量化數(shù)據(jù)庫,幫助學者探究民國時期大學生群體的社會階層、宗教信仰、專業(yè)選擇、就業(yè)去向等相關(guān)信息;沈立力等運用上海圖書館“人名規(guī)范庫”等數(shù)據(jù)庫和“歷史人文大數(shù)據(jù)平臺”,從人物、地點、事件、共同體等維度搭建了近代報人群體的關(guān)系圖譜,可視化呈現(xiàn)其先賦性關(guān)系網(wǎng)絡(luò)、業(yè)緣網(wǎng)絡(luò)和自獲性關(guān)系網(wǎng)絡(luò),挖掘隱藏在近代報人群體內(nèi)部的信息特征和規(guī)律;另有李惠等基于歷史人物的書信檔案,從時間維度建立了古代書信網(wǎng)絡(luò)模型,設(shè)計了信聯(lián)活躍度和節(jié)點刷新率等網(wǎng)絡(luò)度量概念,以便動態(tài)考察歷史人物的社會交際行為,充分挖掘書信的史料價值。
民國出版業(yè)的地緣網(wǎng)絡(luò)和人情網(wǎng)絡(luò)涉及出版業(yè)與政界、文化界的多重互動,出版企業(yè)的經(jīng)營管理和制度建設(shè),企業(yè)內(nèi)部管理者的權(quán)力博弈,出版從業(yè)者之間的人情往來等多方面的問題。隨著出版史研究日趨向微觀史、生活史的領(lǐng)域延展和深化,研究者若能借助關(guān)聯(lián)數(shù)據(jù)技術(shù)對歷史上出版從業(yè)者的親屬關(guān)系和社會關(guān)系進行深度挖掘,就有可能激活和形塑更為多元復雜的人物網(wǎng)絡(luò)和出版業(yè)態(tài),發(fā)現(xiàn)新的觀察視角和研究命題。對出版家的日記、書信、傳記和年譜進行數(shù)據(jù)化處理,亦能形成不同線索的群體傳記網(wǎng)絡(luò),其既可用來開展以人際交往為中心的人物研究,也可支持有共同背景特征的群體研究。
以出版家張元濟為例,關(guān)于張元濟的史料十分豐富,除了其本人的日記、書信集、詩文集,還有許多關(guān)于他本人的零散史料,它們可能散布在商務印書館的檔案中,或其他相關(guān)人物的書信、日記、回憶錄里,研究者若通過關(guān)聯(lián)數(shù)據(jù)技術(shù)對張元濟的零散史料進行重新編排和整合,便能對其地緣網(wǎng)絡(luò)、人際網(wǎng)絡(luò)有一個更為清晰全面的認知,可能會有新的發(fā)現(xiàn)。目前,已有學者開始嘗試對《張元濟全集》《張元濟書札》中涉及人情交往、書信往來的史料信息進行數(shù)據(jù)提取,運用超圖搭建“收信人—寄信人”網(wǎng)絡(luò)、“共同寄件人”網(wǎng)絡(luò)及“聯(lián)合寄件人”網(wǎng)絡(luò),以此了解張元濟更為潛在的公共交往情況。
關(guān)于“數(shù)字史學”技術(shù)工具的詳細介紹見表1。
四、理論與方法: 建構(gòu)“ 數(shù)字出版史學”
20世紀30年代,陳寅恪在談及“古今學術(shù)史之通義”時有言:“一時代之學術(shù),必有其新材料與新問題。取用此材料,以研究問題,則為此時代學術(shù)新潮流。”該時期甲骨文、敦煌寫卷、漢晉木簡等古代史料相繼出土,學者從中發(fā)現(xiàn)新的研究課題,提出相應的研究方法,推動了近代史學思潮的發(fā)展。在數(shù)字時代,史料從存儲形式和可視化分析的角度也能被視為一種“新材料”,有望促成新問題的發(fā)現(xiàn)和新潮流的出現(xiàn)。
建議研究者基于現(xiàn)有的研究成果,在“數(shù)字史學”的方法論指導下,參考文獻學、經(jīng)濟史、社會史、歷史地理學等領(lǐng)域的研究工具和方法路徑, 推動出版史研究邁入“ 技術(shù)軌道”,這項工作可從材料整理、分析手段和理論引介3個層面分別發(fā)力:第一,建設(shè)檢索型和專題型出版史料數(shù)據(jù)庫,創(chuàng)新數(shù)字時代出版史料的整理方法;第二,借助GIS、關(guān)聯(lián)數(shù)據(jù)、可視化等技術(shù)對出版史料進行脈絡(luò)重組和綜合分析;第三,引入社會網(wǎng)絡(luò)分析、歷史地理信息化的相關(guān)理論和研究方法,深入挖掘出版史研究中潛藏的時空信息以及出版家、出版群體的潛在關(guān)系網(wǎng)絡(luò)。
不可否認的是,當下出版史研究與數(shù)字技術(shù)的結(jié)合仍處于初步探索的階段,學者開展研究大多停留在“數(shù)字史學”的第一個層面——運用基礎(chǔ)的檢索工具查閱史料。同時筆者也注意到,有研究者對西南聯(lián)大多部人物日記進行數(shù)字化的文本聯(lián)合挖掘,雖有一定新意,但又明顯存在關(guān)鍵性的學理問題,其被數(shù)據(jù)所碾壓而顯得異常扁平化,帶給人們的新見與啟示并不是太多。這樣似新而實舊的問題也同樣可能出現(xiàn)在出版人物社會網(wǎng)絡(luò)分析的數(shù)字化中。
數(shù)字人文的收益無法僅從數(shù)字技術(shù)或傳統(tǒng)方法的單一途徑中獲得。因此,我們對數(shù)字技術(shù)既要有敢為人先的嘗試,亦要堅守人文學科的本質(zhì)。我們?nèi)灾鲝堃猿霭鎸W理論為指導,在數(shù)字研究環(huán)境中繼續(xù)吸納書籍史、新文化史、知識社會史等其他學科的研究理論與方法,設(shè)計適合出版史學科邏輯的技術(shù)工具,在實際研究中堅持問題的學理性和論證的科學性。
經(jīng)過長期的積累與探索,我們或許可以在“數(shù)字史學”領(lǐng)域建構(gòu)“數(shù)字出版史學”——在材料、方法及理論層面創(chuàng)設(shè)出版史的數(shù)字研究空間,鼓勵學者積極運用計算機技術(shù)開展出版史的學術(shù)實踐,開拓出中國出版史研究的新境界。
“數(shù)字出版史學”的研究空間至少要由3個要素構(gòu)成:出版史料數(shù)據(jù)庫、綜合分析平臺、支撐研究的方法論。數(shù)據(jù)庫建設(shè)能夠幫助收錄和整合海量的出版史料,是推動“數(shù)字出版史學”研究進程的基礎(chǔ)環(huán)節(jié)。在開拓出版史料的數(shù)字化整理途徑后,要根據(jù)研究訴求進一步聯(lián)合相關(guān)的統(tǒng)計分析系統(tǒng)開展數(shù)據(jù)挖掘,將經(jīng)過數(shù)字化編排的史料導入綜合分析平臺,利用統(tǒng)計和定量的分析方法對目標文獻分別進行近距閱讀和遠距閱讀。近距閱讀源自人文學研究的語言學傳統(tǒng),要求學者理解文本的內(nèi)涵、版本及歷史,并能對內(nèi)容作出深度解讀。遠距閱讀則是數(shù)字時代的一種新型研究方式,研究者運用計算機的自然語言處理能力從海量文本中抽取要旨、歸納總結(jié),有可能發(fā)現(xiàn)一些大范圍、長時段的模式、關(guān)系與規(guī)律。同時,結(jié)合兩種閱讀方式解讀史料有利于在研究中聯(lián)結(jié)起“目光向上”的宏觀視角與“眼光向下”的微觀史。特別是在過去的研究中,政治史、革命史視角下的宏大敘事與社會史、文化史視角下的微觀分析常被用來對立討論,但在“數(shù)字史學”提供的論證軌道中,計算機強大的數(shù)據(jù)處理能力既可以處理長時段的宏觀敘事分析,同時也可以支持微觀數(shù)據(jù)的深度挖掘,能夠支持學者在同一研究問題中靈活切換不同的考察視角。在出版史研究引入新技術(shù)和新方法后,我們可以展望“數(shù)字出版史學”實現(xiàn)“數(shù)字史學”的第三層革新——整合出版史研究的原有理論,創(chuàng)建一種關(guān)于“鏈接”的闡釋策略和論證框架,在考察書籍生產(chǎn)、知識傳播、出版人的生活交往時對事件的整體趨勢及內(nèi)外部關(guān)系進行更深層次、綜合性的理解與分析。最后,出版史的學科基體在注入“數(shù)字思維”后將更為注重跨學科合作,在科學研究與知識分享上將更具生產(chǎn)性和創(chuàng)造力,切實遵循文理融合的新文科發(fā)展目標,向具有共有價值和共有范例的學科共同體進一步邁進。
(作者范軍系華中師范大學文學院教授、博士生導師;秦雅婕系華中師范大學文學院2023 級博士研究生)