吳玲
【編者按】不久前,在濟南舉行的國際歷史學大會上,數字史學為主要議題之一,說明了大數據時代數字化技術與歷史學的密切關系。本刊對此問題亦給予了較多關注,陸續刊發了相關議題的文章。為進一步對相關問題展開討論,本刊“關注新樣態史料”專欄特開辟筆談,誠邀熱心于數字化史學、新樣態史料的學界新秀加盟筆談,以期使人們對新樣態史料的認知與研究逐步走向深入。
[中圖分類號]K0 [文獻標識碼]A[文章編號]1000-3541(2015)05-0068-03
[收稿日期]2015-07-09
大數據時代將帶來歷史學研究的巨大變革。這種變革不僅體現為新樣態史料的廣泛應用,更表現為以往被視為自然科學研究工具的統計學和數學算法、信息處理和存儲技術等大數據技術,將應用到歷史學研究領域,從而促使傳統的歷史學研究手段發生根本性變革。這種變革包括史料結構、研究手段與方法、研究隊伍、歷史研究面向未來的功用等內容。隨著電子文本、電子閱讀的推廣和應用,數字化技術催生的新樣態史料越來越受到歷史學研究者的青睞,研究者可以通過計算機技術歸納、整理、分析、綜合海量信息,大數據技術的開發和應用成為歷史學研究產生新趨勢的推動力。同時,歷史學研究者仍然作為歷史研究的主體,借助大數據技術推動歷史學研究走向專業化、專門化、多元化、精細化。
趨勢一:建設“全史料數據平臺”,實現傳統紙質文本史料向新樣態史料轉變。有“大數據之父”之稱的英國學者維克托·邁爾·舍恩伯格認為,大數據時代帶來的信息變革,比人類發明印刷機之后發生的閱讀革命還要猛烈,各種形式的電子閱讀及其高度普及頗能說明這一點。當下,世界各國數字圖書館建設都獲得了政府的資金支持,各領域的研究者都將訪問數字圖書館,作為獲取資料的重要途徑。隨著各國數字圖書館的數字化工程逐步推進,傳統的紙質史料將在不久的將來完成向數字化轉型,必將出現一個可以為數據化提供計算、分析、整合基礎的“全史料數據平臺”。此處所言的“全史料數據平臺”應是一個相對性概念,因為它永遠處在不斷完善、充實的狀態下。當前的史學研究恰恰處于“全史料數據平臺”的建設時期,即量的積累時期,一旦傳統紙質史料大致完成向數字化轉型,并開始設計、試用對數字數據進行計算機信息處理的模型或算法,便迎來了由量的積累到質的飛躍的節點。由于通過數學模型或算法進行的分析與綜合而得出的相關性數據,又將作為新樣態史料充實到“全史料數據平臺”中去,因此,“全史料數據平臺”必將是一個不斷進行自我充實的數據體系。在“全史料數據平臺”初具規模,大數據技術逐步運用到歷史學研究領域時,歷史學研究者不僅能夠通過電子閱讀更便捷、有效地掌握資料,更能夠運用大數據技術對新樣態史料進行高效分析,從而大大提升研究效率。
趨勢二:大數據可以極大擴充歷史學研究者占有歷史資料的廣度,提升史學研究的精細化水平。大數據使研究者擁有大規模收集和分類數據的條件,傳統史學研究中普遍使用的采樣分析法將逐漸被數據分析法取代。在傳統史學研究領域,通過采樣獲取的局部性數據構成核心史料。歷史研究者按照事先設計好的問題范式,對相關數據進行搜集、歸類、整合、計算,如某個特定區域在不同歷史時期的人口數量、農業產值、工商業產值、軍事力量等,若時空設計合理,上述數據完全可以成為對該時期該地區研究的權威數據。然而,由于局部樣本不能等同于全樣本,在設定了細致范圍的特定區域與時間樣本的分析中,傳統方法可以得出局部性結論,如果將研究視野擴大到較大歷史時期的經濟、社會變遷中,傳統的樣本便不足以充分地論證結論,而必須通過對海量數據的分析與處理,在呈現出歷史的多維度特征基礎上,更深入地推進歷史學研究。
趨勢三:新的史料搜索系統的加盟將豐富傳統的史料分類與索引體系。在傳統的歷史學研究中,分類和索引一直是研究者檢索史料的基本手段。然而,由于這種分類與索引是事先設定好的高度精確和準確排列的資料目錄,海量數據因無法被該目錄接納,而不得不游離于這個索引系統之外。因此,傳統的資料索引在提供有限資料的同時,也在一定程度上限制了史學工作者對資料的獲取廣度。大數據時代,初步掌握大數據技術的研究者,可以通過使用一組標簽編組、分類和檢索史料,并可以通過合并多個搜索標簽有效地過濾用于歷史研究的資源。由于史學研究面臨的是各種各樣、參差不齊的海量數據,很難用預先設計好的目錄分類這些數據,因此,適用于大數據時代的史料搜集、分類、辨析的史料搜尋技術與方法將逐步替代傳統圖書館的卡片式分類與檢索系統。
趨勢四:大數據技術在相關關系研究中具有的優勢將推動歷史學研究走向多元化,發揮歷史學研究的現實功用。大數據時代的史料搜索系統擁有處理和分析海量數據、進而尋找數據之間關聯性的功能,可以幫助史學工作者發現新問題、產生新靈感。歷史研究者通過計算機分析和統計技術迅速獲得一個事物大概的輪廓和發展脈絡,比起嚴格的精確性研究結論,這個包納了不精確因素的大概輪廓與脈絡,在評判與分析宏觀歷史規律時,更具啟發性。“全史料數據平臺”中豐富的新樣態史料,將為歷史學研究提供無限可能性:文學作品中描繪的人們的生活狀態與心理傾向,繪畫作品中展現出的社會風貌與審美特征,大量零散的日記與信件中傳遞出的情感欲念與人際交流,商品往來中各種看似無關緊要的物品交換與信息交流,自媒體時代出現的海量影音作品中表達出的個性化生活場景與流行趨勢等等,這些看似沒有邏輯關系的數據,均可用來論證一些重要的歷史性結論。大數據時代,在傳統史學依賴清晰和精確數據的研究方式的基礎上,較多地接受并利用這些模糊和不確定的史實,將更有助于發現人類歷史發展的樣貌。另外,今天的大數據技術可以通過放置在大型機器、橋梁、建筑物等設施上的傳感器,分析預測這些設施未來的狀態和故障預警。由于人類社會的歷史性變動也是由多種因素互相作用、緩慢積累導致的。因此,可以設想,歷史學家可以運用大數據技術分析導致某區域發生社會騷動的諸多關聯性因素,找出該區域多種關聯性因素之間的動態規律,從而預測該區域發生不穩定狀況的可能性。
趨勢五:利用計算機進行文本分析的方法將大大提升歷史研究的效率與總體水平。現在的歷史學者仍然以利用數字圖書館的搜索引擎便捷地閱讀書籍,作為獲取資料的主要方式,利用大數據技術分析、辨別數字化文本史料的工具僅僅處于嘗試性開發階段。谷歌公司最先開發出在文本中統計詞頻的算法,只要在計算機中輸入任何詞或詞組,這種算法都會輸出這些詞組的詞頻統計結果。谷歌公司的工程師分別輸入了“黑鬼、黑人、非裔美國人”,“科學、哲學與宗教”等詞組,計算機繪出了這些詞組出現的時間、頻次的對比圖,歷史學家可以通過分析這些數據闡釋黑人在不同時期美國社會受到的不同對待,以及科學、哲學與宗教在人類歷史不同時期的地位,從而展開多樣性研究。由于書頁的數字化圖像被轉化成數據化文本,使書本中潛藏的巨大價值被釋放出來,對于歷史學研究來說,這可以說是一次工具革命,如果開發出具有分析功能的算法,那么大數據技術必將在歷史學研究中大顯身手。
趨勢六:計算機技術、云存儲技術的加盟將改變歷史學研究隊伍的構成。首先,由于海量數據可以被所有人共享,數據分析能夠在云處理平臺上快速、低成本地進行,因此,歷史研究不再僅僅是職業研究人員專屬的領域,所有對歷史學研究感興趣的人都可以展開個性化研究,并在資料辨析、古文書辨偽等專門性領域參與歷史學專題性研討與爭鳴,歷史學研究也將突破單一學科的限制,向普遍性的多學科共同參與轉變。其次,專門從事歷史數據挖掘和分析的公司、專業化的歷史數據分析師、數據科學家會大量出現,成為歷史學研究隊伍中不可或缺的組成部分。歷史學研究也將極大地延展學術研究的生產鏈條與傳播途徑,走上多功能、多技術、多學科交叉的研究與傳播道路。
綜上所述,大數據將改變歷史學研究的未來發展方向,然而,如同電腦永遠不可能取代人腦,大數據不可能取代歷史學工作者的主觀思考,也不可能取代傳統歷史學研究的基本理論與方法,歷史學研究者必須明確大數據在歷史學研究中的地位。首先,歷史學家必須發揮主導作用,由歷史學家主導制定相關計算機數據分析指令、參數模型的基本原則,這些原則的制定必須依據歷史學的研究理論與方法。其次,大數據可以從海量數據中提取、挖掘、分析、計算出趨近于全體數據的數值及其動態變遷趨勢,但分析這些數值及趨勢之間的本質關系,諸如原因與結果、現象與本質、個性與共性等理論性問題,還必須借助歷史學家在歷史學理論與方法指導下的天才思考。再次,由于歷史學研究的相關參數是從成千上萬的參數擬合值中通過計算機工程性操作得出的,因此,必須判斷這些參數擬合值在多大程度上能夠成為引出歷史性結論的可靠依據;這些參數會在多大程度上展現歷史發展的規律;通過這些參數對歷史學研究對象做出怎樣的判斷等等,這些判斷都需要歷史學家借助歷史學的研究理念與方法展開深邃思考。大數據時代極大地豐富了歷史學研究的工具與手段,拓展了歷史學研究的廣度,但是,大數據的研究手段不僅不能完全取代歷史研究的理論與方法,而且其手段與工具的應用必須以歷史理論與方法作為指導。(作者系哈爾濱師范大學副教授,歷史學博士)