999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

北美與西歐的數(shù)字人文中國研究狀況論析

2018-01-29 05:32:49荷蘭李友仁宋迎春
山東社會科學(xué) 2018年7期
關(guān)鍵詞:文本研究

[荷蘭]李友仁 撰 宋迎春 譯

(萊頓大學(xué) 數(shù)字人文中心,荷蘭 萊頓 2311)

過去5—10年間,在西方的中國研究中,數(shù)字人文的應(yīng)用有了長足的進步。這一領(lǐng)域快速發(fā)展,從研究生到教授等各個層次的學(xué)者對之產(chǎn)生興趣。以人們所致力領(lǐng)域的不斷擴張為標志,數(shù)字人文中國研究(Digital Chinese Studies)經(jīng)歷了幾個分明的階段。早年間,大部分工作主要是基礎(chǔ)建設(shè)性的,集中于數(shù)據(jù)庫發(fā)展、平臺構(gòu)建和數(shù)字化等方面。近年來,新的實踐群體已經(jīng)涌現(xiàn),學(xué)者們也開始利用過去30年中建立起來的重要基礎(chǔ)。在中國歷史和中國文學(xué)研究中,研究者們已經(jīng)開始取得真正的進展。

關(guān)于研究中國的學(xué)者們運用數(shù)字方法所開展的工作,有眾多不同的分類方式。一部分人繼續(xù)構(gòu)造并完善大規(guī)模的基礎(chǔ)建設(shè)項目,而一些研究歷史、文學(xué)和藝術(shù)的個體學(xué)者如今則使用包括地理、網(wǎng)絡(luò)、文本和圖像分析在內(nèi)的各種方法。在這篇短文中,我將簡單地介紹北美和歐洲的數(shù)字人文中國研究中的幾種主要潮流,還將介紹一些主要的研究者。要在這些眾多分類中劃出清晰的邊界是困難的(數(shù)據(jù)、基礎(chǔ)結(jié)構(gòu)和研究工作往往會相互生成),不過我仍會首先簡要概述幾個主要的數(shù)字基礎(chǔ)建設(shè)項目(其中既有老的,也有新的),接下來我會討論當下研究中的各種潮流,最后以對正在出現(xiàn)的數(shù)字人文中國研究新研究中心的討論作結(jié)。需要留意的是,這篇文章并非涵蓋一切,而只是意在描述我對這一領(lǐng)域當下狀況的看法。

一、數(shù)據(jù)挖掘與基礎(chǔ)結(jié)構(gòu)創(chuàng)建發(fā)展迅猛

西方的中國研究中最早的數(shù)字人文項目主要致力于數(shù)據(jù)庫建設(shè)與數(shù)字化。這些數(shù)據(jù)庫項目中,最為著名,使用者也最為廣泛的,也許是由郝若貝(Robert Hartwell)的工作所開創(chuàng)的“中國傳記數(shù)據(jù)庫”(CBDB)。*“History of CBDB,” Harvard University, 2018年2月8日查閱,https://projects.iq.harvard.edu/cbdb/history-of-cbdb。Robert Hartwell (1932—1996) 是一位研究宋代中國的經(jīng)濟和社會歷史學(xué)家。CBDB是一個關(guān)系數(shù)據(jù)庫,包含了眾多重要歷史人物的傳記,其結(jié)構(gòu)方式則有助于大規(guī)模分析。CBDB可以被用作一種簡單的參考文獻來源,也是一種查詢個體人物信息的快捷方式,但其真正價值在于它所支持的新的分析類型。例如,CBDB包含了庫中許多人物之間的互動數(shù)據(jù),這讓學(xué)者們得以通過系統(tǒng)的方式展開歷史社會結(jié)構(gòu)研究。

CBDB的設(shè)計用途是一個可下載數(shù)據(jù)庫,使用微軟Access來支持其眾多特色。它也可以被當作一個單純的在線服務(wù)來訪問,這也正是許多人利用它的方式。其最新迭代最初是由傅君勱(Michael Fuller)設(shè)計的,并由陳松加以擴展。*“History of CBDB,” Harvard University.哈佛大學(xué)、臺灣“中研院”歷史語言研究所以及北京大學(xué)的一批學(xué)者至今仍在維護和擴充這一數(shù)據(jù)庫。*Harvard University, Academia Sinica, and Peking University, “China Biographical Database,” 最后修訂于2018年1月1日,https://projects.iq.harvard.edu/cbdb.截至2017年4月發(fā)布的內(nèi)容,CBDB包含了有關(guān)約37萬個歷史人物的大量群體傳記信息。*Harvard University, Academia Sinica, and Peking University, “China Biographical Database”.

與CBDB十分類似,中國歷史地理信息系統(tǒng)(CHGIS)是另一個由郝若貝創(chuàng)建的數(shù)據(jù)庫。*“Project History,” Harvard University,訪問于2018年2月8日,http://sites.fas.harvard.edu/~chgis/pages/history.它一直位于哈佛大學(xué)(合作方為復(fù)旦大學(xué)),其維護受葛劍雄、包弼德(Peter Bol)和萊克斯·伯曼(Lex Berman)的指導(dǎo)。這一數(shù)據(jù)庫包含了有關(guān)中國歷史的詳盡圖形文件。

諸如CBDB和CHGIS等項目的主要推動者是歷史學(xué)家們,而圖書館學(xué)家們同樣出現(xiàn)在數(shù)字研究發(fā)展浪潮的前沿,并在我們當前的數(shù)字研究生態(tài)系統(tǒng)的建設(shè)中發(fā)揮了關(guān)鍵作用。令人遺憾的是,一個曾在這一領(lǐng)域有過卓越貢獻的重要早期項目在數(shù)年前就停止了運行。至少在西方的大學(xué)里,這個項目是停止了。中文善本圖書項目(Chinese Rare Book Project)曾為善本中文圖書開發(fā)了一套聯(lián)合目錄*“Chinese Rare Books in a Union Catalog,” OCLC,訪問于2018年2月10日,https://www.oclc.org/research/activities/chineserarebooks.html.,該項目由普林斯頓大學(xué)的艾思仁(Soren Edgren)牽頭,盡管如今項目已經(jīng)結(jié)束,其數(shù)據(jù)卻并未流失。幸運的是,大部分數(shù)據(jù)被整合到了WorldCat在線目錄中,而項目本身也在2011年被轉(zhuǎn)移到了北京的中國國家圖書館。*“Soren Edgren,” Rare Book School,訪問于2018年2月10日,http://rarebookschool.org/faculty/history/soren-edgren.在創(chuàng)建這一聯(lián)合目錄的過程中,莎拉·艾爾曼(Sarah Elman)、陳智華(音譯,Chi-wah Chan)和團隊中的其他學(xué)者共同制訂并發(fā)表了一套準則,用以指引一種能夠?qū)⑦@些書以機器可識別的格式進行歸目,又能反映傳統(tǒng)文獻研究的系統(tǒng)性方法。這套準則初次發(fā)表于2000年,并在2009年得到修訂。*Cataloging Guidelines for Creating Chinese Rare Book Records in Machine-Readable Form (Mountain View: Research Library Group, 2009),http://www.eastasianlib.org/ctp/webinars/ChineseRareBook/CRBP_guidelines.pdf.這份資料的制訂發(fā)揮了關(guān)鍵作用,讓更多人得以接觸這些善本圖書。不僅如此,它也為我本人關(guān)于中國印刷潮流的量化分析奠定了基礎(chǔ)。*Paul Vierthaler, “Analyzing Printing Trends in Late Imperial China Using Large Bibliometric Datasets,”Harvard Journal of Asiatic Studies 76 no. 1/2 (2016): 87-133.

盡管各有完全不同的目標,但以上各個項目都著眼于發(fā)展結(jié)構(gòu)化的數(shù)據(jù)集。對于我們中那些致力于文本挖掘的人而言,因中文語言文獻的數(shù)字化及其被納入語料庫的過程而誕生的未結(jié)構(gòu)化的數(shù)據(jù)集也同樣重要。在這一方面,亞洲學(xué)者們已經(jīng)取得了重大成果,西方的進展也不遜色。截至2018年2月,這些項目中最大的一個是“中文文本項目”(Chinese Text Project,簡稱CText),其創(chuàng)立者和負責人是唐納德·斯特金(Donald Sturgeon)。*Donald Sturgeon, Chinese Text Project,訪問于2018年2月8日,http://www.ctext.org.這一項目從早期中文經(jīng)典著作開始,已經(jīng)成長為全球最大的開源中文數(shù)字文本庫。*Sturgeon, “Introduction,” Chinese Text Project,訪問于2018年2月8日,http://ctext.org/introduction.“中文文本項目”如今包含的經(jīng)過數(shù)字化轉(zhuǎn)錄的中文文本超過50億字,其中許多文本都經(jīng)由CText社區(qū)成員的細心編輯。2016年,CText開始收錄哈佛-燕京圖書館所藏眾多中文善本圖書的掃描件(掃描圖片超過500萬頁)。*Sturgeon, “Latest Addition,” Chinese Text Project,訪問于2018年2月8日,http://ctext.org.斯特金運用光學(xué)字符識別技術(shù)(OCR),為這些圖片創(chuàng)建了可以完全由機器識別的版本。*Sturgeon, “Optical Character Recognition,” Chinese Text Project,訪問于2018年2月8日,http://ctext.org/instructions/ocr.

CText沒有局限于其最初致力收錄的古代文本的范圍,而是納入了來自中國歷史上所有時期、種類極為廣泛的文獻。其他項目則更特別著眼于某些特定類別的文本。例如,馬克斯·普朗克科學(xué)史研究所(Max Planck Institute for the History of Science)的地方志數(shù)據(jù)庫項目就創(chuàng)建了一個數(shù)據(jù)庫和分析平臺,旨在讓研究者能夠直接訪問地方志的數(shù)字版本。這些文獻出自地方上的重要人物之手,往往包含著有關(guān)當?shù)丨h(huán)境的廣泛信息(既有政治的,也有生態(tài)、語言及更多方面的)。項目的主要開發(fā)者——薛鳳(Dagmar Sch?fer)教授和陳詩沛博士——希望他們提供的材料和分析工具能促進對地方歷史的分析。這一項目“著眼于探索尺度的改變(地方記錄從個別的地方志轉(zhuǎn)入單一的全球數(shù)據(jù)庫)會如何重塑中國歷史研究的面貌”*“Local Gazeteers,” Max Planck Institute for the History of Science,訪問于2018年2月12日,https://www.mpiwg-berlin.mpg.de/research/projects/departmentSchaefer_SPC_MS_LocalGazetteers.。

在這種專為某個特定類別的寫作創(chuàng)建文本庫的努力中,另一個例子是“明清女性寫作”(Ming-Qing Women’s Writings)項目。該項目由麥吉爾大學(xué)的方秀潔(Grace Fong)教授負責,始于2003年,至今仍在擴充之中。如今,它收錄的明清時代女性著作的掃描版共有342個不同類別,納入了超過5000名女性作者的作品。*Grace Fong, “Introduction to the Digital Archive of Ming-Qing Women’s Writings,” McGill University,訪問于2018年2月13日,http://digital.library.mcgill.ca/mingqing/english/introduction.php.

滿族研究領(lǐng)域的學(xué)者們同樣開發(fā)了他們的平臺和文本庫。Manc.hu就是一個收錄了眾多滿語文獻的閱讀平臺,由萊頓大學(xué)的京以宬(Fresco Sam-Sin)和利昂·羅登伯格(Léon Rodenburg)開發(fā)。

在創(chuàng)建上述種種數(shù)據(jù)的過程中,一些項目還開發(fā)了旨在讓學(xué)者們可以高效地瀏覽和分析數(shù)據(jù)的工具。CBDB的Access版本就包含了眾多能讓使用者查閱數(shù)據(jù)庫并迅速建立關(guān)系網(wǎng)絡(luò)的工具。CText也整合了各種工具(如詞典、索引工具,以及平行段落識別工具),能幫助使用者對CText文本庫所收錄的著作進行細讀,并執(zhí)行基本文本挖掘任務(wù),而這些工具的數(shù)量還在不斷增長。*Sturgeon, “Tools,” Chinese Text Project,訪問于2018年2月8日,http://ctext.org/tools.“明清女性寫作”項目所構(gòu)建的數(shù)據(jù)庫則包含了大量有關(guān)這些作品的元數(shù)據(jù)(從作者的姓名到個體詩歌的格律)。

在那些將大量精力投注于數(shù)據(jù)創(chuàng)建的項目之外,獨立于內(nèi)容擴充的工具開發(fā)也出現(xiàn)了。在過去大約5年時間里,眾多旨在幫助學(xué)者閱讀和標記源文本的平臺得以問世。由萊頓大學(xué)的魏希德(Hilde De Weerdt)和何浩洋(Brent Ho)創(chuàng)建的古籍半自動標示平臺MARKUS即為一例。它允許使用者上傳前現(xiàn)代的中文文本,并可以自動為之加上人物、地點以及使用者定制概念等種種標簽。MARKUS還擁有其他特點,能讓使用者自動創(chuàng)建“地理信息系統(tǒng)”(Geographic Information System,簡稱GIS),視覺化數(shù)據(jù)(即地圖),并將標記后的結(jié)果數(shù)據(jù)輸出,以便在其他平臺上進行分析。*Brent Hou Ieong Ho and Hilde De Weerdt, MARKUS. Text Analysis and Reading Platform,訪問于2018年2月14日,http://dh.chinese-empires.eu/markus.

近年出現(xiàn)的這種工具開發(fā)的繁榮局面有賴于數(shù)字人文研究中一個重要的新潮流。這一潮流與數(shù)字人文領(lǐng)域?qū)﹂_源精神的接受緊密相關(guān)(并且部分有賴于后者),而后者又表現(xiàn)為漢學(xué)研究數(shù)據(jù)庫及工具的主要開發(fā)者們對應(yīng)用編程接口(APIs)的廣泛創(chuàng)建。應(yīng)用編程接口使得軟件開發(fā)者可以直接從他人的服務(wù)器上提取信息(在某些情況下也可以整合某種特定工具的功能)。CText、CBDB以及其他項目全都包含了此類訪問功能,這有助于創(chuàng)建一種項目之間彼此衍生、緊密關(guān)聯(lián)的生態(tài)系統(tǒng)。在這方面,MARKUS堪稱典范:使用者可以通過CText插件直接輸入文本,并使用CBDB、漢典ZDIC以及其他數(shù)據(jù)源的信息來自動標注文本。

讓MARKUS(以及其他類似項目)得以成為一種可變研究平臺的,是完全轉(zhuǎn)化為數(shù)字版本的文本數(shù)量的增加。學(xué)者們?nèi)缃衲軌蛞赃^去不可想象的方式來處理文本,以揭示陳舊的研究方法難以辨識的信息和傾向。然而,其他一些重要的努力則致力于利用互聯(lián)網(wǎng)的社區(qū)屬性,構(gòu)建起以技術(shù)方式對數(shù)千年來一直發(fā)揮重要作用的研究方法(諸如注釋和翻譯等)加以組織的平臺。耶魯大學(xué)的“廣廈千萬間”項目(Ten Thousand Rooms Project)便是這種努力的典范之一。該項目由梅隆基金會(Andrew W. Mellon Foundation)資助,由呂立亭(Tina Lu)和米克·亨特(Mick Hunter)負責,自我描述為“前現(xiàn)代文本研究協(xié)作空間”*“The Ten Thousand Rooms Project,” Yale University,訪問于2018年2月10日,https://tenthousandrooms.yale.edu.。使用者可以通過斯坦福大學(xué)開發(fā)的、符合國際圖像互操作框架(IIIF)的Mirador瀏覽器,向“廣廈千萬間”平臺上傳文獻的掃描圖像,并圍繞它們來構(gòu)建研究項目。*“The Ten Thousand Rooms Project,” Yale University,訪問于2018年2月10日,https://tenthousandrooms.yale.edu.任何感興趣的人都可以加入并創(chuàng)建項目?!皬V廈千萬間”被設(shè)計為一個允許學(xué)者們就公版文獻展開協(xié)作研究的平臺,其核心創(chuàng)造性就在于這一平臺旨在支持的研究工作的眾包和協(xié)作屬性。這種做法具有研究和教學(xué)兩方面的意義。由于多人能夠?qū)ν晃谋具M行研究,世界任何角落的學(xué)者群體都可以輕易地展開協(xié)作,為某部唐詩集創(chuàng)建一個注釋版本。此外,大學(xué)里的課程也可以對某部明清小說進行轉(zhuǎn)錄、翻譯和評注。最重要的是,這些工作無須是文本性的。學(xué)者們也可以上傳藝術(shù)作品圖像,并直接注釋它們?!皬V廈千萬間”項目的運行基于“知識共享”(Creative Commons)的署名非商業(yè)用途許可,因此是對公眾開放的,任何人都可以閱覽這些協(xié)作項目的成果。目前已經(jīng)有近50個研究和課程項目出現(xiàn)在這一平臺上。

歐洲和北美的中文數(shù)字人文研究的工具開發(fā)領(lǐng)域正值繁榮期,許多新的項目在開發(fā)之中。這些項目數(shù)量太多,我難以一一給予恰當介紹。不過,其中有幾個項目尤為重要,略過它們將是我的疏忽。以Intertext項目為例:有不少項目旨在開發(fā)出某種軟件,用以識別不同文獻中出現(xiàn)的文本重復(fù),Intertext便是其中之一。*“Intertext (beta 0.8),” University of Chicago, 訪問于2018年2月12日,http://edoc.uchicago.edu/textccr/textconcordancer.php。Intertext是芝加哥大學(xué)的一個項目,主要由Jeff Tharsen 開發(fā)(我曾有限地參考過該項目)。在這一領(lǐng)域中努力的也有其他人,例如Donald Sturgeon, “Unsupervised identification of text reuse in early Chinese literature,” Digital Scholarship in the Humanities (November 2017),https://doi.org/10.1093/llc/fqx024.我也曾開發(fā)一種類似的實驗性算法,在文本庫水平執(zhí)行,對上千種文獻進行比較。其目的在于幫助那些不會編程的人使用遠程閱讀工具。另一個項目是“漢典古籍的主題模型化”(Topic Modeling the Handian Ancient Classics),其目標與此類似。它使用主題模型方法,對早期中文文獻之間的關(guān)系加以視覺化。這一項目(由美國國家人文基金會提供資助)的設(shè)計者是美國印第安納大學(xué)的一個學(xué)者團體,而他們的合作學(xué)者則來自中國西安交通大學(xué)。這個團隊開發(fā)了一種“主題瀏覽器”,以幫助學(xué)者視覺化他們得到的結(jié)果。*Colin Allen, et. al., “Topic Modeling the Handian Ancient Classics (漢典古籍)”, The Journal of Cultural Analytics (October 2017),https://doi.org/10.22148/16.016.

二、研究態(tài)勢日趨繁榮

此時應(yīng)當已經(jīng)很明顯了:許多這樣的數(shù)字化項目、基礎(chǔ)建設(shè)項目與研究領(lǐng)域之間存在著一種共生關(guān)系(并且理當如此)。研究生成數(shù)據(jù),數(shù)據(jù)生成基礎(chǔ)結(jié)構(gòu)。這一生成循環(huán)有時是一種自然的發(fā)展,其他時候則是出自設(shè)計(設(shè)計方案誕生于基金申請的寫作階段)。由萊頓大學(xué)的佛教學(xué)者喬納森·斯科(Jonathan Silk)教授所主持、目前正處于初創(chuàng)之中的“開放語文學(xué)”(Open Philology)項目就是這類項目的一個例子。這一項目由歐洲研究委員會資助,旨在設(shè)計一種平臺,自動將用中文與藏文書寫的佛經(jīng)加以排列。*這個問題在計算意義上相當復(fù)雜。該團隊聘請了一名博士后研究員,專門負責解決這一問題。作為一名顧問,我也參與了這一項目。致力于這一項目的學(xué)者團隊將為《大寶積經(jīng)》(MahāratnakūtaCollection)的文本創(chuàng)造出評注版本,而該團隊將要開發(fā)的平臺則可以讓學(xué)者們更有效率地探索某一給定文本的眾多校訂版本之間的文獻學(xué)聯(lián)系。

在諸多例子中,當下歐洲和北美數(shù)字人文中國研究領(lǐng)域所開展的研究都應(yīng)當感謝這些從事數(shù)字基礎(chǔ)建設(shè)的先行者,他們在亞洲和西方都進行了數(shù)字化和開發(fā)工作。數(shù)字人文中國研究領(lǐng)域的一些學(xué)者過去就曾為這些項目工作,陳松就是其中之一,他曾為哈佛大學(xué)的CBDB項目工作,并曾將GIS和基于CBDB信息的網(wǎng)絡(luò)分析結(jié)合起來,以研究宋朝官員之間的網(wǎng)絡(luò)關(guān)系。*Song Chen, “Native Incumbency and Elite Networks in Song Dynasty Sichuan: Evidence of the Turn of the Mid-Eleventh Century from China Biographical Database (CBDB),” Song, Yuan, and Conquest Dynasties Studies, (2008),https://www.academia.edu/18396876/2008_conference_paper_Native_Incumbency_and_Elite_Networks_in_Song_Dynasty_Sichuan_Evidence_of_the_Turn_of_the_Mid-Eleventh_Century_from_China_Biographical_Database_CBDB_._Online_publication_via_online_via_the_Society_for_Song_Yuan_and_Conquest_Dynasties_Studies_2008.其他一些學(xué)者并沒有這種與某個基礎(chǔ)建設(shè)項目的歷史聯(lián)系,他們的研究工作大部分獨立于這些項目。有許多學(xué)者如今在數(shù)字空間中展開研究,并利用這些開發(fā)成果;此外,盡管GIS和社會網(wǎng)絡(luò)分析在數(shù)字人文中國研究中的歷史更長,但隨著學(xué)者們開始學(xué)習(xí)編程或是開始使用他人不斷開發(fā)的新工具,文本挖掘正變得越發(fā)流行。幾乎所有涉及我此前提到的各個項目的學(xué)者都積極參與到數(shù)字研究中,然而也有許多其他學(xué)者并未與這些較大的項目發(fā)生直接聯(lián)系。與其他任何迅猛發(fā)展中的分支學(xué)科一樣,北美和歐洲有太多學(xué)者投身這一領(lǐng)域,多到我無法一一提及。不過我將在此聊舉幾例,以展示這一領(lǐng)域中的學(xué)者人物和研究主題的多樣性:陳威(Jack Chen,唐詩與《世說新語》的文本挖掘)、馬瑞詩(Ruth Mostern,宋朝的GIS與地方志)、伊安·米勒(Ian M. Miller,對明朝歷史進行文本挖掘以研究環(huán)境變化)、戴史翠(Maura Dykstra,明清法律文獻的文本挖掘)、包美歌(Margaret Wan,明朝小說的文本挖掘與GIS研究)、詹森·普羅塔斯(Jason Protass,對宋朝佛教詩人的GIS/網(wǎng)絡(luò)分析)、康森杰(Jeff Tharsen,對早期中文文本的語音學(xué)分析/文本挖掘)、文欣(唐、宋及中亞歷史的文本挖掘/GIS)和韓瑞亞(Rania Huntington,志怪小說中的社會網(wǎng)絡(luò));他們只是運用數(shù)字工具來理解中國歷史和文學(xué)的學(xué)者群體中的一小部分。還有一些學(xué)者在西方接受訓(xùn)練,如今在亞洲工作,如劉晨(音譯,Chen Liu,宋朝書信的文本挖掘)。此外,全球各地的大學(xué)中還有眾多研究生使用數(shù)字方法,即將創(chuàng)造出優(yōu)秀的研究成果。

傳統(tǒng)學(xué)術(shù)領(lǐng)域中也出現(xiàn)了與此并行的發(fā)展,開始發(fā)表基于數(shù)字方法的學(xué)術(shù)成果。因此,這些學(xué)者的研究成果并非僅僅出現(xiàn)在專注于數(shù)字人文的期刊上,如《文化分析期刊》(JournalofCulturalAnalytics)或《人文學(xué)科中的數(shù)字學(xué)術(shù)》(DigitalScholarshipintheHumanities),也出現(xiàn)在《早期近代中國》(EarlyMedievalChina)*例見Jack Chen, Zoe Borovsky, Yoh Kawano, and Ray Chen, “The Shishuo xinyu as Data Visualization,” Early Medieval China 20 (2014): 22-58.和《哈佛亞洲研究》(HarvardJournalofAsiaticStudies)*在其2016年刊中,HJAS 發(fā)表了該期刊第一篇數(shù)字研究領(lǐng)域的作品,即我關(guān)于大規(guī)模文獻分析的文章,參見David Howell, “Editorial Preface,” Harvard Journal of Asiatic Studies 76 no. 1/2 (2016), vii.等歷史悠久的中文研究期刊上。

三、團體與會議層出不窮

隨著研究的繁榮,致力于數(shù)字人文的團體也蓬勃發(fā)展起來。在過去幾年中,已經(jīng)有了一系列重要的組織發(fā)展,為西方漢學(xué)研究領(lǐng)域的數(shù)字研究提供了助力,其中一個重要組織便是Facebook上的數(shù)字漢學(xué)研究群。該群由阿琳娜(Elena Valussi)、邁克·以基維斯(Mikael Ikivesi)和維習(xí)安(Christian Wittern)于2015年5月創(chuàng)建,截至2018年2月6日,它已經(jīng)有了超過1000名成員,并成為中文數(shù)字人文討論的活躍站點。學(xué)者們在群中分享會議消息、文章、職位列表,并征集文章。

此外,人們也在努力組織專為支持數(shù)字人文中國研究的長期計劃。斯坦福大學(xué)的穆蘭尼(Tom Mullaney)教授創(chuàng)建的DHAsia計劃就是此類努力的重要范例。盡管該計劃著眼于更廣泛意義上的亞洲研究,但有許多中國研究學(xué)者參與其中。這個計劃始于2016年,當時正有一群演講者在斯坦福參加一次為期一周的短期駐?;顒樱陂g他們發(fā)表演講,為學(xué)生提供咨詢,并為社區(qū)成員舉辦了一場研討會。2018年,將有來自世界各地的近40名學(xué)者向DHAsia主辦的一場會議提交論文(其中半數(shù)都是從事中國或中文材料研究的學(xué)者)。*“DHAsia 2018 Schedule Released,” DHAsia, 訪問于2018年2月14日,http://dhasia.org/2018/01/dhasia-2018-schedule-released.

該領(lǐng)域還有一些更小規(guī)模的會議。美國霍普金斯大學(xué)的梅爾清(Tobie Meyer-Fong)教授在2017年10月組織了一場會議,名為“豐富的焦慮:數(shù)字時代清史研究的文獻與方法”,討論學(xué)者們?nèi)绾蚊鎸迫鐭熀5那迨凡牧线@一問題。*Late Imperial China的2017年12月刊上出現(xiàn)了一條關(guān)于此次會議的筆記:Emily Mokros, “Conference Note: Anxieties of Abundance: Sources and Methods for Qing Studies in the Digital Age,” Late Imperial China 38 no. 2 (December 2017): 153-156.加州大學(xué)圣芭芭拉分校的余泰明(Tom Mazanec)教授在2018年2月也組織了一次會議,名為“中國古典文學(xué)中的模式與網(wǎng)絡(luò):來自數(shù)字前沿的筆記”*“Conference: Patterns and Networks in Classical Chinese Literature: Notes From the Digital Frontier,” University of California, Santa Barbara, 訪問于2018年2月13日,http://www.ihc.ucsb.edu/event/conference-patterns-networks-classical-chinese-literature-notes-digital-frontier.。然而,就在幾年之前,數(shù)字漢學(xué)研究會議的層出不窮在北美還是聞所未聞的事。

盡管西方中國研究領(lǐng)域中數(shù)字人文的發(fā)展勢頭迅猛,但它仍然落后于其他領(lǐng)域。主要障礙之一在于正規(guī)培訓(xùn)的缺乏。關(guān)于更廣泛的數(shù)字人文,已經(jīng)有了一些培訓(xùn)項目(例如倫敦的國王學(xué)院便設(shè)有數(shù)字人文的碩士學(xué)位項目)。但相對而言,中文研究者的選項仍然十分有限。2016年,萊頓大學(xué)舉辦了一次數(shù)字人文暑期班,提供數(shù)據(jù)庫設(shè)計、GIS、網(wǎng)絡(luò)分析和文本挖掘方面的培訓(xùn),吸引了來自全球的學(xué)生。哈佛大學(xué)也向研究生提供一些課程訓(xùn)練,斯特金就開設(shè)了一門名為“中國研究之數(shù)字方法”的課,以數(shù)學(xué)家安東尼·羅齊(Anthony Ruozzi)和我在2015年開設(shè)的實驗性的“數(shù)字中國實驗室”講座為基礎(chǔ)。*“Digital China,” Harvard University,訪問于2018年2月13日,http://fairbank.fas.harvard.edu/projects/digital-china.然而此類課程的數(shù)量還遠遠不夠廣泛。除了這種非常設(shè)的項目,大部分數(shù)字人文中國研究的學(xué)者仍然只能依靠自學(xué),或是從那些專長不在中國研究的學(xué)者那里接受培訓(xùn)。這種情況意味著許多人需要經(jīng)歷一個復(fù)雜的過程,學(xué)會如何將那些為西方研究設(shè)計的工具和方法轉(zhuǎn)入一個新的文化與語言空間。

這一語言轉(zhuǎn)換正是西方的數(shù)字人文中國研究發(fā)展較慢的主要原因之一。大部分西方數(shù)字人文學(xué)者的研究對象都是西方,這意味著大量工具的設(shè)計工作語言都是英語、法語或其他歐洲語言,并非總能輕易地應(yīng)用于中文作品。最大的困難之一在于詞的分割,即在中文語境中如何將文本分割為詞語(我在與本文配合的那篇文章中深入討論了這一問題)。就在不久之前,字符編碼還是一個主要問題。盡管unicode編碼標準已經(jīng)存在了許多年,大量計算機工具仍未完全兼容它,或是兼容其他任何中文字符編碼標準,如GB18030。幸運的是,隨著計算機生態(tài)系統(tǒng)開始原生支持unicode,這種情況已經(jīng)不再那么普遍了。編程語言Python的最新迭代Python 3已將unicode作為其默認的字符串格式,與使用bytecode的前一迭代Python 2不同。要理解數(shù)字人文中國研究的當前狀況,關(guān)鍵在于認識到開發(fā)數(shù)字工具的學(xué)者和機構(gòu)不斷增加的開放性。這些工具越來越易于掌握,為學(xué)者們提供的結(jié)果也越來越令人鼓舞。隨著各大學(xué)開始提供更廣泛的培訓(xùn),以及更多材料得以數(shù)字化,這一潮流還會加速。當下,數(shù)字人文研究者在某種程度上仍然隔絕在自己的小天地里,但這些方法將會逐漸成為學(xué)者工具箱中的標準配置。當然,并非所有學(xué)者都需要在工作中使用量化分析或文本挖掘,但他們需要熟悉這些方法,并能夠評價它們,正如他們面對那些更廣為接受的方法時一樣。中國研究正處于一個激動人心的時刻,而我們將不斷從新的方法和模型中了解到更多中國歷史和文化中的有趣內(nèi)容。

四、結(jié)語

本文完全著眼于西方數(shù)字人文漢學(xué)研究中以20世紀20年代前的材料為對象的部分,主要原因之一在于我本人的專長領(lǐng)域,但更迫切的理由是:數(shù)字方法有賴于使用數(shù)字化研究材料,而對那些研究更現(xiàn)代材料的學(xué)者來說,做到這一點要困難得多。這主要是因為版權(quán)上的限制:公版材料的入手更加容易,而要取得1925年之后出現(xiàn)的材料的使用許可,難度遠大于前者。盡管如此,數(shù)字人文現(xiàn)代中國研究領(lǐng)域中仍然出現(xiàn)了一些重要的成果,包括但不限于弗萊堡大學(xué)的毛澤東遺產(chǎn)項目正在開展的工作(Daniel Leese、Wang Baigulahu、Amanda Schuman等)、戴安德(Anatoly Detwyler,關(guān)于20世紀20年代的科學(xué)與文學(xué)的研究)、蘇真(Richard Jean So,現(xiàn)代中國文學(xué))、郭旭光(Arunabh Ghosh,關(guān)于中華人民共和國初期的文獻計量分析/文本挖掘)以及其他許多人的研究。

猜你喜歡
文本研究
FMS與YBT相關(guān)性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
在808DA上文本顯示的改善
EMA伺服控制系統(tǒng)研究
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
新版C-NCAP側(cè)面碰撞假人損傷研究
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
主站蜘蛛池模板: 国产精品99久久久| 午夜电影在线观看国产1区| 国产精品短篇二区| 国产爽妇精品| 朝桐光一区二区| 国产成人高清精品免费5388| 亚洲成人一区二区三区| 爽爽影院十八禁在线观看| 亚洲国产高清精品线久久| 日本高清成本人视频一区| 亚洲成人网在线播放| 日韩在线影院| 午夜福利网址| 在线看片中文字幕| 国产精品福利社| 国产欧美日韩专区发布| 精品国产女同疯狂摩擦2| 欧洲高清无码在线| 色噜噜在线观看| 国产午夜看片| www.99在线观看| 夜精品a一区二区三区| 日韩激情成人| 精品成人免费自拍视频| 久久夜色撩人精品国产| 亚洲精品波多野结衣| 亚洲第一精品福利| 国产精品久久久久久搜索| 91久久偷偷做嫩草影院免费看| 国产一级毛片网站| 亚洲天堂免费观看| 成人夜夜嗨| 一本色道久久88综合日韩精品| 国产精品自在在线午夜| 亚洲综合色吧| 女人av社区男人的天堂| 国产xx在线观看| 在线观看热码亚洲av每日更新| 女人一级毛片| 日韩在线第三页| 999国产精品永久免费视频精品久久| 尤物国产在线| 精品91视频| 久久精品娱乐亚洲领先| 99久久这里只精品麻豆| 国产免费观看av大片的网站| 亚洲精品无码AⅤ片青青在线观看| 有专无码视频| 五月综合色婷婷| 精品国产自| 国产SUV精品一区二区| 亚洲v日韩v欧美在线观看| 欧美成人A视频| 午夜日韩久久影院| 国产日本欧美在线观看| 欧美色99| 91国内视频在线观看| 全部免费特黄特色大片视频| 日韩成人午夜| 欧美伊人色综合久久天天| 一本大道香蕉高清久久| 沈阳少妇高潮在线| 日本免费a视频| 国产精品专区第1页| 免费观看成人久久网免费观看| 国产精品视频公开费视频| 国产精品久久久久久久久kt| 欧美在线一二区| 大乳丰满人妻中文字幕日本| 亚洲国产黄色| 欧美日韩精品在线播放| 92精品国产自产在线观看| 国产美女主播一级成人毛片| 国产在线高清一级毛片| 91精品伊人久久大香线蕉| 麻豆a级片| 91福利一区二区三区| 无码精品国产VA在线观看DVD| 中文精品久久久久国产网址| 青青草国产免费国产| 在线观看国产精品日本不卡网| 超碰免费91|