999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數字人文研究中的方法論誤區及研究規范

2021-11-29 08:54:59張志慶張正午
現代傳播-中國傳媒大學學報 2021年10期
關鍵詞:方法論研究

■ 張志慶 張正午

21世紀,數字技術的普及為量化研究插上了翅膀,大數據、云計算等精深的名詞,不再僅被供于廟堂之上,也已“飛入尋常百姓家”。在數字技術的加持下,人文學科研究突破舊有的范式,在與多學科的交合中創建了“數字人文”這一新型研究領域。數字人文研究領域一出現就展現出了強大的學術潛力,甚至有學者認為數字人文具有推動學術體系變革的力量。但是,也有一部分學者對此領域持全盤否定的態度,認為無論是其本體論、認識論還是方法論上均存在明顯缺陷。二元對立之勢日盛。本文將關注重點放在已有研究中的方法論誤區上,并且試圖通過對錯誤研究實踐的評析建立幾個數字人文研究中的研究規范。數字人文的魅力在于其無限的可能性,故而研究規范的建立不宜從上至下寬泛地做出限定,每一條規范的加入都有可能堵死研究的一種可能性。數字人文研究規范應該是建立在對錯誤實踐的否思(unthink)上的,即通過不斷界定“數字人文不是什么”來建立一套不斷完善的學術規范。對其研究實踐抱有最寬容之態度,對其錯誤及時糾偏,方才有益于數字人文研究的發展。

一、數字人文的起源及發展

數字人文是一個日益流行的人文學科研究分支,該分支有各種名稱,其中包括文化分析學、文學數據挖掘、文學文本挖掘、計算文本分析、計算批評、算法文學研究、文學研究的社會計算、計算文學研究以及被用到最多的人文計算(humanities computing)、計算文學研究(computational literary studies)以及數字人文(digital humanities)等。學界對數字人文尚沒有一個明確且統一的定義,大多數學者和研究者都認為,要為這一概念下個確切的定義是困難的。①因為其方法論基礎還不穩定,應用領域尚未形成成熟的范式,學術共同體內部也未形成共識。②當前,對數字人文主要有四種理解方式:一是把它視為一種研究方法,通過引入計算機工具來處理傳統人文研究中長期存在的問題;二是把它視為一個文理交叉的新興研究領域;三是認為它已經成為一個學科;四是把它理解為一種實踐,是充分運用計算機技術開展的合作性的、跨學科的研究、教學與出版的新型學術模式和組織形式,是一組相互交織的實踐活動。③大體來看,數字人文是計算機或數字技術與人文學科交叉的學術活動領域,它包括對人文學科數字資源的系統利用,以及對數字資源應用的反思。④

數字人文這個概念在2004年才被提出,但是首次圍繞計算機技術和統計方法進行人文學科研究實踐,可以追溯到1949年,意大利耶穌會羅伯特·布薩(Roberto Busa,1914—2011)神父與IBM合作,以將文本轉化為數據的方法,為歐洲中世紀著名的經院派哲學家和神學家托馬斯·阿奎那(St.Thomas Aquinas,約1225—1274)的著作《神學大全》建立一個可被索引的數據庫。布薩建立了一個團隊,團隊最多的時候達到60人,從1949年開始,用了將近30年的時間,在1980年才完成了56卷的托馬斯·阿奎那詞匯索引。他的這一創舉無意中使人文學科和數字技術正式牽手,成為現今數字人文研究的始祖。隨著數字技術的不斷普及,可被索引的電子語料庫如雨后春筍般涌現出來,到20世紀60年代,基于語料庫建立的電子索引表適用于高效的量化文本分析成為可能。在這時期,數字人文主要的研究對象,是通過對詞出現的頻率或者詞的計數,去分類作者文本,從而進行“作者身份研究”的研究。⑤其中的代表性成果是對《聯邦黨人文集》(1787—1788)作者身份的確定。⑥20世紀80年代,我國學者陳大康、李賢平等,試圖運用此方法對《紅樓夢》的著作權進行判定。⑦另外,2000年,斯坦福大學英文系教授弗朗科·莫瑞蒂(F.Moretti)在《新左派評論》發表的《世界文學的猜想》一文中提出,在“細讀”的傳統上,發展出一種新的“遠讀”的模式,即借助一些手段來忽略細節信息,從更為宏觀的層面來把握文學作品的結構和意義,并且預言了以計算機和“大數據”來考察文化體系的做法。⑧2016年,派珀·安德魯(Piper Andrew)在《要有數字》(There Will Be Numbers)中提出,數字人文的核心在于解決傳統人文學科中“客觀性”“全面性”的不足,以及“證據缺口”的問題。⑨自此,在數字技術的加持下,數字人文的研究在語言學、史學、圖書情報學、文學、藝術學等各個領域全面鋪開。⑩

二、數字與人文之爭

數字人文研究源于人文學界對于研究的客觀性、全面性的追求,試圖基于大量數據,對充滿主觀性的人文學科進行量化分析,并在此基礎上獲得結論。具體而言,數字人文研究的核心特征有三:其一,將浩如煙海的經驗材料數據化,建立數據庫從而奠定分析的基礎;其二,引入統計學方法論,進行數據挖掘,比較量化指標間的顯著性特征,或是發現某種模式、趨勢以及規律性現象;其三,研究結果的多樣化、動態化呈現,可以具體表現為呈現渠道的多樣化、研究內容的可視化、研究結果的動態化呈現。這就使得數字人文的研究具有跨學科甚至是反學科特征,因為要將上述三點結合起來,依照現有學科劃分體系來看,需要多學科背景的研究人員協同合作,這也就導致了數字人文研究以團隊制為研究主體、以項目制為基本單位的特點。但是,在多學科合作的過程中,各學科所本持的研究范式具有相當大的差別,這種差別可能體現在本體論、認識論上,但更多的是體現在方法論的差異與隔閡上。如不試圖彌合這種差異,對方法論各自為政、信手拈來,則無法獲得令人信服的研究結論。

目前,學界對數字人文的態度分歧極大。支持學者認為,數字人文是一場徹底的學術生產方式變革,隨著學術生產資料的數字化重構,可能會打破過去自然科學、社會科學和人文學科三分的對立、割裂局面,其影響不亞于印刷媒介革命。更有甚者,認為倡導數字人文的最終愿景是進一步發展文化,進而創造文化,其影響并不亞于第二次文藝復興。而反對學者則認為,其一,數字人文研究的影響被過分夸大了,自存在之日起,就是“只聽雷聲大,不見雨點來”,雖然在數量上有一些論文成果,可真正令人滿意的、有價值的成果極其稀少。就連“遠距離閱讀”提出者弗朗科·莫瑞蒂也在采訪中表示不滿:“數字人文目前為自己造就了一種永久的嬰兒期,總是在寄希望于未來;數字人文自己號稱是了不起的新事物……但取得的成績并不令人滿意……到目前為止遠低于預期……”其二,數字技術和人文主義向來分屬兩個不同陣營,數字人文玷污了傳統的批判性態度和方法論,主觀的、帶有人性的、批判性的研究才是人文學科的精華。過分強調“數字”,可能對“人文”產生不利影響,甚至有學者疾呼“拋棄人性的歷史學沒有存在價值”。其三,數字人文是“科學拜物教”的再現,體現的是唯科學主義的“技術決定論”論調。數字人文混淆了信息和知識這兩個截然不同的概念,數字人文僅僅能獲取信息,卻無法使信息成為知識,因為技術的功能是獲取信息,人文學科才能生成知識。詞頻統計結果并不等同于有意義的研究結果,數字人文批評的方法論和理論前提并不適用于分析文學、文學史和語言學的復雜,其最大的問題在于本體論的缺失。

本文無意陷入二元對立的爭論當中,也無意從本體論、認識論方面展開討論,僅做方法論層面的探索。本文將從幾個負面案例出發,探討數字人文背景下的人文學科研究方法論規范,避免方法論謬誤。

三、“大數據”的邊界——數字人文不是數量大小

數字人文研究的首要特征就是研究實踐是建立在數據庫基礎上的,基于大數據資料庫對文本進行挖掘,以追求獲得客觀性、全面性。而數據及由此得出的研究結果是否具有客觀性和全面性,涉及獲取樣本的方法、部分與整體的關系等。絕對“量”的大小不能說明問題。

以文章《多即不同:作為大數據的微影評及其遠讀》為例,該文聲稱運用了“大數據”進行“遠讀”,在互聯網平臺“豆瓣”上抓取了1500條評論進行分析,得出了電影《流浪地球》在網絡輿論場中存在評論極化現象等結論。但是,首先,這個研究的所有數據皆來自“豆瓣”這一個平臺,而其他不同媒介場域下的數據都沒有被納入考量范疇。特別是考慮到互聯網媒介環境中的社群化傾向,導致任何平臺都有其特定的“用戶群”,而這一特定的“用戶群”擁有相對穩定的身份特征和行為偏好,所以在單一的互聯網媒介平臺中收集到再多的數據都只能說明本社群的情況,而不能用以說明整體。其次,乍一看該文收集到了1500條評論,絕對數量不小,但是原文中也提到了,《流浪地球》在豆瓣上共有654914條短評,而其選取的研究對象只是“豆瓣”平臺篩選后所展示的1500條。簡而言之,“豆瓣”平臺作為“守門人”已經將數據篩選過一遍,而研究者看到的只是平臺讓你看到的那一部分數據,也就是說,這1500份數據能否代表“豆瓣”用戶社群都要存疑。

以上這篇文章暴露出來的就是方法論上的謬誤。在統計學方法論中,存在一個核心的概念——樣本。樣本是總體中抽取的所要考察的元素總稱,通過“概率抽樣”或“理論抽樣”等科學的抽樣方法,從總體中抽出樣本。獲得樣本數據之后還需要通過各種檢驗手段,用以證明樣本具有說明整體的能力。在數字人文語境下、數字技術加持下,研究者們擁有了處理海量數據的能力,但有的研究者對樣本及其抽樣方法卻不夠重視,似乎未來的研究可以告別樣本、擁抱總體。并且為區別于統計學范式,有的數字人文的研究者更是放棄了“樣本”這一稱謂,使用“數據”作為稱呼方式和基本分析單元。但是,我們在“大數據”的樂觀中必須清醒地認識到研究的范圍和邊界,即使一個研究分析了海量數據,也不等于分析了全部數據,研究者需要在研究中對數據的來源和范圍做詳細的匯報,即使數據的絕對值再大也要說明整體與部分的關系。

四、量化指標的構建——數字人文不是數據的簡單使用

量化研究的本質在于對現實世界的測量,而使測量能夠達成必須對所要測量的事物概念化,通過指定一個或多個指標,賦予概念一個明確的意義。通過區分概念的不同維度和確定概念的每一個指標,達成完全的概念化,通過名義定義和操作定義,使指涉的事物絕對具體、不會模棱兩可。例如,在社會科學常用的量化研究方法——內容分析法中,就必須對所測對象進行極其細致的操作化定義,匯報每個概念的內涵和外延并且舉例說明,使其清晰明確,這是開展相關研究的基礎。同時,量化指標的形成需要一套完整的科學檢驗方法作為支撐。以問卷調查法為例,一份嚴謹的社會科學調查問卷中,每一個問題指標的構建都需要進行嚴謹的、反復的測量驗證,以保證問卷的效度。一份具有效度的問卷需要通過測量表面效度實證測量的結果與我們的共識或我們頭腦中的印象的吻合程度;通過測量內容效度檢驗指標體系是否詳盡;通過對結構效度——包括聚合效度和離散效度——的測量,檢驗不同方法或相同方法測量相同或不同變量的結果是否相同或是不同。

相較于社會科學量化研究方法構建、匯報指標的嚴謹性,有的數字人文研究者在研究實踐中的指標構建則體現出較大的隨意性。以《文藝報》上發表的文章《傳播學視野下的中國當代文學70年世界影響》為例,這篇研究聲稱,以定量方式收集數據為基礎,以傳播學效果研究的理論框架,評估中國文學70年的世界影響。文章將中國文學70年的世界影響劃分為傳播范圍的大小,專業研究、評價的有無,讀者反饋的多寡三個指標維度,隨后分別羅列了傳播范圍大小的一些數據、評價的一些數據、讀者反饋的情況,得出了《白毛女》至《三體》一至十名的影響力排序。該文除了存在上文所述數據庫使用單一、只注重絕對值和未能說明所用數據和整體數據的關系外,還存在未對使用的概念進行清晰的定義、三個指標維度的建構極其隨意等問題。具體而言,其一,傳播范圍的大小只是數量的關系,量大的未必效果好,量小的未必影響差,傳播數量的大小本身說明不了傳播效果。其二,該文所述專業研究、評論的多少和有無依舊只注意了數量多少,而專業評論的長短、褒貶,在這個研究中并沒有進行區分。其三,在讀者反饋的多少這一部分中,文章并沒有區分作品生產的時間和讀者反饋的時間,讀者反饋的內容也被排除在外,依舊只關注反饋數量多少問題。讀者反饋的長短、喜歡的原因及其程度以及如何區分等,我們都看不到。其四,該文還存在關鍵指標維度的缺失。以傳播學效果研究的理論,評價中國文學70年的世界影響,僅用以上三個指標維度是顯然不夠的,有一些關鍵指標維度未被納入考量范疇。比如,作品的典范性、美譽度和傳閱度三個維度,每一個維度相應的指標及其主觀賦權和客觀賦權的權重。這個研究應該但是沒有說明的是:第一,資料庫的范圍是什么、總量是多少;第二,用什么軟件分析的樣本;第三,如何將評價分類的。另外,基于量化研究方法的效果研究一般采用問卷調查法或實驗法,這個研究都沒有采用。比如,通過問卷調查法,才可能從認知、情感、行動三個層次列出讀者反饋的強度、價值取向等指標,獲得量化數據并分析之。

基于以上分析,這篇文章的結論也許沒有錯,最后提出的兩條啟示也很振奮人心,但是,這些都不是來自本次研究活動本身。因此,本次研究活動是不成功的,結論和啟示是沒有學術價值的。這里并不是說該研究完全沒有意義,從而對其全盤否定,而是強調指標構建中的科學性問題以及學術生產、匯報流程的嚴謹性問題。

指標維度構建的隨意性會使測量工具或手段不能準確測出所測事物,從而導致研究失去效度。主要檢驗研究有效性的效度有四種:表面效度(face validity)、標準關聯效度(criterion-related validity)、建構效度(construct validity)和內容效度(content validity)。其中,在數字人文研究中內容效度最值得被關注,為保證內容效度,數字人文研究可以參考量化研究方法對于測量指標維度構建的流程。首先,發展階段,研究者通過對所測事物概念化和維度分析確定該概念應包括哪幾個維度,然后,根據概念的性質確定每個維度包括哪些條目,形成條目池。其次,評判階段,邀請相關領域專家,組成五人以上十人以下的專家組共同評判,通過內容評定問卷填寫各條目評價表。最后,效度計算,測算評定者間的一致性,隨后進行內容效度指數(CVI)測算,達到相應數值標準,建構完成。

五、結語:從休謨問題談起

現代人文學科的根源可以追溯到文藝復興時期,在人文主義思想的指引下,中世紀教會統治下的神權世界觀在以人為中心的世界觀面前受到巨大沖擊。早期的人文主義經歷近七個世紀的發展形成了今日璀璨的人類學術文明。在此過程中,人們學會了劃分“實然”和“應然”,并將討論“實然”的部分劃出了“人文”的范疇。這種趨勢在17到18世紀初見端倪,最終在19世紀末,細分的人文學科從自然科學和社會科學中脫離出來,形成了今天的學術體系。人文學科探討人的本質,社會發展歷程,社會價值體系、管理體制,人的精神世界,創造能力,心理機制等等,其偉岸之處在于批判性地思考人及其社會,指引人類文明朝“應然”的方向前進。

18世紀英國哲學家大衛·休謨(David Hume,1711—1776)指出,對于道德問題,科學是無能為力的,科學只能回答“是什么”的問題,而不能告訴我們“應該怎樣”,“事實”命題不能推導出“價值”命題。這一論斷對于數字人文的研究極具啟發。數字技術賦予了人類前所未有地把握整體世界的能力,但是,這種把握即使能夠了解世界的全貌也只是“實然”層面上的,而不是“應然”層面。然而“實然”不能等于“應然”,更不能推斷出“應然”,尤其是在涉及價值判斷的研究中,此二者的界限必須明確。自2008年始,中國的數字人文研究實踐發展出文學“排行榜”這種研究實踐,這種研究實踐本質上是一種建立在客觀數據基礎之上的主觀評價模式,具有典型的中國特色。這類研究應該特別注意上述三個問題:所用數據庫是否得當,能否用以說明整體情況;指標建立是否科學,是否遵循嚴格的學術流程,每個流程是否進行了詳盡的匯報;“事實”和“價值”的界限是否清晰,是否有用“事實”推斷“價值”的情況存在。

總體上看,數字人文作為一種方法論創新是有價值的,創新并不意味著放棄原有的人文學科的研究方法,而是對原有人文科學研究方法的必要補充,使研究的論據更加充分。本文所指,只是數字人文研究中方法論上幾個顯見的謬誤,隨著數字人文研究的不斷發展,更多潛在的問題將會浮現。學術成果的動態化呈現——隨時補充、修正研究成果——是數字人文研究的最大特色之一,數字人文的研究方法規范也應該符合這條特征,故而本研究是一份“永遠未完成”的研究,僅做拋磚引玉之效。但是數字人文的創新意義遠不止于方法論層面,數字人文更深遠的意義在于學術生產方式和學術呈現方式的創新。學術呈現方式的創新意義在于,打破了將書籍、論文等傳統印刷媒介作為單一學術呈現方式的現狀,使網頁、視頻、VR等多元媒介渠道作為學術呈現方式成為可能。跨學科、項目制的學術生產模式打破了19世紀以來涇渭分明的學科體系劃分,在數字人文的帶動下,跨學科融合的學術生產模式變革呼之欲出。但在融合的過程中我們必須警惕,幾個世紀壁壘森嚴的獨立學科發展,使每個學科都形成了一套獨特的學術范式,融合的過程也必然導致范式間的雜糅、揚棄和創新,尤其是在使用新的方法開展研究的時候,每一個步驟都應該仔細考量,檢查是否符合相應的學術規范,從而避免一些主觀臆斷的、情緒化的推論和判斷。

注釋:

① 張墨研:《數字人文的本體論反思——以意識形態批判的批判為起點》,《理論月刊》,2020年第8期,第120頁;郭英劍:《數字人文:概念、歷史、現狀及其在文學研究中的應用》,《江海學刊》,2018年第3期,第190頁。

② 劉煒、葉鷹:《數字人文的技術體系與理論結構探討》,《中國圖書館學報》,2017年第5期,第34頁。

③ [美]安妮·伯迪克等:《數字人文:改變知識創新與分享的游戲規則》,馬林青、韓若畫譯,中國人民大學出版社2018年版,第2頁。

④ Caldeira,S.P.DigitalHumanities:KnowledgeandCritiqueinaDigitalAge.Communications-European Journal of Communication Research,vol.45,no.2,2017.pp.267-269.

⑤ 戴安德、姜文濤、趙薇:《數字人文作為一種方法:西方研究現狀及展望》,《山東社會科學》,2016年第11期,第29頁。

⑥ Mosteller Frederick,David L.Wallace.InferenceinanAuthorshipProblem:AComparativeStudyofDiscriminationMethodsAppliedtotheAuthorshipoftheDisputedFederalistPapers.Journal of the American Statistical Association,vol.58,no.302,1963.pp.275-309.

⑧ Moretti,F.ConjecturesonWorldLiterature.New Left Review,vol.l,no.1,2000.p.54.

⑨ Piper Andrew.ThereWillBeNumbers.Journal of Cultural Analytics,vol.1,2016.pp.1-10.

⑩ 陳海玉、向前、萬小玥:《數字人文視域下抗戰檔案資源的開發策略與路徑研究》,《山西檔案》,2021年第3期,第71-72頁。

猜你喜歡
方法論研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
漢學方法論值得關注
國際漢學(2020年1期)2020-05-21 07:23:52
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
方法論視角下的制定法解釋
法律方法(2019年4期)2019-11-16 01:07:02
EMA伺服控制系統研究
法本位的方法論闡釋
法律方法(2018年2期)2018-07-13 03:22:02
UAF的方法論意義
抓改革落實,習近平的十大方法論
主站蜘蛛池模板: 国内精品视频区在线2021| 污视频日本| 欧美日韩亚洲综合在线观看| 国产一级在线播放| 久久人人97超碰人人澡爱香蕉 | 四虎AV麻豆| 黄色福利在线| 无码高潮喷水在线观看| 国产情侣一区二区三区| 毛片久久久| 19国产精品麻豆免费观看| 国产剧情无码视频在线观看| 99久久国产综合精品2023| 久久久久久国产精品mv| 欧美成一级| 午夜不卡福利| 久久公开视频| 国产福利免费视频| 国产在线91在线电影| 欧美成人日韩| 色综合热无码热国产| 狠狠做深爱婷婷综合一区| 日本高清视频在线www色| 国产午夜无码专区喷水| 欧美翘臀一区二区三区| 午夜欧美在线| 亚洲香蕉久久| 伊人久久福利中文字幕| 国产AV毛片| 九九久久99精品| 97超碰精品成人国产| 99视频在线免费观看| 婷婷色在线视频| 日本高清成本人视频一区| 亚洲自偷自拍另类小说| 国产v精品成人免费视频71pao| 无码粉嫩虎白一线天在线观看| 亚洲精品国产成人7777| 视频二区国产精品职场同事| 2021国产在线视频| 亚洲精品无码不卡在线播放| 国产熟睡乱子伦视频网站| 制服无码网站| 国产美女91呻吟求| 国产免费a级片| 免费99精品国产自在现线| 亚洲天堂网2014| 国产国产人在线成免费视频狼人色| 露脸国产精品自产在线播| 青青国产在线| 成人免费网站在线观看| 国产精品无码作爱| 国产精品久久自在自线观看| 亚洲热线99精品视频| 国产午夜福利在线小视频| 国产jizzjizz视频| 亚洲欧美综合在线观看| 在线亚洲小视频| 东京热一区二区三区无码视频| 日韩国产综合精选| 天天躁狠狠躁| 久久国产精品77777| 国产精品999在线| 亚洲福利视频一区二区| 成年人福利视频| 99re在线视频观看| 99热这里只有免费国产精品| av一区二区无码在线| 精品91自产拍在线| 欧美在线观看不卡| 99久久性生片| 精品自拍视频在线观看| 日本国产精品| 三区在线视频| 中文字幕有乳无码| 久久这里只有精品国产99| 国产精品片在线观看手机版| 中文字幕丝袜一区二区| 91视频精品| 精品少妇三级亚洲| 青青国产视频| 国产办公室秘书无码精品|