999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

計算機民俗學研究:百年學術論文主題地圖繪制

2016-10-28 06:57:27約翰洛頓喬納森古德溫著喬英斐揚譯
文化遺產(chǎn) 2016年5期
關鍵詞:文本研究

[美]約翰·洛頓 喬納森·古德溫著  喬英斐 李 揚譯

?

計算機民俗學研究:百年學術論文主題地圖繪制

[美]約翰·洛頓喬納森·古德溫著喬英斐李揚譯

像大部分學者一樣,民俗學者通過兩方面的結合來了解自己的學科歷史,一方面是自身的閱讀,另一方面是源自研究型訓練和專業(yè)互動的共識。民俗學科歷史被快捷梳理,高度偶然隨機的過程逐漸被普遍認可為歷史的必然性。本文是一個檢驗計算機方法在思想史研究中應用大型項目的初步報告,我們對運用主題建模方式去理解某一領域中的主題及范式的興衰進行了探究。我們使用期刊數(shù)據(jù)庫的研究數(shù)據(jù)應用程序接口訪問了源自三份民俗研究期刊(美國民俗學刊,西部民俗,民俗研究)的6778篇文章的內(nèi)容,運用“潛在狄利克雷分布”(Latent Dirichlet Allocation)主題建模形式,描述了125年間的學術作品的50種不同主題。其中最有趣的就是在我們學科中著名的“轉向表演研究”現(xiàn)象。

AFS民族志詞典:思想史計算機分析民俗與民眾生活期刊雜志

期刊百年索引在1988年年底發(fā)表時,確實是一部鴻篇巨制。它共有500頁,據(jù)編輯統(tǒng)計,是由一個接近20人的團隊進行了大量的工作才完成的。這份期刊及其所在的大學為其提供了資助,另外,學會又為其印刷提供了資金,在這些資助支持下,這部索引得以圓滿完成。但最重要的是,當時的期刊編輯在前言中強調(diào),這部索引是民俗學家和計算機程序員共同合作的產(chǎn)物,它建成了一個穩(wěn)健的數(shù)據(jù)庫基礎系統(tǒng)。*編輯布魯斯·杰克遜(Bruce Jackson)指出,為該索引提供資金支持的有L.J.和瑪麗·C·斯卡格斯(Mary C. Skaggs)基金,約翰·W.(John W.)和克拉拉·C·希金斯(Clara C. Higgins)基金,以及紐約州立大學水牛城分校藝術與人文學院。另外,美國民俗學會執(zhí)行委員會也為該索引出版過程中的印刷和郵寄費用提供了支持(杰克遜 1988:1)。

這部索引最終文件的大小高達50M,這在當時是非常驚人的數(shù)據(jù),布魯斯·杰克遜承認,這個項目“甚至動用了IBM 3081大型機”(1988:1)。譯碼的數(shù)據(jù)輸入和校對工作由不同的索引編撰者完成,最終這部索引辭典開頭以“該期刊第一個百年中所發(fā)表的9655篇論文、評論、筆記、訃告及公告”(杰克遜、塔夫脫,1988:5)開始;最后以三份目錄結束,依次是作者目錄、主題目錄、標題目錄。當一個民俗學家將這部索引拿到手上時,他不僅拿到了打開這個知識領域大門的鑰匙,同時僅僅通過瀏覽他就能真正地感受到這一領域已發(fā)展到哪里以及如何發(fā)展到此的。所以,這部索引既是一部歷史,也是一幅地圖。

在一段時間內(nèi),這部索引成為查找期刊中各類民俗學學術研究成果的便捷參考工具和方法。但是,索引的最后幾頁預示了其即將到來的消亡:此期刊的最后一期第101期,不僅包含索引,還有整卷內(nèi)容的目錄。目錄第一頁的底部是一份以“《美國民俗學刊》(JAF)開通網(wǎng)絡版”為標題的公告。這個簡單的公告成為出版業(yè)轉變的開始,軟硬件開發(fā)者與使用者之間的動態(tài)關系帶來了計算機的發(fā)展,這就為出版業(yè)運用各種信息技術進行出版業(yè)務提供了可能性。二十五年以后,也就是我正在寫作這篇文章的時候,我們大部分人都已經(jīng)熟悉了使用期刊數(shù)據(jù)庫查詢期刊的方式,并且有可能花費更多的時間在這上面,而非“百年索引”的紙版工具書上。原本用于編寫索引辭典的計算機技術已開始用于開發(fā)替代這部索引的搜索工具。同時我們也承認,盡管期刊數(shù)據(jù)庫界面具有無可比擬的流暢性,但或許正是因為此而使得它不能像使用索引辭典那樣便捷地進行內(nèi)容瀏覽。此外,索引的固定屬性決定了它的使用會受到出版時編輯所選術語的限制。這些術語以及索引本身,在某種程度上與收入索引的論文一樣是歷史的產(chǎn)物。

讓我們暫時停留在索引辭典上,想象一下自己走進了圖書館查閱特定的某一期期刊。這時我們的指尖便會從上到下滑過期刊的書脊一一查找,直到我們找到想要的那一本,然后從書架上拿下來,快速翻到要查閱的那一頁。我們承認,這樣的想象或許是有些過時了。大部分人都已太過習慣于縮小本領域甚至是任何領域的視野,僅僅通過在電腦屏幕上的搜索框里輸入幾個單詞、術語或名稱進行查找,所以我們很少為過去120年間所積累下來的浩繁卷帙所累。然而,當我們已經(jīng)習慣于使用精確度從本學科的歷史記錄中查找材料時,我們就趨向于不再從整體上觀照材料。因此,當我們站在圖書館里時,我們會再一次感到震驚。

當我們要從書庫中查找一本期刊的時候,一定會去回顧更大整體中的許多期刊,這都是與我們當前工作有關的。如果我們走近去細讀特定的文章,那么當我們要退后一步的時候會怎樣?我們可以遠觀么?在人文學科中,我們既要細讀也要遠觀的觀點日益強化。文學家佛朗哥·莫雷蒂(Franco Moretti)指出:“遠觀是獲取知識的一個條件,它使得你能夠注意到比文章本身更大或更小的部分,如方法、主題、修辭,抑或是體裁、系統(tǒng)”(莫雷蒂,2000:57)。這種思考方法當然是民俗學家非常熟悉的。在20世紀,他們在索引編撰工作中所付出的努力,創(chuàng)制了有關故事類型和主題索引方面的精密類型系統(tǒng)。

在某種程度上,類型學知識創(chuàng)造了前一個時代極為重要的索引,我們建議將其推向另一個重要時期,嘗試利用它編撰客觀的本學科思想史。我們建議民俗學家像其他領域的學者一樣通過兩方面的結合來了解自己的學科歷史,一方面是自身的閱讀,另一方面是源自研究型訓練和專業(yè)互動的共識。作為一種有效的口頭交流形式,民俗學科歷史被快捷梳理,高度偶然隨機的過程逐漸被普遍認可為歷史的必然性。

我們搜遍125年間的民俗學學術研究成果的目的,只是為了繪制出其主題的歷史轉換地圖。我們只選用了論文作為研究對象,并深信其最適合呈現(xiàn)我們所認為的將在這項工作中呈現(xiàn)出來的觀念圖形(ideational topography)。為了充分利用各種計算機方法,我們選用了三份期刊用于研究,如下:《美國民俗學刊》(JAF)、《民俗研究》(JFR)(包括其前身《民俗研究所期刊》)、《西部民俗》(WF,包括《加利福尼亞民俗季刊》)。

雖然我們會在本文的下一部分進行詳細討論,但我們?nèi)栽敢忸A先指出被檢測文章的總數(shù)。占大多數(shù)的人文學科論文共有6778篇,這些論文的總字數(shù)維持在用于計算機科學主題建模分析的各種語料庫的大小范圍之內(nèi)。這個數(shù)據(jù)能夠保證你找到方法去獲取一種模型,用于預見不能立刻識別的趨勢。你僅僅翻開一份期刊的第一期第一頁,就會產(chǎn)生某種曲解,隨著閱讀更多其他的期刊,辨識其趨勢就成為可能,甚至會出現(xiàn)令人滿意的結果。

我們承認首先通過統(tǒng)計計算的方式,用扎實的學科史來造福于民俗學研究的并非我們。吉爾·特里·魯?shù)?Jill Terry Rudy)和西蒙·布朗納(Simon Bronner)都在使得我們正在從事的探索工作成為可能上發(fā)揮了重要作用。有趣的是,在我們看來,他們最近的研究都表現(xiàn)出對“轉向表演”的興趣。盡管他們現(xiàn)在思考的原因和方式已經(jīng)發(fā)生了轉變,但是他們都利用了計算機分析本身總結出來的方式,其數(shù)據(jù)則取自更大的數(shù)據(jù)庫:魯?shù)蠌纳鐣W引文索引和人文學科引文索引中引用信息;而布朗納則從期刊數(shù)據(jù)庫中引用信息。魯?shù)鲜昵霸诖似诳l(fā)表過的研究成果就源自于她對《作為表演的口頭藝術》的興趣,她論述了“在成果和接受兩方面,這篇文章如何既符合又偏離了民俗學研究的歷史軌道”(魯?shù)希?002:6)。同我們一樣,她的研究興趣在于個人的和觀念的關系網(wǎng)相互交叉、相互塑造的方式。*的確,大量的研究都在通過使用“范圍(domain)、個人(individual)、領域(field)”的DIFI體系來建立創(chuàng)新文化計算模型,民俗研究緊隨其步伐,長期以來民俗學家一直都聚焦于亨利·格拉斯(Henry Glassie)所說的“由人的社會、思想所構成的文化”。本領域早期的研究概況,參見契克森特米哈依(Csikszentmihalyi)、費爾德曼(Feldman)、加德納(Gardner)合作的文章(1994)。布朗納的研究力圖證明,民俗學轉向表演的過程中伴隨著后結構主義用“詮釋”(interpretation)取代早期強調(diào)的“解釋”(explanation)的轉變,這兩個詞差別很大。為了證實他的研究,除了進行細讀以外,他還強調(diào)了這些文章僅僅是民俗學研究文集更大趨向的指針而已。他在期刊數(shù)據(jù)庫中檢索了這兩個詞的使用,指出:

后結構主義的轉變與用“詮釋”取代早期的“解釋”相互聯(lián)系,而且用數(shù)據(jù)來證實這種觀點是可行的。通過檢索期刊數(shù)據(jù)庫,我發(fā)現(xiàn),在1888年至1946年期間,民俗學期刊中對“詮釋”的使用次數(shù)只有284次;而在時間段1947年至2005年期間,其使用次數(shù)則為1094次,近乎原來的四倍之多。實際上,早期“解釋”一詞的使用次數(shù)為388次,占據(jù)了主要地位;但是后期“詮釋”的使用次數(shù)增加,比“解釋”多出321次。(布朗納,2006:415)

魯?shù)虾筒祭始{均要求其讀者,至少能將民俗學研究史料的一部分,看作是有其自身模式和關系的、可資驗證作的實體(包括一個網(wǎng)絡、一部文集等),它們并不受限于傳統(tǒng)的文本與其作者及歷史的聯(lián)系。

借助魯?shù)虾筒祭始{的啟發(fā),我們癡迷于將美國民俗學研究論文作為研究客體本身。我們想知道,再加上一個二十五年和兩份期刊,這部百年索引會變成什么樣?我們將如何去理解它的擴展形式?我們以索引作品中可能被翻閱次數(shù)最多的主題索引作為起點。畢竟,它既是我們大部分人的研究起點,也是我們真正需要推進的部分。我們意識到,雖然我們都樂于看到自己的名字出現(xiàn)在出版物中,但是真正驅動我們并使我們完成研究的途徑,是吸引其他學者參與到就特定主題進行的討論。

因此,我們決定聚焦于主題,不過以下將要描述的特定主題是許多人所不熟悉的。我們所要探究的主題不是由學科專家決定的,而是從文本中抽取出來的,也就是說文本中的文字決定和影響著主題。我們運用了名為“潛在狄利克雷分布”的分析模型對主題進行分析。我們認為它非常適用于表演研究體系內(nèi)的民俗學研究,其實質是通過語言進行的社會建構。心理學家托馬斯·蘭道爾(Thomas Landauer)將其描述為一種非常近似的語言學方法——潛在語義分析(LSA),具體如下:

其前提很簡單。大量(并非全部)話語的含義取決于構成它的詞匯的含義,大量(并非全部)詞匯的含義又取決于其存在的語境。“潛在語義分析”(LSA)提供了兩種模型:一種是大量(并非全部)相對穩(wěn)定、共享、主要的詞匯含義是如何從語境中衍生出來的,另一種是大量(并非全部)話語含義是如何由其構成詞匯確定的。

主題建模使“以貫穿文章始終的主題為依據(jù)的文獻探究”成為可能(布萊,2012:77)。我們的興趣在于探索民俗學研究的主題是如何在我們能夠搜集到的特定文本中體現(xiàn)的(以可行的形式——稍后詳述)。如果我們僅以文本本身為起點,用一系列用于描述詞匯與文本關系的計算機算法來讀取文本或者有人更愿意將文本輸入這些算法,那么我們會發(fā)現(xiàn)并命名什么樣的常見模型?同樣,這種探究活動能挖掘出尚未發(fā)現(xiàn)的——甚至隱含的——值得深入思考的動態(tài)或趨勢嗎?

本文筆者,一位是民俗學家,一位是文學學者,我們的合作就是在強調(diào)這個項目的探索性。我們都寄希望于計算機方法(或定量法)。此項合作源自于我們共同的興趣,即對信息與工具如何相互作用的探索。我們相信主題建模為我們提供了一種去理解學科話語屬性的方法。但這不是唯一的方法,我們將在下文詳述其他我們感興趣的方法。很顯然,學術論文也不是學科話語的唯一形式,但我們認為,在初次探索中,更應使用現(xiàn)成的學術論文以及順手的、最具保障的工具。

這里要提前強調(diào)一下,我們認為用于學科歷史研究的定量法,例如此法形成的概述,為學者們提供了理解和質疑標準學科敘述的新方法。至于民俗學研究,主題建模揭示出了其穩(wěn)固的模型,即在20世紀90年代與表演相關的名詞越來越重要,這與一般學科歷史是一致的。這種一致性標志著此法能夠揭示不為人知的學科變化或尚未確認的學科轉變的可能性。雖然這些方法依賴于復雜的數(shù)據(jù),但是其常具暗示性的結果卻與定性評估、理論背景進行了極好的對接。

學者常常質疑關于學科變化的傳統(tǒng)理解——與復雜的原始文獻相比較,學科史的結論未免失之于簡單。如果這種介入的力度足夠大,其本身就會導致新的學科轉向。我們認為民俗學中的表演研究轉向適合作為檢驗的對象。我們擬來對學科轉向進行重新評估認定——使用計算機來進行。

主題建模

我們當前項目的作用可以用遠觀來比喻,類似的文庫盡可能地采用了所有有關期刊,但它正面臨著一個確定的難題,即地圖范圍關系。格雷戈里·貝特森(Gregory Bateson)指出,問題不在于地圖描述的精確性,而在于其結構與我們目標的可比性。最好的例子是倫敦地鐵交通圖,這份地圖犧牲了地理的精確性以便標識沿線站點,即哪個站點和哪條路線相連,哪個站點設在哪個收費區(qū)內(nèi),總之盡可能使之容易理解。換句話說,它更加強調(diào)拓撲關系而非精確的地理位置。在倫敦乘坐過地鐵的人都知道,有時候地圖上站點之間的距離比實際距離遠很多,因此去地下乘坐地鐵會比在地面上步行花費更多時間。反之亦然,線路上站點之間整齊的間距,導致不了解情況的使用者認為地面上的距離會比看起來更短。凸面后視鏡也是同樣的道理,壓縮就意味著某種程度的變形:目標必須是一種壓縮,在應用情境中,使用者不難理解其變形。

這對我們來說非常重要,為了達到我們追求的壓縮目標,并用一種可應用于所有被研究文本的方式來實現(xiàn)目標,我們找到了一種實現(xiàn)方法,這種方法聚焦于實際運用的語言,從具體開始,然后逐步趨向抽象觀念。畢竟,我們的目標是判斷已確定的抽象觀念,如“轉向表演”,在其本身的數(shù)據(jù)中是否為可辨識的。機器學習研究者及其它計算機科學研究者已研發(fā)出一種可從大量文本中推斷語義的技術。各種各樣的隱含語義分析方式,以那些著名的方法為例,它們在用各自的方式處理文本時同有三個基本假設:文本具有潛在語義結構(簡稱為“主題”);可以通過關注各種文本中同時出現(xiàn)的詞匯來推斷出其主題;詞匯與主題相關,主題與文本相關。這些方法各自不同的數(shù)學體系使得它們得以相互區(qū)分。

為使方法背景的介紹盡可能簡潔,我們將盡快轉向我們選擇的主題建模方法,這種方法已被證實在人文學科中的使用相當普遍,且因此而獲得了令人矚目的聲望——所以出于求知的驅動,我們會將其試用于本領域一個常見語料庫的分析,由此可以探究這一方法在其他研究領域的潛在效用。我們將通過對過去120年間發(fā)表在三份期刊上的近7000篇文章進行分析來探究民俗學思想史,用于這一探究活動的技術即著名的“潛在狄利克雷分布”(LDA)。“潛在”如上文所言是指該算法的篩選過程。“狄利克雷”(Dirichlet)是一位德國數(shù)學家的名字(來自于比利時家庭)。*布萊(Blei)指出,該算法的早期版本有一個比較乏味的名稱“模型三”。大衛(wèi)·布萊(David Blei)、安德魯·Y· Ng(Andrew Y. Ng)及邁克爾·I·喬丹(Michael I. Jordan)在2002年首先介紹了這種算法。他們的論文《潛在狄利克雷分布》于次年發(fā)表(布萊、恩格、喬丹,2003)。“潛在狄利克雷分布”有關算法因而成為眾多研究的主題。布萊寫了一篇關于此算法的使用說明,他以一種非專業(yè)的方式解釋了這種基本統(tǒng)計方法。在這篇文章里,布萊將“潛在狄利克雷分布”定義為“試圖獲取直觀知識的統(tǒng)計模型,這種模型極易通過其生成過程加以描述,它通過虛構的隨機過程假定了文檔的呈現(xiàn)”(布萊,2011:2-3)。這一模型中的主體是通過分析整個文檔集中的詞匯分布而得出的。最初,它是根據(jù)狄利克雷分布的預先假設隨機進行的。然后,隨著文檔的增多,算法也逐步改善主題分布情況。

要注意,“潛在狄利克雷分布”與上下文無關。它使用的是著名的“詞包”法。也就是每一篇文檔中的詞匯出現(xiàn)頻率會被測量。常見的詞及與即將進行的研究語義關系不明確的詞都會在使用算法之前被過濾掉。這個過程常常需要重復多次,以確定由光學字符識別錯誤生成的詞及原來未被過濾掉的無用詞匯。期刊數(shù)據(jù)庫的研究數(shù)據(jù)列出了每個數(shù)據(jù)庫的“詞-詞頻”列表。“潛在狄利克雷分布”的算法會在加工之前將文檔轉化成“詞-詞頻”矩陣。因為我們進行主題建模的工具——“馬利特”(MALLET)需要自己將文檔轉化為矩陣,所以必須將“詞-詞頻”表轉化成一篇無序文檔。但是這個過程并不會影響模型的運轉。

比起這種算法能否模擬人類的概括能力,更重要的問題是,通過這種統(tǒng)計方法所概括出的主題是否能與讀者通過閱讀概括出的主題近似。例如,普通版本的“潛在狄利克雷分布”不會關注構成主題的名詞隨時間發(fā)生的變化。布萊和J.D.拉弗蒂(J. D. Lafferty)開發(fā)的名為“動態(tài)主題建模”的新算法則力圖描述主題隨著時間的推移產(chǎn)生的變化(布萊、拉弗蒂,2006)。但是普通“潛在狄利克雷分布”算法也可以追蹤時序型語料庫中主題分布的變化。從維基百科到《紐約時報》,這些語料庫都已成功地運用“潛在狄利克雷分布”主題建模進行了分析。布萊的團隊已使用期刊數(shù)據(jù)庫中的期刊《科學》的數(shù)字化語料庫進行了全面的實驗,他們用動態(tài)主題建模的方法顯示了主題隨時間產(chǎn)生的變化,以及《美國政治學評論》網(wǎng)絡瀏覽主題的變化。*《科學》瀏覽地址:http://topics.cs.princeton.edu/science/;《美國政治學評論》瀏覽地址:http://topics.cs.princeton.edu/pilisci-riview/。

如上所述,期刊數(shù)據(jù)庫研究數(shù)據(jù)界面顯然不會返回完整的論文文本,每個文本都會以一系列的雙入口形式返回,包括文本使用的每一個詞及其使用頻次。由于“馬利特”需要接收完整的文本而非“詞-詞頻”(例如:the-345)列表,所以我們要設法使文本脫離兩欄數(shù)據(jù)的形式。*“潛在狄利克雷分布”使用最廣泛的工具就是馬利特(MALLET)( http://mallet.cs.umass.edu/ ),其他工具也是可行的。我們會用一些簡單的編碼來表示第二欄中的詞頻數(shù)據(jù),將原來的“詞-詞頻”列表轉化成符合馬利特方法需要的新文檔。下一步就是利用“馬利特”將數(shù)據(jù)模型化。這個軟件允許使用者指定某些可變因素,例如將要生成的主題數(shù)量。這個參數(shù)對于我們達成目標非常重要,因為“潛在狄利克雷分布”不能協(xié)助選擇要適當?shù)闹黝}范圍。太少了,不同主題會融合在一起;太多了,相關主題就過于分散,所以選擇合理的數(shù)量是一個探索過程。最終,我們將50作為能夠有效闡明語料庫話語范圍的數(shù)量。

為了證明我們的假設,即“潛在狄利克雷分布”可以揭示民俗學轉向表演的隱含話語結構,我們從期刊數(shù)據(jù)庫的研究數(shù)據(jù)中下載了一個語料庫,其中包含發(fā)表于《美國民俗學刊》、《西部民俗》及其前身《加利福尼亞民俗季刊》、《民俗研究》(加上其續(xù)刊《民俗研究所期刊》)的所有文章。早期關于英國期刊《民俗學》的實驗結果顯示,英國民俗學研究指向學科實踐,并未像美國那樣強烈地受到轉向表演研究的影響。另外需要注意,還有許多其他重要的民俗學期刊目前沒有電子版,所以我們的分析結果自然會因受限于目前所擁有的資料而存在偏差。但是我們相信,目前我們所擁有的語料庫足夠大,對于學科轉變的建模工作來說是具有代表性的。

“馬利特”生成了一個列表,包含作為主題的名詞及這些名詞在整個語料庫中所占的相對比例。其中的主題大多與我們所感興趣的表演直接相關,如下:

表演 社會的 口頭的 敘述 文本 觀眾 語境 語言 講演 結構 話語儀式 表演(復數(shù)) 分析 風格 事件 戲劇 意義 事件

由以上內(nèi)容可見“表演”(performance)和“表演”的復數(shù)(performances)作為各自獨立的詞同時出現(xiàn)了。語料庫可以借助現(xiàn)有的軟件工具按屈折變化形式歸類或精簡為詞根形式,*我們使用皮東(Python)自然語言工具包(NLTK)的世界網(wǎng)界面對語料庫進行了分類。NLTK是皮東(Python)庫中的一個強大的工具包,可以對文本和語料庫進行基本和高級語言計算。但將此模型用于按屈折變化形式歸類的語料庫中仍然會生成類似的主題:

文化的 表演 話語 實踐 文本 研究 模式 社會的 作品 語境 文化 風格 權力 認同視角 身體 發(fā)布 經(jīng)驗 空間

重要的是“表演”(performance)也在其他主題中出現(xiàn)。例如,它赫然出現(xiàn)在節(jié)日主題中:

舞蹈 節(jié)日 馬迪格拉嘉年華 舞者 節(jié)日 戲劇 日 跳舞 慶祝 服裝 年 狂歡節(jié) 群體表演 習俗 隊伍 事件 圣誕節(jié) 地方的

一個主題如此緊密關聯(lián),以至于我們懷疑,構成主題的參數(shù)未來的調(diào)整可能無法將這些主題歸為一類:

社會的 集體 社區(qū) 表演 成員 事件 個人 儀式 行為 人們 角色 環(huán)境 關系 社會 傳統(tǒng)的 結構 功能 觀眾 時代

那么我們就會將這些主題作為更大主題集合的一部分去談論它們相互間的關系,更大的主題集合將在本文的下一部分被稱為“表演”集群。

我們正在探索以主題建模為工具繪制一個領域的思想史地圖,以上給出的詞匯直接取自于“馬利特”軟件的輸出內(nèi)容,它是按順序列出詞匯的:靠左邊的詞匯與整個詞群所反映的主題聯(lián)系更密切。“潛在狄利克雷分布”是用以補充文檔檢索技術的。如果太過依賴于使解釋符合給定主題的詞目,那我們發(fā)現(xiàn)的模型中就可能存在隨機的松散的聯(lián)系以致以偏概全。*本·施密特(Ben Schmidt)證明將此用于捕鯨航行的數(shù)據(jù)也非常有趣,他指出“潛在狄利克雷分布”不是一個僅限于文本的模型。(施密特 2012)

認識到“潛在狄利克雷分布”的局限使我們能夠利用它去探究民俗學學科語料庫,而不會將其模型作為預測該學科發(fā)展趨勢的獨立證據(jù)。除了關于分類變量如何被大量描述的基本觀念外,此模型沒有任何民俗或語言知識,但其生成的主題和文檔集群使我們得以檢驗我們關于本學科如何隨時間產(chǎn)生變化的觀點。民俗學表述行為的變化只是人文學科更大變化的一部分,人文學科正由分類和描述轉向日益復雜的解釋。我們運用機器學習分類工具來檢驗民俗學理解自身表述轉變的方式。主題建模遠非客觀陳述,但其結果不存在自反性退化,自反性退化常用來描述學科歷史的解釋性說明出現(xiàn)疑點的情況。

換句話說,我們是在以主題建模的方式對不完全但是具有代表性的民俗學研究作品進行生成性研究。傳統(tǒng)研究可以揭示出關鍵詞的相對頻次,這種生成性研究則可繪制出將關鍵詞聯(lián)系在一起的話語結構。將此結構地圖與現(xiàn)有的學科知識相結合使我們能夠對現(xiàn)有的關于學科變化的假設進行檢驗。

民俗學研究中計算機方法的應用

圖1:所有主題,1888-2012

總覽基于超過一百年的民俗研究繪制的50幅歷史圖表,我們想要從其中獲得什么呢?我們期待能夠得到幾個通用模型:受關注度下降的主題模型,受關注度上升的主題模型,及一些不變因素的模型。我們也非常期待能夠發(fā)現(xiàn)任何特別的上升、下降或其他形式的歷史動態(tài),這同樣不會令我們失望。這里最容易看到的是,50個主題的五年均值返回了一些有意思的結果。圖1為分類語料庫中50個主題的五年均值。當我們預計主題建模將揭示出當時符合民俗學表述行為轉變的上升趨勢時,圖2中“文化的 表演 話語”主題從1888-2012年的五年均值顯示其在20世紀70年代出現(xiàn)了明顯的上升趨勢。

圖2:“文化的 表演 話語”主題,時間約為1888-2012

如果我們轉向有關的真實文本,列出“馬利特”軟件已排好序的占本主題最大比例的20篇文章,我們就會看到表1的結果。從某種程度上說,在我們探究工作的這一點上,我們至少已經(jīng)確認主題模型與學科本身的主題中心意義是一致的。另外,此表還顯示出元批評研究在所有名詞中得到了最高關注,從學者對表演理論及其在特定場合的實際應用的深入研究即可見。實際上,其中四篇文章都來自于同一份期刊《西部民俗》。*值得注意的是,本文前面引用的吉爾·特里·魯?shù)系难芯恐辉谠撝黝}前列文檔中下降了四位,證實了元話語研究包含更高的主題關鍵詞密度。

表1:“文化的 表演 話語”主題的前二十篇論文,按主題在論文中的顯著程度排序

這種民俗學的量化研究,使我們有可能探究與轉向表演類似的主題趨向。為了簡潔和使我們的觀察盡量客觀,我們篩選出了8個主題,它們均在“最后四分之一時期較活躍”(其他趨勢將在下文中加以探討)。表2完整地列出了這8個主題,并且按照反映每個主題的文檔的數(shù)量進行了排序。

表2:以下八個主題呈現(xiàn)出與主題“文化的 表演 話語”相同的動態(tài)趨勢

我們標注為“表演”的主題在表中位列第三。位于它之上的是主題4(作品 研究 民俗),在這個主題中,學科工作者“民俗學家”和學科話語進行的手段,例如出版和項目,同等重要。位于列表頂端的主題21(做 制作 世界)使我們產(chǎn)生了一時的困惑,但之后我們遠觀了研究的起點,然后再拉近距去理解現(xiàn)象的本質,我們查看了與該主題有關的文本,發(fā)現(xiàn)讀者在這里更加熟悉的概念是“民俗心理學方法”。一部分作者在此表中規(guī)律性出現(xiàn)的現(xiàn)象可作為我們這一結論的例證:大衛(wèi)·赫弗德(David Hufford),阿蘭·鄧迪斯(Alan Dundes),艾利奧特·奧里恩(Elliott Oring),布魯斯·杰克遜,羅杰·亞伯拉罕斯(Roger Abrahams),羅伯特·喬治斯(Robert Georges)以及 沃爾夫岡·米德(Wolfgang Mieder)。

面對這樣的圖表,我們認為必須對關注心理學方法的高峰和下降進行探索,結果發(fā)現(xiàn)我們最初關注的主題“表演”顯示出一個相似的,即使不是下降,也至少是平穩(wěn)的趨勢。總覽我們定義為“最后四分之一時期較活躍”的8個主題,我們幾乎都看到了相似的下降和平穩(wěn)趨勢,除了主題9(文化的 政治的 民族的)。但另一方面,此趨勢表明心理學和表演可能或者是發(fā)現(xiàn)了某些政治決議,或者僅僅是取代之前的關注轉而關注政治。這里,安德魯·戈德斯通(Andrew Goldstone)和泰德·安德伍德(Ted Underwood)描述了某些解釋的危險因素及其機會因素:

隨著主題數(shù)量(及其他參數(shù))的變化,模型會呈現(xiàn)出同一個基礎集合的不同情況。但這并不意味著主題建模是一種含混不定的方法或不可靠的證據(jù)。所有的情況都是有根據(jù)的。可以這么說,這些不同的情況是從不同距離觀察的結果,有著不同的粒度水平;但他們是同一證據(jù)的所有情況,并且是明顯相容的。不同模型為不同的證據(jù)詮釋提供支撐,但這些詮釋并非是絕對沖突的。

其他主題集中在五大趨勢上,我們將根據(jù)簡單客觀的圖表將這五大趨勢描述為:前半期活躍、早期高峰、中期高峰、恒定、動態(tài)。構成每種趨勢的主題列表及每種主題所涉及到的文本數(shù)量都在表3中。

表3

2568食物藥物病人恒定2462笑話幽默性的恒定0557諺語德國人諺語的恒定0151婦女兒童女性的恒定4049人們非洲人夏威夷人恒定4849華人日本人韓國人恒定1246猶太族的猶太人土耳其的恒定1446教堂宗教的上帝恒定3642黑色非洲人黑人區(qū)的白人恒定0739xcxb印度恒定1726愛爾蘭人吉普賽人匈牙利人恒定3923意大利人瑞典人挪威人恒定0617國王kiii恒定

表3顯示有7種主題在前半期異常活躍。因為在這段時間《西部民俗》和《民俗研究》均未出版,所以這一時段及下一時段的趨勢都是《美國民俗學刊》自身歷史的產(chǎn)物。即使僅對這些主題內(nèi)容進行簡單的瀏覽也能看出,正如威廉·威爾斯·紐厄爾(William Wells Newell)曾在他的開篇中概括的,它們反映著《美國民俗學刊》的諸多項目,這些項目后來被不同的學會成員發(fā)展起來。在以上按順序排列的表格中有來自世界各地的民間傳說(44),美洲土著的故事和儀式、(34、20、22、37、29),美國民歌(02)及美國黑人傳說(22)。

接下來的四個趨勢是由更少的主題代表的。我們將這種早期得到較高關注但又迅速下滑的趨勢稱為“早期高峰”,這些主題是探討拉丁美洲民間傳說的,包括新墨西哥州傳說(47、13);操法語者的傳說,大多數(shù)是關于在路易斯安那州從事深夜工作的加拿大人的;以及非常有趣的跨越新舊世界的混合傳說集及其研究。有趣的是,這幾個高峰都在同一時期,它們的出現(xiàn)和下滑都是在20世紀兩次世界大戰(zhàn)的間期,大約是1917年到1942年。

在這些主題之后,高峰出現(xiàn)在中期的有兩種主題“年度 西部 政府”(00)和“加利福尼亞 地方 山脈”(30),產(chǎn)生這種情況的部分原因是本領域的一份重要期刊《西部民俗》的出現(xiàn)。

最后,在研究的時期內(nèi)表現(xiàn)為顯著的動態(tài)趨勢的有三種主題,它們的表現(xiàn)難以簡單概括。這三種主題分別為:“好的 人們 制作”,表現(xiàn)為這一主題的文章數(shù)量高達425篇,在整個語料庫中居首;“時代 講述 故事”,表現(xiàn)為這一主題的文章有317篇;“形式 數(shù)量 部分”,表現(xiàn)為這一主題的文章有299篇。與該主題有關的詞匯集群的完整列表(表4)也未能揭示出其本質。相反,這些主題與我們的觀點驚人的相似。只要看一下與每個主題相關的文本就會發(fā)現(xiàn),“好的 人們 制作”主題表述了民間信仰;“時代 講述 故事”是笑話、傳說、口傳故事以及來自同一歷史背景的行業(yè)傳說的混合體;“形式 數(shù)量 部分”則包含了地方傳說集,其中包括地名、傳播研究、物質文化形式的調(diào)查及對神話的論述。

表4:離群主題(Outlier Topics)的歷史趨勢,1888-2012

然而,問題仍然存在,是否有對這種動態(tài)趨勢的特殊本質進行解釋的方法。拿民間信仰來說,它在社團歷史的早期似乎就已經(jīng)達到了頂峰,接著在一戰(zhàn)期間急轉直下。在20世紀20年代,民間信仰的受關注度一直較低,30年代有所上升,在二戰(zhàn)早期再次下降。50、60年代再次急劇上升,伴隨著民間信仰廣受關注,在轉向表演方面的趨勢似乎并不顯著。

包含了“地方傳說”之義的主題各項之間的聯(lián)系與上文所述的“民間信仰”模式有些類似。對這一主題的關注度也是在社團歷史的早期達到頂峰,在20年代呈下降趨勢,在30年代保持較低水平,直到二戰(zhàn)以后才得到了顯著重視。這種趨勢需要進一步的探究,我們注意到對地方傳說的關注度一直保持在較高水平上,在表演研究出現(xiàn)的期間,它也并不像其他主題那樣出現(xiàn)下降。反而在比例上一直是緩慢上升的,在接近90年代的時候達到頂峰。上文已經(jīng)提到過,在這一期間,表演研究已經(jīng)越發(fā)趨向自反性。

在此示意圖的其他部分中,我們會發(fā)現(xiàn)“舞蹈 節(jié)日”主題的下降并不是那么急劇,出現(xiàn)相對晚一點。因為它與表演論述的聯(lián)系并不是那么緊密,所以這個結果正是我們所期待的。以“文化 表演”為主題的代表性文章包括《融合與市場:民俗學新型范例》和《誰的尸體?尸體傳說簡介》(卡普昌,1993;揚,1994)。明顯以“社會的 集體 團體”為主題的文章包括《巴馬那民間戲的時代意識與成長》和《布朗的招待酒吧:作為藝術表演的職業(yè)角色》(布林克,1982;貝爾,1976)。

在該圖中我們也注意到有兩種主題是西班牙語的產(chǎn)物,它們在這些年的出版物中異常突出。但我們沒有足夠多相關的外語出版材料來顯示這種在內(nèi)在于英語語料庫的外語名詞集群的獨立性。

重要的是我們也要注意到對語料庫進行歸類產(chǎn)生的有趣差異為我們的深入研究提供了保證。例如,未按屈折變化形式歸類和按屈折變化形式歸類語料庫的兩個最具代表性的主題分別是“重大的 男人(復數(shù)形式) 制作(過去式) 時代 長的 白天 小的 結束 離開 大的 年輕的 好的 頭 順序 場所 舉行 背景 手 制作”和“形式 數(shù)目 部分 建立 時代 普通的 實例 制作(過去式) 現(xiàn)在 事實 相似的 類型 一般的 群體 材料 區(qū)域 觀點 建立 研究。此處按屈折變化形式分類的語料庫更加具體明確,其中含有更多能夠顯示民俗研究進程的單詞。像“制作(過去式)”和“結束”這樣的單詞應該包含在阻止詞表中。這種單詞的出現(xiàn)是人文學科逐步細化導致的。另一個能夠顯著影響結果的因素是,一個單詞在進入主題模型的概率矩陣之前出現(xiàn)在語料庫中的頻次。

不嚴格的非按屈折變化形式分類的模型的一個有趣細節(jié)是這個主題:“民俗 研究 民俗學家 材料 學者 材料 搜集 文學 道森(dorson)”。這樣一個和民俗實踐緊密聯(lián)系的主題包含最杰出的民俗學者之一并不奇怪。但通常即使是討論最多的學者名字也很少出現(xiàn)在期刊文章的主題中,只有一個作為民俗學者的作者姓氏出現(xiàn)在這些主題中,毋庸置疑就是鄧迪斯。*“麥克弗森(Macpherson)”和 “葉芝(Yeats)”因對凱爾特民俗研究所做出的貢獻出現(xiàn)在了一個主題中:“愛爾蘭人、愛爾蘭、蓋爾人、凱爾特人、麥克弗森、奧西恩、蘇格蘭人、圖特(tut) 、約翰、肖恩、芬蘭、巴(ba) 、威爾士人、 ii、芒(mun) 、葉芝、蘇格蘭等”,但是我們認為這些在多數(shù)情況下是屬于研究主題而非學者 。名字分散出現(xiàn)在主題中,但是“理查德(Rechard)”這個名字就很難判斷是否是指一個特定的學者,因為姓氏在引用中出現(xiàn)的頻率太低,所以難以確定名字所指的學者。按屈折變化形式分類的語料庫則不包含任何學者名字。

另一個對讀者來說比較有趣的此期刊的主題建模過程產(chǎn)物是,出版地與和與新聞報道及其他資源相關的項目聚集在一起:“年、西部的、州、新聞、約克郡、天使城、圣、加利福尼亞、項目、報紙、四月、報道、三月、日報、通訊、七月、戰(zhàn)爭”。期刊《西部民俗》的名字出現(xiàn)在這個主題中;我們已將“美國的”和“民俗”從語料庫中移除了,以避免此類主題比例失衡。但是“西部的”這個單詞在其他語境中的潛在意義足以保證將其納入其中。

一篇文章和一個能夠代表學科轉變的主題的相關程度,并不能表明該文章的重要性和影響力。實際上那些預示著方法論轉變的文章反而有可能包含著“更少”的后來與之相關的關鍵詞集群。找出這種轉變的來源并不是本文的目標,因為現(xiàn)存的學術研究在這方面已經(jīng)做得很好,并且將會不斷地對此重估以確定民俗學是否遵循了其他學科的發(fā)展模式。*例如,芭芭拉·科什巴萊特-吉布列特(Barbara Kirshenblatt-Gimblett)的《民俗危機》(1998)。而我們關注的是發(fā)現(xiàn)即將發(fā)生的轉變的跡象,以及計算機方法是否能夠像學科敘述那樣為這些片斷的轉變歸納出同樣的年表。

繪制更好的民俗研究地圖

豪爾赫·路易斯·博爾赫斯曾描述過一個聲名狼藉的帝國如此追求描事狀物的完美:“制圖師工會打造出一幅與該帝國疆域面積同等大小的地圖,而且是極其精確的相一致”。在博爾赫斯的敘述中,這個帝國的百姓最終丟棄了這幅地圖,那些剩余的碎片成為了動物和乞丐的遮蔽物。如格雷戈里·貝特森所解釋,博爾赫斯的虛構世界的諷刺意味是“領土乃自在之物,人不能用它做任何事”(1972:454)。地圖即我們所構想和具體化的更大的實體的代表和壓縮,我們希望利用它來互動和導航。地圖要求我們置身于想象之中,投身于這種實體替代物中并相信那些道路會引導我們到達我們想去的地方。

這個地圖的比喻非常有用,是因為在這個例子中制圖所用的數(shù)學計算相當復雜。這里的地圖就是一個主題模型,其背后的地圖制作就對通過“馬利特”發(fā)現(xiàn)的潛在狄利克雷分布的執(zhí)行。這項特別技術的執(zhí)行是一個概率過程,最終導致了連貫的詞匯集群規(guī)律性地相伴出現(xiàn),這些集群即我們所說的主題。因為這個有目的的過程一開始在某種程度上是隨機的,隨著這種算法不斷重復作用于這些文本,這個過程才漸入佳境。盡管使用的是相同的材料,這個過程仍會自然產(chǎn)生互有微小差異的主題。在調(diào)查研究的后期,我們可能能夠非常順利地瀏覽不同時代的幾十個甚至是幾百個集合,希望在主題的穩(wěn)定構成成分上獲得統(tǒng)計回歸。

根據(jù)前一部分所描述的結果,我們有理由相信我們已經(jīng)能夠得出民俗研究在第一個百年中的草圖——這個草圖具有發(fā)展成為更穩(wěn)健的地圖的巨大潛力。未來的探索者可能會引領我們修改主題數(shù)量,以嘗試確定是否存在一個針對這種特別語料庫的理想數(shù)量,但是面對不斷擴大和變化的大量作品,任何這樣的理想都只是暫時的。我們相信重要的是現(xiàn)在的模型能通過收集一些特別的文本,發(fā)現(xiàn)學科在一般意義上的發(fā)展和分布特征。另一個模型可能會很好地從一個主題向另一個主題轉換一兩個詞匯,但要考慮到,在我們的心中,地圖是否呈現(xiàn)了特定的地貌特征,如丘陵或者山地。貝特森說:“每一個有效差異都在指示一個、一列以及所有類別的等級劃分。換句話說,這些差異為其自身的分類提供了依據(jù)。”(貝特森 1972:457)從旅行者的觀點來看,重要的是風景的變化。分明的界線是政治的產(chǎn)物,而不是事實本身。我們相信民俗學者及所有學科的學者都能夠接受這種特別的方法論所帶來的少許潛在變化。

最初的工作限制在歷史趨勢的研究上,實際有更多的工作要做。八個各自獨立的潛在主題在轉向表演的過程中相互纏繞在一起,這種情況給我們提出的挑戰(zhàn)是嘗試去理解這些思想是如何相互聯(lián)系的。有了這些主題,我們也可以生成可能出現(xiàn)在這些文本中的引文的網(wǎng)絡圖表。這個方法能讓讀者不僅看到思想觀念、意識形態(tài)或民俗研究意識形態(tài)的網(wǎng)絡圖,也能看到作者網(wǎng)絡圖。作為一個整體,隱藏在學科和領域背后的文化和社會為我們提供了一個良好的機會去系統(tǒng)地理解我們自身及我們的工作。作為一個小型社會,我們的社會只是眾多社會中的一個系統(tǒng),然而這種限制同樣為我們提供了機會。

在要做的工作中,我們僅是剛剛開始分類,據(jù)戈德斯通和安德伍德的觀察,這些主題中的一部分更像學科分類,一部分則僅僅是與特定的理論方法相聯(lián)系的詞匯集群。我們在民俗研究思想史的探究上反復運用“集群”,以此來思考我們力圖探究的地圖類別以及任何可能已經(jīng)出現(xiàn)但尚不清晰的潛在分類方法。主題本身就是共同出現(xiàn)在文本中的詞匯集群。這些主題以歷史圖表或是網(wǎng)絡可視化的形式繪制出來,構成了集群(此術語在網(wǎng)絡研究中稱為“成分”)的一部分,集群可以幫助我們理解較大領域中的分支領域。我們堅信,這種方法不僅能夠為我們提供民俗研究中的隱含觀點,還能幫助我們理解相近領域中的分支領域如何相互聯(lián)系和相互交叉的,甚至可能幫助我們溝通其他相關觀念。*也有一些工作現(xiàn)在還難以實現(xiàn),因為有大量的人類學期刊被防火墻攔截了,無法用我們的建模方法所要求的方式訪問。可以肯定的是,隨著越來越多的有關期刊可以通過像期刊數(shù)據(jù)庫的研究項目數(shù)據(jù)這樣的界面訪問,我們將能夠進一步理解民俗研究。

在擴展工作中,我們期望能發(fā)現(xiàn)更多的有關該歷史趨勢的細節(jié),并且能夠更好地評價作者、觀念、文本、和調(diào)查領域之間相互交叉和互動的方式。探究文本之間的關系,特別是在那些合著現(xiàn)象很常見的領域內(nèi),一種常見的方法既是繪制包含作者和文本的雙體系圖表(bimodal graph,見圖3)。以這樣的圖表作為起點,可設計兩種網(wǎng)絡圖:合著文章的作者的網(wǎng)絡圖和有相同作者的文本的網(wǎng)絡圖。同類的雙體系網(wǎng)絡圖也適用于引文,類似的項目很常見。*這個項目早期的工作集中在生成引文網(wǎng)絡上,利用當時短期內(nèi)通過期刊數(shù)據(jù)庫(JSTOR)可接觸到的引文數(shù)據(jù)。在初步的評估工作中,數(shù)據(jù)極為復雜,并要求進行大量有效的結構化處理。戈德斯通和安德伍德在其他領域中嘗試了這種圖表,他們利用《美國現(xiàn)代語言學協(xié)會會刊》(PMLA)創(chuàng)建了一個雙體系圖表,該圖表內(nèi)容為“趨向于出現(xiàn)在同類文章中的主題是相互聯(lián)系的”(戈德斯通和安德伍德 2012)

圖3:包括作者、文本的雙體系例圖,以合作者的數(shù)量作為權重劃分作者和文本的網(wǎng)絡投射圖。

圖4:作者,文本,主題。

即使僅從這幾個不多的例子來看,也很容易發(fā)現(xiàn)從一個雙體系圖表跨越到另一個具有多種可能性,例如我們可利用雙體系圖表探究作者和特定主題之間的關系(見圖4)。不難想象,可以將這種圖表應用于不同的相關期刊或者反復地比較引文網(wǎng)絡和主題網(wǎng)絡等研究中。

所有這些關系及其網(wǎng)絡圖表使得探究各組關系之間可能存在的共同點、不同點及變化成為可能。我們相信這些共同點可能能夠證實都我們對民俗研究這個領域的一般理解,而這些變化則可能提出一些有趣的問題,這些問題將需要我們對該學科共同體和思想史進一步細究。例如,這些變化僅僅會揭露隱含的學科關注焦點嗎?它們會引起學科邊緣向學科中心轉化的革新嗎?這種學科中心和學科邊緣的互換多久以后會發(fā)生?

很明顯,這種新的繪制思想地圖和學科歷史的方法為構成成分間的相互關聯(lián)提供了很大的可能性。這些關系為理解個人或集體所做的但尚未顯露出來的工作提供了新的理解方法。如上所述,根據(jù)戈德斯通和安德伍德的觀點,主題建模在揭示如何寫作上與揭示寫作內(nèi)容上同樣好用,這可能為那些想通過文體來探究學術話語模式的人提供了一條途徑。當像主題建模這種方法開始得到大規(guī)模應用時,它就為我們提供了近距離審視事物的新方法。主題建模并非抹殺學術個性,它作為一種遠觀也使得細讀成為可能,細讀使我們更能夠從個人角度審視文章及其作者。傳統(tǒng)中的個人角色對民俗研究來說一直都是關注重點。最后,思想史編纂的方法很多,它使我們能夠從鏡子中反觀自己,就像我們通過實踐的窗口去觀察世界一樣。

1.格雷戈里·貝特森.1972.意志生態(tài)學入門.紐約:百齡壇圖書。

2.邁克爾·J·貝爾.1976. 布朗的招待酒吧:作為藝術表演的職業(yè)角色.西部民俗35(2):93-107。

3.大衛(wèi)·M·布萊.2011.概率主題模型導論.美國計算機協(xié)會通訊:1-16.

http://www.cs.princeton.edu/~blei/papers/Blei2011.pdf.

——.2012.可能性主題建模. ACM 通訊55(4):77-84。

4.大衛(wèi)·M·布萊,約翰·D·拉弗蒂.2006.動態(tài)主題模型.第23屆機器學習國際研討會會議記錄138:113-20.賓夕法尼亞州匹茲堡市,7月25至29日。

5.大衛(wèi)·M·布萊,安德魯·Y·Ng,邁克爾·I·喬丹.2003.潛在狄利克雷分布.機器學習研究期刊3:993-1022。

6.豪爾赫·路易斯·博爾赫斯,1972. 丑惡世界史.諾曼·托馬斯·德·喬瓦尼譯.紐約:企鵝圖書有限公司。

7.詹姆斯·T·布林克.1982. 巴馬那民間戲的時代意識與成長.美國民俗期刊95(378):415-34。

8.西蒙·J.布朗納.2006.民間邏輯:民俗學解讀.西部民俗65(4):401-34。

9.米哈伊·契克森特米哈依,大衛(wèi)·亨利·費爾德曼,霍華德·加德納.1994.改變世界:創(chuàng)意研究體系. 康涅狄格州威斯伍德市:普雷格出版社。

10.戈德斯通,安德魯,泰德·安德伍德.2012.美國現(xiàn)代語言學協(xié)會會刊(PMLA)提出的主題模型為文學研究提供了何種借鑒?12月14日http://tedunderwood.com/2012/12/14/what-can-topic-models-of-pala-teach-us-about-the-history-of-literary-scholarship/

11.布魯斯·杰克遜.1988.序言.美國民俗學刊101(402):1-3。

12.布魯斯·杰克遜,邁克爾·塔夫脫.1998.百年民俗學.美國民俗學刊101(402):5-19。

13.黛博拉·A·卡普蘭.1993.融合與市場:民俗學新興范例.西部民俗52(2-4):303-26。

14.芭芭拉·科什巴萊特-吉布列特.1998.民俗危機.美國民俗學刊111(441):281-327。

15.托馬斯·蘭道爾.1999.潛在語義分析.話語過程27(3):303-10。

16.約翰·朗頓,凱爾·費爾克.2011.從學科引文網(wǎng)絡看范式轉換.美國民俗協(xié)會年會報告論文,印第安納州布盧明頓市,10月12日至15日。

17.佛朗哥·莫雷蒂.2000.世界文學猜想.新左派評論1:54-68。

18.吉爾·特里·魯?shù)?2002.評《作為表演的口頭藝術》:通過修辭分析進行的跨學科引文研究.美國民俗學刊115(455):5-27。

19.本·施密特.2012.有了“馬利特”,每個問題都仿佛是一枚釘子,11月2日http://sappingattention.blogspot,come/2012/11/when-you-have-mallet-everything-looks.html

20.凱瑟琳·揚.1994.誰的尸體?尸體傳說簡介.美國民俗學刊107(423):3-8。

[責任編輯]王霄冰

約翰·洛頓(John Laudun),路易斯安納大學英語系副教授;喬納森·古德溫(Jonathan Goodwin),路易斯安納大學拉斐特分校英語系助理教授。此譯文的翻譯和發(fā)表得到作者授權,特此致謝。

[譯者簡介]喬英斐(1987-),女,山東萊陽人,中山大學中國語言文學系博士研究生;李揚(1962-),男,四川自貢人,中國海洋大學文學與新聞傳播學院教授。(廣東 廣州,510275)

K890

A

1674-0890(2016)05-069-14

猜你喜歡
文本研究
FMS與YBT相關性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
在808DA上文本顯示的改善
EMA伺服控制系統(tǒng)研究
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
新版C-NCAP側面碰撞假人損傷研究
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 欧美成人免费午夜全| 777国产精品永久免费观看| 伊人天堂网| 特级欧美视频aaaaaa| 五月婷婷亚洲综合| 1级黄色毛片| 无码有码中文字幕| 日韩区欧美国产区在线观看| 伊人网址在线| 免费大黄网站在线观看| 四虎永久免费地址在线网站| 欧美成人A视频| 成年午夜精品久久精品| 国产精品30p| 成人福利视频网| 华人在线亚洲欧美精品| 全部免费毛片免费播放 | 狠狠五月天中文字幕| 伊人色天堂| 欧美区一区二区三| 精品伊人久久久香线蕉 | 亚洲第一黄片大全| 亚洲中文字幕日产无码2021| 亚洲一区色| 国产精品女主播| 老汉色老汉首页a亚洲| 免费av一区二区三区在线| 天天躁夜夜躁狠狠躁图片| 在线欧美日韩| 国产毛片久久国产| 亚洲无码高清一区| 精品无码国产一区二区三区AV| 久久久噜噜噜| 一级福利视频| 91探花国产综合在线精品| 在线观看国产网址你懂的| 免费A级毛片无码免费视频| 9啪在线视频| 欧美一道本| 亚洲永久视频| 九九精品在线观看| 亚洲AⅤ波多系列中文字幕| 亚洲色欲色欲www网| 国产国语一级毛片在线视频| 伦精品一区二区三区视频| 亚洲天堂网2014| 国产精品综合久久久 | 亚洲 日韩 激情 无码 中出| 欧美 亚洲 日韩 国产| 经典三级久久| 中文成人在线视频| 亚洲丝袜中文字幕| 国产精品亚洲а∨天堂免下载| 无码中文字幕乱码免费2| 中国国产一级毛片| 婷婷丁香在线观看| 手机永久AV在线播放| 久久国产香蕉| 欧美激情综合| 国产精女同一区二区三区久| 亚洲一区波多野结衣二区三区| 97视频在线观看免费视频| 亚洲第一成人在线| 欧美亚洲另类在线观看| 免费看av在线网站网址| 欧美国产综合视频| 色综合五月婷婷| 在线播放国产一区| 欧美精品一区二区三区中文字幕| 国产毛片久久国产| 久久精品国产999大香线焦| 亚洲狼网站狼狼鲁亚洲下载| 欧美一级在线播放| 免费一级α片在线观看| 国产杨幂丝袜av在线播放| 免费国产高清视频| 毛片最新网址| 久久久久国产精品嫩草影院| 国产一区二区三区在线观看免费| 不卡国产视频第一页| 亚洲91精品视频| 五月天综合网亚洲综合天堂网|