999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)字人文的工具屬性研究

2019-01-21 04:32:39
圖書館研究 2019年5期
關(guān)鍵詞:可視化文本研究

(廣州大學(xué)圖書館,廣東 廣州,510006)

1 數(shù)字人文的定義和研究誤區(qū)

在媒體環(huán)境下,數(shù)字人文研究方興未艾。從2001年英國布萊克威爾出版公司(Blackwell Publishing) 將出版的新書《數(shù)字計算指南》(A Companion to Humanities Computing)擬更名為《數(shù)字人文指南》(A Companion to Digital Humanities),正式提出了“數(shù)字人文”(Digital Humanities)的表述[1-2],距今不足20年。這期間,數(shù)字人文研究正成為新的人文社科和數(shù)字技術(shù)相結(jié)合的研究熱點。截至2019年1月底,國際數(shù)字人文中心網(wǎng)絡(luò)(Center Net)統(tǒng)計的全球數(shù)字人文中心達(dá)到了201個[3]。在國內(nèi),數(shù)字人文研究盡管起步稍晚,但發(fā)展卻十分迅猛。在研究機(jī)構(gòu)方面,2011年,中國大陸首個數(shù)字人文研究中心——武漢數(shù)字人文研究中心在武漢大學(xué)成立,隨后,南京大學(xué)等高校相繼成立了數(shù)字人文研究中心或類似的研究機(jī)構(gòu),至2018年6月,北京大學(xué)已連續(xù)舉辦了3屆數(shù)字人文論壇;在研究成果方面,筆者在中國知網(wǎng)以“數(shù)字人文”為主題進(jìn)行檢索,從2005年廖祥忠在《現(xiàn)代傳播》刊物上發(fā)表《“超越邏輯”:數(shù)字人文的時代特征》開始,至2018年底,主題為數(shù)字人文的研究論文達(dá)到389篇,其中2018年就發(fā)表了174篇。

這些研究成果對數(shù)字人文的研究包羅萬象,然而,對于什么是數(shù)字人文,它的定義、概念仍然沒有一個準(zhǔn)確的定論,不同的研究者從自己的研究角度給出了不同的定義。例如,布雷特·鮑利(Brett Bobley)認(rèn)為,數(shù)字人文是一個圍繞著技術(shù)與人文學(xué)術(shù)諸多不同活動的傘狀概念,包含的主題涉及資料的開放獲取、知識產(chǎn)權(quán)、工具研發(fā)、數(shù)字圖書館、數(shù)據(jù)挖掘、原生數(shù)字資源保存、多媒體出版、可視化、GIS、數(shù)字重建媒介學(xué)習(xí)等諸多方面[4]。美國伊利諾伊香檳分校圖書情報學(xué)院院長安斯沃斯教授則指出,數(shù)字人文是“一種代表性的實踐,一種建模的方式,或者說就是一種擬態(tài)、一種推理、一個本體論約定。這種代表性的實踐可一分為二,一端是高效的計算,另一端是人文溝通”[5]。而武漢大學(xué)數(shù)字人文研究中心主任王曉光認(rèn)為數(shù)字人文“更重要的是在傳統(tǒng)的人文研究范式之外,提供更多更新穎的問題、方法、工具和平臺,推動人文研究范式變革與創(chuàng)新。此外,數(shù)字人文還是對數(shù)字革命這一單向的、不可逆轉(zhuǎn)的社會趨勢的回應(yīng)”[6]。因此,作為不斷發(fā)展的數(shù)字時代的新興產(chǎn)物,要對數(shù)字人文進(jìn)行一個標(biāo)準(zhǔn)的定義是不科學(xué)的,也是不嚴(yán)謹(jǐn)?shù)模且粋€不斷發(fā)展的概念,其內(nèi)涵與內(nèi)容都在不斷地發(fā)展之中。

數(shù)字人文研究為人文學(xué)科的發(fā)展帶來了新的契機(jī),推動著人文學(xué)科的發(fā)展。但在研究中,也出現(xiàn)一些偏頗之處,或者說研究的誤區(qū)。一是過度推崇數(shù)字化造成了對人文學(xué)科屬性的削減。我們知道,數(shù)字人文的出現(xiàn)和發(fā)展,一定程度上發(fā)展和革新了人文學(xué)科的核心價值,也因此使得部分人文學(xué)者開始對數(shù)據(jù)中心論、重圖輕文、重制作輕思想、重編碼輕創(chuàng)作推崇備至。但是依賴和過分強(qiáng)調(diào)數(shù)字化,只有一種結(jié)果,就是將人文學(xué)科推往偏技術(shù)、保守的、純實驗室的實踐研究模式,人文學(xué)者的思辨和批判性思維遭到摒棄,這就使得數(shù)字人文并未成為人文學(xué)科與理工學(xué)科之間的溝通橋梁,反而實質(zhì)疏遠(yuǎn)了兩者的關(guān)系[7]。二是在“數(shù)字人文”實踐的過程中,存在自以為是的閉門研究,脫離了具體的人文學(xué)科研究情況和人文社會活動場景,而人文學(xué)科的研究或創(chuàng)作帶有非常強(qiáng)的個人色彩,而且沒有固定的套路,人文研究所要使用的數(shù)據(jù)集、工具軟件或平臺一般是小眾的,而且指向性非常明確。上述數(shù)字人文實踐,往往造成只是數(shù)字人文項目推動者的狂歡,而沒有真正意義上的更多受眾[8]。數(shù)字人文研究中上述誤區(qū)的出現(xiàn),過分強(qiáng)調(diào)了數(shù)字技術(shù)的重要性,卻忽視了人文才是數(shù)字人文實施、發(fā)展的目的和根本。因此,探討數(shù)字人文的性質(zhì)、特點,厘清數(shù)字人文的本質(zhì)屬性顯得尤為迫切。

2 工具屬性是數(shù)字人文的根本屬性

屬性,是事物所具有的性質(zhì)、特點。一門學(xué)科或者一個研究領(lǐng)域要不斷地推動發(fā)展,既需要對其定義和內(nèi)涵進(jìn)行發(fā)展中的闡釋,也需要厘清其屬性,這是推動學(xué)科或領(lǐng)域發(fā)展的必然要求,否則就會妨礙學(xué)科或領(lǐng)域研究的發(fā)展。那么,數(shù)字人文又具有什么屬性呢?數(shù)字人文的產(chǎn)生和升起,一個最重要的原因是數(shù)字技術(shù)的產(chǎn)生和不斷發(fā)展。數(shù)字人文的前身,人文計算( Humanities Computing)的起源,是意大利神父羅伯托·布薩(Roberto Busa)與IBM公司合作,以計算機(jī)為平臺、數(shù)字為載體編撰拉丁文的意大利典籍[9]。隨著數(shù)字化技術(shù)、數(shù)據(jù)管理技術(shù)、數(shù)據(jù)分析技術(shù)、可視化技術(shù)、VR/AR技術(shù)和機(jī)器學(xué)習(xí)技術(shù)等數(shù)字時代新技術(shù)的不斷出現(xiàn)和發(fā)展,也推動著“人文計算”向“數(shù)字人文”發(fā)展,并不斷拓展數(shù)字人文的研究領(lǐng)域和研究內(nèi)容。數(shù)字人文依賴和發(fā)展的基礎(chǔ),正是不斷發(fā)展的技術(shù)[10]33。在科學(xué)研究中,技術(shù)被視為研究的一種方法和手段,得到了廣泛的應(yīng)用,網(wǎng)絡(luò)時代的技術(shù)應(yīng)用正滲透到各學(xué)科研究中。數(shù)字人文的產(chǎn)生和發(fā)展,正是學(xué)科研究中泛技術(shù)化現(xiàn)象的重要特征[11]。因此,從這個角度而言,數(shù)字人文具有工具屬性,并且工具屬性是數(shù)字人文最根本和最重要的屬性。

按照《現(xiàn)代漢語詞典》的解釋,工具有兩種層面的解釋:進(jìn)行生產(chǎn)勞動時所使用的器具;比喻用以達(dá)到目的的事物。如語言是人們交流思想的工具[12]。所謂數(shù)字人文的工具屬性,是數(shù)字人文的本質(zhì)特征,它是一種人文學(xué)科研究者在開展研究時借助其實現(xiàn)自己的研究設(shè)想、推動學(xué)科發(fā)展的一種工具,也是人們?yōu)閷崿F(xiàn)人文社會活動目標(biāo)的一種工具,包括數(shù)字技術(shù)思路、技術(shù)方法、技術(shù)手段。從這個意義出發(fā),數(shù)字人文不能稱之為一門學(xué)科,只能是人文學(xué)科研究依托數(shù)字技術(shù)的一種方法、手段。在開展數(shù)字人文研究時,其首要考慮的應(yīng)該是人文,即實現(xiàn)人文研究本身所要達(dá)成的目標(biāo),其次才考慮采用何種數(shù)字技術(shù)或路徑來實現(xiàn)人文研究本身,不能本末倒置。

3 基于工具屬性的數(shù)字人文研究策略

在開展一項人文社會科學(xué)項目研究時,一般應(yīng)該先認(rèn)真分析項目研究的背景、研究需要解決或回答的人文問題、項目完成需要達(dá)成的具體目標(biāo)等內(nèi)容,在此基礎(chǔ)上,再去考慮選擇何種數(shù)字技術(shù)、方法手段(人文社會科學(xué)研究的技術(shù)工具)去實現(xiàn)研究的目標(biāo)。例如,如果需要對文本進(jìn)行數(shù)據(jù)分析(包括詞條、年代、姓氏等關(guān)鍵詞),通過這些大數(shù)據(jù)來揭示一些社會特征,顯然文本挖掘技術(shù)可以作為技術(shù)工具,用于人文社會科學(xué)的數(shù)字人文項目研究;如果是以普及人文社會科學(xué)知識,提升市民大眾的人文素養(yǎng)的人文社會項目,則選擇可視化技術(shù)、圖像技術(shù)和3D技術(shù)更容易實現(xiàn)項目的初衷、目標(biāo)。因此,開展數(shù)字人文項目研究的策略,第一需要明確人文社會科學(xué)項目研究的目的,然后據(jù)此選擇合適的數(shù)字技術(shù)來開展項目研究,實現(xiàn)研究目標(biāo)。下文將以文化典籍?dāng)?shù)字人文項目為例來闡述這一策略和具體思路。

4 基于文化典籍項目的數(shù)字人文工具屬性分析

4.1 文化典籍類數(shù)字人文項目的內(nèi)容與目標(biāo)

文化自信是一個民族、一個國家以及一個政黨對自身文化價值的充分肯定和積極踐行,并對其文化的生命力持有的堅定信心[13]。如何堅定文化自信?唯有從民族優(yōu)秀文化經(jīng)典中去汲取養(yǎng)分,增強(qiáng)民族自豪感和文化自信。在數(shù)字時代,經(jīng)典閱讀不僅必要,并且技術(shù)的發(fā)展為促進(jìn)經(jīng)典閱讀提供了更多的便利和可能。在蓬勃開展的數(shù)字人文項目中,對文化典籍、經(jīng)典圖書的開發(fā)和利用,構(gòu)成了數(shù)字人文項目的重要組成部分和主要內(nèi)容,其最終目的,無疑是為了促進(jìn)經(jīng)典閱讀,傳承文化。為此,需要通過數(shù)字技術(shù)這一工具,實現(xiàn)文化典籍類數(shù)字人文項目的開發(fā)目標(biāo):

(1)經(jīng)典的可獲得和易獲得。在大眾所知的文化典籍中,很多經(jīng)典都存世不多,成為圖書館、博物館收藏的珍藏、孤本。要讓這些經(jīng)典為人閱讀和利用,第一要務(wù)是使之?dāng)?shù)字化,并與大眾共享,使普通民眾均可以通過一定的渠道來獲得其數(shù)字化版。借助數(shù)字化技術(shù)這一工具手段,可以實現(xiàn)經(jīng)典資源的可獲得和易獲得。

(2)經(jīng)典的可讀性和易讀性。經(jīng)典著述產(chǎn)生的時代已經(jīng)距離現(xiàn)代時空遙遠(yuǎn),經(jīng)典的文字和用語,對于許多人來說,往往生澀難懂。普通讀者在閱讀時會遇到極大的理解困難和記憶障礙,而通過可視化技術(shù),對相關(guān)文獻(xiàn)信息進(jìn)行數(shù)字處理可以有效降低閱讀的難度,提高可讀性和易讀性,也便于人文學(xué)科研究者開展相關(guān)研究。

4.2 文化典籍類數(shù)字人文項目案例

為實現(xiàn)上述目標(biāo),國內(nèi)外數(shù)字人文研究中心、相關(guān)研究機(jī)構(gòu)和學(xué)者借助數(shù)字技術(shù),圍繞文化典籍利用、倡導(dǎo)經(jīng)典閱讀這一主旨,開展了大量的文化典籍類數(shù)字人文項目的研究。

4.2.1 數(shù)字化項目

對經(jīng)典的數(shù)字化,是數(shù)字人文項目的基礎(chǔ),也是開展最早、最多的數(shù)字人文項目。它通過采樣、量化、建模等技術(shù)手段,對文獻(xiàn)進(jìn)行統(tǒng)一處理,提高其利用價值。如《四庫全書》電子版、《國學(xué)寶典》《中國基本古籍庫》《廣州大典》等經(jīng)典數(shù)字化項目[14]。以《廣州大典》為例,它是由中共廣州市委宣傳部、廣東省文化廳策劃并組織研究編纂,旨在系統(tǒng)搜集整理和搶救保護(hù)廣州文獻(xiàn)典籍、傳播廣州歷史文化的大型地方文獻(xiàn)叢書。它依經(jīng)、史、子、集、叢五部分類,共收錄4064種文獻(xiàn),編成520冊圖書[15]。為推廣《廣州大典》的閱讀和研究,上述文獻(xiàn)全部實現(xiàn)了數(shù)字化,并建成了《廣州大典》數(shù)據(jù)庫。數(shù)據(jù)庫提供了檢索、紀(jì)年換算、全文下載等多種功能,極大地便利了人們的閱讀和研究開展。在國外,類似的文化典籍類數(shù)字化項目也很多,如哥倫比亞大學(xué)圖書館將本館珍貴的人文學(xué)科照片、海報、繪畫、票證和手稿等檔案材料數(shù)字化,建設(shè)數(shù)字資源館藏庫(Digital Library Collections, DLC),并將資源鏈接到圖書館 OPAC系統(tǒng)中,實現(xiàn)實體資源與數(shù)字資源的關(guān)聯(lián)鏈接[16]。

4.2.2 文本挖掘與可視化項目

近年來,隨著數(shù)字技術(shù)的不斷發(fā)展,利用文本挖掘技術(shù)、可視化技術(shù)進(jìn)行經(jīng)典的數(shù)字人文項目開發(fā)也越來越多。所謂文本挖掘是從半結(jié)構(gòu)或非結(jié)構(gòu)的文本信息中挖掘可理解的、有價值的知識,是對人文資料的深層次利用,通常包括文本預(yù)處理、語料庫構(gòu)建、特征提取、文本聚類、文本分類等過程,有些文本挖掘項目還伴隨著對挖掘成果的可視化處理,即以表格、圖像等形式將成果生動地表現(xiàn)出來。類似的項目有普林斯頓大學(xué)的映射外籍巴黎項目、耶穌會圖書館起源項目等,前者對旅居巴黎的美國人于1919年創(chuàng)辦圖書館的會員數(shù)據(jù)進(jìn)行了深入挖掘,展示了1919-1940年間巴黎外籍社區(qū)與法國作家、藝術(shù)家的聯(lián)系圖像;后者創(chuàng)建了一個虛擬圖書館系統(tǒng),揭示芝加哥洛約拉大學(xué)前身——圣伊格納修斯大學(xué)圖書館耶穌會書籍的獲取和使用歷史,努力發(fā)現(xiàn)保存至今的原版書籍[17]。

針對傳統(tǒng)文學(xué)文本閱讀與研究方式的局限,在信息可視化和文本可視化技術(shù)的基礎(chǔ)上,斯坦福大學(xué)教授 Franco Moretti提出了“遠(yuǎn)距離閱讀(Distant Reading)”理論,為閱讀與研究信息量大、復(fù)雜度高的文本提供新的解讀途徑與工具[18]。哈爾濱工業(yè)大學(xué)教授王妍和她的碩士研究生李欣哲完成的對《詩經(jīng)》情感可視化閱讀,就是“遠(yuǎn)距離閱讀”的一個典型項目案例。《詩經(jīng)》文本為古漢語,古奧晦澀、生僻字多、詞意隱蔽、語境懸隔,這為經(jīng)典的大眾普及設(shè)置了障礙,使文化經(jīng)典的閱讀與傳承遇到了嚴(yán)峻的現(xiàn)實問題。王妍、李欣哲以“喜、怒、憂、思、悲、恐、驚”來定性《詩經(jīng)》的情感信息,借助信息時代的數(shù)字技術(shù)力量,通過對情感信息的處理和計算,運用信息可視化技術(shù)對《詩經(jīng)》的情感信息內(nèi)容進(jìn)行信息建構(gòu),將《詩經(jīng)》的文本信息轉(zhuǎn)換為視覺信息,幫助人們高效、快速閱讀,以視覺之“閱”的方式進(jìn)入到《詩經(jīng)》的情感世界[19]。

4.3 文化典籍類數(shù)字人文項目的工具屬性分析

通過上述數(shù)字人文項目案例,可以清晰地看到,數(shù)字人文具有鮮明的工具屬性。在這些項目中,為了促進(jìn)文化典籍利用,倡導(dǎo)經(jīng)典閱讀的目的,利用了不同的數(shù)字技術(shù)作為技術(shù)工具和手段,以達(dá)成項目目標(biāo)。包括數(shù)字化技術(shù)(掃描,拍攝,采樣,捕捉,圖形設(shè)計,3D建模等)、數(shù)據(jù)管理技術(shù)(文本編碼,語義描述,本體建模,數(shù)據(jù)庫設(shè)計,語義搜索,API數(shù)據(jù)服務(wù)等)、數(shù)據(jù)分析技術(shù)(文本分析,聚類分類,主題分析,內(nèi)容挖掘,時序分析,地理空間分析,社會關(guān)系分析等)、可視化技術(shù)(信息美學(xué),知識地圖,主題圖,關(guān)聯(lián)呈現(xiàn),場景模擬,歷史仿真等)、VR/AR技術(shù)(人機(jī)交互,認(rèn)知,互動測量,游戲化學(xué)習(xí)等)、機(jī)器學(xué)習(xí)技術(shù)(自動分類,圖像視頻音頻識別和分析,深度學(xué)習(xí),超級計算等)[10]35等數(shù)字時代的各種信息技術(shù)被充分融合運用到數(shù)字人文項目的開發(fā)中,采用“發(fā)現(xiàn)(Discovering)、注釋(Annotating)、比較(Comparing)、參考(Referring)、抽樣(Sampling)、說明(Illustrating)和表示(Representing)”等七種方法[20],實現(xiàn)了文化典籍資源的再利用、再開發(fā),幫助媒體環(huán)境下的人們更容易閱讀經(jīng)典、研究經(jīng)典。

5 結(jié)語

數(shù)字時代,技術(shù)的發(fā)展促成了數(shù)字人文的興起,這對促進(jìn)人文學(xué)科的發(fā)展和創(chuàng)新提供了更多可能和新的機(jī)會。顯然,數(shù)字人文具有鮮明的工具屬性,它的出現(xiàn),為人文學(xué)科的研究提供了一種工具,它可以幫助文學(xué)家、歷史學(xué)家、藝術(shù)家、圖書館學(xué)家等人文科學(xué)研究者以新的思路和技術(shù)方法、手段去認(rèn)識研究問題,探究研究問題,找到通向研究結(jié)論的全新道路。

猜你喜歡
可視化文本研究
基于CiteSpace的足三里穴研究可視化分析
FMS與YBT相關(guān)性的實證研究
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
遼代千人邑研究述論
基于CGAL和OpenGL的海底地形三維可視化
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
在808DA上文本顯示的改善
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
EMA伺服控制系統(tǒng)研究
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
主站蜘蛛池模板: 成人在线综合| 亚洲精品无码不卡在线播放| 巨熟乳波霸若妻中文观看免费 | 青青国产视频| 久久伊人操| 九色在线观看视频| 夜夜拍夜夜爽| 2048国产精品原创综合在线| 91久久国产综合精品| 国产精品亚洲а∨天堂免下载| 国产黄色片在线看| 国产伦片中文免费观看| 午夜国产在线观看| 亚洲欧洲自拍拍偷午夜色无码| a级毛片在线免费观看| 日韩人妻无码制服丝袜视频| 久久久91人妻无码精品蜜桃HD| 国产人成网线在线播放va| 国产96在线 | 国产AV毛片| 亚洲成人黄色在线| 欧美成人在线免费| 国产福利大秀91| 欧美激情第一欧美在线| 午夜无码一区二区三区在线app| 伊人狠狠丁香婷婷综合色| 精品无码视频在线观看| 亚洲第一区在线| 456亚洲人成高清在线| 亚洲欧美综合精品久久成人网| 精品国产Av电影无码久久久| 97超爽成人免费视频在线播放| 国产99在线| 五月婷婷综合网| 国产一区二区丝袜高跟鞋| 国产乱子精品一区二区在线观看| 强乱中文字幕在线播放不卡| 欧美一级在线看| 国产日本欧美在线观看| 国产一区二区人大臿蕉香蕉| 国产黄色片在线看| 萌白酱国产一区二区| 欧美精品啪啪一区二区三区| 国产日本一线在线观看免费| 久久香蕉国产线看精品| 欧美在线视频不卡| 国产成人综合久久| 少妇露出福利视频| 欧美国产日韩在线观看| 久久久黄色片| 尤物视频一区| 日本a级免费| 日本一区二区不卡视频| 暴力调教一区二区三区| 91丝袜乱伦| 综合色区亚洲熟妇在线| 精品久久久久久成人AV| 亚洲日本www| 无码内射在线| 秘书高跟黑色丝袜国产91在线| 日韩高清在线观看不卡一区二区| 亚洲国产综合精品一区| 欧美综合在线观看| 99久久这里只精品麻豆| 嫩草影院在线观看精品视频| 精品少妇人妻一区二区| 国产成熟女人性满足视频| 无码精品国产VA在线观看DVD| 国内毛片视频| 国产精品自拍露脸视频| 久久综合色88| 曰韩免费无码AV一区二区| 不卡无码h在线观看| 亚洲成人动漫在线| 亚洲黄色网站视频| 中文无码精品a∨在线观看| 亚洲v日韩v欧美在线观看| 亚洲AV无码久久精品色欲| 中国丰满人妻无码束缚啪啪| 成人年鲁鲁在线观看视频| 三级国产在线观看| 日本高清视频在线www色|