







摘 要:數字人文為我國名人文獻的研究提供了新方法和新思路,地理信息系統和可視化等技術手段也助力了名人文獻的知識化服務。文章在探討數字人文視野下名人文獻場景構建策略的基礎上,以宋慶齡書信為例,從數據清洗、書信知識圖譜框架設計及宋慶齡書信場景化應用實踐等方面進行了深入的剖析和闡釋,為名人文獻的數字人文研究提供方法支撐,使得名人文獻的信息和價值被充分挖掘,從而拓展其傳播深度和廣度。
關鍵詞:數字人文;名人文獻;知識圖譜;宋慶齡書信
Research on the Construction of Digital Humanities Scene for Celebrity Literature: A Case Study of Soong Ching-ling's Letters
Abstract Digital humanities offer new methods and perspectives for studying celebrity literature in China. Technologies such as GIS and visualization tools further enhance the knowledge-based services of celebrity literature. This article explores strategies for constructing scenes of celebrity literature from a digital humanities perspective, using Soong Ching-ling's letters as a case study. It provides an in-depth analysis of data cleaning, the design of a knowledge graph framework for the letters, and the practical application of scene construction. This study offers methodological support for digital humanities research on celebrity literature, facilitating the thorough exploration of their information and value, thereby expanding their depth and breadth of dissemination.
Key words digital humanities; celebrity literature; knowledge graph; Soong Ching Ling's letters
1 引言
名人文獻作為傳承文明、傳播思想、積淀文化的載體,是寶貴的文化遺產和文獻資源,有著很高的學術研究價值和參考價值[1]。名人文獻資源是較為重要的一類特藏資源和珍貴史料,蘊含大量有待開發和利用的信息資源[2]。加大對名人文獻資源的開發利用力度,深入挖掘名人文獻資源,有助于推動文化事業發展。近年來,學界積極開展名人文獻數字資源建設的探索,如宋慶齡文獻數據中心[3]、沈從文專題數據庫[1]、賀龍特色文獻數據庫[4]、周恩來研究專題數據庫[5]、蔣介石資料數據庫[6],等等。目前,對名人文獻的開發利用多以數字化為主,這也是名人文獻整理過程中必不可少的組成部分,而對于名人文獻的深度價值挖掘(如事件抽取、命名實體標注、社會網絡分析等)與可視化知識服務的研究尚處于起步階段。
數字人文(Digital Humanities, DH),源于人文計算(Humanities Computing)[7],通過將數據挖掘、可視化技術、開放關聯等數字技術融入學術研究,深刻影響人文學科研究的范式[8],引發社會各界的廣泛關注與探索,日益成為一個新興的研究領域[9]。數字人文作為一個跨學科領域[7],它的出現深刻地影響著人文學術的研究過程與內容,并自然而然地與以知識組織為主要功能的圖書館相遇[10],被認為是圖書館重要的發展趨勢之一[11]。此外,數字人文在提高資源的生動性、場景化服務以及用戶體驗等方面都發揮著重要作用。因此,數字人文技術的發展,為我國名人文獻的知識化研究提供了新方法和新思路,也是名人文獻資源知識發現研究的趨勢。
宋慶齡是中華人民共和國名譽主席,也是一位愛國主義、民主主義、國際主義和共產主義的偉大戰士,被譽為“國之瑰寶”[12]和二十世紀的偉大女性[13-14]。“永遠和黨在一起”[15],不僅是宋慶齡一生秉持的堅定信念,也是她光輝一生的真實寫照。宋慶齡在革命的一生中,寫出了大量文章,發表過不少著名的宣言和聲明,這些都是中國革命史上的重要文獻。宋慶齡的書信,表現了她同海內外各方面人士、親屬和故舊的交往,大體上涵蓋了她一生各個重要歷史時期的工作和生活,是留給我們的重要歷史文獻和寶貴的精神財富,對學習和研究宋慶齡的思想和品德,研究中國近現代史,都具有重要的意義[16]。學界對宋慶齡書信的研究大多通過書信內容研究其政治思想的演變[17]或革命友誼[18]等。讓書信講述歷史,對我們了解中國人民偉大的革命事業的前進路程,有很大的幫助。
本文旨在拋磚引玉,以宋慶齡書信為例,從數字人文視角出發,探討名人文獻數字人文場景的構建,嘗試利用地理信息系統(Geographic Information System, GIS)、知識圖譜等技術整合名人文獻資源,一方面可以為相關領域的學者提供已有研究成果的客觀佐證,直觀且形象地呈現宋慶齡書信所蘊藏的深層次知識,提升名人文獻的知識發現深度與價值呈現維度,為名人文獻的數字人文研究提供方法支撐;另一方面,可以推動名人文獻資源建設從數字化向語義化轉變,從而促進相關數字資源的深度開發利用。
2 相關研究及數字人文項目調研
2.1 相關研究
國內利用數字人文對人文特藏資源進行研究起步比較晚,主要集中在GIS、可視化、文本挖掘以及關聯數據等領域[19]。劉寧靜等人以學術名人為核心,構建學術名人描述框架模型和學術名人與其他實體關系模型,對以李政道為代表的學術名人特色資源從知識顆粒的角度進行有效的組織和展示[20]。牛力等人梳理數字記憶視角下學術名人知識庫的基本屬性和構建要求,據此形成“融合、建構與服務”的學術名人知識庫建設路徑,并以學術名人吳寶康先生的知識庫建設為案例進行應用闡釋[21]。孫鳴蕾等人以中國作家庫的作家檔案為例,闡述構建名人檔案知識圖譜的方法,使名人檔案的利用價值得到進一步提升[22]。上述研究多以學術名人的數字資源對象為核心,實現對學術名人的數字資源組織及利用。
此外,國內對名人文獻的研究,除了上述以學術名人的數字資源對象為主外,還側重于部分人物的資源內容挖掘,如宋雪雁等人以王世杰日記為例開發名人日記數字化資源,形成人物關系、地域熱點、情感傾向等可視化圖譜,探索具有可行性的日記資源內容挖掘方法[2]。宋雪雁等人還以人物關系挖掘為切入點,發現和提煉《譚延闿日記》中蘊含的知識,形成能夠呈現日記人物同現關系的可視化圖譜,將非結構化的日記文本以更加清晰直觀的方式進行展示[23]。李惠等人基于曾國藩個人書信集數據構建古代書信網絡模型,探索個人書信集里的群體人際關系[24]。國外的書信研究大多數聚焦于知名學者的個人書信網絡[25-26],分析特定學者的學術思想交流情況。以上研究多以單個人物的文本內容挖掘為主,探索其蘊含的深層知識并進行可視化呈現。
2.2 數字人文項目調研及其可借鑒之處
2.2.1 項目調研
隨著數字人文技術的發展,各科研院校及圖書館開展了數量眾多的數字人文項目。在調研眾多數字人文項目的基礎上,筆者最終選取了8個案例,分別是:上海圖書館的盛宣懷檔案知識庫、中國家譜知識服務平臺、香港中文大學的盛宣懷檔案、浙江大學的智慧古籍平臺、上海博物館的董其昌書畫藝術展、中南民族大學的唐宋文學編年地圖、中國人民大學高遷古村數字記憶網站、華東師范大學數字方志集成平臺。對上述數字人文項目進行分析,收集不同故事性應用場景設計、主要技術及特色功能點,并歸納總結出可借鑒之處,能夠為宋慶齡相關文獻的故事性應用場景構建打下基礎。
2.2.2 可借鑒之處
(1)時間與人物關系可視化相結合
除了文本分析之外,時空分析、社會關系分析也是數字人文研究通常采用的方法,成為許多數字人文平臺提供的基本功能[27]。上海圖書館的盛宣懷檔案知識庫可以通過時間、地點、主題、人物、數量,查詢信函、電報收發關系圖;香港中文大學的盛宣懷檔案以年為單位,將每年的盛宣懷檔案涉及的人物以圖譜的形式進行展示。因此,可以按照書信的寫信時間,對宋慶齡往來書信進行可視化展示。
(2)時空檢索
現代歷史地理學為人文研究貢獻了多維時空框架下的數據、技術、平臺與方法。歷史地理數據及其相關技術、平臺和方法的利用,已成為數字人文中不容忽視的要素和不可或缺的一部分[28]。華東師范大學數字方志集成平臺上的時空檢索,可查看并檢索不同朝代方志的地區分布情況,方志越多的地區,地圖中的圓點就越大。因此,可以對宋慶齡的書信進行時空呈現及檢索。
3 名人文獻的數字人文場景構建策略
宋慶齡文獻數據中心的建設,為后續知識組織及知識發現提供了資源保障。宋慶齡文獻數據中心是由上海宋慶齡研究會、上海圖書館、上海市孫中山宋慶齡文物管理委員會三家單位合作,共同建設的上海“四史”學習成果展示平臺和上海圖書館紅色資源揭示展示的試點平臺,也是一個集文獻、圖片、音視頻等多種資源類型的平臺。如何提高資源的開發利用效率和知識服務水平?針對這一問題,項目組以場景構建為抓手,從數據賦能、知識賦能、工具賦能三個方面入手,探討數字人文視野下名人文獻場景的構建策略,以期充分挖掘宋慶齡書信中的知識關聯,促進名人文獻資源的深度開發利用。
3.1 數據賦能
數據是數字人文研究的基石,也是知識服務的基礎。數字人文對數據的精細度、顆粒度及結構化程度提出了更高要求,從文獻外部特征的組織揭示向文獻內容的深度加工挖掘轉變,通過更加細顆粒度的數據化建設搭建不同類型數據之間的空間聯系。宋慶齡文獻數據中心在建設之初,為了對史料進行精細化的加工,充分挖掘其內在價值,在參考一系列國家及行業標準的基礎上,制定了詳細的元數據規則。以宋慶齡書信為例,除了基礎元數據項外,還對寫信人、收信人、寫信時間、寫信地點、文中人名、文中事件組織等進行著錄。元數據著錄完善,為人、地、時、事的實體化奠定了堅實基礎,也為知識關聯創造了條件。
3.2 知識賦能
數字人文通過知識關聯,可實現資源的整合以及知識的廣度拓展和延伸。因此,在宋慶齡文獻數據中心的基礎上,充分利用網絡資源為場景提供更多的知識服務成為項目組考慮的重點之一。關聯數據可以將各種數據源無縫關聯,形成一個廣泛的知識網絡,目前,上海圖書館已使用關聯數據對館藏書目文獻進行組織和發布。以宋慶齡為核心的知識關聯思路如圖1所示。
其中文獻資源庫方面,主要基于宋慶齡文獻數據中心、全國報刊索引數據庫。例如,宋慶齡文獻數據中心收錄的資源中,宋慶齡與國際友人如艾黎、愛潑斯坦、斯諾、馬海德等的相關文獻占了一定的比重,尤其是書信;在全國報刊索引數據庫中,以艾黎、馬海德、斯諾、史沫特萊、愛潑斯坦等國際友人的名字為檢索詞進行檢索,發現相關的文獻資源比較豐富。此外,宋慶齡往來書信中涉及的人物、機構、地點、事件等,也通過上海圖書館基礎知識庫進行關聯,實現資源的整合,以知識賦能場景,進一步豐富以宋慶齡為核心的知識化服務。
3.3 工具賦能
數字人文具有很強的工具屬性,借助可視化、GIS等工具,可以提升場景服務及用戶體驗。可視化在數字人文領域的重要性不言自明,甚至可以說數字人文就等同于對人文語料的可視化[29]。目前,古籍文本閱讀可視化、檔案及文物可視化以及名人日記可視化等都受到了數字人文學者的關注。而以GIS技術為核心的數字人文注重地理空間和人地關系;歷史地理數據及其相關技術、平臺和方法的利用,也成為數字人文中不容忽視的要素和不可或缺的部分。
因此,以知識圖譜的形式對宋慶齡的來往書信進行可視化展示,側重揭示書信中的社會網絡關系,對其書信網進行更加直觀的視覺呈現;同時,宋慶齡往來書信主要涉及人(寫信人和收信人)、地(寫信地點)、時(寫信時間)、事(文中事件),與在數字人文領域應用非常廣泛的GIS技術吻合。因此,依托宋慶齡文獻數據中心豐富的資源,從人物、時間、地點、事件等多維要素出發,在敘事視域下豐富和完善宋慶齡書信集內容,探索挖掘名人文獻價值的新路徑。在此基礎上,還可以對宋慶齡的事業網(如宋慶齡的婦女兒童事業)和其足跡進行場景構建及可視化嘗試和探索。
4 名人文獻的數字人文場景構建實踐
4.1 數據來源
1981年,宋慶齡逝世后,上海有關部門在上海宋慶齡故居中整理出孫中山、宋慶齡與各界往來函電共計1 100多封,除當時即移交中央檔案館保管的部分外,仍存有1 000多封,其中以致宋慶齡的函電居多[30]。宋慶齡一生與中外友人和親人有大量的書信往來,她的書信大多是親自執筆或用打字機書就的英文信,是留給我們的重要歷史文獻和寶貴的精神財富。但是由于社會環境和保護同志以及其他種種原因,宋慶齡的大批信件或散失或銷毀。多年來,宋慶齡基金會和中國福利會等有關部門又向國內外人士征集了許多書信,但這些書信也僅僅是她一生幾十萬件書信中極小的一部分[16],已在有關部門主持下進行翻譯和編輯出版。
宋慶齡文獻數據中心平臺上收錄的函電(信函、電報類文獻)數據共2 024篇,剔除部分非宋慶齡的函電后將近2 000篇,時間跨度從1909年宋慶齡少女時代至1981年逝世為止,是她長達72年的生活記錄。這些書信記錄了她與國內外政要、親朋故舊的交往情況,從側面反映其政治觀點、人生經歷、思想情感等,作為中國近現代史的寶貴文獻傳之于世,有著重大的補史和證史作用[31]。這些書信大部分來源于已出版的《宋慶齡書信集》《宋慶齡書信集(續編)》《孫中山宋慶齡文獻與研究》《鄧廣殷、孫君蓮及鄧勤藏宋慶齡書信集》等圖書,且被宋慶齡文獻數據中心收錄并提供原始圖像,確保了數據的原始真實且可靠。為了驗證技術路線的可行性,項目組選取部分數據進行試驗。
4.2 數據清洗
由于書信中對人物的記載伴隨著大量的姓氏、職位、別稱、身份等指代稱謂,為了從書信中準確提取有利用價值的實體要素數據并進行可視化分析,需要對數據進行清洗。本研究人工識別和提取宋慶齡往來書信中的人物實體要素,為了確保人物數據便于加工著錄,針對人物稱謂不統一、不規范的情況,制定人物實體著錄細則,并結合書信文獻、人物傳記等有關資料,對指代稱謂進行查找和統一替換。以宋慶齡為例,寫信時常用的落款有宋慶齡、羅莎蒙德·宋、孫夫人、孫宋慶齡、SCL、孫逸仙夫人、孫中山夫人等,數據清洗時將這些寫信落款統一聚合為宋慶齡;由于宋慶齡往來書信中,有部分書信是發給某某夫婦(如致愛潑斯坦夫婦)的,在人物實體提取時,需將夫婦分開處理,并為其添加親屬關系;還有部分書信,收信人為某人物親屬或家屬(如致陳賡親屬)等泛稱,在著錄人物的親屬關系時,新增一個人物節點,節點名稱為人物親屬,專門用于勾連這些指代不明確的親屬關系。
此外,宋慶齡部分書信是寫給某個機構或機構中的小團體的,如中國福利基金會全體工作人員、中共中國福利基金會支部,收信人則統一以機構名為主,即中國福利基金會,并著錄機構實體。同時,由于書信涉及寫信時間和寫信地點,寫信地點統一處理為市級行政區劃。
4.3 書信知識圖譜框架設計
近年來,知識組織領域的研究熱點之一是知識圖譜。知識圖譜在人文領域的研究中也得到了應用,是名人文獻資源高效利用及細粒度呈現并實現語義關聯的有效途徑,為名人文獻資源知識發現提供了可能。知識圖譜作為以結構化三元組形式存儲現實世界中實體以及實體間關系的知識庫[32],通過可視化手段,顯示知識內部結構與發展進程,其中圖的結點代表實體或者概念,而圖的邊代表實體/概念之間的各種語義關系。項目組在比較各種知識圖譜存儲的優缺點后,采用圖數據庫Neo4j對書信知識圖譜進行存儲。
4.3.1 書信知識圖譜實體類型
在宋慶齡文獻數據中心建設過程中,為了對史料進行精細化加工,元數據方案采用多層級結構,即資源層、劃到層、篇層以及文中附圖(或子圖)。宋慶齡書信均以函電篇為單位進行加工,同一封書信刊載在不同的圖書上時,為了保證數據的完整性,將作為不同的函電篇進行加工。
項目組在全國報刊索引數據庫框架構建的基礎上,借鑒上海圖書館人名規范庫本體及手稿檔案本體中與書信相關的實體、實體屬性以及實體關系,最終完成書信知識圖譜框架設計。書信知識圖譜的核心是寫信人收信人對應的人物、涉及的部分機構、寫信地點對應的地名信息以及刊載書信的不同文獻資源(如圖書、報紙、期刊等),由于文獻資源涉及連續出版物,因此還包括不同文獻資源的劃到信息。為了解決同一信件對應多個函電篇的問題,項目組在設計書信知識圖譜的框架時,既要包括書信的外在屬性,又要包括書信本身的隱含知識。因此,將信件分為內容層和篇層,內容層主要是信件本身,即寫信人、收信人、寫信時間、寫信地點,篇層即為函電篇,可看作內容層的不同版本。
在宋慶齡文獻數據中心函電元數據框架元素的基礎上,從概念上將書信知識圖譜歸為信件(Letter)、人物(Person)、機構(Organization)、地名(Place)、資源(Resource)、資源劃到(Item)、函電篇(Pian),其中資源(Resource)對應的子類有報紙(Newspaper)、期刊(Periodical)、圖書(Books),資源劃到對應的子類有報紙劃到(Newspaper_Item)、期刊劃到(Periodical_Item)、圖書劃到(Books_Item)。書信知識圖譜的實體類型如表1所示。
4.3.2 書信知識圖譜實體關系類型
實體關系(entity relation)是指某一時間段內實體之間存在的關系[33]。書信知識圖譜實體之間存在多種關系,主要有信件與人物、信件與機構、信件與地名、人物與人物、人物與機構、信件與函電篇、信件與資源劃到、資源劃到與資源、資源劃到與機構之間的關系。由于信件分為內容層和篇層,一個函電篇可看作信件內容的一個版本,當某個信件刊載于不同的資源劃到時,那么該信件就有多個版本,對應多個相關的函電篇。信件與人物和機構的關系主要是信件都有寫信人(機構)及收信人(機構),信件與地名主要是寫信地點的關系,人物與人物、人物與機構主要是收發信關系,信件與資源劃到主要是刊載于的關系,資源劃到與資源之間主要是資源劃到是資源的單件的關系,資源劃到與機構也存在關系,即機構是資源劃到的出版方(見表2)。
4.3.3 書信知識圖譜實現
以宋慶齡與周恩來之間的書信往來為例,對書信框架進行詳細解讀。宋慶齡與周恩來的往來書信主要集中在1950年,這些書信大部分收錄在《宋慶齡書信集》(1999年出版)下冊,宋慶齡書信集的上冊及下冊的出版機構均為人民出版社,這些數據在圖數據庫中的呈現如圖2所示。
書信知識圖譜是對宋慶齡書信進行深層次開發利用的一次嘗試,大大增強了書信的知識服務功能。宋慶齡與周恩來的往來書信集中在中華人民共和國成立初期反映了一段重要史實。中華人民共和國成立之初,遭到了西方國家的多重封鎖,在當時惡劣的國際形勢下,將我國的正面形象及時傳播到世界各國,顯得十分迫切與重要。由于宋慶齡在國內外享有崇高威望,抗戰時期有著豐富的國際傳播實踐,是最適合擔此重任的特殊人選。1950年10月,周恩來代表黨中央正式向宋慶齡提出,由她創辦對外宣傳刊物,打破西方霸權主義的封鎖,向全世界介紹我國真實的情況。在宋慶齡和中國福利會的努力下,1952年1月,《中國建設》創刊號公開發行。作為當時唯一能夠進入美國的期刊,《中國建設》可以說是“講好中國故事”的先聲。
4.4 書信知識圖譜應用
在對宋慶齡書信進行數據清洗處理,并完成了書信知識圖譜框架設計的基礎上,借助可視化技術手段,從時間、空間以及人際關系等維度進行可視化的知識服務,從而促進名人文獻資源的知識服務和價值挖掘。
按照書信知識圖譜的框架設計,將實體嵌入特定的時空或場景,從特定角度對宋慶齡往來書信進行知識服務,實現時間、空間及人際關系的概覽。時間維度以時間軸為基線,將寫信時間與實體進行融合并串聯;空間維度則采用“時間-空間”雙重基線,不僅能展示不同寫信時段內宋慶齡書信的地區分布,還能夠將宋慶齡在不同寫信時間段內位于同一地點的書信進行聚合,形成名人文獻的追溯。此外,書信網絡能夠呈現與宋慶齡有書信往來的人物,如周恩來、鄧穎超等黨和國家的卓越領導人,以及斯諾、馬海德、艾黎、愛潑斯坦等國際友人,這一關系網絡基本包括了以宋慶齡為中心的,她與國內外政要、親朋故舊的交往情況。通過知識圖譜可以了解宋慶齡的書信往來,增強文化傳播。
目前,宋慶齡文獻數據中心已實現對其往來書信的檢索和全文瀏覽服務。用戶可以在文獻類型中選擇函電,進行檢索、瀏覽PDF。在此基礎上,為了更好地服務用戶,項目組選擇可視化工具vis.js將Neo4j圖數據庫中的數據可視化。此外,在可視化表達中,時間和空間也是兩個重要的維度,采用CSS3實現時間軸的可視化,采用高德地圖開放的應用程序接口(Application Program Interface,API)實現時空分析及呈現。
4.4.1 宋慶齡書信可視化
為了驗證技術路線的可行性,項目組先選取100余封書信,并按照上述書信知識圖譜的框架進行數據梳理,從而對書信進行可視化呈現和時空檢索。宋慶齡書信可視化呈現的頁面設計包括三部分:人物關系圖譜、時間軸、人物/機構簡介,如圖3所示。默認中心人物是宋慶齡,時間軸上顯示宋慶齡每年的發信數量,人物關系圖譜上節點的大小可根據發信量的多少進行調整,發信量越多的節點越大。此外,可以按寫信時間進行過濾,查看一段時間內跟宋慶齡有書信往來的人物/機構,如圖4所示。
點擊兩個人物實體中間的邊,可以查看兩者之間所有的書信。例如,點擊宋慶齡發信給蔣介石這條邊,可查看宋慶齡發給蔣介石的所有信件,如圖5所示。在圖5上,單擊某個信件實體,可顯示與其相關的屬性字段;雙擊某個信件實體,則跳轉至新頁面,以單個信件為核心,展示與其相關的實體,如圖6所示,額外顯示出該信件實體刊載于的資源劃到實體。點擊資源劃到實體,以圖6為例,資源劃到實體為《宋慶齡選集》(1992年版)上卷,可跳轉至PDF瀏覽頁面,查看該篇書信的全文內容。
4.4.2 宋慶齡書信時空檢索
由于宋慶齡書信的時間跨度長達72年,如果按年進行時空呈現和檢索的話,每年的數據量較少,效果可能不甚理想。因此,項目組考慮按時間段進行處理,時間段劃分參考《中國圖書館分類法》通用復分表中的中國時代表[34]。以寫信地點是國內的城市為例,對宋慶齡各時段書信的地區分布進行可視化展示,默認顯示全部時段的書信分布。頁面分為兩部分:時空地圖、檢索結果顯示區。為了更直觀地顯示出每個地區書信分布情況,項目組采用三維地圖,并按書信量的多少,將寫信地點以柱狀圖的形式在時空地圖上進行呈現。
鼠標放至時空地圖上的某個地點,就可以顯示這個地點寫的所有書信數量;點擊這個地點,則可對寫信地點為該地點的書信進行檢索,并將檢索結果以篇名列表的形式顯示在時空地圖下方;左上角的寫信時段,勾選后也可以按寫信時段進行檢索。在檢索結果顯示區,點擊某個信件標題,則調用宋慶齡書信可視化場景的單個信件相關圖譜展示頁面,即彈出類似圖6的頁面,可以查看該信件實體的相關知識圖譜。此外,點擊資源劃到實體即可跳轉至PDF瀏覽頁面,查看該篇書信的全文內容。由于宋慶齡部分書信的寫信地點在莫斯科、東京等,項目組后續考慮將時空地圖進行切換,以便更完整地展示宋慶齡書信的地區分布。
5 結語
盡管數字人文在國內的研究還處于起步階段,但是已經為圖書館服務模式的創新提供了新的思路和方法,GIS和可視化等技術手段也能有效助力名人文獻資源的揭示和知識化服務,從而更好地服務讀者。本研究從數字人文視角對名人文獻進行知識關聯化的探索,通過對書信知識圖譜模型的構建及應用,為相關人文學者提供數據基礎和方法支撐,兩個場景的前臺展示也驗證了技術路線的可行性。同時,知識圖譜化的宋慶齡書信展示頁面以實體為紐帶,實現了宋慶齡相關文獻的廣泛匯聚和深度融合,形成立體化知識網絡并予以呈現,大大增強了書信知識服務功能。此外,可視化技術又為名人文獻資源的展示帶來了新的體驗,拓展其傳播深度和廣度。
本研究對名人文獻的數字人文場景構建尚處于起步階段,仍存在不足之處。其中場景涵蓋的數據量有限,尚不能達到規模化應用;GIS技術目前主要用于書信的時空呈現和檢索,后續可考慮深入書信內容進行分析。接下來擬建立線上平臺,吸引更多的學者參與,通過線上互動,使名人文獻的信息和價值被充分挖掘。名人文獻資源知識發現研究也將煥發生機,推動文化遺產“活起來、亮起來、傳起來”。
參考文獻:
[1] 張筠.名人專題數據庫建設的理論與實踐探索:以沈從文專題數據庫建設為例[J].吉首大學學報(社會科學版),2012,33(1): 150-152.
[2] 宋雪雁,崔浩男,梁穎,等.數字人文視角下名人日記資源知識發現研究:以王世杰日記為例[J].情報理論與實踐,2021,44(6): 105-111.
[3] 宋慶齡文獻數據中心[DB/OL].[2022-07-11].http://www.sclrd.net.cn/index.html.
[4] 袁子英.紅色資源數據庫建設研究:以籌建賀龍圖書館為例[J].圖書館學研究,2012(14):46-48.
[5] 周恩來研究專題數據庫[DB/OL].[2022-07-11].https://lib.hytc.edu.cn/info/1062/1467.htm.
[6] 趙曉紅,周維煦.人物數據庫建設新模式探索:以蔣介石資料數據庫為例[J].浙江檔案,2016(6):15-17.
[7] 劉煒,葉鷹.數字人文的技術體系與理論結構探討[J].中國圖書館報,2017,43(5):32-41.
[8] UNSWORTH J.What is Humanities Computing and What is not?[J].Jahrbuch für Computerphilologie,2002,4:71-83.
[9] 王曉光.“數字人文”的產生、發展與前沿[C]//全國高校社會科學科研管理研究會.方法創新與哲學社會科學發展.武漢:武漢大學出版社,2010:207-221.
[10] SULA C A.Digital humanities and libraries:a conceptual model[J].Journal of Library Administration,2013,53(1):10-26.
[11] 杜宗明.數字人文環境下的圖書館角色定位與實踐路徑[J].農業圖書情報學刊,2017,29(10):103-106.
[12] 鄧穎超.向宋慶齡同志致崇高的敬禮![N].人民日報,1981-5-29(1).
[13] 愛潑斯坦.宋慶齡:二十世紀的偉大女性[M].北京:人民出版社,1992.
[14] 盛永華.20世紀的偉大女性:宋慶齡[M].廣州:廣東人民出版社,2006.
[15] 宋慶齡.永遠和黨在一起[M].上海:上海人民出版社,1983.
[16] 宋慶齡基金會,中國福利會.宋慶齡書信集[M].北京:人民出版社,1999:1.
[17] 凌霄.淺析宋慶齡20世紀20—30年代政治思想的演變:基于1925—1932年宋慶齡致楊杏佛書信的考察[J].蘇區研究,2017(5):88-96.
[18] 陳孜穎.革命的情誼——宋慶齡致魯迅書信考辨[J].紹興魯迅研究,2022(1):215-221.
[19] 張毅,李欣.面向數字人文的特藏資源揭示研究:以方志數據庫建設為例[J].圖書館,2019(6):100-105.
[20] 劉寧靜,劉音,王莫言,等.數字人文視角下學術名人知識模型構建研究:以李政道數字資源中心為例[J].圖書情報工作,2019,63(23):113-121.
[21] 牛力,高晨翔,劉力超,等.層次與空間:數字記憶視角下名人檔案的價值挖掘研究[J].檔案學研究,2021(5):138-144.
[22] 孫鳴蕾,房小可,陳忻.數字人文視角下名人檔案知識圖譜構建研究:以作家檔案為例[J].山西檔案,2020(6):79-88.
[23] 宋雪雁,鐘文敏.數字人文視角下《譚延闿日記》人物關系挖掘及可視化研究[J].情報科學,2022,40(6):25-35.
[24] 李惠,侯君明,陳濤,等.星漢窈渺——書信網絡中蘊藏的人際關系挖掘[J].圖書館雜志,2020,39(5):86-92,80.
[25] Darwin Correspondence Project[EB/OL].[2022-09-02].http://www.darwinproject.ac.uk/.
[26] The Newton Project[EB/OL].[2022-03-01].http://www.newtonproject.ox.ac.uk.
[27] 劉煒,謝蓉,張磊,等.面向人文研究的國家數據基礎設施建設[J].中國圖書館學報,2016,42(5):29-39.
[28] 夏翠娟.中國歷史地理數據在圖書館數字人文項目中的開放應用研究[J].中國圖書館學報,2017,43(2):40-53.
[29] 王軍.從人文計算到可視化——數字人文的發展脈絡梳理[EB/OL].(2020-05-10)[2023-07-10].https://m.sohu.com/a/394279713_786014.
[30] 秦量.上海孫中山宋慶齡文物圖錄[M].上海:上海辭書出版社,2005:64.
[31] 葉建華.心靈的鏡子 寶貴的遺產——《宋慶齡書信集》評介[J].今日中國(中文版),2001(5):10-11.
[32] 曾蕾,譚旭.數據的語義增強——解讀圖檔博支持數字人文的新動向[J].數字人文研究,2021,1(1):65-86.
[33] 歐陽劍,梁珠芳,任樹懷.大規模中國歷代存世典籍知識圖譜構建研究[J].圖書情報工作,2021,65(5):126-135.
[34] 國家圖書館《中國圖書館分類法》編輯委員會.中國圖書館分類法:第五版[M].北京:國家圖書館出版社,2010.
作者簡介:王靜,通訊作者,上海圖書館館員,研究方向為知識組織與知識發現、數字人文;朱蓓琳,上海圖書館館員,研究方向為知識組織與知識挖掘;姜鵬,上海圖書館,工程師,研究方向為中圖分類、數字人文。
收稿日期:2024-03-18本文責編:王曉琳
本文系上海圖書館青年揚帆計劃專項“名人文獻的數字人文場景構建——以宋慶齡為例”的研究成果之一,榮獲2023年中國數字人文年會(CDH2023)優秀論文。