


本文系廣西民族文化保護與傳承研究中心開放課題“數字人文背景下的銅鼓數字資源組織構建研究”(2021KFYB01)研究成果之一。
收稿日期:2024-03-20
摘? 要:
銅鼓作為古代文化遺產的重要組成部分,其資源的語義表達形式需要向知識細粒度化、知識集成、知識可視化方向拓展,并充分利用強大的文獻資源作為其知識體系的重要支撐。本研究以銅鼓史料文獻為研究對象,利用知識元提取和可視化圖譜技術,探索表層視覺元素與內在知識的關聯、銅鼓文獻知識元組織模型的構建,以及時空屬性向量可視化等問題,提出數據融合的銅鼓知識平臺應由至少4個基礎數據庫組合而成,并展望其下一步探索路徑。
關鍵詞:
銅鼓;知識元;細粒度;時空向量;數據融合
中圖分類號:G250.7??? 文獻標識碼:A??? 文章編號:1003-7136(2024)04-0023-09
Research on the Fine-grained Knowledge Elements of Historical Documents in the Organizing of Timbal Resources
QIN Xi
Abstract:
Timbal, as an important component of ancient cultural heritage, needs to expand its semantic expression into knowledge fine-grained, knowledge integration and knowledge visualization, and fully utilize the powerful document resources to support its knowledge hierarchy.This paper takes the historical documents of timbal as the research object, uses technologies of knowledge element extraction and visualized map, and explores the correlation between surface visual elements and internal knowledge, the construction of knowledge element organization model of timbal documents, and the visualization of vectors with spatio-temporal attributes.It is proposed that the timbal knowledge platform of data fusion should consist of four fundamental databases at least, and prospecting its next pathway of exploration.
Keywords:
timbal; knowledge element; fine-grained; spatio-temporal vector; data fusion
0? 引言
銅鼓是我國古代西南地區具有少數民族代表性的歷史遺物,也是我國古代文化遺產的重要組成部分,為少數民族文化研究提供重要的信息價值。銅鼓資源組織建設目前常見的形式是以銅鼓類型、代表性實物圖片、實物屬性、現代研究文獻為數據元的數據庫為主?!白屛奈锘钇饋怼保⒉皇呛唵蔚卦谄魑镎故旧嫌善矫孀兞Ⅲw、靜態變動態,其背后應該有一個知識體系[1]。作為考古和歷史研究的對象,銅鼓的史料文獻應作為參考文獻及研究對象進入資源組織建設范疇,但由于其具備古籍特殊的語法結構和語言特點、特定的時間空間屬性、人物及事件屬性等方面的處理特征,現代文獻的知識元提取技術很難直接運用于史料研究,銅鼓資源組織將古文獻納入建設體系就顯得尤為困難。
隨著可視化技術在資源揭示與挖掘方面的廣泛運用,學者和大眾對銅鼓資源的需求向知識細粒度化、知識集成、知識可視化方向拓展,對史料文獻的需求表現為更豐富的語義描述與知識關聯。他們關注的不僅是銅鼓本身的特征和屬性,還強調圍繞文物資源的領域背景知識展開,關注與其相關的空間、地理、事件、人物等信息以及隨著時間變化的發展規律[2]。因此,建立合理的時空數據可視化的史料文獻細粒度知識組織模型,提供數字信息閱讀方案,是推動銅鼓研究和知識管理的有效路徑。
1? 相關研究
1.1? 銅鼓信息資源相關研究
銅鼓資源建設方面,廣西民族博物館構建了目前最齊全的銅鼓數據庫[3],以圖片和文字為知識元作儲存和展示,以關鍵詞方法對器物進行描述。為了構建世界上最完備的銅鼓專業數據平臺,廣西民族博物館還對館藏銅鼓進行數據采集和數字化保護,獲取高精度幾何信息、紋理信息、色彩信息,實現文物本體客觀、完整的信息數字化存檔,并制作銅鼓高精度三維模型、高精度影像、線劃圖、展開圖等。
在信息組織方面,單獨面向銅鼓的知識組織體系相對缺乏,但文物知識組織方法是相通的。學者們研究構建不同類型的館藏文物知識體系,主要從文物作為知識本體方面展開。如從中、細粒度層面設計文物知識組織方法,對“后母戊”青銅方鼎進行實例研究[4];針對文物圖像資源建立基于知識元構造的細粒度知識表示模型[5],以及基于關聯數據的文物資源知識關聯模型[6];對比不同元數據架構的特征,選擇出最佳的架構方式,并提出文物信息資源元數據應用策略[7];結合國際上數字博物館領域成熟的元數據,對“文物館藏信息指標體系規范”進行修改完善[8]。在國外,斯里蘭卡4個博物館2600多個資源記錄,通過映射到蓋蒂《藝術與建筑敘詞表》(AAT),實現了博物館詞匯之間的資源元數據交叉描述[9]。
1.2? 史料文獻細粒度知識元相關研究
數字人文作為人文學科的一種研究新范式正在古籍研究領域蓬勃發展,由此催生出的文本遠讀、統計、分析等數字人文工具也層出不窮。史料的文本標注方法上,有基于古籍半自動標記平臺MARKUS的文本標注模型[10];文本分類摘要方面有SikuBERT和SikuRoBERTa預訓練模型[11-12]。
古籍文獻的標引和知識元提取在中醫研究領域的運用相對廣泛,有學者基于病名、病因、辨證、療法、方劑、預后等30多個知識元進行標引,為中醫知識可視化提供了大量的史料基礎[13],多數采用元數據或是本體方法[14]。史料元數據知識組織的研究主要集中在三個方面:提取時空數據和特定屬性數據、建設開放性的時間詞表和地名詞表及其轉換工具、設計時空數據模型[15]。
2024年第4期總第260期
覃熙:銅鼓資源組織中的史料文獻細粒度知識元研究
從史料中提取出描述知識的元數據之后,我們發現仍然難以描述知識之間的復雜關系。知識本體可以描述信息之間的概念關系,但無法建立知識與資源實體間的關聯,并且大多數研究仍在理論階段,尚未運用于實際的知識服務。
1.3? 數據融合的知識組織相關研究
知識組織強調大規模、多種類、跨學科、粒度不一、結構不同的知識互支持、互操作,強調知識建模和表示方式的統一。以用戶需求為導向,數字圖書館多粒度集成知識服務模式已展開,基于顯性、隱性知識鏈接的多粒度知識集合集成方法,通過知識元抽取、標引和鏈接的方法,滿足用戶的知識需求,構建“需求—知識—資源”映射[16]。數據標準方面,國際文獻工作委員會(CIDOC)開發的基于本體的數據模型CIDOC CRM成為國際標準化組織(ISO)的推薦標準[17],它提供了一個通用并且可以擴展的語義框架,適用于任何文化遺產的信息描述,并定義了各類實體、屬性,形成通用的屬性詞表[18]。國際圖聯發布的業內標準《圖書館參考模型》,是一個元數據高層框架,集合了書目記錄功能需求模型FRBR、規范數據功能需求模型FRAD、主題規范數據功能需求模型FRSAD,旨在應用關聯數據環境[19]。知識組織方面,本體匹配技術被廣泛運用,通過融合規則與算法得到新知識的關聯數據知識融合模型[20]。美術館、圖書館、檔案館、博物館等文化記憶機構(以下簡稱:GLAM)領域都經歷了知識組織方法發展的三個階段:分類主題法、元數據方法、本體方法[21]。概念與規則方面,趙蓉英等論述了館藏資源聚合的四個層次:實體文獻整理、數據集成、信息整合和知識聚合[22]。李亞婷對知識聚合、融合、整合作了概念辨析,并將不同粒度的聚合對象(文獻、數據、信息、知識本體)囊括為知識聚合[23]。
綜合以上現狀,現有的銅鼓資源平臺構建方式普遍采用空間表述的策略,側重于資源表層視覺特征的知識表示,缺少資源內部特征的語義描述,以及銅鼓研究背后整個知識體系的深度結合;細粒度知識元提取以及數據融合的知識組織研究雖已有理論體系,但未能進入到具體的銅鼓資源建設實戰中。因此,有必要解決表層視覺元素與內在知識體系之間的“語義鴻溝”現象,通過在史料文獻與銅鼓實物之間建立一致性的細粒度數據融合,實現表層視覺特征與知識體系的有效關聯和映射,為銅鼓資源引入具有知識背景的時空結合的表述策略,從而進一步完善銅鼓資源組織的建設。
2? 基于文獻細粒度知識元的銅鼓資源組織表示過程
2.1? 銅鼓文獻數據源及知識組織模型
關于少數民族鑄造和使用銅鼓的文獻記載,自漢以來,史不絕書[24]。曾任廣西壯族自治區博物館館長、中國古代銅鼓研究會理事長的蔣廷瑜先生編著了《廣西銅鼓文獻匯編及銅鼓聞見記》[25]、《古代銅鼓通論》[26]兩部著作。前者搜集了自漢代以來的廣西銅鼓文獻,分為綜合文獻輯錄、地方志輯錄、銅鼓專論輯錄、銅鼓詩詞;后者包含了銅鼓的記載、收藏、起源、分布、類型、年代、族屬、用途、鑄造工藝、裝飾工藝及其反映的音樂、舞蹈等內容,囊括了銅鼓研究的各方面知識,是非常齊全的銅鼓史料文獻,也是銅鼓資源平臺組織中應當包含的隱性知識體系,可為銅鼓文化知識組織提供重要支撐。本研究以此兩部書為研究對象,并采用文獻細粒度標引平臺作為框架工具,基于數據標引聚合結構化拆分方法進行知識元組織,從語料庫中抽取建模元數據,并緊密適配“數據倉儲”模塊,通過知識圖譜推理、語義搜索核心技術,實現在自主學習、智能文本信息讀取、知識圖譜、文本摘要、內容生成等場景上的應用,提供一種新的信息檢索模式。
銅鼓文獻知識組織模型是其資源平臺構建的邏輯基礎,體現從數據源中提取知識元并建設成數據庫的過程,包括概念定義、技術手段和組織方式等,如圖1所示。首先,確定數據源,即史料文獻與文物實體,兩者之間存在表層視覺元素與內在知識體系的初步關聯。其次,針對史料文獻的文本知識特征和實物表層元素屬性等特征分別選取適合的知識元抽取方法,完成實體抽取和屬性關聯,并通過模型訓練實現知識推理、知識關聯,建立銅鼓實物的表層視覺元素與內在知識體系的一致性和細粒度的元描述。然后,在知識表示層的基礎上通過關系抽取和知識融合,實現多種實體匹配,聯系知識元與命名實體之間的語義映射,實現實體統一、實體消歧、指代消解。最后在知識推理和本體抽取的基礎上,對實體匹配層的數據進行質量評估。最終,銅鼓文獻和相關實物的知識以細粒度形態提供給用戶檢索,以知識圖譜的形式組織和發布。
2.2? 文獻知識元細粒度化及提取
2.2.1? 知識細粒度化及其運用優勢
文獻知識細粒度化是對學術文獻內容的深入解析,將文獻中的復合信息拆解為基本的、離散的且具有明確意義的知識單元,包括但不限于數據、概念、人名、地名、術語等,它們共同構成了知識的微觀基礎,為知識聚合研究提供更多視角。聚合粒度越小,知識單元語義越豐富,因此,作為不能進一步細化、分割的最小的知識單元,細粒度知識元被廣泛運用于GLAM領域,并呈現出兩大優勢:①知識元以足夠細微的描述粒度,與表層視覺元素構建相對吻合的描述關系;②知識元能夠實現知識本體內部與外部復雜語義的組配、關聯和聚合。細粒度知識元能夠在知識本體的表層視覺特征與內在知識體系之間建立多維度、精細、動態的關聯,減少知識表示中的“語義鴻溝”現象[5]。
2.2.2? 銅鼓文獻細粒度知識元提取過程
分詞和標注。數字資源精細化標引一般以文獻結構的最小單元為加工單位,首先開展文獻信息著錄,進而進行知識內容標引。針對史料資源,應將書衣、封面(內封)、牌記、序、凡例、目錄、正文卷目、插圖、跋、簽條、夾紙、???、附錄、封底等每個獨立結構作為著錄單元,將文獻中的人物、機構、地理名稱、事件或其他具有標目意義的關鍵詞作為標引單元。這些都是銅鼓文獻的細粒度知識元,每個標引單元生成一條數據。因古漢語表達的特殊性和語料庫的不完全性,在現代分詞工具進行簡單分詞后,還需要人工進行精準校對。古今地名轉換是本研究的重要工作之一。一千多年以來的社會與政治變遷使得今天的地名與文獻中的大不相同,目前的中國古今地名轉換系統能夠實現歷史行政區劃地名的轉換[27],卻難以運用在《廣西銅鼓文獻匯編及銅鼓聞見記》中所用的通俗地名轉化,例如俚僚、夷僚、交阯、駱越等非行政區名稱的片區地域名。因此,本研究需要運用多種資料的檢索匹配,用人工方式實現古今地名的轉換和地理信息的配準,以完成現代地名的標注。
主題詞提取。利用protégé軟件將本體概念體系可視化并建立知識抽取模型,如圖2。
以《廣西銅鼓文獻匯編及銅鼓聞見記》為例,核心類目有作者、相關事件、古籍名錄、銅鼓描述四大類,擴展元數據則有:作者簡介、生卒年(公歷年/朝代年)、相關其他文獻、古籍原文、注引、卷名、注釋、相關事件時間(公歷年/朝代年)、地名(古地名/今地名)、地理位置標注(地理可視化數據)、事件人物簡介(官職/功名)、簡介文本、相關歷史時間、銅鼓的用途、大小、類型、族屬、鑄造年份、鑄造工藝、裝飾工藝、反映的內容、出土地點、分布特點、出土年份、收藏館、符合描述的實物圖片等30個知識元類目。遵循模型,開展知識標引工作,以形成基于文獻知識內容的語料庫。每個從文獻中抽取出來的知識條目生成一條知識抽取數據。從同一基礎文獻、不同內容位置抽取的同一個人物、職務、地理名稱、事件、專題等信息,原則上應合并為一條數據。
實體關系抽取。主要任務是識別文本中的本體短語以及這些本體之間的語義關系(例如從屬、發生、影響等)并加以歸類[28],涉及模式識別和邏輯推理。實體及關系作為知識圖譜的基本元素,其抽取的準確率和召回率直接關系到后續知識組織的質量。古籍史料屬于詞法分析中未登錄詞數量最多的文獻類別之一,無站點、詞典、開放域的參考。本文采用基于統計機器學習的方法進行實體抽取,對文本語料進行訓練,分析各文獻中的收錄信息、銅鼓屬性信息、時空數據,并利用訓練好的模型去識別實體,構建核心屬性語義場,如表1。
《十道志》,全稱為《十道四蕃志》,乃是唐代武周時梁載言所撰,共計十六卷,為后世研究唐代地貌和疆域等提供了寶貴的重要史料,是唐代全國地理總志。
《太平寰宇記》是古代中國地理志史,記述了宋朝的疆域版圖。廣泛引用歷代史書、地志、文集、碑刻、詩賦、仙佛雜記等,計約二百種,且多注明出處,保留了大量珍貴的史料……
2.3? 銅鼓文獻知識關聯構建
知識關聯構建的最終目標是通過發布知識圖譜,構建高質量的銅鼓資源分析服務平臺,實現表層視覺特征與內在知識的關聯,即對銅鼓文獻知識庫實體、事件或者概念以及它們之間的相關性進行描述。本研究采用一種成熟的基于三元組的表示方式,知識以一個資源描述框架結構的三元組方式進行表示[29]。首先對文獻實體抽取得到的一系列離散的命名實體,例如以“title”為“嶺表錄異”的text中,抽取到命名實體如下:
“鼓大小”:“鼓面圓二尺許,通體均勻,厚二分以外”;
“鼓形式”:“形如腰鼓,而一頭有面。鼓面圓二尺許,面與身連,全用銅鑄。其身遍有蟲魚花草之狀,通體均勻,厚二分以外”;
“用途”:“樂器”;
“相關人名”:“張直方、鄭綱”;
“相關古地名”:“1國,2龔州-賽漢-延慶,3番禺-高州”。
結合時空地理信息對照,再抽取出“相關現代地名”:“1緬甸(伊洛瓦底江流域),2廣西壯族自治區貴港市平南縣-湖北省襄陽市-河北省唐山市灤南縣,3廣東省廣州市番禺區-廣東省茂名市高州市”。
抽取出的實體和關系需要與本體對齊,并將數據融合到一起,構建起一個有關聯的數據網絡。這個過程需要對其中存在的指向歧義進行消解,對知識庫中已有的其他實體關系數據,包括文獻知識元的屬性、本體概念層次關系等,進行計算機知識推理,建立新的實體關聯,豐富和拓展知識網絡,初步完成知識建模。
模型訓練步驟中,我們使用基于Transformer的一種深度雙向語言表征模型——BERT預訓練語言模型,對初步完成的知識建模進行優化,將BERT的兩步關系抽取過程(識別subject的位置和識別 predicate和object的位置)修改為多任務類型,同時預測suject、predicate、object 三部分,最終形成文獻屬性知識關聯可視化圖譜。
3? 文獻時空向量屬性庫建設
時空向量是指將在分詞、標引環節中獲取的年代數據轉換為公元年,形成時間向量;將獲取的地名數據轉換為現代地名或區域,形成空間向量。為保證建成高質量的知識圖譜,對存疑的地名需加強人工干預識別。如《林邑記》記載的“浦通銅鼓,外越安定、黃岡、心口”,此處“銅鼓”在機器語言中無法識別為地名,經聯系下文的地名,判斷應為廣西壯族自治區桂平市銅鼓灘,因此,該文本對應地名增加一標注為“桂平”。再如,《歐陽頠傳》中記載“欽南征夷僚,擒陳文徹,所獲不可勝計,大獻銅鼓,累代所無”,在標引環節中對“夷僚”一詞賦予的空間定義較寬泛,涉及云南、貴州、湖南、廣東、廣西等地的僚族,因此,該文本可從人名進行考證。《南史》稱,陳文徹是西江俚帥,西江即今廣東肇慶一帶,陳文徹便是那里俚人的首領。因擒獲他而得到大量的銅鼓,于是此文本應增加一地理標注為“肇慶”。經過大量的人工識別和討論考證,進一步精確向量屬性,采用規則和監督學習相結合的方法實現古文獻與時間地圖向量界面。
從本體構建、實體關系抽取、數據融合、圖數據庫存儲到檢索與可視化,整個銅鼓文獻知識構建的數據流中,需要確保不同模塊之間的數據格式和接口是兼容的,例如,實體關系抽取模塊的輸出(實體和關系)需要能夠被圖數據庫識別和存儲,同時,圖數據庫的查詢結果應該能夠被可視化工具所展示。一些平臺能提供從知識獲取到知識應用的端到端解決方案,包括實時動態時序知識圖譜和AI平臺的構建。在實現不同技術模塊之間的數據轉換與銜接時,還需要考慮到系統的可維護性、擴展性以及性能要求,確保知識數據庫能夠適應不斷變化的數據和查詢需求。
4? 探索:數據融合的銅鼓知識平臺建設
銅鼓具有樂器和社會文化象征的雙重角色,其豐富的史料文獻,以及在藝術、工藝、歷史價值和學術研究中展現的跨文化特性,使它成為連接不同民族和時代的文化橋梁,而且為研究中國南方及東南亞地區的古代民族歷史提供了珍貴視角,因此,銅鼓知識平臺的建立具有重要的學術和文化價值。本文以部分銅鼓史料文獻,漢晉南北朝至民國的331條古代文獻記載文本、125幅圖片、1383具銅鼓實測記錄資料,作為細粒度知識表示的研究對象,通過知識元的處理理論,建立起史料文獻高層語義特征與知識圖譜表層視覺特征的映射,為銅鼓研究提供新的文獻知識表示思路。
然而,為徹底解決銅鼓內部知識、外部特征以及語義特征等眾多資源的“語義鴻溝”現象,更多的銅鼓史料文獻以及現代屬性需要加入到完整的銅鼓資源組織中來,如現存世銅鼓圖片/視頻/音頻、館藏地點、出土記錄。完整的銅鼓知識平臺應至少由史料文獻庫、現存世器物庫、時空向量庫、基礎知識及研究成果庫四個數據庫組成的龐大知識庫提供支撐,并規范術語,統一數據結構,建立本體辭典。通過數據映射技術對不同數據源中抽取詞匯的映射關系建立數據融合,在模型訓練過程中對不同源數據指向同一現實客體的數據進行融合,對不同術語描述的同一客體數據進行融合?,F存世器物庫中的銅鼓特征,依然需要提取細粒度知識元,進行精確的語義描述,才能與其他庫相關的知識元進行關聯,實現史料文獻與銅鼓實體器物的匹配。通過構建數據中臺,實現結構化、半結構化、非結構化數據的接入和異構數據源儲存管理,建立起銅鼓資源“自上而下”的知識表示方式,不斷豐富知識存量和提升知識圖譜的質量。在未來的研究中,還需要在銅鼓資源組織中對Spark或者Hadoop等數據平臺的融合功能作進一步實踐探索。
參考文獻:
[1]李峰.文物知識聚合與傳播的初步研究:以上海博物館“宋徽宗與他的時代數字人文專題”為例[J].東南文化,2022(3):169-177,191-192,197-199.
[2]高勁松,楊慧娟,付家煒,等.數字人文視域下可移動文物時空數據模型構建研究[J].數字圖書館論壇,2022(1):37-46.
[3]廣西民族博物館.銅鼓[EB/OL].[2024-02-26].http://www.amgx.org/Collection/Treasure/tonggu?name=%E9%9 3%9C%E9%BC%93&typecode=tonggu.
[4]李迎迎,孫玉琦.文化傳承視角下館藏文物多粒度知識組織研究[J].數字圖書館論壇,2022(8):65-72.
[5]高勁松,付家煒.基于知識元的文物圖像資源細粒度知識表示方法研究[J].情報科學,2022,40(1):16-24.
[6]劉思洋.基于關聯數據的館藏文物資源知識關聯模型研究[D].武漢:華中師范大學,2019.
[7]龔花萍,孫曉,劉春年.文物信息資源元數據模型、實施標準與應用策略[J].情報科學,2015,33(2):80-84.
[8]賈君枝,史璇.數字博物館元數據標準構建研究[J].山西大學學報(哲學社會科學版),2015,38(1):114-119.
[9]WIJESUNDARA C,SUGIMOTO S,NARAYAN B,et al. Bringing cultural heritage information from developing regions to the global information space as linked open data:an exploratory metadata aggregation model for Sri Lankan heritage and its extension [C]//The 7th Asia-Pacific Conference on Library and Information Education and Practice (A-LIEP),November 3-4,2016,Nanjing University,Nanjing:117-132.
[10]于亞秀,李欣.數字人文視域中的古籍文本標注方法研究:以MARKUS為例[J].大數據,2022,8(6):15-25.
[11]徐潤華,王東波,劉歡,等.面向古籍數字人文的《資治通鑒》自動摘要研究:以SikuBERT預訓練模型為例[J].圖書館論壇,2022,42(12):129-137.
[12]胡昊天,張逸勤,鄧三鴻,等.面向數字人文的《四庫全書》子部自動分類研究:以SikuBERT和SikuRoBERTa預訓練模型為例[J].圖書館論壇,2022,42(12):138-148.
[13]黃俊偉,劉金濤,史延昊,等.基于知識元標引的中醫古籍研究回顧與反思[J].北京中醫藥大學學報,2021,44(8):694-699.
[14]DUTTA B,GIUNCHIGLIA F,MALTESE V.From knowledge organization to knowledge representation[J].Knowledge organization,2014,41(1):44-56.
[15]夏翠娟,婁秀明,潘威,等.數智時代的知識組織方法在歷史地理信息化中的應用初探:兼論圖情領域與人文研究的跨學科融合范式[J].圖書情報知識,2021,38(3):37-49.
[16]畢崇武,王忠義,宋紅文.基于知識元的數字圖書館多粒度集成知識服務研究[J].圖書情報工作,2017,61(4):115-122.
[17]What is the CIDOC CRM?[EB/OL].[2024-02-28].https://www.cidoc-crm.org/.
[18]王紹平.FRBR與面向對象模型[J].新世紀圖書館,2007(2):11-14.
[19]胡小菁.國際圖聯圖書館參考模型及其應用[J].上海高校圖書情報工作研究,2018,28(3):38-39.
[20]高勁松,梁艷琪.關聯數據環境下知識融合模型研究[J].情報科學,2016,34(2):50-54.
[21]夏翠娟.文化記憶資源的知識融通:從異構資源元數據應用綱要到一體化本體設計[J].圖書情報知識,2021(1):53-65.
[22]趙蓉英,王嵩,董克.國內館藏資源聚合模式研究綜述[J].圖書情報工作,2014,58(18):138-143.
[23]李亞婷.知識聚合研究述評[J].圖書情報工作,2016,60(21):128-136.
[24]洪聲.廣西古代銅鼓研究[J].考古學報,1974(1):45-90,188-191.
[25]蔣廷瑜.廣西銅鼓文獻匯編及銅鼓聞見記[M].桂林:廣西師范大學出版社,2014.
[26]蔣廷瑜.古代銅鼓通論[M].北京:紫禁城出版社,1999.
[27]中國歷史地名查詢系統[EB/OL].[2024-02-28].http://archive.ihp.sinica.edu.tw/hplname/.
[28]
CHINCHOR N, MARSH E.Muc-7 information extraction task definition[C]//Proceedings of Seventh Message Understanding Conference(MUC-7),April 29-May 1,1998,Fairfax, Virginia:359-367.
[29]杜悅,常志軍,董美,等.一種面向海量科技文獻數據的大規模知識圖譜構建方法[J].數據分析與知識發現,2023,7(2):141-150.
作者簡介:
覃熙(1980— ),女,碩士,副研究館員,任職于廣西民族大學圖書館。研究方向:知識組織、數字人文。