999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

甲骨文研究中跨模態知識圖譜的重要性芻議

2020-11-16 07:46:04韓勝偉
殷都學刊 2020年3期
關鍵詞:語義模態研究

熊 晶, 韓勝偉

(1.安陽師范學院 計算機與信息工程學院, 河南 安陽 455000;2.甲骨文信息處理教育部重點實驗室,河南 安陽 455000)

一、前言

甲骨文是目前發現的最早成體系的漢字,是中華民族傳統文化的瑰寶。甲骨文因其記錄了3000年前殷商時期各方面的事件,具有極高的文物價值、史料價值和研究價值[1]。從1899年甲骨文被發現以來,經海內外學者近120年前赴后繼的探索,甲骨文的歷史奧秘逐漸揭開,針對甲骨文的研究嶄然成為一門舉世矚目的國際性顯學——甲骨學[1]。甲骨學是以甲骨文和它的載體卜甲、卜骨及相關考古學現象為研究對象,整合古文字學、歷史學、歷史文獻學、文化人類學等多個學科的理論、方法和材料探析甲骨文和甲骨自身規律及商周歷史文化的專門性學科[2]。但是傳統的甲骨學研究方法存在知識體系龐大、學習難度高、學習周期長、知識關聯性弱、知識共享程度低等問題[3],若能將海量的甲骨學知識點以語義關聯方式進行組織和管理,可以有效解決或緩解這些問題。2019年10月18日,“殷契文淵”——甲骨文大數據平臺正式發布,該平臺為甲骨學研究提供大數據支持,標志著甲骨學研究進入智能化時代。正如中國社會科學院學部委員、中國社會科學院甲骨學殷商史研究中心主任宋鎮豪先生在紀念甲骨文發現120周年國際學術研討會學術工作委員會上所說:“新世紀、新機遇,新使命,在甲骨文的整理保護與科學研究方面,應該有新的作為。”因此,新時代的甲骨學研究需要開啟新的研究模式。

二、人工智能時代的甲骨學研究

近年來,人工智能技術發展迅猛,在各行業都有了成熟的應用或突破性的進展,如人臉識別、語音助手、自動駕駛等。總體而言,人工智能在感知層面的發展較好,如人臉識別技術。但是,在認知層面人工智能的發展相對滯后,如常識理解。其主要原因是目前的人工智能絕大多數是基于大數據、大算力和強算法的,需要大量的人工進行數據的標注和處理,呈現“人工有余而智能不足”的現象。而認知層面的人工智能需要計算機具備認知理解和知識推理的能力,需要有深厚的背景知識作為基礎。甲骨學是屬于融合了感知智能和認知智能且認知多于感知的綜合研究,因此勢必需要一個龐大的知識庫作為支撐。知識圖譜[4]就是一個可以提供領域背景知識超大規模的知識庫,它通過“節點-邊-節點”的方式,將知識點進行語義關聯,從而構成一個龐大的知識網絡,可望實現人工智能從感知智能向認知智能邁進。因此,構建甲骨學知識圖譜是一項極其重要的基礎工程,可為甲骨學的知識共享和推理提供基本需求。

因此,人工智能時代的甲骨學研究需要實行人機結合、分工明確、通力合作、機服務人的策略和部署。即甲骨文專家和計算機各自充分發揮自身優勢,由計算機負責感知層面的圖像識別、信息檢索等有規律可循、有模式可用的重復性強的工作;由甲骨文專家負責認知層面的知識推理、正誤判斷等無固定模式、需要決策的創造性強的工作。在現階段,總體思路是計算機服務于甲骨文專家,輔助專家進行甲骨學研究。

隨著甲骨學研究的不斷推進,我們已經積累了相當規模的基礎數據,包括甲骨學文獻、甲骨文著錄、數據庫、文本語料庫、視頻、圖像、3D模型等多種形式,已體現出多模態特征[3]。因此,我們的目標是基于多源異構數據源,構建跨模態的甲骨學知識圖譜。

三、構建跨模態知識圖譜的重要性

作為一門綜合學科,甲骨學的研究涉及到多領域多來源的知識,且知識存儲格式不統一,知識表示方式各異,涉及到字(甲骨文字形字體)、圖(甲骨文圖片)、文(甲骨文文本)、表(數據表格)、著(文獻及著錄)等多種形式。管理、共享和重用這些知識需要一個有效的工具,跨模態知識圖譜可堪此重任,且在解決甲骨文考釋和綴合兩大難題方面有著重要作用。跨模態知識圖譜示意圖如圖1所示。

圖1 甲骨學跨模態知識圖譜示意圖

1.在知識管理和共享方面的重要性

甲骨學研究必須依賴大量的文獻資料,并基于文獻進行一系列的知識關聯分析。如學者與文獻的關系、學者及其合作關系、研究機構及其合作關系、文獻之間引用與被引關系。而且,甲骨學的研究必須借助于相關的輔助學科。如借助于考古學,去解決甲骨出土的問題;借助于文獻學,去解決甲骨學中的殷商歷史問題;借助于語言學理論,去解決甲骨學的語言文字的問題;借助于自然科學中的天文學、地理學、物理學和數學,去解決甲骨學中的諸方面的問題[5]。這些問題都涉及到文獻的計量與分析技術,因此構建甲骨學文獻圖譜極其重要。

甲骨文信息處理為改善傳統的甲骨學研究開拓了一條新的有效途徑。經過20年的甲骨文信息處理的研究積累,我們設計和構建了一系列甲骨文數據庫,如甲骨文語義詞典、甲骨文著錄數據庫、甲骨文文獻數據庫、甲骨文綴合數據庫等。這些數據庫符合一定的模式,存儲的是知識元組,是從海量的甲骨文知識數據源中提煉出結果,是知識在一定程度的整理和總結。因此,建設甲骨文數據庫有著重要作用。

利用計算機進行甲骨文研究,需要考慮甲骨文的語法結構、句法結構以及語義信息,因此甲骨文的文本整理成為一項基礎工作。甲骨文文本既包括甲骨文釋文,也包括甲骨文文獻及著錄的文本化,還包括涉及甲骨文研究的網頁、教材、評論等信息。基于甲骨文文本,通過構建語言模型,可以進行文本挖掘、實體識別、關系抽取、語義相似度計算等機器學習和自然語言處理等自動化工作。因此,構建甲骨文文本語料庫具有重要作用。

甲骨文研究的對象包括甲骨照片、拓片、摹本等圖像,如何從這些圖像中自動檢測和識別出甲骨文字,是甲骨文信息處理研究的重要任務。與其他自然場景的圖像處理不一樣的是,甲骨圖像含有更為特殊的噪聲,而且對拓片圖像進行處理時,往往會將甲骨上的生物紋理識別為文字筆畫。甲骨片的殘缺以及甲骨上的殘字模糊字給甲骨文字的檢測與識別帶來極大的挑戰,往往需要綜合考慮和對照甲骨照片、拓片、摹本以及釋文等信息。因此,構建甲骨文圖像資源庫是極其重要的。

甲骨學體系龐大,知識點眾多,知識表示及存儲格式不統一,而且甲骨文專家對甲骨文的辨識依靠長期的學術鉆研和經驗積累,這種經驗知識僅存儲在專家的頭腦中,并不能實現知識的有效共享。如何利用一種有效的技術實現現有甲骨文知識的共享,并方便計算機對其進行理解和處理?本體作為共享概念模型的明確的形式化規范說明[6]可以為這一問題提供解決方案。甲骨文信息處理研究中,為了給甲骨文基礎數據提供語義信息,需要采取一種機器可讀的表達形式。構建甲骨文本體可以為甲骨文數據提供語義表達及知識推理功能,因此,對甲骨文知識的共享、重用和推理具有極其重要的作用。

綜上所述,管理和共享甲骨學知識需要整合各種數據資源,并從這些多源異構的數據中抽取知識實體,并挖掘和構建實體之間的語義關聯,這樣就構建了一個大規模的跨模態知識圖譜。具體的構建流程如圖2所示。

圖2 甲骨學跨模態知識圖譜的構建流程

2.在甲骨文考釋方面的重要性

甲骨文字考釋,是利用其他古文字材料和傳世字書把過去不認識的甲骨文字釋讀出來,從而把不易理解的甲骨卜辭講解清楚,為其他研究做準備。甲骨文考釋的常用方法有“字形比較法”“辭例推勘法”“偏旁分析法”等。

“字形比較法”一方面要求熟悉每一個甲骨字的筆畫特征,還要深入把握同一個甲骨文字的不同異體,需要明確哪些筆畫區別字形,哪些筆畫不區別字形,通用無別;而且還要對甲骨文字的類組差異、異體分工等現象有深入理解,需要全面梳理甲骨用字情況。另一方面,要求把握每一個已識甲骨字的形體演變,總結出基本構字偏旁的歷時演變規律,因此需要掌握不同時期甲骨字關聯的其它形體的古文字。

“辭例推勘法”主要通過不同辭例的互相比較、分析,歸納出甲骨未釋字的語義特征和范圍,鎖定釋讀方向。雖然多數情況下不能直接得出釋讀結論,但卻是“字形比較法”的重要補充,具有重要的作用。因此,在不能肯定某一未釋甲骨字究竟為何字時,能推測其所屬的語義范疇也是極其重要的。

“偏旁分析法”是形體分析法的重要組成部分,也是學界常用的考釋文字的手段和方法,它是通過文字構成部件及其組構關系的分析來達到考釋文字的目的。把這種方法提高到一種具有科學意義的研究手段,是從清末孫詒讓開始的。其做法是先把已經認識的古文字,按照偏旁分析為一個個單體,然后把各個單體偏旁的不同形式收集起來,研究它們的發展變化;在認識偏旁的基礎上,最后再來認識每個文字[7]。因此,明確偏旁和文字之間的關聯和位置關系也是一項重要工作。

因此,對甲骨文考釋而言,知道哪一個字出現在哪些甲骨片上,知道某個甲骨字的異體字有哪些,知道哪些甲骨片記載于哪些著錄,知道哪些文獻研究過哪些甲骨片是至關重要的。這就勢必要求建立這些知識元素之間的關聯關系,并能通過關系獲取考釋線索,從而輔助甲骨文專家進行考釋研究。跨模態知識圖譜可以很好地滿足這些要求,一個知識圖譜片段如圖3所示。

圖3 甲骨字與甲骨片、異體字的關聯關系

知識圖譜的另一個優勢是鏈接預測和知識圖譜補全,通常知識圖譜補全以鏈接預測的形式來實現。簡言之,在知識圖譜的“節點(頭實體,可用h表示)-邊(節點之間的關系,可用r表示)-節點(尾實體,可用t表示)”結構中,可能會有缺失的元素,知識圖譜補全則是將缺失的元素補充完整。例如,假定有一個鏈接預測任務 (h, r, ?) ,對于一個給定的實體h,和一個給定的關系r,預測的任務就是確定哪個實體或者哪些實體可以形成一個知識三元組 (h, r, t)。利用知識圖譜補全的方法,可以預測甲骨文中殘缺或模糊字語義鏈接,從而為甲骨文專家進行考釋提供有價值的線索。

綜上所述,跨模態知識圖譜在甲骨文考釋方面具有重要的作用。

3.在甲骨文綴合方面的重要性

通過綴合而得到的甲骨刻辭具有相當高的史料價值。刻寫著文字的龜甲獸骨,有的早在殷代就已斷裂,有的經過三千多年地下的埋藏腐蝕,已成碎片殘骨,有的在出土后遭人為的原因而斷缺。把斷片盡可能綴合復原,是甲骨文研究的重要工作之一[8]。甲骨文經過綴合復原的處理,才能找出各辭之間的相互關系,恢復當時的卜辭文例,從而成為認識商代社會的重要史料[9]。

進行甲骨文綴合研究,需要綜合考慮多種數據來源和數據屬性,如甲骨圖片、甲骨綴合圖版、釋文考釋、綴合人、綴合方法、綴合時間、增量綴合(即在前人綴合成果上增加的綴合新例)情況、著錄、發表的綴合文章、綴合出處等,還需要考慮片形、文字、卜兆、文例、分期等信息。不同時期的甲骨綴合也采用了不同的方法,如甲骨綴合的初級階段多是傳世著錄拓片碎片的零散片斷的綴合,主要是靠學者的學識和聰慧;發展與成熟階段,董作賓首倡的甲骨拓片“定位法”研究,不僅對甲骨文例的研究,而且對零碎的甲骨拓本綴合研究也頗有啟示意義,并愈來愈得到1928年科學發掘殷墟出土甲骨實物的驗證和豐富;“甲骨形態學”研究的新階段,開始對甲骨文的載體——龜甲和胛骨進行深層次、全方位、多角度的研究。如黃天樹等學者對龜腹甲(包括背甲)和胛骨進行了化整為零的齒縫片形態和特征的深層次觀察,為甲骨碎片的求其全體的“定位”的“甲骨形態學”的完善和形成作出了貢獻,推動了甲骨綴合研究的發展[9]。

由此可見,從事甲骨綴合研究,需要專家長期的科研積累和對甲骨材料、文獻的敏銳洞察,一點一滴的綴合線索往往隱含在海量的甲骨數據和傳世文獻中。而且,綴合過程中往往需要各種數據相互印證和信息互補。如較小的拓片無法確定材質時,通常可以用照片或3D來補充;候選綴合片組合是否正確時,通常利用釋文進行驗證。這些線索之間往往有著直接和間接的聯系,一旦找到其關鍵點,就能達到“綱舉目張”的效果。而這些關聯信息一旦存儲和記錄在跨模態知識圖譜中,通過節點路徑查找,可以尋覓“蛛絲馬跡”,從而輔助甲骨文專家進行綴合。

計算機輔助甲骨綴合研究中,排除不正確的綴合候選項也是一個重要內容。一方面,綴合后的甲骨有利于復原甲骨卜辭;另一方面,擬復原的甲骨卜辭也可以印證綴合候選項是否正確。但是,判斷擬綴合的候選甲骨是否正確是一項高要求高標準的工作,完全依賴甲骨文專家仍然無法擺脫現有的研究困境。而知識圖譜可在這一方面“助一臂之力”。基于知識圖譜進行查詢和推理,利用一致性檢驗、異常點分析、團組挖掘,可以發現潛在風險。正因為如此,知識圖譜在金融反欺詐場景中有著廣泛應用。同樣,這一優勢可以遷移到甲骨綴合研究,通過發現“綴合異常”為甲骨文專家提供判斷線索。

綜上所述,跨模態知識圖譜在甲骨文綴合研究方面有著重要作用。

四、 總結

大數據時代,一個場景中缺失的信息往往在另一個場景中重復出現,各種信息重疊和復現,很容易就能實現“用戶畫像”,甲骨文信息處理的研究也是如此。基于甲骨文基礎研究數據的多模態特性,通過構建大規模跨模態的甲骨學知識圖譜,將知識實體的屬性及關系進行知識表示和存儲,就能實現“甲骨畫像”。借助甲骨學知識圖譜,利用人工智能技術可以有效緩解或解決目前甲骨學研究中知識表示、管理、共享及重用等諸方面的問題,從而服務于甲骨文專家從事考釋及綴合方面的研究。

猜你喜歡
語義模態研究
FMS與YBT相關性的實證研究
遼代千人邑研究述論
語言與語義
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
國內多模態教學研究回顧與展望
基于HHT和Prony算法的電力系統低頻振蕩模態識別
認知范疇模糊與語義模糊
由單個模態構造對稱簡支梁的抗彎剛度
計算物理(2014年2期)2014-03-11 17:01:39
主站蜘蛛池模板: 美女高潮全身流白浆福利区| 欧美日韩在线观看一区二区三区| 五月天久久婷婷| 国产国拍精品视频免费看| 亚洲欧洲日产国码无码av喷潮| 国产精品无码制服丝袜| 国产成人精品第一区二区| 九九免费观看全部免费视频| 欧美、日韩、国产综合一区| 日韩第九页| 亚洲另类第一页| 国产在线精彩视频二区| 91精品小视频| 夜色爽爽影院18禁妓女影院| 日a本亚洲中文在线观看| 五月天久久综合| 亚洲最新网址| 欧美日韩亚洲国产| 国内精品伊人久久久久7777人 | 亚洲日韩国产精品综合在线观看| 婷婷99视频精品全部在线观看| 欧美国产中文| v天堂中文在线| 国产噜噜在线视频观看| 九九久久精品国产av片囯产区| 在线五月婷婷| 成人欧美日韩| 亚洲av日韩av制服丝袜| 国产欧美亚洲精品第3页在线| 欧美精品xx| 亚洲经典在线中文字幕| 亚洲欧美成人网| 激情六月丁香婷婷四房播| 丁香五月亚洲综合在线| 欧美性猛交xxxx乱大交极品| 中文字幕乱码二三区免费| 国产特级毛片| 日本91视频| 国产成人h在线观看网站站| 国产精品lululu在线观看| 亚洲国产欧美目韩成人综合| 秋霞国产在线| 国模私拍一区二区 | 亚洲成在人线av品善网好看| 亚洲 欧美 中文 AⅤ在线视频| 中文字幕免费视频| 午夜精品久久久久久久99热下载 | 亚洲伦理一区二区| 国产女主播一区| 免费在线看黄网址| 国产精品99久久久| 九色最新网址| 久久精品一品道久久精品| 久久精品波多野结衣| 四虎精品国产永久在线观看| 丁香婷婷激情综合激情| 一本大道无码高清| 国产精品视频999| A级毛片无码久久精品免费| 亚洲高清国产拍精品26u| 亚洲精品在线观看91| 久久久精品无码一二三区| 日本一区高清| 亚洲成a人片77777在线播放| 欧美日韩国产在线播放| 国产精品专区第一页在线观看| 欧洲日本亚洲中文字幕| 国产香蕉97碰碰视频VA碰碰看| 国产91全国探花系列在线播放| 亚洲欧美日韩另类在线一| 毛片在线播放网址| 成人亚洲天堂| 亚洲综合香蕉| 国产97公开成人免费视频| 国产成人综合在线视频| 亚洲日韩每日更新| 999精品免费视频| 丝袜美女被出水视频一区| 91色在线视频| 精品无码一区二区三区电影| 中美日韩在线网免费毛片视频| 久久永久精品免费视频|