999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

古籍數字化國內外研究現狀分析與路徑構建研究

2023-11-24 06:34:34李世鈺張向先侯力鐵張承坤
現代情報 2023年11期
關鍵詞:數據庫內容研究

李世鈺 張向先 沈 旺* 侯力鐵 張承坤

(1.吉林大學商學與管理學院,吉林 長春 130012;2.長春中醫藥大學基礎醫學院,吉林 長春 130117)

古籍是歷史文化中誕生的重要文化資源,具有豐富的內容和多樣的形式。然而隨著時間的推移,古籍的保存受到傳統記錄、表現和傳承方法的限制,其在長期保存上面臨一定的困難與問題,如古籍載體的老化與破損、古代帝王陪葬制度、戰爭或政治因素導致的損毀、古籍轉運過程中的佚失、轉謄抄錄過程中受個人意見等影響造成的刪減等,所以對古籍實施數字化工程是保護內容完整的重要方式。

1949年,羅貝托布薩首先使用計算機輔助編輯了大型書籍《托馬斯著作索引》,而在國內,王曉光等[1]首先引入數字人文研究,開始對敦煌壁畫進行圖像底層視覺的標注。伴隨著數字人文研究的興起,古籍數字化的研究內涵逐漸豐富,一方面現代信息技術的應用可以將古代文獻轉化為電子媒體的形式,通過光盤、網絡等介質保存和傳播[2];另一方面針對數字化后古籍的挖掘與利用也日益增多。目前在世界很多國家和地區都開展了古籍數字化的相關項目[3-5],涉及范圍廣泛,包括少數民族古籍、中醫古籍、單書等內容。

可以看出,古籍數字化研究內涵日趨豐富。因此,本文旨在通過國內外古籍數字化主要研究內容,并構建古籍數字化研究路徑,明確古籍數字化的研究意義與現實作用。同時從古籍數字化研究路徑視角出發,藉由國內目前相對于國外古籍數字化研究的差距,找尋我國古籍數字化的不足與缺陷,探索我國古籍數字化未來的研究思路與發展方向。

1 國內外古籍數字化研究現狀分析

研究借助國內外古籍數字化已發表文獻,利用文獻計量的方法挖掘古籍數字化研究的目的、主題與發展階段,結合代表性文獻內容分析,歸納古籍數字化文獻的方法、技術與特點,為古籍數字化路徑建設提供參考依據。

1.1 文獻數據獲取

研究以“古籍數字化”為主題方向在國內外文獻數據庫中進行檢索,但英語中缺乏“古籍”一詞的對應表述,且古籍又包含善本、手稿、拓片等形式,同時古籍數字化項目的目的多以實現古籍的數字化,構建古籍數據庫與數字圖書館為成果以供整理完成的古籍可以進一步應用,因此本文使用古籍形式,即“古籍(Ancient book、Ancient Work)”“善本(Rare Book、Rare Edition)”“手稿(Manuscript)”“拓片(Rubbing)”“碑(Inscription、Monumental Writing)”與數字化相關形式,即“數字化(Digitization)”“數據庫(Database)”“數字圖書館(Digital Library)”組合作為檢索關鍵詞。即中文檢索式形為:SU=(古籍 &數字化)、SU=(古籍 &數據庫)、SU=(古籍 &數字圖書館)等15個組合出的檢索式。英文檢索形為:TS=(Ancient Book AND Digitization)、TS=(Ancient Book AND Database)、TS=(Ancient Book AND Digital Library)等24個組合后的檢索式在中國知網數據庫CNKI和Web of Science核心合集數據庫進行文獻檢索,檢索日期為2023年1月4日。在我國國家標準化管理委員會2008年頒布的《古籍著錄規則》[6]中,古籍主要是指1912年以前在中國書寫或印刷的、具有中國古典裝訂形式的書籍。由于手稿等載體形式在現代文獻同樣具備,同時為了保證國內外古籍研究時間的一致性,研究根據《古籍著錄規則》,剔除掉了研究對象為1912年之后的文獻以及不符合古籍數字化主題的文獻,最終得到了中文文獻3 222篇,英文文獻998篇。

圖1統計了國內外古籍數字化文獻年份分布,根據統計結果可以看出,國內外關于古籍數字化的研究均始于20世紀80年代中期,在這一時間數字化技術開始逐步得到應用,并在當前已得到了廣泛發展。隨著國內數字化技術的不斷發展和國內文化遺產保護意識的提高,數字化古籍研究在國內得到了更多的關注和支持,國內關于古籍數字化的研究自2000年后增長迅速。國外研究總體呈現上升趨勢,伴隨著學者和社會公眾對于數字資源需求的增加,相關研究在2015年后穩定在每年100篇左右,這表明古籍數字化研究逐步演變為全球性的趨勢,同時也表明數字化技術在保護和傳承文化遺產方面具有重要意義,得到了國際社會的廣泛認可和支持。無論是國內還是國外的相關研究,在近些年都逐漸趨于穩定,其計量結果可以為古籍數字化路徑建設提供成熟的依據。

圖1 國內外古籍數字化文獻年份分布

1.2 文獻計量分析

研究利用詞頻統計、關鍵詞共現與聚類及Timeline視圖的方式對古籍數字化文獻的研究目的、主題與階段進行挖掘。

1.2.1 研究目的分析

文獻標題是文獻研究目的最直接的體現,能夠包含論文的研究方法、對象與領域等內容。研究利用Jieba分詞,使用Python語句對檢索到的文獻標題進行分詞與去停用詞處理,并進行詞頻統計,最終分別生成了國內外文獻標題的詞云圖如圖2、圖3所示,用以對當前古籍數字化研究的廣泛目的予以展現。

受檢索式影響,中文詞匯“古籍”“數字化”“圖書館”“數據庫”以及英文詞匯“digital”“database”“ancient”等詞占比較高,但仍有許多其他詞匯具有較高的詞頻,反映出了國內外古籍數字化的主要研究目的。

首先,圖2結果顯示,在國內研究進展中,古籍整理與保護是古籍數字化重要的研究目的。古籍整理與保護是保證古籍存續的重要工作,而數字化可使古籍脫離傳統紙質等載體的桎梏,減少古籍的物理損耗,顯然古籍數字化已成為古籍長久保存的重要手段。而在圖3國外文獻的標題詞云圖中可以看出,“recognition(認出)”“identification(識別)”等詞的高詞頻結果同樣說明國外對于古籍完整性的重視,反映出對于古代文獻保護與傳承的努力。

同時圖2和圖3反映出,國內外古籍數字化研究有各自側重的研究對象。我國的古籍數字化研究涉及到“中醫古籍”“民族古籍”等明顯有國內文化特征的研究對象。而國外對“手稿”這一對象的研究相對較多,這與國外古籍多以手稿形式呈現有關。同時,由于國外包含諸多國家和地區,所以能夠看出國外的研究涉及對個別文化、文明與語種的研究。如詞云圖中體現的與中世紀(Medieval)時代和阿拉伯(Arabic)文化相關的研究。

1.2.2 研究主題分析

關鍵詞是一篇文獻中的核心詞匯,反映了論文研究中最核心的研究主題。通過對關鍵詞的計量,可以呈現相關研究的熱點方向。

研究使用CiteSpace,以檢索文獻的關鍵詞作為標簽進行分析,得出“古籍數字化”研究主題下關鍵詞的共現結果。

圖4和圖5展示了文獻檢索結果的關鍵詞共現圖。其中,節點越大,表明該關鍵詞出現的詞數越多,連線表示關鍵詞之間存在共現關系。由于獲取的文獻,尤其是中文古籍數字化相關文獻數量較多,導致節點與連線相對密集,所以進一步計算節點的中介中心性用于衡量其中介作用,中介中心性較高的節點處在多個其他節點中間,把持節點之間的連接通道,因此中介中心性大于0.1可以認為是圖中的關鍵節點。圖4中,“數據庫”節點的中介中心性達到了0.33,“數字化”“圖書館”“古籍”“古籍整理”“中醫古籍”等節點的中介中心性也均大于0.1,說明這些節點被廣泛提及。而在圖5的英文文獻關鍵詞中,“digital library(數字圖書館)”“cultural heritage(文化遺產)”也均為中介中心性大于0.1的節點。

圖4 國內古籍數字化文獻關鍵詞共現圖

圖5 國外古籍數字化文獻關鍵詞共現圖

除高中介中心性節點以外,高頻關鍵詞同樣作為關鍵詞共現中的重要節點出現,如“古籍保護”“古籍整理”等文獻標題中同樣高頻的詞匯,在關鍵詞中擁有100以上的高詞頻出現率,這進一步佐證了針對文獻標題的分析結果。而在標題高頻詞與高中介中心性節點詞及它們的近義詞之外,如圖4中的“元數據”“數據挖掘”“古籍利用”,圖5中的“deep learning(深度學習)”“convolutional neural network(卷積神經網絡)”“image segmentation(圖像分割)”等詞也均為各自共現圖中排名在前30以內的高頻關鍵詞。

可以看出,古籍數字化研究已開始多樣化發展,針對數據標準,古籍內容的挖掘與相關開發工作均有所開展,而國外在這一領域對于機器學習、深度學習等信息化技術有著相對更加具體的運用。

由國內外關鍵詞共現結果可以看出,古籍數字化研究主題主要包含:①數字化技術的應用,包括數字化技術在古籍文獻數字化、古籍整理、數字化圖書館建設等方面的應用;②數據標準化研究,主要關注如何建立符合古籍數字化標準的著錄規則與分類規則,以方便數字化古籍數據的管理和共享;③信息技術在古籍數字化中的應用,主要關注如何將信息技術手段如機器學習、深度學習等運用到古籍數字化的各個方面,以提高數字化效率和質量。

研究進一步根據檢索結果的關鍵詞共現圖進行了關鍵詞聚類,以發現古籍數字化相關研究中的主要研究主題與研究方向。圖6和圖7分別展示了國內外研究關鍵詞的聚類結果,中文關鍵詞的聚類最終得到了147個類別,其中前17個類別的聚類關鍵詞數不少于5個。這17個類別的Silhouette(聚類平均輪廓值)均大于0.801。而國外文獻關鍵詞共得到158個聚類類別,其中前15個類別聚類的關鍵詞數量均不少于6個。這15個類別的Silhouette值均大于0.879。通常Silhouette值大于0.5即可認為聚類結果是合理的,Silhouette值大于0.7即可認為聚類結果是令人信服的。可見,本研究對于國內外研究關鍵詞的聚類結果具有較強的說服力。

圖7 國外古籍數字化文獻關鍵詞聚類圖

通過左上角的參數可以看出,圖6 Modularity即模塊化參數為0.5993,圖7為0.842,說明圖中各個節點的劃分效果較好。Weighted Mean Silhouette是用來衡量圖中集群同質化程度的參數,在圖6中達到0.8672,圖7達到0.9336,說明集群同質化效果良好。

通過國內外古籍數字化文獻關鍵詞聚類結果可以看出,雖然受檢索式影響導致“數據庫”等詞在文獻標題與關鍵詞中都作為高詞頻出現,但國內聚類結果所出現的“數據庫”與“語料庫”及國外古籍數字化文獻關鍵詞聚類中排名靠前的“creating digital libraries(建立數字圖書館)”?!皊mall museum(小型博物館)”等結果仍表明,古籍內容挖掘及相關開發工作是當前古籍數字化工作的重要方向,其能夠挖掘古籍文獻中的知識和信息,也是開展古籍內容挖掘研究與開發利用服務的重要基礎。

1.2.3 研究階段分析

研究進一步利用各年份的關鍵詞,制作了關鍵詞Timeline視圖,如圖8、圖9所示,用以反映時間軸推移下國內外古籍數字化研究的發展趨勢。

圖9 國外近年文獻關鍵詞Timeline時間視圖

由圖8可以看出,國內對于古籍數字化的研究始于對圖書館資源以及對于古籍數據庫的探索,中醫古籍是最早被關注的研究對象。古籍的整理、保護在20世紀末開始被廣泛提及,至21世紀初研究開始重視古籍的信息資源,開始了大量的古籍數字化轉化進程,以達成存儲、修復等目的,同時用于規范古籍數字化資源的元數據條目也開始制定。在2010年左右,伴隨著信息化技術的發展,許多研究開始關注古籍的數據挖掘,古籍開始了由信息化到知識化的轉變。如今,知識圖譜等工具的運用為古籍的進一步知識服務與數字化推廣提供了新的技術與方式。

圖9則在標題分析與關鍵詞詞頻和聚類分析的基礎上,進一步揭示了國外在古籍數字化研究中對于技術的不斷利用與迭代。在古籍數字化研究的早期即關注信息檢索與系統的構建,相較于國內也更早地將算法運用到古籍數字化的研究中,包括圖像分割與機器學習的運用,以及目前向深度學習的轉變,并在如今被廣泛運用于作者、手寫體等古籍有關內容的識別,完成對古籍的知識發現。

1.3 文獻內容分析

通過總結文獻計量關于“古籍數字化”文獻研究目的、主題與階段的分析結果,可以看出古籍數字化研究主要有“研究對象選取”“數字化處理”“數字化存儲”“內容深度挖掘”“古籍知識發現”“數字化平臺建設”“數字化整理”“數字化保護”“古籍著錄規則”“古籍分類規則”等主要研究方向。依據這些研究的特點及目的,本文進一步將其總結歸類為“古籍數字化處理”“古籍數字化存儲”“古籍數字化標準”“古籍數字化利用”“古籍數字化服務”5類主要內容,其對應關系如表1所示。通過選取國內外關于主要內容相關的代表性文獻并進行內容剖析,可以發掘古籍數字化主要研究內容的側重點及相關技術方法。

表1 古籍數字化研究的內容類別與主要研究方向對照表

1.3.1 古籍數字化處理

古籍數字化處理是古籍數字化的開始階段,關注重點在于將傳統古籍文本轉化為數字化文本形式。在這一階段需要選定古籍研究對象,以及使用掃描、拍照等方式形成數字化古籍文檔。

在“研究對象選取”階段,國內外古籍數字化的研究對象帶有明顯的地域特色與文化差異。我國的古籍數字化研究涉及“中醫古籍”“民族古籍”等明顯有國內文化特征的研究對象。如《愛如生系列數據庫》《瀚堂典籍數據庫》等都針對《傷寒雜病論》《難經》《黃帝內經》等中醫經典古籍進行了數字化處理[7]。民族古籍方面,陳汝模[8]在研究中論述了福建海上絲綢之路相關古籍的內容、特征、原則及將其數字化后的意義,而對《齊民要術》《論語》等古籍的數字化也體現了國內以傳統歷史典籍為研究對象的特點[9-10]。國外對于“Maunscript(手稿)”這一研究對象的數字化研究更為側重。Guido R等[11]針對500余份中世紀手稿,進行了數字化與古籍分類工作。Ladewig S L等[12]使用了高分辨率成像設備,進行《新約》手稿的數字化。

“古籍數字化處理”形成數字化古籍文檔通常只作為古籍數字化相關研究的一個基礎步驟,很少作為研究重點。通常掃描、拍照一類形成數字化古籍圖像的方式應當是形成古籍數字化文檔的有效手段。焦佳琛等[13]在文獻中提到,掃描或拍照,并進行糾偏、拼接、去污、裁切及水印等處理是目前形成古籍數字化文稿的重要方式,Choro K等[14]通過使用波蘭古代手稿照片對OCR(光學字符識別)手稿數字化的方法進行測試,他們認為,改進古代手稿數字化的方法應該具備適當的掃描設備,高分辨率的掃描、無損壓縮、文檔圖像的手工校正、圖像的手工調平使文本水平排列、使用具有古詞匯的詞典等手段以保證稿件圖像的質量。

1.3.2 古籍數字化存儲

“古籍數字化存儲”主要是保存已形成的數字化古籍內容,以便于后續加以利用。目前已有的古籍數據庫項目中,山東大學建立了易學古籍數據庫[15],對易學古籍進行收集、復制、影印等工作。數據庫共包括易學古籍總目數據庫、易學古籍全文數據庫以及易學古籍研究與知識圖譜數據庫,不僅存儲了易學古籍數字化數據,也為進一步提供古籍服務奠定了基礎。鞠斐等[16]提出,基于中國版刻古籍紡織圖像的數據庫架構設計,以數字形式發布、存取和利用中國版刻古籍圖像。

國外如以色列國家圖書館建立的“時間旅行”數據庫,采用眾包的形式收集并數字化以色列歷史文獻[17]。印度同樣建立了國家手稿中心,用于存儲和保存印度數字化手稿文獻[18]。Abdelhaleem A等[19]構建了一個數據庫,其中包括伊斯蘭遺產項目(IHP)由302位不同作家撰寫的333份歷史手稿,用于研究各種手寫相關問題,如文本識別、作者識別、文本預處理等問題的研究。

1.3.3 古籍數字化標準

“元數據”一詞在關鍵詞中的高頻出現,代表了大量的數字化古籍產生后所伴隨的規則演進。當前研究中的古籍數字化標準主要分為“古籍著錄規則”與“古籍分類規則”。

我國擁有相對統一的古籍著錄規則,國家標準化管理委員會曾于2008年發布了《古籍著錄規則》[6],其元數據包括標準號、中文標準名稱、英文標準名稱、發布日期、實施日期、首次發布日期、標準狀態、復審確認日期、計劃編號、代替國標號、被代替國標號、廢止時間、采用程度、國際標準分類號、中國標準分類號、標準類別、標準頁碼、標準價格(元)、主管部門、起草單位在內的20項元數據標準,這也成為我國目前古籍著錄的總體標準。但由于古籍內容、種類繁多,也有學者研究設定專題古籍著錄規則。先巴[20]設定了藏文古籍著錄規則,在著錄細則上增加藏族古籍特點語義說明和限定,如古籍語種限定為藏文、古籍主題按照藏族古籍主題詞分類等。國外的古籍編目系統相同普適性更強,如OCLC聯機計算機圖書館可以收錄眾多國外文獻資源編目數據。Bannay O E等[21]還利用XML語言表示的元數據和手稿注釋構建了阿拉伯手稿可視化平臺,加上DC元數據集合MARC著錄格式等的利用,使得其適用性相對更強,且有助于館際之間資源的交流與整合。

在“古籍分類規則”研究中,“經、史、子、集、叢”五部分類法在我國具有悠久的歷史,也適用于古籍的常規分類,部分研究會進行“專題古籍分類規則”的設定與研究,但是普適性相對較差。國外關于古籍分類的分類法相對較少,但是由于計算機技術與信息技術的使用明顯提高,通過自動識別、聚類等方法,能夠自動提出對所獲取到的古籍數據的分類結果,但顯然這一結果也很難具有普適性,更換古籍數據很有可能帶來分類結果的不同。

1.3.4 古籍數字化利用

古籍數字化不是單純的形成數字文檔。更好地利用數字化古籍,完成古籍內容的深度挖掘與研究,發揮數字化相對于傳統文本的優勢,是古籍數字化更高層級的意義與作用。

目前,古籍數字化利用主要有以下方面:一是運用“本體構建”“機器學習”“圖像分割”等技術打破古籍原有文本組織結構,從而實現“內容深度挖掘”與“古籍知識發現”。二是古籍的“數字化整理”與“數字化保護”,通過數字化過程更好地進行古籍內容保存。

國外在近些年針對古籍數字化的研究采用了大量機器學習及圖像處理等技術,從而完成古籍“內容深度挖掘”。Chanda S等[22]利用CNN(卷積神經網絡)對法國國家檔案館所藏的14世紀初法國行政活動文件進行特征提取,并使用零次學習算法進行了中世紀單詞的識別,結果達到了56.87%的識別準確率。Avadesh M等[23]對古代梵文手稿進行字母分割和圖像標注,實現了對梵文手稿圖像的處理,并利用卷積神經網絡進行梵文單詞的學習與識別,準確率達到了93.32%。倪劼[24]在文獻中提出了基于流水模式的古籍漢字切分算法,該算法將古籍文獻圖像進行預處理,然后用投影法與圖像形態學處理實現列切分,再在列基礎上進行逐字切分,仿照水流的運動軌跡實現古籍中漢字的劃分?!肮偶R發現”多聚焦在對古籍進行文本關聯以及本體構建等研究。如周莉娜等[25]以唐詩為研究對象,構建了“詩歌—詩人”本體模型以及“面向史學的時空經歷本體模型”,并在此基礎上構建了知識圖譜,從而挖掘并可視化出詩人與詩歌之間的關系,并解釋了詩人經歷的時序變化特征。

古籍數字化整理主要關注對古籍進行審閱、??焙妥⑨尩裙ぷ鳎彩切纬蓴底只偶那捌诒貍涔ぷ鳌H鐝堄衩穂26]按照寧夏舊方志存世價值以及時間順序等選擇進行數字化的古籍版本,如存在破損等問題則進行按原內容抄寫等手動內容補全工作。國外在古籍整理過程中,除了對古籍的物理性整理以及對古籍進行編錄外,還會使用一定的計算機技術來輔助整理。早在1987年,Stringer G A等[27]便設計了程序對《約翰·多恩詩集》進行逐字審核,Kaoua R等[28]則構建了一個有2 000多個從古籍中提取的插圖以及1 200多個注釋的數據集,并能夠利用該數據集對古籍中的插圖與注釋構建對應關系。

古籍數字化保護是對古籍進行數字化的重要作用與意義,將古籍轉化為數字形式存儲,相比傳統載體顯然能夠保存更久的時間。黃俊[29]將江西圖書館館藏古籍進行縮微管理,從而生成了古籍的縮微圖像庫,盡可能地保存了古籍的內容與原貌。譚小華[30]概述了重慶圖書館的古籍數字化保護工作,除掃描、拍攝形成古籍圖像之外,還對古籍進行了普查登記,形成古籍普查檔案,方便古籍資料的查詢以及對原版古籍的保護。國外關于“古籍數字化保護”的研究中,古籍修復成為關注重點。Grosso A M D等[31]在研究中構思了歷史手稿的有效數字化保存系統,該系統可以實現手稿圖像的圖像采集、利用層壓技術實現手稿的圖像增強,并在此基礎上進行半自動轉錄、學術編碼和語言分析功能的完善,從而提升了對載體老化的手稿內容的分辨能力。

1.3.5 古籍數字化服務

古籍數字化服務是在新形式的數字化平臺下提供的有關數字化古籍的相關服務,如檢索、問答、古籍知識的可視化呈現等。隨著信息時代的到來與移動終端的廣泛普及,古籍數字化平臺可以擴展古籍宣傳及普及渠道,對古籍進行新形式的展示,同時使得古籍研究得以利用信息化手段,實現進一步的應用開發。

國內外已有眾多對古籍數字化平臺的嘗試,如羅渝等[32]在西南師范大學出版社出版的《域外漢籍珍本文庫》基礎上構建的“域外漢籍數字服務平臺”,收錄了境外40余個國家(地區)近百余圖書館及個人所收藏的漢語珍本,可以提供閱讀與多條件檢索功能。傅寶珍[33]提出,通過構建古籍VR閱讀系統、構建古籍VR閱讀資源庫等方式以拓寬古籍閱讀渠道,加強古籍融媒體交互與知識服務能力。Russo G等[34]則在意大利那不勒斯的“Girolamini圖書館”創建一個古籍和手稿“服務中心”,該“服務中心”可以使用物聯網和機器學習等技術對圖書館中數字化后的古籍進行分類,從而為信息檢索提供依據。

2 古籍數字化路徑構建

古籍數字化路徑的構建有助于為古籍開發及傳承提供系統化的研究思路與方法,從而深入挖掘其中的文化內涵和知識價值。因此,研究總結文獻分析所得出的古籍數字化主要內容及其相關技術與方法,通過參考相關理論體系,梳理古籍數字化路徑框架,規劃路徑各模塊的執行內容,為古籍的保護和傳承提供有力支持,并為發現古籍數字化現有研究不足及未來發展方向提供新的視角。

2.1 古籍數字化路徑框架分析

伴隨著數字人文的興起,相關理論也逐步發展,這為古籍數字化路徑的框架搭建及要素名稱的確定提供了基礎。Anderson S等[35]提出發現(Discover)、收集(Collect)、比較(Compare)、發布(Deliver)和協作(Collaborate)的不同類型的原語,稱為“五原語論”,這一理論成為當前數字人文研究中應用于考古工作進程的階段劃分依據。劉煒等[36]則進一步從五原語論及其二級原語出發,對數字人文的技術體系展開探討,提出包括“數字化技術”“數據管理技術”“數據分析技術”“可視化技術”“VR/AR技術”“機器學習技術”6類技術在內的數字人文技術體系,涵蓋了當下數字人文發展的主要研究技術。

相關理論的逐步發展拓展了古籍數字化研究的內涵,數字化古籍得以被進一步開發與利用。因此,研究參考五原語論與數字人文技術體系,對古籍數字化的主要研究內容進行對應匹配,完成古籍數字化路徑構建。

研究基于古籍數字化文獻分析結果的5類主要研究內容,即:“古籍數字化處理”“古籍數字化存儲”“古籍數字化標準”“古籍數字化利用”“古籍數字化控制”的相關代表性文獻,進一步總結了5個階段所運用的技術與方法,如表2所示。

通過將古籍數字化研究階段所運用的技術與方法,與數字人文技術體系相匹配,可進一步將古籍數字化研究內容與五原語論中的階段模式相對應,從而完成古籍數字化路徑框架的構建。

古籍數字化的基礎是完成古籍內容由傳統載體向數字化載體的轉變?!肮偶當底只幚怼敝兴玫降腛CR技術、掃描技術等明顯對應了數字人文技術體系中的“數字化技術”。以“數據庫”“語料庫”為代表的古籍“數字化存儲”則在構建數據庫的過程中需要運用“數據管理技術”進行組織。根據數字人文技術體系與五原語論的對應關系,這兩項技術分別對應五原語論中的“發現”與“收集”兩個環節,由于這一階段的目的是主要完成古籍由傳統載體向數字化形式的轉變與保存,研究將這一部分內容總結為古籍數字化的“轉化”環節。

伴隨著信息技術的發展,古籍數字化的內核已不僅僅是轉換載體,而且也同樣經歷著由信息化向知識化的轉變。古籍的“內容深度挖掘”與“古籍知識發現”是新時期古籍研究的重點。這兩類研究對于數據統計、知識圖譜、卷積神經網絡等技術均有涉及,其充分對應了數字人文技術體系中的“數據分析技術”“可視化技術”與“機器學習技術”。在五原語論中,這3種技術都涉及“比較”這一原語,意為“整合多樣性信息以便可以在數字人文之間比較信息?!币虼耍芯繉⑦@一環節定義為“重構”,通過“重構”古籍文本內容,挖掘古籍內容關聯,獲取古籍內容深層次信息。

數字化古籍可通過“開發”與“利用”,依托古籍數字化平臺所形成“知識服務”。同時“古籍數字化利用”中的“數字化整理”與“數字化保護”也是數字化古籍的重要應用目的。在古籍數字化平臺構建中,對于“可視化技術”與“VR/AR技術”已有充分的探討,古籍在其整理與保護過程中,也開始對機器學習等現代化技術加以應用,這3種技術集中對應了五原語論中“比較”“發布”與“協作”3項原語,體現出數字人文中“整理”“出版”與“分享”信息的現實作用。因此,研究將這一環節定義為“應用”,反映古籍數字化的實際應用層面。

“古籍數字化標準”中的“古籍著錄規則”與“古籍分類規則”運用了數字人文技術體系當中的“數據管理技術”。在五原語論中,這項技術主要運用于“發現”和“協作”兩個原語?!鞍l現”主要對應古籍的“轉化”環節,而“協作”環節在“重構”與“應用”中均有涉及。事實上,古籍的“轉化”“重構”與“應用”也應當盡可能遵守古籍的數據管理規則,才有助于數據的全方位協同與利用,因此,研究將這一環節定義為古籍數字化的“控制”。

通過對古籍數字化階段所運用技術的疏理,可以看出古籍數字化主要研究內容與數字人文技術體系及五原語論之間存在對應關系,如圖10所示。

圖10 古籍數字化路徑梳理

研究最終形成了以“轉化”“重構”“應用”和“控制”為4個核心環節的古籍數字化路徑框架,如圖11所示。

圖11 古籍數字化路徑框架

其中,“轉化”環節主要包含古籍研究對象的選取、數字化處理與數字化存儲3個部分,主要實現古籍由傳統載體向數字載體的轉換。“重構”環節包含“內容深度挖掘”“古籍知識發現”等內容。其實現古籍內容的多維度關聯關系發現,實現知識發現與重組,是古籍實現數字化的重大優勢?!皯谩杯h節包含“數字化平臺建設”“數字化整理”與“數字化保護”等內容,其主要關注古籍數字化后所能實現的功能與價值,實現古籍內容的長久性保護與現代化古籍信息傳播?!翱刂啤笔侵浮肮偶浺巹t”與“古籍分類規則”等的確立,利用“數據管理”等技術實現古籍數字化過程的規范化,為整合古籍數字化資源提供規則。

2.2 古籍數字化路徑內容規劃

研究通過規劃古籍數字化路徑中的關鍵環節的執行內容,系統化古籍數字化的研究目的及可行方向。

2.2.1 古籍數字化轉化內容規劃

古籍數字化轉化是古籍數字化全路徑的開始階段,也是后續路徑階段工作開展的基礎。在這一階段需要選取古籍研究對象,利用現代化技術轉換古籍載體,實現古籍在終端的數字化存儲。

1)古籍資源的就近選取

通過觀察古籍數字化相關文獻的量化分析結果可以看出,古籍數字化對象的選取具備地域特色與領域特色,這與研究所能接觸到的資源密切相關。我國的古籍資源繁復,圖書館等眾多類型機構都具有一定的古籍館藏資源。就近選取可獲取到的古籍資源,可以保證古籍數字化的完整性及研究人員專業知識的可信度。

2)數字化處理技術的合理選擇

考慮到古籍的年代性,部分古籍的原本載體可能較脆,也可能存在一定的破損,而不同技術的成像效果與適用環境也有不同,所以針對不同古籍選取不同轉化方式尤為重要。OCR技術可以實現古籍的大規模文本輸入,并實現古文字體字形向現代字體字形的轉換,是進行文本挖掘等深度研究的基礎,因此選取合適的圖片清晰度的成像方法也是進行古籍數字化研究所必須考慮的問題。

3)古籍數據庫的規范化設計

大多數數據庫是基于圖書館本身具有的館藏資源,或科研院所、數字化公司、眾包等方式形成,主要可以分為古籍全文數據庫、古籍電子索引和古籍書目數據庫[37],而其中以古籍全文數據庫建設較多,利用較為廣泛。

古籍全文數據庫主要包含圖像型、文本型和圖文型3種類型[38],圖文型能夠提供轉譯及修復后的古籍內容,也可通過展示古籍圖片留存古籍原有樣貌,同時為古籍內容的對照提供依據??梢钥闯觯玫墓偶當祿鞈軌虮M可能留存多樣式古籍形式以充分發揮其數據留存作用,實現古籍數據的存儲、組織與處理。同時能夠使用數據操作語言對數據庫進行查詢、更新等相對完善的數據庫功能。

古籍電子索引和古籍書目數據庫相較于古籍全文數據庫能更好地詮釋了古籍數據庫的數據規范問題,對于大多數古籍數據庫來說,使用更為普適的元數據體系更有助于數據庫之間的互聯互通,并有助于跨數據庫的數據利用。當然,個別專題數據庫需要根據已有主題設置不同的元數據,用以保證數據的錄入。

2.2.2 古籍數字化重構內容規劃

古籍數字化重構意在實現對古籍內容的深度挖掘,發現隱藏知識,實現對古籍所含知識的重新組織,從而有助于更加深入地、多維度地了解古籍。

1)實體識別

實體是古籍中的重要信息載體,通常以名詞的形式出現,如人名、地名、機構、藥材等,是挖掘隱藏知識、找尋古籍關系的基礎。挖掘古籍中的實體,需要從古籍電子文檔中找尋有意義的命名實體。相對于應用已經較為廣泛且成熟的英語與現代漢語,中文古籍面臨著傳統字體與語法的障礙。因此,在這一過程中,除了足夠的領域語料之外,還需要結合自然語言處理技術與歷史學者、古文學者的學術經驗,將計算機與人工融合,實現語義關系的處理,并對同一實體的不同表述進行統一,從而完成實體的抽取。

2)屬性對應

屬性是對實體更細節的解釋,可以實現對實體的全面介紹,通常可以作為一個句子中的表語出現,如人物的年齡、籍貫、藥物的藥性等。在古籍中,實體通常不會獨立存在,而是會在上下文中予以一定的介紹,因此屬性對于實現古籍的重構至關重要,豐富的屬性可以為古籍提供打破原有結構的敘事維度,從更多的視角入手對古籍進行深層次剖析。

3)關系抽取

關系提供了實體之間的聯系,同樣也是眾多自然語言處理任務的基礎,可以作為句子中的賓語等形式存在。關系能夠揭示古籍中實體之間的關聯,在特定的語義結構中,能夠加深對實體所處環境的理解。同時,對古籍實現關系抽取,也是對古籍實現進一步應用,輔助古籍數字化平臺實現應用任務,如在線問答、文本注釋等的基礎。

2.2.3 古籍數字化應用內容規劃

古籍數字化應用需要依托于系統、平臺的建設或新興的信息化手段。隨著信息時代的到來與移動終端的廣泛普及,古籍數字化平臺可以擴展古籍宣傳及普及渠道,對古籍進行新形式下的展示,同時使得古籍研究得以利用信息化手段,實現對古籍的整理、保護與進一步的應用開發。

1)多維度敘事

古籍數字化平臺是古籍進行現代化內容展示的主要載體,基于古籍的內容重構,數字化平臺可以從多維度對古籍內容進行新形式呈現。牛力等[39]在文章中提出“時間敘事”“空間敘事”“鎖鏈型敘事”等6種檔案數據故事結構。我國史書自古也有“紀傳體”“國別體”“編年體”等區別,總體來看,古籍主要可以從“時間”“空間”以及“實體”3個維度對內容進行重新組織,而數字化后的古籍恰恰可以利用如知識圖譜與時間序列模型等,充分反映古籍中實體與實體之間的關系及隨時間的演化。因此,多維度的敘事模式可以更生動地展現古籍重構后所發現的隱藏知識內容。

2)宣傳與普及

古籍數字化平臺起到讓公眾了解古籍內容的重要作用。伴隨著終端的廣泛使用以及網絡廣泛而高效的信息連通,古籍數字化平臺的建設勢必成為公眾接觸古籍的內容、價值及其誕生背景等的重要渠道。上海圖書館在古籍數字化平臺建設上一直廣受業內好評,如搭建的中文古籍聯合目錄與詢證平臺,整合了官修目錄、史志目錄、藏書樓目錄等中的人名、地名等數據,并在平臺中提供了內容統計分析、時空及社會分析、相關可視化功能,實現古籍的聯合查詢、規范控制,對古籍的考證、語義關聯等研究提供了實用且有效的平臺??梢钥闯?,好的古籍數字化平臺,不僅能夠提供閱讀、搜索、詢證等多方面功能,同時可以實現古籍規范整理,減輕古籍搜尋與閱讀難度,從而提升公眾對于古籍的了解效率。

3)保護與修復

傳統古籍面臨著載體老化、破損等問題,時間的推移使得古籍的保護與修復問題愈發緊迫。一方面,利用古籍數據庫可以對古籍進行規范化整理,進行字符編碼、元數據指定、古漢語對應等工作,輔助傳統古籍的物理化保護與數字化古籍的規范存儲;另一方面,借助計算機對古籍圖像等進行處理,可以打破肉眼限制,對古籍的年份等進行判定,豐富古籍背景信息,甚至對古籍內容進行修復。

2.2.4 古籍數字化控制內容規劃

古籍的數字化控制階段為整個古籍數字化路徑提供參考標準與規則,從數據庫設計到古籍的內容挖掘,從古籍數字化系統的建設到內容保護,都應對標準體系加以控制,從而增加古籍數據互聯互通的可能性。

1)著錄規則

古籍由于其歷史的復雜性及數量眾多,導致題名復雜,用語繁復,制定著錄規則可以明確古籍的著錄范圍、原則與條目,明確古籍的基本信息。因此,遵循標準化的古籍著錄規則可以盡可能地增強古籍著錄的普適性,減少館際古籍資源之間的引用壁壘,加強在古籍數據庫中的檢索覆蓋范圍,增加檢全率與檢準率。目前,除去我國公布的標準化的《古籍著錄規則》外,北京大學圖書館也曾基于數字圖書館規范建設的目的,設立了一套古籍描述元數據著錄規則[40],與國家標準存在部分條目重疊的同時,也為圖書館古籍著錄提供了參考。國外的古籍著錄研究多依托于圖書館等中心或機構,力求覆蓋世界上大部分的文獻資源編目數據。而對于如民族古籍、領域古籍等內容,普適著錄規則難免出現不能完全適用的情況,但著錄條目也應盡可能在標準化規則下開展。

2)分類規則

古籍分類同樣是古籍整理過程中的重要工作環節,對題材與體裁均紛繁復雜的古籍進行分類,可以輔助用戶在使用古籍數字化平臺時的檢索與瀏覽行為,節省目標古籍查找時間,同時提升古籍數字化平臺中推薦算法應用的準確性,提升用戶可接觸到的古籍范圍。我國之前頒布了《中國古籍善本書目》,整體分為經、史、子、集、叢5部,并在各部下方又分出類、屬等,屬之下又根據情況進行了復分。而《全國古籍普查平臺分類表》則在經史子集4部分類的基礎上,合并或新建類從部與新學部,用于解決“類書”與“叢書”之間的重復問題以及近代部分古籍的劃分問題。與著錄規則類似,采用標準化分類規則有助于古籍普查等工作,對用戶及研究人員提供更好的引導作用。應盡可能在標準化規則基礎上根據自身資源特點進行細致類目劃分,從而為古籍整理與古籍平臺設計提供一定的依據和范式。

3 國內古籍數字化研究不足

研究結合國內外古籍數字化研究現狀,基于古籍數字化路徑視角,從古籍數字化路徑各環節的規劃內容角度分析當前國內古籍數字化的研究不足。

3.1 古籍數字化信息技術應用不足

當前我國的古籍數字化研究更多專注于古籍數字化平臺的構建,但其僅為古籍數字化路徑中的一步,不論是從古籍的內容正確識別、挖掘,還是從古籍的整理與保護等角度,都需要對古籍中的深層次內容進行探索與分析,如古籍模糊內容識別分析、古籍內容知識發現等。這些超出人工范疇目的的實現離不開各類數字化與信息化技術的應用。國外在古籍數字化進程中已經充分利用各類機器學習技術等大量信息技術對古籍進行文本和特征識別等工作,達到了較高的準確率。國內研究對于利用數字化和信息化技術來實現古籍內容的挖掘和延伸仍存在不足,且涉及算法輔助古籍內容的挖掘和識別的研究也多使用成熟算法,對算法的改進仍有較大空間。

3.2 古籍控制階段規則難以互通

我國因歷史悠久,以及具有豐富的文化積累與文明體系,在時代變遷中產生了多民族、多主題、多形式的古籍,為我國的文化傳承提供了豐富素材與寶貴的財富。但同時,我國古籍因其內容與形式上的不同,同樣有很多學者在研究中構建了專題古籍的元數據標準,雖方便了古籍專題數據庫的構建,卻也導致了多種古籍著錄規則的出現,這為數據庫內容互通帶來了一定的困難,使得統一的古籍著錄規則被利用率有限。

同時,國內目前也缺乏一個能夠面向古籍整體進行分類的標準。我國很多圖書館與數字化平臺會利用“經、史、子、集”傳統類目以及中圖法等元數據標準對古籍進行分類,但這些分類法并不完全面向古籍數據庫構建且細化程度不夠,導致不同圖書館與平臺之間,同一古籍所處的類目不同。這同樣會導致館際數據互通的混亂,導致館際數據互通過程中的存儲資源的浪費。

3.3 古籍數字化平臺功能相對基礎

從文獻分析結果可以看出,國內目前構建了許多古籍數字化平臺,內容豐富,完善了眾多圖書館館藏體系。但同時,目前的古籍數字化平臺架構大多基于閱讀和檢索的功能,所提供的服務相對基礎和單一。通過國外的古籍數字化平臺建設可以看出,很多平臺以及古籍數據庫都加入了數據統計與分析的能力,引入云計算、物聯網、機器學習等方法,直接利用平臺內的古籍數據,進行大量深層次分析。顯然,將數字化平臺賦予這類技術更有利于將古籍資源與學術研究相結合,研究人員可以直接利用平臺中的資源進行高學術層次的數據分析,這使得研究過程中的數據獲取與數據分析進程都得到了簡化,降低了研究過程中第三方軟件的培訓過程與使用成本,有助于加強古籍研究成果的轉化。

3.4 缺乏古籍資源的互聯互通

國內古籍數據庫面臨的一個主要問題是古籍資源的互聯互通缺失,古籍數據庫之間缺乏有效的連接和交互,這導致了古籍資源的碎片化和孤立化。美國OCLC平臺為各個圖書館提供了一個統一的資源共享網絡,使得圖書館之間能夠共享書目數據、館藏信息和數字資源,方便研究者查找并獲取全球范圍內的圖書館藏書,不受地域限制,極大地拓寬了其獲取古籍資源的渠道和范圍。然而在國內,各個古籍數據庫之間缺乏標準化的數據格式和共享協議,導致了資源的孤立性和重復建設。研究者往往需要在多個數據庫之間進行繁瑣的搜索和轉換操作,以獲取所需的古籍信息,限制了研究效率和深度。

4 國內古籍數字化研究發展方向

4.1 堅持古籍數字化轉化過程中的中國特色及學科融合

我國的古籍數量繁多,種類、題材多樣,在古籍數字化對象選取中,應堅持選用“中國特色”古籍,進一步深耕我國各類古籍文獻。同時也應嘗試將研究目光投向稀有的、冷門的、瀕臨失傳的古籍文獻,加快此類古籍的數字化進程,為古籍的保護以及古籍數字化新的領域研究打下基礎。

同時,古籍數字化不能僅僅局限于對古籍的研究與理解,計算機技術、信息技術等多學科的內容也需要在其中扮演重要角色。因此,在未來關于古籍數字化的研究與項目中,需要將文獻學、歷史學、計算機、信息資源管理乃至材料學等學科充分融合,對各學科技術實現充分利用,發揮古籍數字化所涉及的相關學科的長處,才能更充分地實現古籍的整理與數字化轉化,盡可能地保留古籍所攜帶的信息。

4.2 加強古籍數字化資源之間的互聯互通

古籍數字化存儲所用的數據庫及重構后的知識組織平臺是數字版古籍重要的資源載體,是對古籍進一步研究利用的重要數據來源。未來,應當在古籍數字化控制所涉及的元數據標準體系的基礎上對古籍存儲平臺的架構進行改善,同時盡可能設置數據庫之間的接口,探索建立互聯互通機制。通過制定共享標準、建立數據交換平臺和推動合作共建,國內的古籍數據庫可以實現資源的整合和共享,使研究者能夠更便捷地訪問和利用豐富的古籍資源,推動古籍研究的深入發展,以達成各古籍數據庫與知識平臺之間的互聯互通,實現資源共享,擴大古籍數字化研究的數據可選擇范圍,從而保證數字化古籍的利用效率與研究的深化。

4.3 完善古籍數字化控制階段各類標準體系

在未來,針對古籍的著錄、技術、管理和工作流程上,都可以進一步開發并完善相關的標準體系,以及在已有標準下進行說明或細化。政府和權威機構可以組織、領導相關工作,從而出臺規范化、統一化、實用性高的標準化體系,在保證體系得到細化的同時,也保證其可借鑒性,從而促進資源的廣泛利用。如果能夠在已有標準體系的基礎上設計充分細化的古籍著錄規則與分類體系,將有助于規范化古籍數字化研究,以相對統一的標準體系涵蓋專題古籍內容,提升相關研究的借鑒與接續能力,有助于古籍數字化平臺、數據庫與圖書館之間的互聯互通與資源共享,加強數字化古籍的整體性與規范性。

4.4 加強古籍數字化技術的開發與利用

充分利用現有的信息化技術,通過語義分析與關聯,對古籍內容進行深層次探索,改進算法使之更符合古籍語言規律,從而挖掘古籍內容中的隱含信息,形成知識發現是當前形勢下古籍數字化的一項重要任務。目前,知識圖譜等可視化模型的構建越來越受到重視,其是知識發現的重要表現形式,所能生成的結構化數據有助于被研究人員進一步利用,為古籍數字化平臺的智能化功能開發提供研究基礎。而知識發現及其重組與可視化是挖掘、抽取并理解文本內容的重要方式,也是深刻理解古籍含義的重要研究目的。有效的知識發現有助于古籍的整理與保護,以及古籍中的重要信息和價值的傳承。因此,加強古籍數字化技術的開發與利用,充分結合信息技術以驅動對古籍的知識發現是未來古籍數字化研究中的重要方向,是增強古籍研究利用、提升古籍價值的重要手段與途徑。

4.5 開展面向用戶需求的古籍數字化平臺服務

古籍數字化的目的,則是能夠實現信息挖掘與知識發現,保留并提升古籍價值,并為古籍的相關研究提供基礎。因此,通過面向用戶需求構建新的數字化平臺應用應是未來古籍數字化平臺建設的重要方向。隨著技術的發展與研究的逐漸深入,未來有著大量的服務于用戶的應用可以被推廣與使用到古籍數字化平臺上來。如輔助閱讀的古漢語字典、紀年換算以及論壇功能等,都可以輔助用戶對古籍進行理解乃至交流,是現有基礎功能的深化形式。另外,為了方便信息挖掘與知識發現,字/詞頻統計、主題聚類、地理空間模型、主體與關系關聯及相關內容的可視化功能均可作為應用被提供,減少研究中的時間及人力成本,充分滿足用戶需求。

5 結 語

本文利用Python以及CiteSpace等相關軟件與技術,對國內外古籍數字化主題文獻的研究現狀進行了分析,找出了包括研究對象選取、數字化處理、數字化存儲在內的10項古籍數字化主要研究內容。文章進一步將古籍數字化主要研究內容與五原語論及數字人文技術體系相對應,構建出了古籍數字化路徑,為古籍數字化工作及古籍進一步開發提供參考。

通過分析結果可以看出,我國目前關于古籍數字化的研究在技術運用、平臺服務、標準化體系構建與完善等方面還有進步空間。在未來,我國古籍數字化研究應加強信息技術使用,提升學科融合能力,開發面向用戶的數字化平臺應用,并進一步完善古籍數字化標準體系,從而為古籍信息化挖掘與知識發現提供有效地幫助,為提升古籍利用價值以及更好地保護傳世古籍做出更大的貢獻。

猜你喜歡
數據庫內容研究
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
FMS與YBT相關性的實證研究
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
數據庫
財經(2017年2期)2017-03-10 14:35:35
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 日本人又色又爽的视频| 无码视频国产精品一区二区 | 中日韩一区二区三区中文免费视频 | 2020国产免费久久精品99| 欧美日韩北条麻妃一区二区| 久久久成年黄色视频| 97国产在线视频| 91口爆吞精国产对白第三集| 好吊妞欧美视频免费| 亚洲高清免费在线观看| 国产又粗又猛又爽| 看国产毛片| 最新国产你懂的在线网址| 国产一区二区丝袜高跟鞋| 小蝌蚪亚洲精品国产| 91精品国产麻豆国产自产在线| 一级不卡毛片| 久久9966精品国产免费| 久久国产热| 狠狠综合久久| 亚洲无码四虎黄色网站| 国产乱码精品一区二区三区中文 | 国产成人综合日韩精品无码首页 | 亚洲伊人天堂| 亚洲国产成人在线| 国产欧美日韩综合在线第一| 亚洲成人一区二区| 亚洲综合婷婷激情| 欧美激情二区三区| 伊人久久久大香线蕉综合直播| 亚洲无码免费黄色网址| 欧美日韩在线亚洲国产人| 多人乱p欧美在线观看| 欧美成人A视频| 欧美精品三级在线| 亚洲水蜜桃久久综合网站| 女同国产精品一区二区| 国产人成在线观看| 国产一级在线观看www色| 免费看a级毛片| 婷婷亚洲视频| 114级毛片免费观看| 国产在线视频欧美亚综合| 激情六月丁香婷婷| 国产成人亚洲综合A∨在线播放| 国产三级国产精品国产普男人 | 国产精品吹潮在线观看中文| 久久亚洲美女精品国产精品| 精品91在线| 成人在线综合| 四虎在线观看视频高清无码| 国产精品无码影视久久久久久久| 亚洲人成网站色7777| 99精品国产自在现线观看| 国产亚洲精| 久久婷婷五月综合色一区二区| 五月婷婷综合网| 这里只有精品国产| 麻豆国产精品视频| 欧美激情视频二区| 九色免费视频| 亚洲Av激情网五月天| 日韩免费中文字幕| 欧美一级片在线| 看你懂的巨臀中文字幕一区二区| 精品国产网| 国产人前露出系列视频| 欧美亚洲另类在线观看| 亚洲色图欧美在线| 日本人又色又爽的视频| 亚洲高清无在码在线无弹窗| 亚洲一级色| 丁香婷婷综合激情| 中文字幕亚洲综久久2021| 国产成人久久777777| 色综合中文| 美女内射视频WWW网站午夜| 欧美日本在线播放| 精品一區二區久久久久久久網站| 凹凸精品免费精品视频| 黄色福利在线| 5388国产亚洲欧美在线观看|