999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

安徽師范大學(xué)圖書館館藏徽州文書數(shù)據(jù)庫平臺建設(shè)研究*

2023-03-07 02:23:56王毓銘張霞云董家魁劉和文
圖書館研究 2023年1期
關(guān)鍵詞:數(shù)據(jù)庫資源管理

王毓銘,張霞云,董家魁,劉和文

(安徽師范大學(xué)圖書館,安徽 蕪湖 241002)

近年來,館藏特色資源數(shù)據(jù)庫平臺建設(shè)成為業(yè)界和學(xué)界的研究熱點(diǎn),國外如Ball,MJ等通過學(xué)術(shù)信息管理系統(tǒng)(IAIMS)整合老年醫(yī)學(xué)、高血壓相關(guān)館藏內(nèi)容形成特色資源[1],國內(nèi)圖書館特色資源數(shù)據(jù)庫系統(tǒng)平臺建設(shè)起步較晚,主要涉及到的技術(shù)包括DIPS、TRS、TPI 等[2]。部分圖書館利用C/S或B/S 架構(gòu)站點(diǎn)自建特色資源平臺,如:國家海洋中心使用TRS系統(tǒng)構(gòu)建海洋數(shù)字資源庫[3];杭州市圖書館建設(shè)的民國圖書、民國期刊、古籍、家譜、地方文獻(xiàn)等數(shù)據(jù)庫[4]。現(xiàn)有特色資源數(shù)據(jù)庫平臺功能包含混合索引、并行檢索、搜索引擎、主題詞字典、多風(fēng)格多類型自定義資源發(fā)布等,最新技術(shù)方案中逐步實(shí)現(xiàn)全文檢索、數(shù)據(jù)挖掘、知識圖譜等最新功能服務(wù)。而徽州文書作為特色資源之一,數(shù)量巨大、類型豐富,可以充分反映區(qū)域政治經(jīng)濟(jì)、風(fēng)俗民情等社會形態(tài),各收藏單位相繼建設(shè)了特色數(shù)據(jù)庫,如:安徽大學(xué)“徽州文書書目數(shù)據(jù)庫”(2005 年),黃山學(xué)院“徽州文書特色文獻(xiàn)數(shù)據(jù)庫”(2007年),上海交通大學(xué)“中國地方歷史文獻(xiàn)數(shù)據(jù)庫”(2015 年),中山大學(xué)“徽州文書數(shù)據(jù)庫”(2019年),等等。此外,日本京都大學(xué)的“中國清代民國公私文書”(2003 年)也包含大量徽州文書資源數(shù)據(jù)。從數(shù)據(jù)庫類型上看,已建設(shè)的各類徽州文書數(shù)據(jù)庫中,除“中國地方歷史文獻(xiàn)數(shù)據(jù)庫”為全文文本數(shù)據(jù)庫外,其他均為圖像庫或書目庫;在運(yùn)行方式上,大多數(shù)已建設(shè)的徽州文書數(shù)據(jù)庫并未提供開放預(yù)覽,僅廣西師范大學(xué)的“徽州文書數(shù)據(jù)庫”等少數(shù)數(shù)據(jù)庫提供半開放資源瀏覽,但數(shù)據(jù)庫仍需授權(quán)后方可使用。在總結(jié)已建設(shè)圖書館特色資源數(shù)據(jù)庫的技術(shù)、管理、服務(wù)經(jīng)驗(yàn)后,充分考慮館藏徽州文書現(xiàn)狀與保存利用需求,建設(shè)安徽師范大學(xué)圖書館(以下簡稱我館)館藏徽州文書特色數(shù)據(jù)庫平臺。

1 館藏徽州文書管理平臺建設(shè)方案

我館館藏徽州文書近千件八千余頁,涵蓋土地關(guān)系文書、賦役文書、商業(yè)文書、宗族文書等類型,具有整體時(shí)間跨度長、地域分布廣、歸戶性強(qiáng)、種類多樣等特點(diǎn)。我館館藏文書具有極高價(jià)值,主要體現(xiàn)在:一是善本多,據(jù)統(tǒng)計(jì),近千件徽州文書中有600 余件為清乾隆以前保存均較為完好的善本,宋、元至明代嘉靖時(shí)期者近200件,迄今國內(nèi)公布的同時(shí)期的徽州文書檔案總量僅數(shù)百件;其中《元至正五年二月初九日休寧縣朱右寵賣山契約》《元至正六年二月十二日陸保黃賣山契約》更為國內(nèi)僅存為數(shù)不多的元代徽州文書。二是孤本多,民間契約往往具有唯一性的特點(diǎn),我館館藏中多為徽州民間契約,且均為孤本。其他的魚鱗圖冊、保甲冊、戶口環(huán)冊等也為國內(nèi)僅存的孤本。

為了加強(qiáng)特色資源的利用,2019 年我館啟動館藏徽州文書資源平臺建設(shè),平臺建設(shè)分為徽州文書數(shù)據(jù)化與數(shù)據(jù)庫管理平臺建設(shè)兩個(gè)階段,徽州文書特色數(shù)據(jù)庫平臺建設(shè)流程圖如圖1所示。

圖1 徽州文書特色資源數(shù)據(jù)庫平臺建設(shè)流程圖

文書數(shù)據(jù)化包括元數(shù)據(jù)設(shè)計(jì)與收割、徽州文書原件掃描、資源數(shù)據(jù)加工、發(fā)布級文件處理等步驟,主要是對徽州文書基礎(chǔ)數(shù)據(jù)、原件掃描圖像、應(yīng)用發(fā)布文件進(jìn)行流式處理。數(shù)據(jù)庫管理平臺建設(shè)包括數(shù)據(jù)存取系統(tǒng)建設(shè)、館藏徽州文書管理平臺開發(fā)、徽州文書發(fā)布檢索服務(wù)平臺建設(shè),主要用于徽州文書元數(shù)據(jù)的存儲、數(shù)據(jù)庫平臺管理以及徽州文書數(shù)據(jù)庫檢索等。

2 徽州文書資源數(shù)據(jù)化

2.1 徽州文書元數(shù)據(jù)設(shè)計(jì)

特色資源的數(shù)據(jù)庫設(shè)計(jì)需要建立規(guī)范的資源建設(shè)標(biāo)準(zhǔn),確保特色數(shù)字資源建設(shè)長期穩(wěn)定運(yùn)行[5]。元數(shù)據(jù)設(shè)計(jì)是特色資源數(shù)據(jù)庫建設(shè)首先要考慮的問題,目的在于通過將不同類型特色資源按標(biāo)準(zhǔn)化的采集方案匯聚形成各類特色資源元數(shù)據(jù),最終滿足不同用戶對于各類特色資源數(shù)字化和元數(shù)據(jù)采集的不同需求[6]。由于徽州文書外部特征獨(dú)特,內(nèi)容涉及各個(gè)方面,筆者結(jié)合通用資源的元數(shù)據(jù)設(shè)置,參考圖書、論文、音視頻、人物等類型資源的元數(shù)據(jù)設(shè)置和《民間歷史文獻(xiàn)整理概論》[7],定義了17 個(gè)徽州文書元數(shù)據(jù)字段(具體如表1 所示)。其中:描述字段包括財(cái)產(chǎn)號/標(biāo)識符、題名、尺寸、人物及機(jī)關(guān)團(tuán)體、主題詞/關(guān)鍵詞、實(shí)物形態(tài)、保存狀況、館藏信息、語種、相關(guān)資源等10個(gè);內(nèi)容字段包括時(shí)間、涉事地點(diǎn)、歸戶、譜系、金額、賦役、頁數(shù)等7 個(gè)。描述性字段與內(nèi)容字段的設(shè)計(jì)在于以標(biāo)識符、資源文件路徑為主要字段連接資源元數(shù)據(jù)與資源文件,以實(shí)現(xiàn)檢索發(fā)現(xiàn)、分析統(tǒng)計(jì)、資源服務(wù)等功能,充分揭示徽州文書的內(nèi)容特征和形式特征。

表1 特色資源通用平臺元數(shù)據(jù)字段設(shè)置

2.2 館藏徽州文書掃描

資源數(shù)字化是特色資源庫建設(shè)的基礎(chǔ)工作,針對數(shù)據(jù)庫平臺的功能要求和文書的品相,徽州文書數(shù)字化采取拍攝式掃描和資源收割的方式。數(shù)字化資源的圖像質(zhì)量具體要求定為:300DPI(像素密度),24 位色彩色階和JPEG/JPEG2000(壓縮方式)。為保證后期校正處理和使用服務(wù)時(shí)的色彩準(zhǔn)確性,在每一份文書掃描后添加專用色卡拍攝圖。

由于文書的品相不同,在數(shù)字化加工過程中,針對文書頁面褶皺、殘缺、破損等現(xiàn)實(shí)情況,事先做了修復(fù)處理,在數(shù)字化過程中專門標(biāo)注。

針對大開本的文書,采取圖片裁剪和分頁的形式來處理,保證每件文書數(shù)字化資源“一圖一頁”,清晰完整。

2.3 徽州文書數(shù)據(jù)化加工

數(shù)據(jù)化加工是將徽州文書掃描件轉(zhuǎn)化至用戶可用資源文件的主要步驟,包括對資源文件加工、元數(shù)據(jù)關(guān)聯(lián)和補(bǔ)全。考慮可用資源在傳輸速率和使用效果兩個(gè)維度的切實(shí)矛盾,資源加工的要素主要為資源文件版式、容量、DPI、分辨率。在數(shù)據(jù)化加工流程中:首先,對每件資源進(jìn)行“一圖一頁”的統(tǒng)一版式、一致的壓縮分辨率和DPI控制處理,在可清晰辨識內(nèi)容基礎(chǔ)上,容量限制在200 KB 至1 MB 之間,以同時(shí)滿足讀者瀏覽資源時(shí)對加載效率和使用體驗(yàn)的要求。其次,將徽州文書加工資源進(jìn)行元數(shù)據(jù)關(guān)聯(lián)匹配,最終形成文書資源散件727份,多頁或成冊文書203份,總計(jì)8 809頁。最后,針對發(fā)布應(yīng)用的實(shí)際使用場景和用戶資源需求,在完成元數(shù)據(jù)補(bǔ)充基礎(chǔ)上,進(jìn)行整體和獨(dú)立分頁的發(fā)布應(yīng)用級數(shù)字對象生成,包括PDF 資源文件、基于都柏林核心集字段的元數(shù)據(jù)描述文件、目錄結(jié)構(gòu)信息文件、資源封裝信息文件和資源原件圖像。

此外,由于存在魚鱗圖冊、保甲冊、戶口環(huán)冊等類型的成冊文書資源,需按古籍文獻(xiàn)規(guī)范要求對頁面布局、放大率、默認(rèn)打開頁等項(xiàng)進(jìn)行配置,并添加導(dǎo)覽標(biāo)簽,便于讀者用戶對此類文書資源的高效使用。

3 徽州文書資源庫平臺建設(shè)

我館館藏徽州文書資源庫平臺的建設(shè)是以規(guī)范化、通用性為建設(shè)指導(dǎo)原則,以數(shù)據(jù)存取子系統(tǒng)、徽州文書管理平臺、檢索服務(wù)子系統(tǒng)為節(jié)點(diǎn),完成對徽州文書的歸類、元數(shù)據(jù)著錄、整理、數(shù)字化掃描、資源加工和加工成品發(fā)布的整體工作流程。

3.1 數(shù)據(jù)存取子系統(tǒng)

在館藏徽州文書管理平臺系統(tǒng)中,需要進(jìn)行數(shù)據(jù)資源存儲的包括徽州文書元數(shù)據(jù)、資源原始數(shù)據(jù)和加工數(shù)據(jù)。其中,元數(shù)據(jù)存儲于結(jié)構(gòu)化數(shù)據(jù)庫中,資源原始數(shù)據(jù)和加工數(shù)字對象存儲于文件存儲系統(tǒng)中。

徽州文書元數(shù)據(jù)在建設(shè)過程中使用MySQL+Redis 數(shù)據(jù)庫的混用方案。MySQL 數(shù)據(jù)庫作為結(jié)構(gòu)化數(shù)據(jù)存儲節(jié)點(diǎn),Redis 作為內(nèi)存緩存存儲系統(tǒng),對資源集數(shù)據(jù)進(jìn)行同步并向前端服務(wù)提供高速數(shù)據(jù)讀取服務(wù)。基于以上架構(gòu),形成管理平臺和發(fā)布檢索服務(wù)在元數(shù)據(jù)使用層面的讀寫分離數(shù)據(jù)存取方案。在數(shù)字對象與資源文件存儲方面,子系統(tǒng)使用mofileFS分布式文件存儲方案,利用其適用于海量小文件的特性,充分滿足大量容量為1 MB至10 MB大小的徽州文書數(shù)字化對象文件的高效存取需求。

基于以上數(shù)據(jù)存取子系統(tǒng)建設(shè),為館藏徽州文書管理平臺提供完整的數(shù)據(jù)、文件讀寫底層方案,進(jìn)而完成館藏徽州文書管理平臺的功能和服務(wù)開發(fā)。

3.2 徽州文書管理平臺

徽州文書管理平臺和發(fā)布檢索服務(wù)使用ThinkPHP5.1+Vue.js的開發(fā)框架進(jìn)行前后端分離,前后端通過鑒權(quán)與業(yè)務(wù)API 通信實(shí)現(xiàn)數(shù)據(jù)流通,平臺以功能模塊化的思路進(jìn)行開發(fā)建設(shè),結(jié)合徽州文書掃描和數(shù)據(jù)化加工過程中的具體流程節(jié)點(diǎn),整體設(shè)計(jì)為6個(gè)主要模塊,分別是管理控制、資源數(shù)據(jù)上傳、資源加工管理、數(shù)據(jù)標(biāo)引管理、數(shù)據(jù)集管理、發(fā)布管理,平臺的一、二級功能模塊如圖2所示。

圖2 圖書館特色資源通用平臺架構(gòu)設(shè)計(jì)

3.2.1 平臺管理

管理控制模塊對館藏徽州文書平臺的非業(yè)務(wù)操作和功能進(jìn)行整體管理,模塊建設(shè)以RBAC 模型(Role-Based Access Control:基于角色的訪問控制)進(jìn)行開發(fā)建設(shè),使得平臺具有高自由度、可持續(xù)優(yōu)化更新等優(yōu)勢,具體功能包括管理員管理、菜單管理、權(quán)限管理和日志統(tǒng)計(jì)。管理員以自身角色所擁有的菜單和功能訪問權(quán)限對平臺系統(tǒng)進(jìn)行管理,平臺建設(shè)完成后通過限制管理員賬號對平臺管理進(jìn)行管控,后續(xù)的功能更新和優(yōu)化可基于菜單管理和權(quán)限管理模塊進(jìn)行自定義配置。

3.2.2 數(shù)據(jù)加工管理

數(shù)據(jù)加工流程在平臺中由資源數(shù)據(jù)上傳模塊、資源加工管理模塊和數(shù)據(jù)標(biāo)引管理模塊組成。

首先,資源數(shù)據(jù)上傳模塊包含標(biāo)準(zhǔn)管理、元數(shù)據(jù)管理、文件管理、數(shù)據(jù)關(guān)聯(lián)子模塊。標(biāo)準(zhǔn)管理模塊在本平臺中僅額外添加有徽州文書類型字段標(biāo)準(zhǔn),作為元數(shù)據(jù)管理中徽州文書元數(shù)據(jù)導(dǎo)入的字段標(biāo)準(zhǔn)。標(biāo)準(zhǔn)管理模塊在通用平臺中設(shè)計(jì)對更多類型的資源導(dǎo)入預(yù)處理;元數(shù)據(jù)管理和文件管理分別向徽州文書元數(shù)據(jù)和掃描圖片提供入庫、管理功能,完成入庫后可通過數(shù)據(jù)關(guān)聯(lián)子模塊以特定識別字段進(jìn)行元數(shù)據(jù)與資源文件的關(guān)聯(lián)操作,完成數(shù)據(jù)初始導(dǎo)入。

其次,資源加工管理模塊則主要對導(dǎo)入掃描圖片的進(jìn)一步加工,包括圖像裁剪、圖片分頁、圖像壓縮等。此外,在通用平臺框架中該模塊還設(shè)計(jì)有文本OCR提取、音視頻處理、壓縮轉(zhuǎn)碼等功能模塊。

最后,數(shù)據(jù)標(biāo)引模塊管理主要進(jìn)行徽州文書元數(shù)據(jù)字段的補(bǔ)充標(biāo)目,包括基于切詞匹配、年代轉(zhuǎn)化等的自動標(biāo)目過程和面向圖書館處理人員的手動標(biāo)目模塊。標(biāo)目過程需符合對應(yīng)標(biāo)目規(guī)則子模塊中預(yù)設(shè)的內(nèi)容,包括可標(biāo)目字段,字段類型范圍等。

3.2.3 數(shù)據(jù)集發(fā)布管理

發(fā)布管理模塊實(shí)現(xiàn)對徽州文書發(fā)布檢索服務(wù)的管理,包括發(fā)布審核、檢索設(shè)置和可視化配置。在功能上,發(fā)布審核子模塊完成對發(fā)布字段、發(fā)布資源內(nèi)容、發(fā)布資源描述信息等內(nèi)容的審核;檢索設(shè)置實(shí)現(xiàn)對資源關(guān)聯(lián)數(shù)據(jù)表、統(tǒng)一檢索模式和高級檢索字段與數(shù)據(jù)表字段對應(yīng)關(guān)系進(jìn)行配置;可視化配置子模塊提供對資源集檢索服務(wù)的可視化展示方式進(jìn)行配置選擇。

3.3 徽州文書檢索服務(wù)子系統(tǒng)

檢索服務(wù)子系統(tǒng)是對館藏徽州文書資源加工數(shù)據(jù)的應(yīng)用。子系統(tǒng)由Vue.js 框架搭建,通過后端鑒權(quán)API 實(shí)現(xiàn)數(shù)據(jù)通信。服務(wù)以徽州文書資源檢索發(fā)現(xiàn)為核心,通過欄目分類、檢索發(fā)現(xiàn)、排序篩選和關(guān)聯(lián)推薦實(shí)現(xiàn)對資源的多維度揭示。檢索過程主要使用元數(shù)據(jù)中的題名、人物、主題詞/關(guān)鍵詞、館藏信息、相關(guān)資源、時(shí)間、地點(diǎn)、頁數(shù)字段等字段,通過統(tǒng)一檢索、高級檢索、結(jié)果集二級檢索、關(guān)聯(lián)推薦等揭示、發(fā)現(xiàn)方式,進(jìn)一步提升用戶使用檢索服務(wù)的效率和體驗(yàn)。資源詳情頁面提供資源明細(xì)瀏覽、資源分享下載、自定義批注等功能,充分滿足用戶資源使用需求。同時(shí),以開放眾包的服務(wù)理念進(jìn)一步通過用戶瀏覽批注行為,完善館藏徽州文書資源服務(wù)內(nèi)容。

4 徽州文書資源數(shù)據(jù)庫功能特色

我館徽州文書資源庫平臺的建設(shè),除了具備存儲和檢索服務(wù)功能外,還形成具備量化分析和一定數(shù)字人文研究能力的特色。相較于現(xiàn)有其他徽州文書數(shù)據(jù)庫,本平臺特色主要聚焦:技術(shù)層面對數(shù)據(jù)管理規(guī)范化;內(nèi)容層面融入數(shù)字人文思想,構(gòu)建資源知識點(diǎn)并引入檢索發(fā)現(xiàn)服務(wù);服務(wù)層面更多體現(xiàn)在共建共享機(jī)制和多維檢索發(fā)現(xiàn)服務(wù)中。

4.1 完善數(shù)據(jù)管理維護(hù)機(jī)制

特色資源建設(shè)是一個(gè)長期的過程,完善資源數(shù)據(jù)管理機(jī)制應(yīng)該融入整個(gè)工作流程中。館藏徽州文書數(shù)據(jù)庫對元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)采集、文件上傳、資源加工、資源數(shù)據(jù)化、發(fā)布文件處理全流程進(jìn)行有效管理,明確數(shù)據(jù)加工、存儲、傳輸、備份環(huán)節(jié)的維護(hù)細(xì)節(jié)。

具體包括:(1)數(shù)據(jù)庫系統(tǒng)的性能優(yōu)化和數(shù)據(jù)安全保障。平臺結(jié)構(gòu)化數(shù)據(jù)通過MySQL + Redis的數(shù)據(jù)庫方案進(jìn)行讀寫,數(shù)據(jù)加工管理與資源數(shù)據(jù)服務(wù)實(shí)現(xiàn)讀寫分離,提高使用服務(wù)中資源加工數(shù)據(jù)傳輸效率,控制數(shù)據(jù)庫寫入渠道入口,提升數(shù)據(jù)安全保障。(2)數(shù)據(jù)流中任一環(huán)節(jié)可追溯機(jī)制,管理平臺前后端分離,模塊化功能通過鑒權(quán)API獲取使用數(shù)據(jù),簡化內(nèi)部數(shù)據(jù)流,便于追溯資源數(shù)據(jù)化過程的任一環(huán)節(jié),降低數(shù)據(jù)維護(hù)難度,提升數(shù)據(jù)更新效率。(3)資源數(shù)據(jù)流式處理。在現(xiàn)有徽州文書資源采集加工發(fā)布流程下,對于數(shù)據(jù)可進(jìn)行流式處理,以現(xiàn)有930 件(8 809 頁)館藏徽州文書為例,自數(shù)據(jù)入庫、加工直至發(fā)布級文件生成并更新至檢索系統(tǒng),全部流程可控制在60-90分鐘。

4.2 構(gòu)建知識點(diǎn)發(fā)現(xiàn)索引

平臺數(shù)據(jù)標(biāo)引管理中開發(fā)有知識點(diǎn)半自動標(biāo)引模塊,以節(jié)點(diǎn)名稱、類型、上級節(jié)點(diǎn)、關(guān)聯(lián)詞字段自動構(gòu)建知識點(diǎn)數(shù)據(jù),在經(jīng)由人工審核修正后,知識點(diǎn)按關(guān)聯(lián)關(guān)系組建多維度多層級的知識點(diǎn)網(wǎng)絡(luò),在檢索服務(wù)中提升優(yōu)化數(shù)據(jù)發(fā)現(xiàn)和關(guān)聯(lián)資源推薦的有效性。以圖3為例,在平臺徽州文書資源中,與“稅”相關(guān)的文書類型通過知識點(diǎn)網(wǎng)絡(luò)可直接提取為稅契、稅銀、稅課、稅單、收稅匯票、推稅匯票、歸戶票。聚焦到“地稅”類型,提取包含14份散件資源,可進(jìn)一步按朝代、年份、地域、類型等進(jìn)行進(jìn)一步關(guān)聯(lián)、細(xì)分。此類關(guān)聯(lián)數(shù)據(jù)的形成可用于后續(xù)檢索發(fā)現(xiàn)和資源推薦服務(wù),幫助用戶在尋求相關(guān)資源時(shí)可自行快速獲取更多關(guān)聯(lián)研究內(nèi)容。

圖3 徽州文書數(shù)據(jù)“稅”相關(guān)類型與地稅數(shù)據(jù)知識節(jié)點(diǎn)提取

4.3 實(shí)現(xiàn)徽州文書數(shù)據(jù)共建共享

特色數(shù)據(jù)庫建設(shè)往往需要耗費(fèi)大量人力物力,而圖書館也面臨資源有限、經(jīng)費(fèi)匱乏的現(xiàn)狀[8]。因此,合理的共建共享機(jī)制將直接影響資源共建、機(jī)構(gòu)合作。在本平臺徽州文書資源的共建共享機(jī)制上共設(shè)計(jì)有3層獨(dú)立方案,包括數(shù)據(jù)庫層面元數(shù)據(jù)字段標(biāo)準(zhǔn)化、接口層面鑒權(quán)API 數(shù)據(jù)共享、服務(wù)層面資源授權(quán)下載,以多層次的數(shù)據(jù)共建共享,充分保障資源的通用性和專業(yè)性。

數(shù)據(jù)庫層面元數(shù)據(jù)字段標(biāo)準(zhǔn)化,平臺在分析徽州文書特征基礎(chǔ)上定義了其元數(shù)據(jù)的17 種字段,其中充分考慮兼容都柏林核心集(Dublin Core Element Set)元素字段,保證與其他類型數(shù)據(jù)庫的兼容性,提供數(shù)據(jù)共建共享的底層標(biāo)準(zhǔn)基礎(chǔ)。

接口層面鑒權(quán)API數(shù)據(jù)共享,API是元數(shù)據(jù)標(biāo)準(zhǔn)可解析后數(shù)據(jù)實(shí)現(xiàn)同步獲取的主要途徑之一,平臺API 可通過請求令牌信息識別訪問者身份實(shí)現(xiàn)數(shù)據(jù)通信,對平臺合作機(jī)構(gòu)可提供全面且可定制化的數(shù)據(jù)支持。

服務(wù)層面資源授權(quán)下載,平臺支持授權(quán)個(gè)人用戶按權(quán)限導(dǎo)出資源字段標(biāo)準(zhǔn)、資源發(fā)布文件和原始文件,通過基于合作平臺的用戶互認(rèn)等機(jī)制,即可擴(kuò)大平臺間用戶群體,在用戶層面實(shí)現(xiàn)資源共享。

4.4 資源高效多維度檢索發(fā)現(xiàn)體系

徽州文書資源庫平臺資源發(fā)現(xiàn)通過多維度多渠道的方式,降低平臺資源發(fā)現(xiàn)難度(具體見圖4所示)。具體服務(wù)中以自主檢索、復(fù)合檢索、多維篩選、關(guān)聯(lián)推薦等形式組合,通過多個(gè)入口提取命中資源數(shù)據(jù),增加服務(wù)廣度;結(jié)合資源主題詞、類型、年代、地域等特征信息,便于簡化數(shù)據(jù)字段索引設(shè)置,提升數(shù)據(jù)提取效率,提升發(fā)現(xiàn)深度;遵從主題詞匹配優(yōu)先并使用瀏覽量、資源評分等參數(shù)的混合排序規(guī)則,優(yōu)化展示排序。最終實(shí)現(xiàn)從元數(shù)據(jù)、分析數(shù)據(jù)、知識點(diǎn)關(guān)聯(lián)數(shù)據(jù)等多個(gè)維度完成資源數(shù)據(jù)的整體發(fā)現(xiàn),實(shí)現(xiàn)用戶對所需資源的高效準(zhǔn)確定位和發(fā)現(xiàn)。

圖4 徽州文書檢索服務(wù)頁面

5 結(jié)語

徽州文書資源庫平臺實(shí)現(xiàn)對我館徽州文書資源的數(shù)字化存儲、管理和檢索功能,初步建設(shè)徽州文書知識圖譜和資源推薦系統(tǒng)。在建設(shè)過程和試用過程中,筆者對徽州文書資源庫平臺擬定了進(jìn)一步完善平臺通用性功能的完善方向。同時(shí),在知識圖譜構(gòu)建和檢索發(fā)現(xiàn)上進(jìn)一步挖掘資源內(nèi)容中的人、物、事節(jié)點(diǎn),進(jìn)而組建更完善的語義網(wǎng),使資源使用者尤其是研究學(xué)者可以更好地進(jìn)行內(nèi)容發(fā)現(xiàn)、挖掘和分析。但還存在加工過程遵從以專用元數(shù)據(jù)標(biāo)準(zhǔn)處理收割數(shù)據(jù)資源、以發(fā)布應(yīng)用文件規(guī)范對資源加工進(jìn)行各維度閾值限制、平臺資源加工僅支持人工輸入構(gòu)建全文數(shù)據(jù)等不足,在數(shù)字人文理論與技術(shù)發(fā)展的當(dāng)下,這也是本平臺后續(xù)發(fā)展需要重點(diǎn)攻克的內(nèi)容。

猜你喜歡
數(shù)據(jù)庫資源管理
棗前期管理再好,后期管不好,前功盡棄
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
資源回收
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
“這下管理創(chuàng)新了!等7則
雜文月刊(2016年1期)2016-02-11 10:35:51
主站蜘蛛池模板: 乱色熟女综合一区二区| 囯产av无码片毛片一级| 亚洲人成影院午夜网站| 色婷婷亚洲十月十月色天| 国产a v无码专区亚洲av| 国产一区二区三区精品欧美日韩| 成人看片欧美一区二区| 国产精品久久精品| julia中文字幕久久亚洲| 亚洲人成网站在线观看播放不卡| 亚洲欧美综合在线观看| 无码日韩人妻精品久久蜜桃| 久久99热66这里只有精品一| 久久久黄色片| 亚洲第一视频区| 欧美成人精品在线| 日韩精品高清自在线| 91网址在线播放| 久久久久久久久久国产精品| 国产精品久久久久久久伊一| a天堂视频在线| 日韩欧美中文字幕在线韩免费| 亚洲日韩第九十九页| 亚洲精品天堂自在久久77| 国产国产人成免费视频77777| 专干老肥熟女视频网站| 亚洲成AV人手机在线观看网站| 国产特级毛片| 国产无码在线调教| 国产自在自线午夜精品视频| 亚洲国产系列| 国产成人91精品免费网址在线| 中文字幕在线一区二区在线| 日韩欧美国产区| 国产精品亚欧美一区二区| 40岁成熟女人牲交片免费| 毛片手机在线看| 91黄色在线观看| 久久精品亚洲热综合一区二区| 色哟哟国产成人精品| 国产99视频精品免费观看9e| 欧美成人h精品网站| 久热99这里只有精品视频6| 久久无码av一区二区三区| 中文字幕佐山爱一区二区免费| 国产精品浪潮Av| 国产成人区在线观看视频| 精品人妻一区二区三区蜜桃AⅤ| 日韩欧美一区在线观看| 人妻少妇久久久久久97人妻| 日本福利视频网站| 少妇精品在线| 亚洲人成网线在线播放va| 91精品免费久久久| 亚洲首页在线观看| 亚洲国产AV无码综合原创| 国产精品无码久久久久AV| 国产在线观看一区二区三区| 青青草国产一区二区三区| 亚洲成在线观看| 久操中文在线| 成人无码一区二区三区视频在线观看| 激情视频综合网| 在线精品亚洲国产| 97久久免费视频| 亚洲精品国偷自产在线91正片| 找国产毛片看| 国产在线精品香蕉麻豆| 亚洲国产系列| 伊人蕉久影院| 漂亮人妻被中出中文字幕久久 | 久久久久免费精品国产| 免费一极毛片| 精品无码人妻一区二区| 日韩欧美国产成人| 国产成人亚洲综合A∨在线播放| 国产剧情伊人| 成人欧美日韩| 亚洲精品第一页不卡| 免费人成又黄又爽的视频网站| 欧美日韩激情在线| 91毛片网|