999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

安徽中醫(yī)藥古籍書目提要數(shù)字化建設探析

2023-10-26 13:04:32王詠梅任書俊劉新宇馬巍巍
合肥師范學院學報 2023年3期
關鍵詞:中醫(yī)藥數(shù)據(jù)庫信息

王詠梅,高 宇,任書俊,劉新宇,馬巍巍,鄧 勇,宋 莉

(1.合肥師范學院 計算機與人工智能學院,安徽 合肥 230601;2.安徽中醫(yī)藥大學 圖書館,安徽 合肥 230038)

書目提要是文獻的重要信息。提要又稱為“解題”,日本文獻學家小見山壽海曾言:“解題是一書比較詳細的記載,也就是對每一種圖書的品題解說。”[1]梁啟超曾言:“載籍浩博絕非一人之力所能盡藏、所能盡讀。瀏覽諸錄,可以知古人著作之大凡。有題解者,讀其解題,雖未睹其原書,亦可知梗概。”[2]“提要”不僅為讀書人指引治學門徑,也為“辨章學術,考鏡源流”提供了巨大的幫助,能夠達到讓讀者未目睹其原書也可知梗概的目的,提要的有無與好壞直接關系著文獻的質(zhì)量與價值[3]。中醫(yī)藥古籍除了具有一般古籍的特點外還有著極強的專業(yè)價值,通常晦澀難懂,因而,中醫(yī)藥古籍書目提要信息數(shù)字化建設對深入研究中醫(yī)藥古籍歷史和學術價值有著重要意義。

1 中醫(yī)藥古籍書目數(shù)據(jù)庫存在的問題

國內(nèi)已建好的書目提要數(shù)據(jù)庫普遍存在以下問題:

一是書名著錄規(guī)則不統(tǒng)一,導致以題名途徑檢索時容易出現(xiàn)偏差。很多古籍在封面、版心、內(nèi)封、書衣、書根等處都可能會有書名,而且名字往往不同,因而在著錄時會因所取題名位置不同而產(chǎn)生較大差異,導致以題名途徑檢索時出現(xiàn)差錯。二是分類法不統(tǒng)一,導致數(shù)據(jù)庫共享困難。在古籍文獻分類方面,現(xiàn)有的書目數(shù)據(jù)庫采用的分類法普遍不一,常見的有“四部法”“四庫法”“中圖法”“人大法”和“種次序號”等,分類方法的不統(tǒng)一導致古籍書目數(shù)據(jù)庫難以共享[4-6]。三是主題標引欠缺。現(xiàn)有的《漢語主題詞表》不能滿足中醫(yī)藥古籍主題內(nèi)容的要求,其主題標引差異明顯。四是子目無法檢索。中醫(yī)藥古籍,尤其是合訂本古籍,都包含有很多子目,目前大部分書目數(shù)據(jù)庫都未能實現(xiàn)子目檢索。五是無法提供不同版本在不同單位的收藏線索。同一種古籍,在千百年的流傳過程中形成了不同的版本,這些版本的使用價值和文物價值均不同,不同讀者的使用要求也不同。同一種書的不同版本可能分散在不同的收藏單位,各收藏單位多以自己收藏的版本創(chuàng)建書目數(shù)據(jù)庫,無法有效地為讀者提供不同版本在不同收藏單位的線索。六是目前在用的中醫(yī)藥古籍書目數(shù)據(jù)庫基本不提供提要信息[4]。

2 安徽中醫(yī)藥古籍書目提要數(shù)字化現(xiàn)狀

國內(nèi)中醫(yī)藥古籍主要集中在中醫(yī)藥院校、科研機構及其圖書館,收藏機構多建有書目數(shù)據(jù)庫。如北京中醫(yī)藥大學的“中醫(yī)藥古籍書目數(shù)據(jù)庫”、天津中醫(yī)藥大學的“中醫(yī)古籍珍善本圖書目錄”、上海中醫(yī)藥大學圖書館的“中醫(yī)古籍善本書目提要”等[7]。安徽中醫(yī)藥古籍在省外的收藏信息,散落在這些數(shù)據(jù)庫中。由于各數(shù)據(jù)庫標準不統(tǒng)一,揭示文獻的深度和廣度也不一樣,要查找安徽中醫(yī)藥古籍的收藏情況,只能分別查找各館的書目數(shù)據(jù)庫,效率十分低下。

安徽省內(nèi)有五家古籍收藏單位建立了古籍書目數(shù)據(jù)庫,收藏安徽中醫(yī)藥古籍較多的兩個單位分別是安徽中醫(yī)藥大學圖書館和安徽省圖書館[8]。安徽中醫(yī)藥大學圖書館的館藏安徽中醫(yī)藥古籍與其他古籍、普通文獻按照統(tǒng)一標準建在一個數(shù)據(jù)庫內(nèi)。安徽省圖書館則把安徽中醫(yī)藥古籍相關的書目分建在“安徽省歷代皖人書目數(shù)據(jù)庫”[9]、“安徽省善本書目數(shù)據(jù)庫”[10]和“普通古籍書目數(shù)據(jù)庫”[11]中。用戶檢索時不能進行跨庫檢索,降低了檢索效率。同時,安徽中醫(yī)藥古籍流落海外的部分較少而且地域分散,目前國內(nèi)外均沒有專門的安徽中醫(yī)藥古籍書目提要數(shù)據(jù)庫。由于安徽中醫(yī)藥古籍一方面具有自身的專業(yè)特色,另一方面又肩負著一部分徽文化傳承的重任,因而創(chuàng)建專門的安徽中醫(yī)藥古籍書目提要數(shù)據(jù)庫有重要意義。

3 安徽中醫(yī)藥古籍書目提要數(shù)字化研究

3.1 制定古籍元數(shù)據(jù)規(guī)范

書目提要信息數(shù)字化,是指利用現(xiàn)有的科學技術把中醫(yī)藥古籍編目紙質(zhì)信息轉化為可在計算機中存儲和傳播的資源的過程。考慮到共享與交換,書目提要必須規(guī)范化。我國目前唯一機讀目錄格式CNMARC是在UNIMARC基礎上修訂的,是針對現(xiàn)代文獻研發(fā)的,對古籍文獻并不適用。為了在計算機中合理規(guī)范地描述中醫(yī)藥古籍書目提要信息,本文使用制定元數(shù)據(jù)規(guī)范的方式來描述古籍文獻信息。與古籍有關的元數(shù)據(jù)相關標準有《專門元數(shù)據(jù)設計指南》《專門數(shù)字對象描述元數(shù)據(jù)》《古籍元數(shù)據(jù)規(guī)范》《基本元數(shù)據(jù)著錄規(guī)則》和《都柏林核心元數(shù)據(jù)集》(DC)[12]等。其中DC定義了Web資源通用的核心標準,包含了15個描述資源對象的核心元素,是國際上通用的元數(shù)據(jù)解決方案,已成為Internet的正式標準和美國國家信息標準。其他元數(shù)據(jù)標準基本都兼容DC并在其基礎上進行了擴展。《專門元數(shù)據(jù)設計指南》復用了DC中15個核心元素并提出了復用原則,指出了元數(shù)據(jù)規(guī)范的基本組成元素和擴展原則。《古籍元數(shù)據(jù)規(guī)范》由科技部重大項目“我國數(shù)字圖書館標準規(guī)范建設”提出,用于規(guī)范地描述古籍的內(nèi)容和外觀特征。本文提出的元數(shù)據(jù)規(guī)范從著錄者、使用者、著錄對象三方面入手,充分考慮前兩者的需求和著錄對象的特性并加以平衡,遵循《專門元數(shù)據(jù)設計指南》的設計原則,以DC和《中華人民共和國文化行業(yè)標準·古籍元數(shù)據(jù)規(guī)范》(WH/T66-2014)為基礎,在采集樣本的基礎上針對安徽中醫(yī)藥古籍書目提要的特點設計而成。樣本取自《安徽中醫(yī)古籍總目提要》和《中國中醫(yī)古籍總目》。元數(shù)據(jù)規(guī)范schema結構如圖1所示,該元數(shù)據(jù)規(guī)范在滿足著錄者錄入中醫(yī)藥古籍書目信息要求的基礎上,涵蓋了資源的重要檢索點,不僅可以滿足使用者的要求,其中的數(shù)據(jù)項還可以作為信息抽取依據(jù),滿足安徽中醫(yī)藥古籍款目的信息存儲要求。

圖1 安徽中醫(yī)藥古籍元數(shù)據(jù)規(guī)范結構示意圖

3.2 形成安徽中醫(yī)藥書目提要信息DTD和XML文檔

信息抽取簡稱IE(information extraction),即從自然語言文本中抽取出特定的事件或事實信息,以便將海量內(nèi)容進行分類、提取和重構。安徽中醫(yī)藥古籍信息抽取的目標是將紙質(zhì)書目提要信息抽取出來,形成符合圖1的半結構化數(shù)據(jù)。信息抽取可以通過基于規(guī)則和基于統(tǒng)計的兩種方法實現(xiàn)[13]。以《安徽中醫(yī)古籍總目提要》中的基本款目《傷寒類證便覽》為例(圖2)[14],可以將文本內(nèi)容歸納為:正題名、卷數(shù)、附錄附注、別名、主要責任者、其他責任者、責任者附注、出版時間、成書附注、內(nèi)容提要、版本附注、版本及收藏單位。由以上款目可以看出,《安徽中醫(yī)古籍總目提要》構成相對簡單,相關詞有限,有明顯的規(guī)律性,更適合采用基于規(guī)則的方法對書目提要進行信息抽取。由于正則表達式對于字符串匹配的功能強大,得到大多數(shù)編程語言支持,安徽中醫(yī)藥古籍書目的抽取規(guī)則可以采用正則表達式來描述。

圖2 傷寒類證便覽款目

將抽取的記錄信息放入XML文檔中,形成描述安徽中醫(yī)藥古籍書目提要的XML文檔。為了保證XML文檔的有效性,先要根據(jù)圖1中元數(shù)據(jù)規(guī)范設置文檔數(shù)據(jù)模式定義。XML的數(shù)據(jù)模式可以通過DTD或者XML Schema的形式定義,由于DTD是XML標準的一部分且較成熟,本文使用DTD定義安徽中醫(yī)藥古籍書目提要的款目信息。DTD的模式管理機制包括DTD_DocType、DTD_Element、DTD_Attribute、DTD_ElementScope四部分,安徽中醫(yī)藥古籍書目提要信息的DTD定義如圖3所示。

圖3 安徽中醫(yī)藥古籍書目提要信息的DTD

DTD規(guī)定了安徽中醫(yī)藥古籍書目提要信息XML文檔中使用的標記、父元素包含的子元素、各子元素的出現(xiàn)順序及各元素包含的屬性等。基于該模板,以《傷寒類證便覽》為例,可以得出描述安徽中醫(yī)藥古籍書目提要的XML文檔(圖4)。編程人員可以根據(jù)DTD了解XML的邏輯結構,并編寫相應的應用程序。

圖4 安徽中醫(yī)藥古籍書目提要的XML文檔

3.3 使用DOM訪問安徽中醫(yī)藥古籍書目提要的XML文檔

文檔對象模型(Document Object Model,DOM)是W3C推薦的用來管理XML文檔信息或數(shù)據(jù)的模型,它采用樹型數(shù)據(jù)結構表示XML數(shù)據(jù),基于DOM查詢的實現(xiàn)方法相當于對DOM結構樹的遍歷。XML DOM 定義了所有XML元素的對象、屬性以及訪問方法(接口),這些接口以Document、Processing Instruction、Element、Attribute等類型的形式出現(xiàn)。DOM對XML文檔的訪問以結點訪問為基礎,從XML數(shù)據(jù)樹型結構的根結點開始,每一個下層元素都作為處理節(jié)點。安徽中醫(yī)藥古籍書目提要信息XML文檔對應的DOM結構樹如圖5所示。

圖5 安徽中醫(yī)藥古籍DOM結構樹

安徽中醫(yī)藥古籍書目提要信息數(shù)字化后,利用DOM編寫服務器端腳本程序,可以實現(xiàn)在客戶端遠程添加、修改或查詢服務器端XML文檔的數(shù)據(jù),從而實現(xiàn)XML文檔的在線交互。由于DOM是一種與平臺和語言無關的應用程序編程接口,其對于各種語言展現(xiàn)的都是統(tǒng)一的對象、屬性、方法和事件,因而可以使用各種計算機語言和解決方案編寫服務器端腳本。例如,可以使用JavaScript創(chuàng)建XML DOM對象實例TCMAbook.xml文檔,加載書目提要信息:

Var xmldoc=new ActiveXobject(“MSXML.DOMDocument”);

xmldoc.async=”false”;

xmldoc.load(“TCMAbook.xml”);

創(chuàng)建安徽中醫(yī)藥古籍書目提要信息對象實例后,可以利用ASP編程通過該實例創(chuàng)建、遍歷XML文檔,添加、修改、查詢XML數(shù)據(jù)等,實現(xiàn)對XML數(shù)據(jù)的存儲和管理,工作過程如圖6。

圖6 DOM方式工作過程

3.4 安徽中醫(yī)藥古籍書目提要信息的存儲與管理

基于XML的數(shù)據(jù)庫系統(tǒng)分為NXD(Native XML Database)和XEDB(XML Enable Database)兩類。NXD是以XML文檔為基礎的數(shù)據(jù)庫管理系統(tǒng),XEDB則是在傳統(tǒng)的RDBMS中增加了支持XML技術的功能,需要結構映射或者模型映射才能允許傳統(tǒng)數(shù)據(jù)庫訪問XML。在安徽中醫(yī)藥古籍書目提要信息的存儲方面,由于需要保存中醫(yī)藥古籍的層次型結構信息,同時,針對書目提要信息數(shù)據(jù)庫的操作主要是查詢和存儲,而對數(shù)據(jù)進行修改更新的需求較少。因此,可以選擇專門為處理XML數(shù)據(jù)設計的NXD系統(tǒng),如eXist、BaseX等。

4 結語

XML是用于新一代網(wǎng)絡數(shù)據(jù)表示、傳遞和交換的標準。用XML可以清楚地描述和儲存中醫(yī)藥古籍書目提要的層次型結構特征,解決目前CNMARC格式對古籍文獻并不適用的問題。引入XML處理機制DOM,可以利用ASP編程,實現(xiàn)XML文檔的在線交互,在不同應用平臺之間傳遞和共享數(shù)據(jù)。利用XML數(shù)據(jù)庫技術,構建安徽中醫(yī)藥古籍書目信息資源管理系統(tǒng),對半結構化的中醫(yī)藥古籍書目信息進行管理并提供檢索,在有效解決現(xiàn)有古籍書目數(shù)據(jù)庫問題的基礎上,實現(xiàn)安徽中醫(yī)藥古籍書目提要信息的數(shù)字化。

猜你喜歡
中醫(yī)藥數(shù)據(jù)庫信息
中醫(yī)藥在惡性腫瘤防治中的應用
中醫(yī)藥在治療惡性腫瘤骨轉移中的應用
從《中醫(yī)藥法》看直銷
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
中醫(yī)藥立法:不是“管”而是“促”
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 欧美激情视频在线观看一区| 色哟哟国产成人精品| 午夜精品福利影院| 欧美色亚洲| 久久五月天综合| 凹凸国产分类在线观看| 亚洲欧美不卡中文字幕| 欧洲精品视频在线观看| 91无码人妻精品一区| 免费三A级毛片视频| 国产成人综合亚洲网址| 一本大道视频精品人妻| 亚洲毛片网站| 91福利免费视频| 国产亚洲视频播放9000| 永久毛片在线播| 精品视频一区在线观看| 在线a网站| 亚洲国产精品人久久电影| 久久综合干| 免费不卡视频| 日韩欧美中文在线| 五月婷婷综合网| 久久公开视频| 日韩av手机在线| 国产成熟女人性满足视频| 四虎永久在线精品国产免费| 久热中文字幕在线| 国产一区二区三区精品欧美日韩| 国产精品亚洲а∨天堂免下载| 精品亚洲麻豆1区2区3区| 亚洲日本韩在线观看| 亚洲码在线中文在线观看| 一本久道久综合久久鬼色| 国产一级无码不卡视频| 久久香蕉国产线看观看式| 另类欧美日韩| 天堂在线亚洲| 国产在线八区| 操美女免费网站| 久久国产拍爱| 99热这里只有精品免费| 亚洲免费黄色网| 欧美亚洲激情| 99草精品视频| 欧美啪啪精品| 黑人巨大精品欧美一区二区区| 亚洲欧美一区二区三区麻豆| 欧美日本在线观看| 国产凹凸视频在线观看| 久久黄色毛片| 在线不卡免费视频| 99ri精品视频在线观看播放| 精品国产电影久久九九| 日韩 欧美 国产 精品 综合| 少妇高潮惨叫久久久久久| 中国毛片网| 国产高清精品在线91| 亚洲无码高清视频在线观看| 久久亚洲国产最新网站| 麻豆精品在线播放| 在线中文字幕网| 亚洲日韩AV无码精品| 亚洲AV成人一区国产精品| 国产精品部在线观看| 国产午夜福利片在线观看| 亚洲视频免| 无码综合天天久久综合网| 亚洲一区二区三区麻豆| 亚洲成年人片| 欧美日韩成人在线观看| 亚洲天堂.com| 欧美高清三区| 婷婷色一区二区三区| 亚洲aaa视频| 91精品在线视频观看| 国产精品久久久久久久久| 伊人激情综合| 极品国产在线| 亚洲欧洲自拍拍偷午夜色无码| 亚洲一级毛片免费观看| 九九久久精品国产av片囯产区|