浙江中醫藥大學(杭州,310053) 焦 陽 凌 天 狄碧云
近代中國,社會動蕩,但總體來看,出版業仍相對繁榮,有大量的中醫書籍出版發行。近代中醫文獻包括清末古籍、民國圖書及期刊等文獻,是傳統醫藥文化遺產的重要組成部分。本文通過梳理中醫文獻著作并利用知識挖掘技術,構建中醫文獻特色數據庫,分析某一特定時期特定區域醫家醫籍文獻的分類、分布情況,以期讓讀者更好地利用中醫文獻資源,使其展現經典價值,并為中醫文獻數字化建庫模式提供一種全新的研究方法和思路。
浙派中醫源遠流長,歷代名醫輩出,醫籍汗牛充棟。歷史上先后產生眾多中醫學術派別,諸如永嘉醫派、丹溪學派、錢塘醫派、紹派傷寒、溫病學派等,具有深遠影響。近代以來,中醫受到了西學東漸、“中醫存廢”政策的沖擊,浙派醫家們積極探索中醫學發展新模式。許多中醫名家如國醫革新導師章炳麟、錢塘醫派仲學輅、永嘉徐定超、紹興裘吉生等,共同推動了地方中醫藥事業的發展。著作方面,近代浙江重要醫籍雖不及以前,但也數量眾多,精品迭出。因此整理研究近代浙派中醫文獻并建設中醫文獻特色數據庫,對彰顯和保護傳統醫學、挖掘浙江醫學流派及賢哲經驗智慧具有重要參考價值,值得全面整理、繼承,精心研究。
1.近代中醫文獻具有很高的學術價值
近代中醫學術上秉承“中學為體,西學為用”,其對當代浙江中醫藥事業的發展具有重要價值,體現在:(1)中西醫論爭與匯通類著作涌現。中西醫匯通思想深刻影響了中醫學的發展,也是近代醫學發展的重要特征。浙江地區中西醫匯通之作集中于民國時期,隨著中西醫對比研究更加深入,浙派醫家嘗試用西醫知識來解釋中醫理論,力圖實現中西醫匯通。比較有影響的是楊則民,其《內經的哲學檢討》一文,駁斥了廢止中醫派的各種錯誤觀點[1]。當時中西醫匯通的思想雖有很多局限,但也有很多值得肯定之處。(2)中醫教材著作推動近代中醫學校教育。清末廢除科舉,設立新式學堂,改良了傳統醫學教育模式,開啟了近代中醫教育的序幕。浙江作為近代民辦中醫教育的主要發源地之一,創辦了許多新式中醫學校,編寫了大量教材著作,如“浙江中醫專門學校”校長傅崇黻所編教材《外科要旨講義》(1938年)等。這些中醫教材凝聚了浙江中醫教育界人士的拳拳之心,培養了大批中醫人才,為中醫學術傳承做出了巨大貢獻[2]。(3)臨床醫學著作占據主導地位。近代西方醫學的傳入推動了中醫學尤其是中醫臨床的發展,使其成為近代中醫學發展的核心,浙江地區也大致如此。中醫臨床各科著作以溫病、內科、兒科為主,出現了《溫熱經緯》(1852年)等經典醫學巨著。民國時期的浙派醫家如曹炳章、何廉臣等注重中醫臨床治療效果的總結,以證明中醫科學有效。(4)大型醫學叢書匯編類著作發展。沿襲前代傳統,醫學叢書的匯編匯刻是近代中醫書籍發展的主流。浙派醫家所編叢書匯編類著作主要是一些大部頭的醫學工具書。比較著名的是祝韻梅《壽世匯編》(1867年),重印多次,版本眾多。貢獻最大者當屬裘吉生、曹炳章二人。裘吉生的《三三醫書》(1924年),保存大量江浙一帶的名醫方論,內容齊全,兼顧各科,其中有些書已是孤版,價值很高[3]。曹炳章的《中國醫學大成》(1936年),匯集漢唐至明清一百余醫家及日本漢醫家著述,也很有代表性。叢書匯編類著作為研究近代醫學發展提供了珍貴史料和寶貴經驗。
2.文獻數字化有利于近代中醫文獻保護和利用
清末民國時期的中國,發生過很多極具影響的社會事件,近代文獻在這場社會變革浪潮中具有較高的史料價值和利用價值。這一時期的中醫文獻既有古籍的特性,又有現代文獻的特性,體現中醫由古代向現代邁進過程中的諸多時代特征。當前許多收藏機構,如國家圖書館已經把清末民國時期文獻列入館藏珍品的范圍,并開展數字化研究[4]。但是從一些調查數據來看,當前近代文獻普遍存在不同程度的損毀,文獻保護工作尚需加強[5]。究其原因,首先是自然原因導致的文獻本身的酸化和老化。近代出版的中醫文獻多是采用機制含酸紙張印制而成,紙張質量較差,易于老化, 以其為載體的文獻, 據說只能保存百年左右。其次是人為因素,即早期研究和管理人員認識觀念的偏差,較之那些備受推崇的年代久遠的古籍善本,近代文獻備受冷落,保存隨意,過度翻閱,導致很多的近代文獻損毀嚴重,修復困難。再者,許多近代中醫文獻沒有重新整理再版,僅存唯一抄本,且利用率遠高于傳統古籍,面臨失傳的風險。最后,近代文獻采用雙面印刷形式,傳統的古籍裱托修復方法并不適合近代文獻[6],需要用西方的文獻修復技術,成本很高。因此,文獻數字化,建立特色數據庫是最好的文獻保護方法。首先,建立特色數據庫實現了對文獻數字化還原,原貌再現;其次,根據著作權法的相關規定,大部分近代文獻已過知識產權保護期,為數字化資源共享帶來便利;最后,資源平臺可以豐富用戶體驗效果,實現模擬文獻翻頁、縮放等全新體驗[7]。
1.研究資料及方法
本文以《中國中醫古籍總目》(2007年)(以下簡稱《古籍總目》)中記載的中醫書目為主要數據來源,以近代時期(1840—1949年)浙派醫家醫著文獻為研究對象。《古籍總目》收錄了全國150家圖書館館藏1949年以前出版的存世中醫古籍書目13455部,是迄今為止覆蓋面最廣的反映中醫文獻現狀的大型聯合目錄[2]。
圈定研究范圍后,本研究主要以文獻調查法與網絡調查法搜集、查證相關文獻。參考了《中醫人名辭典》、《浙江醫籍考》及浙江地方志等眾多文獻,對《古籍總目》中醫著作進行標注,做到書名、著者、名號、出版年代一致,剔除了原著補正、校注等非原著者、審定者、無法考證者、著者佚名者醫籍書目,同時還注重《古籍目錄》未收錄的現存文獻的整理和收錄。在整理文獻中,關于收錄的著者遵循以下原則:(1)原籍是浙江、后遷居外地的浙派醫家的醫著以及本土資料記載的醫著,予以收錄;(2)原籍外地,但長期在浙江居住、工作,并對浙派中醫有研究者,醫著可納入;(3)浙派中醫的專論著作予以收錄。
2.館藏分布
調查統計結果顯示,《古籍總目》中共整理出近代浙派中醫醫著475部,各種版本的醫籍數據3944條,涉及醫家近100位。我們從館藏角度將3944條醫籍數據錄入計算機系統進行統計分析,得出版本數879種,藏于139個圖書館中,主要在上海中醫藥大學圖書館(226種)、中國中醫科學院圖書館(212種)、上海圖書館(149種)和浙江省中醫藥研究院(105種)。這些單位收藏量都在百種以上,其中上海中醫藥大學收藏最多。收藏量分列其后的是國家圖書館(89種)、南京圖書館(88種)、南京中醫藥大學圖書館(81種)、安徽中醫藥大學圖書館(81種)、成都中醫藥大學圖書館(76種)、浙江中醫藥大學圖書館(74種),另外,蘇州市中醫醫院圖書館、北京中醫藥大學圖書館也收藏了70種以上的醫籍。由于版本的原因,這些醫籍種類是存在重復的。
3.版本特點
從版本類型來看,879種版本的中醫典籍主要有鉛印本、刻本、石印本、抄本、稿本、影印本等,載體豐富,形式多樣。其中刻本數最多(309種);其次是鉛印本(250種)、抄本(153種)和石印本(112種),稿本(42種)和影印本(8種)較少。可以看出,清末民國時期,現代機械印刷工藝尚未完全取代傳統的雕版印刷,抄本和刻本仍然是主流的書籍出版手段。鑒于鉛印和石印工藝物美價廉、印制方便,可以快速有效地增加館藏數量,方便了書籍的保存和流通,所以從民國開始,以鉛印與石印為代表的機械印刷工藝后來居上,逐漸取代雕版,成為主流的印刷手段,直到今天,也充分說明了近代充滿變革的時代屬性。
4.分類概況
從分類概況來看,475部浙派中醫醫著研究內容廣泛,幾乎涵蓋了中醫藥的所有門類。其中,有關醫案醫話醫論的著作最多(81部),其次是方書(42部)、溫病(41部)、本草(37部)、綜合(35部)、內科(33部)、傷寒金匱(24部)。這幾個門類也是近代醫家普遍關注的門類,故著述相對集中。另外,臨證類各科(臨證綜合、溫病、內科、女科、兒科、外科、五官科、傷科)著作共有178部,中醫基礎理論類(基礎理論、醫經、傷寒金匱)著作共有56部。可以看出,臨證醫學各科研究成果豐碩,已成為近代中醫藥學發展的重要特征[3]。
1.中醫文獻數字化現狀
國內中醫文獻數字化的研究可以追溯到20世紀80年代的古籍數字化,歷經幾十年的發展,在基礎理論和標準化技術方面的研究和應用已經比較成熟[8]。近年來,中醫文獻數字化逐漸受到國家和中醫藥類高校、公共圖書館、中醫科研機構、商業公司等重視,陸續建成一批書目數據庫和全文資源庫,反映了收藏單位的古籍收藏情況。部分數據庫還實現了數據挖掘功能,但是在近代中醫文獻數字化研究方面稍顯不足。在取得成果的同時,我們也應該看到在中醫古籍文獻數據庫的規劃、建設、共享、利用等過程中存在的一些問題:(1)缺乏整體規劃。在中醫古籍數字化規劃中,各個機構和商業公司往往獨立開發,建成的資源庫涵蓋數據量有限,缺乏整體規劃。一些公共圖書館、博物館等非醫學專業收藏機構,沒有做到對館藏資源的分門別類,醫著數字化散見于各個古籍數據庫中,不利于文獻利用[9]。(2)建設滯后。中醫古籍數字化具有很強的專業性,除了一些商業公司和少數單位外,多數單位都存在技術人員與設備不足的問題,缺乏深層次開發。收藏機構數據庫建設質量參差不齊,古籍目錄類數據庫居多,許多數據庫建成很早,缺乏必要的升級維護,已經無法訪問。(3)資源共享不足。資源共享是提升古籍資源利用價值的重要手段,調查發現,除了少數數據庫外,許多庫在互聯網上無法訪問,了解不到該收藏單位的古籍資源情況。
2.文獻全文數字化采集策略
為了避免重復建設,我們在文獻掃描前對文獻數字化情況進行了查重調查。調查發現,當前有關近代浙派醫家醫著主要散見于各個古籍數據庫中或是收錄在民國圖書數據庫中。進行近代中醫文獻全文數字化保存的單位有國家圖書館、北京大學圖書館、上海圖書館等。通過檢索本單位已購買或公開可共享的大型古籍全文數據庫后發現,前期整理475部浙派中醫醫著目錄中有139部醫籍已經完成數字化,占29.3%。其中超星讀秀數據庫全文數字化數量最多,達到101部,之后依次是中國國家數字圖書館(76部)、大學數字圖書館國際合作計劃(以下簡稱CADAL,26部)和瀚堂數據庫(3部)。各個數據庫之間數字化醫籍互有重復,相互補充,采用版本也不同。其中超星讀秀數據庫可以提供全文檢索,使用方便,而CADAL掃描的醫籍質量較高,內容清晰。可以看出,目前浙派醫家醫著數字化程度很低。對于已經數字化的文獻,我們購買數字化全文,下載已購數字資源或遠程調用全文鏈接。除此之外,針對本單位收藏的70余種浙派中醫文獻,我們進行CCD掃描數字化處理,通過糾偏、裁剪、加水印、文件命名等技術化操作,完成數字化加工。對于其中屬于古籍的,數據采集過程嚴格按照國家古籍保護中心的《古籍數字化工作手冊》(2014年)來執行。對于非本單位收藏的文獻,我們以單位的名義與該文獻的收藏單位協商解決數字化問題。在數字化過程中保證文獻資源全貌,符合讀者閱讀習慣。
1.平臺架構
根據前期的文獻梳理情況,本文以“近代浙派中醫文獻數據庫平臺”(以下簡稱“數據庫平臺”)為例,介紹中醫文獻古籍數字化建設。當前各類中醫古籍數據庫琳瑯滿目、各具特色,在古籍數字化平臺建設中應當充分吸收各個數據庫的成功經驗,立足收藏單位的實際需求,自建或采購商業平臺。為了更好地研究浙派中醫發展情況,我們經過對各個商用數據庫平臺的綜合調研,最終決定依托圖書館的文獻信息資源優勢,組織相關專業和技術人員自建該平臺。網站平臺采用B/S架構,HTML5頁面,利用主流的Java+MVC框架技術,構建基于mySQL的醫家子庫、醫著子庫和流派子庫的數據庫,在兼顧實用性的基礎上,頁面具有良好的自適應性,適合各種瀏覽器、中醫文化墻等大屏幕展示,起到了很好的宣傳推廣中醫藥文化的作用。“數據庫平臺”構建主要分全文數字化和數據庫管理平臺搭建兩個部分。
2.元數據著錄
元數據的著錄是數據庫建設的基礎, 統一結構的元數據,有利于古籍數字化成果的共建共享。由于本數據庫文獻類型既有清末古籍也有民國出版圖書,為了方便建庫,統一按照古籍數字化元數據處理。首先要制定好描述策略,確定描述單元和描述深度。本“數據庫平臺”根據《古籍數字化工作手冊》和《古籍描述元數據著錄規則》要求描述和管理元數據, 著錄字段包括加工記錄標識號、名錄號、索書號、分類、題名、卷次、責任者、版本、冊數、版式、裝幀形式、館藏單位、制作單位,同時根據需要增加了內容提要、全文地址等字段。另外針對醫家的著錄字段包括姓名、字號、生卒、出生地、現地名、所屬流派、省份、介紹等。統一標準的著錄方式是下一步數據庫平臺數據挖掘和可視化研究實踐的基礎[10]。
3.功能模塊設計
醫籍文獻數字化后需要發布到特定的數據庫服務平臺上,為網絡用戶提供類型多樣的文獻資源,實現對文獻的瀏覽、檢索和文獻發布。根據前期需求整理,該“數據庫平臺”可劃分為前臺展示頁面和資源管理后臺。數據庫平臺前臺展示頁面分為首頁主頁面、統一檢索頁面、醫家模塊、醫著模塊、醫派模塊、中醫文化模塊等內容模塊。其中主頁面實現了對醫籍的分類展示和醫家的地域分布可視化時間軸展示,實現了文獻信息的主流社交媒體如豆瓣、微信的分享,實現了多條件統計在線可視化展示等特色功能。醫家、醫著模塊為核心服務模塊,分別實現了對收錄醫家、醫著的詳細展示。后臺管理頁面實現了在線的醫著采集加工、全文鏈接、發布等操作,界面友好。在安全管理方面,該后臺模塊需要賬戶密碼登錄,對后臺用戶的訪問權限進行控制,IP登錄審計管理與限制使用。該數據庫發布到互聯網上,實現了數字資源的共享。
近代中醫文獻的整理和數字化,反映了近代浙派醫家醫著的基本概況,在揭示層次和角度方面作了一些先進性的探索,方便了文獻查找,更好地為中醫文獻資源的數據挖掘提供了決策支持。該數據資源庫已經初步建成,各項功能和數據已基本完善,平臺發布在圖書館中醫文化墻上,也可基于互聯網共建共享。近代中醫文獻整理和數字化是一項長期的工作,需要各個部門和專業技術人員積極參與及持續的經費投入[11]。目前,在文獻數據庫建設中也存在一些不足:(1)由于時間和經費問題導致一些前期規劃的建設內容來不及實施;(2)在對近代文獻數字化掃描過程中,掃描設備可能會對文獻造成未知損毀;(3)許多浙派醫家醫籍文獻收藏于其他地區圖書館,紙本文獻獲取渠道需要有關部門一起協商打通;(4)當前數據庫中收錄的浙派醫家和醫籍數量可能有遺漏,需要進一步搜集補充。下一步,該資源庫將會通過門戶網站、微信公眾號等渠道進行宣傳推廣,并考慮繼續擴充數據平臺的內容,補充遺漏的近代浙派中醫文獻,繼續加強對非館藏的中醫文獻數字化全文的收集,建立館藏古籍模塊,展示本館收藏古籍的數字化成果,運用數字人文相關技術揭示醫籍、醫家、醫派間的關聯性等內容[12]。