馬學良 劉玲玲
摘要:哈佛燕京學社引得編纂處編纂的《漢學引得叢刊》是我國將西方現代索引技術應用于古典文獻的第一次嘗試。以中國知網(CNKI)為數據源,借助詞頻統計和主題分析方法,利用詞頻分析軟件和Excel對與哈佛燕京學社引得編纂處及《漢學引得叢刊》相關的樣本文獻內容進行詞頻統計,分析該領域的研究熱點與重點。研究發現:該領域的研究歷時時間長、側重點明顯,但在引得編纂處人物分析、引得個案研究、引得叢刊對當下古籍保護與利用的借鑒意義等方面研究不夠深入,甚至存在空白。
關鍵詞:引得編纂處;引得叢刊;古籍數字化;古籍語料庫
中圖分類號:G255.1文獻標識碼:A
DOI:10.13897/j.cnki.hbkjty.2018.0014
《漢學引得叢刊》(以下簡稱“引得叢刊”)是哈佛燕京學社引得編纂處(以下簡稱“引得編纂處”)于20世紀三十年代開始用西方科學索引方法為中國傳統典籍編纂出版的系列索引工具書,也是民國時期“整理國故”運動和“索引運動”影響下產生的代表性成果[1],在我國索引編纂史上占據重要地位。值得一提的是,自引得編纂處成立及開展引得編纂以來,國內外圖書館學界、文獻學界同仁就對它展開了方方面面的研究,各類期刊雜志刊載了多篇與之相關的研究論文。這些論文大多是基于外部特征的分析總結,內容主要涉及哈佛燕京學社及引得編纂處成立背景、引得叢刊的學術價值、編纂特點及其評價等。而對引得叢刊詞頻及內容分析的研究卻迄今未見。筆者認為,對于索引類工具書的研究,應該運用科學的方法,多層次、多角度地進行內容挖掘與整理,方能揭示其研究的重點和熱點,為我們未來的研究工作提供參考和借鑒。本文從詞頻分析和主題分析的角度,對該領域的文獻報道展開主題分析與評價。
1數據來源及研究方法
1.1樣本文獻
以中國知網(CNKI)為文獻統計源,分別以“引得”和“引得編纂處”為主題進行檢索,通過排除不相關及重復文獻,得到樣本文獻51篇,其中期刊論文47篇,會議論文2篇,學位論文2篇。
1.2研究方法
利用詞頻統計軟件及Excel表格,采用詞頻分析法和定性與定量分析相結合的內容分析法。該方法以單一語詞在樣本文獻中出現的次數為基礎進行詞頻統計,以揭示不同語詞之間的相互關系,達到透過詞頻現象探視文獻內容本質的目的。
2詞頻分析
2.1發文時間分析
一定時間范圍內文獻發表數量的變化情況,在一定程度上可以看出一個學科的研究現狀和發展趨勢。因此,我們按照不同年代的發文量,對“引得”研究的整體發展情況進行分析總結,如圖1所示。
通過圖1,可以看出該領域的文獻報道源于1981年,起步比較早,歷時時間長,發文總量呈穩步增長的趨勢,但總體文獻報道量不大。1985年和2013年是文獻報道的兩個小高峰,分別為8篇和6篇文獻。這說明,有關“引得”研究的總體關注度不高,不是學術研究重點。這在一定程度上,也說明“引得”研究還有很大的發展空間,有待學者深入地挖掘分析研究。
2.2高頻詞分析
借助自然文本詞頻分析軟件,經整理之后,得出關鍵詞5 260個,詞頻77 790次。根據美國明尼蘇達州立大學的多諾霍J.C (Donohue J.C)1973年提出的高頻詞、低頻詞分界公式T=1/2(-1+1+8*I1)(其中I1=854),計算出高頻詞閥值約為41。詞頻≥41次的高頻詞列表,參見表1。
從表1可知,“引得”研究領域的高頻詞主要有:洪業、(引得)編纂處、漢學叢刊、美國、(哈佛)燕京學社、燕京大學、(引得)特刊、中國字庋擷法、文獻學、整理國故、聶崇岐、四角號碼、索引運動、《春秋經傳引得》及其序言、《增校清朝進士題名碑錄·附引得》、標點、印刷、校對、編號、選書、“鑰”、“目”、 《道藏子目引得》、《佛藏子目引得》、《引得編纂手續綱要》、《索引和索引法》、序文、抄片、“注”等。
3主題分析
3.1對洪業及其引得貢獻的關注與研究
樣本文獻中,引得、索引和編纂三個詞為范義詞,因此“洪業”自然成為學者們研究“引得”的第一大熱點主題詞(見詞頻列表第4位詞)。洪業不僅是文獻學和索引學重要學者,還是著名史學家。他作為“索引運動”的積極倡導者與實踐者,為我國索引事業的現代化做出了重大貢獻,是具有里程碑意義的索引學人物。直至今天,他的索引貢獻、學術成就、學術思想和治學方法依然是今人研究的重點和熱點。
洪業受西方先進索引思想及科學治學方法的影響,深刻認識到索引工具書實為“治學之利器” (見詞頻列表第17位詞),故而決心致力于傳統文獻的索引式整理,他親自探索創制了“中國字庋擷”法(見詞頻列表第15位詞),制訂了《引得編纂手續綱要》(見詞頻列表第63位詞),為中國近現代索引學理論奠定了堅實的基礎。在洪業領導下,人數最多時也未超過15人的引得編纂處利用短短20年時間,竟然編纂出版了64種81冊《漢學引得叢刊》(見詞頻列表第6位詞),與引得編纂處存續期間,洪業大膽啟用新人,打造了一支專業精干的編纂隊伍(見詞頻列表第20、61位詞)有著直接關系。洪業及其領導下的引得編纂工程在我國近現代索引事業發展進程中留下了濃重的一筆,為國內外漢學研究提供了便利的治學工具,也為后人從事古籍索引編纂留下了可資借鑒的經驗與教訓。
3.2對引得編纂處的關注與研究
作為我國最早、最大的利用西方科學手段進行古籍索引編纂機構之一,引得編纂處自成立以來就得到學術界的高度關注。有關引得編纂處的研究主要分為背景和概況兩個方面。
3.2.1引得編纂處成立背景研究
引得編纂處的成立及其系統的古籍編纂不是偶然現象,而是“五四”新文化運動、“西學東漸”、“整理國故”、“索引運動”等時代背景下的必然產物,是國際與國內學術環境交互作用的結果(見詞頻列表第25、30位詞)。民國時期,美、法、日等國漢學研究都相當興盛,急需科學的漢學治學工具,故索引編纂事業也相應受到重視。此時的中國學術界在“西學東漸”的影響下,紛紛接受國外先進的治學方法,提倡和鼓勵利用西方科學的方法“整理國故”,并提出提高治學效率應從編纂古籍索引入手(見詞頻列表第19、23、27、29、64、66位詞)。于是,民國初期,時任民國外交總長的蔡廷干為老子《道德經》編纂了語詞索引《老解老》又名《老子道德經串珠》(1921年完成,1922年刊印)。這一時期的索引編纂雖然僅是個人行為,還沒有形成系統化、規模化,但這為“索引運動”的后續興盛和大規模古籍索引編纂起到了開風氣之先的作用。另外,引得編纂處以洪業為首的一些人等,都有國外留學背景,大部分都拿到了碩士、博士學位(見詞頻列表第13、21位詞),掌握西方科學的治學手段,又同時擁有深厚的國學涵養。正是在以上這些因素的綜合作用下,引得編纂處才宣告成立并迅速投入到了熱火朝天的古籍索引編纂工作中。
3.2.2引得編纂處概況研究
51篇樣本文獻中除引得個案介紹,如《藝文志二十種綜合引得》《道藏子目引得》《增校清朝進士題名碑錄·附引得》《藝文志二十種綜合引得》《三十三種清代傳記綜合引得》《遼金元傳記三十種綜合引得》等,從成立時間、機構設置、人員職責、工作手冊、工作流程、工作成果(見詞頻列表第33、34、36、40、48、50、56位詞)等多方面提到了引得編纂處及其哈佛燕京學社成立的概況。張樹華《哈佛燕京學社及其引得編纂處》(山東圖書館季刊,2006年第3期)一文,在闡述哈佛燕京學社的緣起及宗旨的基礎上,介紹引得編纂處的成立及其工作過程、工作成果等,同時認為引得編纂處所編印的引得,是圖書館工作或學者査閱、檢索、利用和開發我國古代文獻內容的重要工具書。趙玉宏、印永清《哈佛燕京引得編纂處背景研究》(《大學圖書館學報》2001年第2期:75-77頁)一文,認為引得編纂處成立是國際、國內因素作用的結果。一方面,美國發達的索引事業和美國興起的漢學研究熱潮是其國際背景;另一方面,在“西學東漸”之風的影響下,中國學術界開始提倡科學的讀書方法和治學方法,也開始了自己的索引事業,興起了所謂的“索引運動”,尤其是以洪業等留學歸來的知識分子為代表,由于他們均有深厚的國學基礎和掌握著當時科學的西學手段。因此,引得編纂處成立也在情理之中了。這類文章主要研究燕京學社引得編纂處的成立背景及簡要過程。
3.3對引得叢刊的關注與研究
引得叢刊自問世以來,得到了胡適、朱孝積、印永清、王燕均、侯漢清、王雅戈、平保興、陳振文、李文濤、馬學良等人的關注與研究。研究內容主要涉及引得叢刊的價值評價與影響、引得正刊與特刊的內容介紹、引得序言、編纂體例、檢字法及引得單刊介紹等。由于完整系統地收集引得叢刊比較困難,今人有關叢刊的研究大都比較分散,缺乏全面、系統地研究。
3.3.1引得叢刊的編纂流程與編纂體例
(1)引得工序。引得編纂處耗時20年時間編纂出版的系列叢刊,擁有獨創的檢字法、完善的工作指南、統一的編排體例(見詞頻列表第24位詞)、出版格式等。科學規范的編纂流程和統一編纂體例使得引得叢刊在當時名噪一時。《引得編纂手續綱要》作為引得編纂處的工作指南,對引得編纂環節,選書、選本、圈目、抄片、校片、編號、發印等十道工序(見詞頻列表第33、34、36、42、48、50、57、60、62、71、72位詞),做了詳細規定,并在日后的實踐工作中不斷修正。
(2)引得類型。為了提高引得的使用效率,洪業等人在索引類型的設置上下了不少功夫:先秦諸子及儒家重要經典多用逐字引得(類似國外的“concordance”,洪業譯為“堪靠燈”),如《毛詩引得》《杜詩引得》《論語引得》《孟子引得》《莊子引得》《墨子引得》《荀子引得》《孝經引得》《周易引得》《春秋經傳引得》《爾雅引得》《琬琰集刪存附引得》等;還有一些儒家經典則用逐句引得,如《儀禮引得附鄭注引書及賈疏引得》《刊誤引得》《周禮引得附注疏引書引得》等;傳記資料多用專名引得,該引得類型又細分人名、地名、書名、文獻著者引得等,如《四十七種宋代傳記綜合引得》《八十九種明代傳記引得》《遼金元傳記三十種綜合引得》《三十三種清代傳記綜合引得》《藝文志二十種綜合引得》《增校清朝進士題名碑錄·附引得》《宋詩紀事著者引得》《全漢三國晉南北朝詩作者引得》《全上古三代秦漢三國六朝文作者引得》等;其他文獻則用關鍵詞引得和篇目引得,關鍵詞引得又可細分為綜合關鍵詞引得、字詞引得、篇目引得和傳統注疏類引書引得,綜合關鍵詞引得有《蘇氏演義引得》《太平御覽引得》《后漢書及注釋綜合引得》《說苑引得》《考古質疑引得》《世說新語引得附劉注引書引得》《容齋隨筆五集綜合引得》《蘇氏演義引得》《封氏聞見記校證附引得》《清畫傳輯佚三種附引得》《食貨志十五種綜合引得》《三國志及裴注綜合引得》等,字詞引得有《白虎通引得》《漢書及補注綜合引得》《水經注引得》、《諸史然疑校訂附引得》等,篇目(書目)引得則有《四庫全書總目及未收書目引得》《太平廣記篇目及引得引得》《一百七十五種日本期刊中東方學論文篇目附引得》《佛藏子目引得》《道藏子目引得》等;傳統注疏類引書引得有《儀禮引得附鄭注引書及賈疏引得》《太平廣記篇目及引書引得》《文選注引書引得》《春秋經傳注疏引書引得》《禮記注疏引書引得》《三國志及裴注綜合引得》《六藝之一錄目錄附引得》《周禮引得附注疏引書引得》《爾雅注疏引書引得》《史記及注釋綜合引得》等。
根據所編引得是否附有原文,又將其劃分為引得正刊和引得特刊,其中正刊23種,50冊;特刊41種,31冊,共計64種81冊。洪業等人根據不同的文獻選擇與之相適應的引得類型對其內容加以揭示,這樣做的目的是為了從最佳角度選取檢索點,以便更好地揭示文獻,滿足讀者要求。
(3)引得款目。洪業對索引結構做了統一規定,指出索引款目由“引”和“得”兩部分組成。其中,“引”由“鑰”(漢字排檢信息編碼)、“目”(標目、副標目)、“注”(注釋)三部分組成;“得”由“數”(地址、出處)和“文”(原文)組成。“引”為內容的識別信息,“得”為內容的查閱信息。“引”、“得”合稱為“錄”,即索引款目(見詞頻列表第51、56、73位詞)。這種規范的索引結構引導民國時期我國的索引編纂工作朝著科學化、規范化的方向發展,也為后世的索引編纂工作提供了許多寶貴的經驗。這也成為今人研究引得編纂處及其漢學叢刊的重點內容。
3.3.2引得排檢法
“中國字庋擷”是洪業在眾多排檢法基礎之上專門為引得叢刊編制的新型檢字法。今人對該檢字法褒貶不一,研究內容主要集中在它的由來、使用方法、與其它檢字法的比較、“庋”“擷”的語詞解釋等方面(見詞頻列表第15、28、68位詞)。
索引運動引發了民國時期漢字排檢法的大發明與大討論,新涌現的漢字排檢法多達72種,相關論文180篇[2]。洪業早在1920年就開始了漢字解剖試驗,探索更適合漢字檢索的檢字法。在試驗過程中,洪業得到王云五寄贈的《四角號碼檢字法》一書,啟發了他“取字角以避筆順之難”的思路。基于引得編纂的需要,于1931年秋,洪業在聶崇岐、李書春、田繼綜等人的幫助下,最終整理出“中國字庋擷”法。學者們對該檢字法基本持批評的態度,認為庋擷之法“較為繁瑣”[2]。筆者認為,這樣的評論未免有失公允,庋擷法不但為引得的統一編排及其快速出版問世提供了最基本的保證,而且大大提高了檢字準確度。
3.3.3引得序言
51篇樣本文獻中提到的引得序言有《春秋經傳引得序》《禮記引得序》《杜詩引得序》《藝文志二十種綜合引得序》《說苑引得序》《儀禮引得序》《白虎通引得序》等。提及序言的文獻如《洪業與中國的“引得”之學》《洪業在我國索引編纂史上的作用》《評哈沸燕京學社所編引得》《哈佛燕京學社漢學引得叢刊研究》《一串打開古文獻寶厚的金鑰匙——哈佛燕京學社的著述活動與所編引得評述》《不廢江河萬古流 ——洪業的治學思路對當代圖書館人的啟示》等多達15篇。許多引得序言都對版本源流、演變及其價值進行了評述(見詞頻列表第16、49位詞),可以視作引得索引對象的版本史梳理。1937年,洪業因《禮記引得序》的發表及其主辦的引得事務,獲得法國法蘭西研究院之銘文學院[3]的“茹理安”獎金。
這些引得序言大多只是在樣本文獻中被簡單提及(參見詞頻列表第35、41、75位詞),并沒有獨立或者系統性的引得序言文獻報道。這是以后開展“引得編纂處及引得叢刊”值得深入研究的方向。
3.4對引得的個案關注與研究
樣本文獻中涉及單種引得的文獻報道20篇(參見表2),占樣本總量的42%,可見引得的個案研究是引得叢刊研究的熱點之一。(見詞頻列表第35、37、41、52、53、55、65位詞)
通過表3,可以看出引得報道共計13種,位居榜首的是《引得說》(5篇),主要為《引得說》在索引學領域的意義與價值討論。但就引得叢刊總體而言,迄今為止的文獻報道僅占引得叢刊的1/5,文獻報道數量不大,涉及種類不夠豐富。因此,繼續加強引得個案研究是未來該領域研究值得關注的方向。
3.5對引得編纂處人物的關注與研究
洪業認為,人是引得編纂要素中的重中之重。洪業“知人善用”,大膽啟用新人(如聶崇岐、李書春、翁獨建等),重視人員業務培訓和業績考核。在他寬松且嚴謹的治學思路及用人思想的帶領和鼓舞下,引得編纂處人才輩出,聶崇岐、翁獨建、齊思和、趙豐田等引得編纂處的主要參與者在離開引得編纂處后都學有所成,成為享譽海內外的一代史學名家,在我國史學研究史上占有一席之地。51篇樣本文獻中,人物文獻報道多達13篇,其中12篇主要介紹洪業的引得貢獻及其學術成就(見詞頻列表第3位詞),1篇主要介紹聶崇岐的引得貢獻(見詞頻列表第20位詞)。除洪業之外,其他人員如李書春(參見詞頻列表中的第61位詞)、田繼綜(詞頻22次)、齊思和(詞頻21次)、翁獨健(詞頻33次)等都只在一些樣本文獻中被簡單提及,未見詳細深入的報道,這不得不說是引得編纂處研究的一大缺憾。因此,編纂處相關人物的深入發掘研究是學者開展引得編纂處研究的新方向。
3.6對引得叢刊價值的研究
引得叢刊作為第一次用西方科學方法大規模編纂的古籍索引工具書,具有很高的索引學價值(見詞頻列表第26位詞)和文獻學價值(見詞頻列表第18、26位詞)。引得叢刊是索引發展史上的經典,它的誕生是傳統文獻學向現代文獻學轉化的里程碑,開創了我國傳統文獻學的新局面,被贊為“代表了史學現代化的第一步”[4]。齊思和認為這些引得對“學術界之貢獻極大,既已風行海內外……城學林之宏舉,不朽之盛業”[2]。馬學良《哈佛燕京學社漢學引得叢刊研究》(河北大學,2007年碩士論文)一文以引得叢刊為第一手資料,評價了漢學引得叢刊的文獻學價值和索引學價值及其蘊含的索引學理論。馬學良、李偉《哈佛燕京學社漢學引得叢刊的文獻學價值與思想》(河北大學學報哲學社會科學版,2010第2期)一文,從文獻學的角度考察了引得叢刊,認為它的編纂使人們開始認識并重視古籍索引對于文獻工作的重要性,擴大了文獻學的研究范圍,打破了傳統治學的方法,引導文獻學研究走上了科學的道路[2]。朱積孝的《哈佛燕京學社所編引得評介》(天津師范大學報,1985年第4期)一文,全面剖析引得編纂處所編之引得成果,充分肯定了它的成果價值,羅列了所編之引得的成功之處,也提出了它不足的地方。另外,引得的序言與一般圖書的序言不同,它不是對該種引得簡單的介紹,而是對引得對象的版本流傳情況、學術價值所在的學術性梳理,具有不可忽視的文獻學價值,如《春秋經傳引得》《禮記引得》《藝文志二十種綜合引得》《莊子》《墨子》《荀子引得》等序言都是可以獨立成文的高水平學術佳作,值得相關領域研究者重視。
4引得編纂處與引得叢刊主題研究述評
自然文本高頻詞中并未涉獵現代計算機技術、語料庫技術、文獻計量學等詞匯,也未提及研究者對國外相關研究文獻的關注程度。綜上所述,可以看出現有研究對漢學引得叢刊數字化建設、知識挖掘及語料庫建設的忽視,對國外相關研究文獻的關注程度不高,有待加強。引得叢刊是我國民國時期重要的古籍叢書,它的編纂意義重大,為中西方學者研究、利用中國傳統典籍提供了極大的便利,是通往古代歷史文化研究的重要橋梁[4]。對引得叢刊的數字化整理和知識挖掘勢在必行,但縱觀現有研究發現:51篇樣本文獻中,黃水清、王東波等人發表的“以《漢學引得叢刊》為領域詞表的先秦典籍自動分詞探討”一文,以《春秋經傳注疏引書引得》中的部分內容為例,制定詞匯表,構建自動分詞模型,探討了先秦典籍文獻的自動分詞方法,對整體挖掘引得叢刊蘊含的知識具有很好的啟發作用[5]。另外,王永華《三十三種清代傳記綜合引得》再造方法簡述一文,介紹了《三十三種清代傳記綜合引得》重新編制的方法,詳細敘述了利用計算機編排及制版技術,變“中國字庋擷法”編排為常用的“四角號碼檢字法”編排的過程,并列舉了原引得由于手工編制而出現的各種問題。今后,對引得叢刊的數字化整理、知識挖掘、語料庫建設及可視化處理等的研究與實踐以及國外相關文獻研究的關注應該引起學術界的重視。應該加強引得叢刊在數字化過程中的標點、箋注、校勘等方面的技術研究。
5結束語
自洪業領導的引得編纂處開始工作迄今,已八十余年。過去的八十年中,學術界對于浩瀚的中國古籍,再未進行過類似哈佛燕京學社引得編纂處所開展的那樣系統性、大規模的索引編纂活動,即便是在信息技術迅猛發展、古籍電子資源層出不窮的今天,檢索不便、版本選擇不當仍是大多數中文古籍電子資源庫的明顯弊端。因此,引得叢刊的編纂方法和引得編纂處管理體制在今天看來并不過時,甚至有著強烈的現實指導意義,它的得與失可以為我國索引事業發展提供借鑒,為當下古籍整理提供很好的參照目標,為古籍資源數據庫建設提供優秀范本。通過詞頻分析和內容分析,我們可以看出:“引得”研究的角度具有多樣性、多元化。但從整體而言,該領域的文獻研究缺乏系統性,內容研究不夠全面、深刻,尤其是對引得叢刊和引得編纂處的研究與當下古籍保護與古籍整理事業的結合不夠緊密,從而導致對引得叢刊和引得編纂處研究的現實意義不夠突出。今后,筆者將繼續加強對引得叢刊和引得編纂處研究的關注。如:加強相關國內外材料的搜集,實現國內外漢學引得叢刊的對比研究;加強引得個案研究,繼續深入對引得叢刊編纂體例、價值與貢獻的發掘;加強對引得編纂處管理體制與引得編纂處人員的研究,完善對引得編纂處和引得叢刊研究的深度與系統性;將引得叢刊研究與當下古籍保護與古籍整理事業的結合,研究揭示引得叢刊在數字時代古籍整理的價值與意義。
參考文獻
[1]馬學良,李偉.哈佛燕京學社漢學引得叢刊的文獻學價值與思想[J].河北大學學報:哲學社會科學版,2010,(2):94-98.
[2]馬學良.哈佛燕京學社漢學引得叢刊研究[D].河北大學,2007.
[3]顏芳.近代學術轉型視野下的燕京大學國學教育[D].北京:北京師范大學,2011.
[4]彭忠德.洪業與中國的“引得”之學[J].福建論壇:文史哲版,1999,(1):62-64.
[5]黃水清,王東波,何琳.以《漢學引得叢刊》為領域詞表的先秦典籍自動分詞探討[J].圖書情報工作,2015,(11):127-133.
作者簡介:馬學良(1980-), 男,博士,國家圖書館研究院副研究館員,研究方向:圖書館基礎理論、文獻學。
劉玲玲(1979-),女, 天津醫科大學圖書館館員。
(收稿日期:20170708責任編輯:張靜茹)
Abstract: Sinological Index Series complied by HarvardYenching Institute Index Compilation Office is the first attempt of western modern index technique applied in classical literature in our country. Taking CNKI as data source, using the methods of word frequency statistics and subject analysis, employing word frequency analysis software and Excel, word frequency statistics of HarvardYenching Institute Index Compilation Office and relevant sample documents of Sinological Index Series is conducted to analyze the research hotspots and key points in this field. Study finds that researches in this field are timeconsuming and have apparent focuses, however, researches on aspects of character analysis of Index Compilation Office, case study of index, the referential value of index series to the ancient books protection and development are not profound or sufficient enough, some research aspects are even blank.
Key words: Index Compilation Office; Index Series; Digitization of Ancient Books; Ancient Books Corpus