湯 萌 張 潔
(上海交通大學圖書館,上海 200030)
?
【文史論苑】
來源視角下的地方歷史文獻整理流程研究
——以上海交通大學圖書館為例
湯 萌 張 潔
(上海交通大學圖書館,上海 200030)
上海交通大學圖書館針對地方歷史文獻館藏制定了由入藏、編號、修復、編目、歸庫構成的標準整理流程。在整理過程中,依據來源信息編號、來源狀態歸庫保存,并且在編目中設計體現來源信息的元數據項目,即檔案號、日期、事主、歸戶、地域等。從來源視角整理地方歷史文獻,并應用于后續的數字化、數據庫開發過程,將有助于研究者在多脈絡的環境下觀察文獻,推動地方歷史文獻的文獻學方法、數據化分析及其他新的研究議題。
地方歷史文獻;來源原則;數字化;歸戶;元數據
2006年,上海交通大學歷史系在浙江省松陽縣石倉地區發現一批保存完整、連續性好的契約文書,并將這批資料整理出版,形成一系列針對清代鄉村社會的研究。[1]此后,2009-2013年間,上海交通大學歷史系又通過文書市場搜集近35萬件各類民間文書,并轉入上海交通大學圖書館(以下簡稱“上交大圖書館”)保藏、整理。地方歷史文獻通常與圖書館入藏的書籍性質不同,因此,近年來研究者已先后討論如何建立資源分類法,如何對資料進行數字化建設和數據庫開發[2-4],并已有成功利用這些資料的案例。[5,6]
2012至今,筆者參與了這批資料到館后的整理加工工作,本文將總結上交大圖書館已經形成的整理流程,提出并論證“來源視角”作為地方歷史文獻整理原則的合理性與推廣建議。目前,以館藏資料進行研究,主要是針對已經整理完成后的狀態,即數字化與文獻研究。但是,地方歷史文獻這類資料應如何整理,以適用于數字化建設與文獻研究,在此前的研究中尚未提及。在徽州文書與清水江文書的整理中,尊重民間文書的來源為學者們所重視。[7,8]不過,目前這些整理原則、方法主要是以紙質出版為導向,上交大圖書館的整理流程則自始即以數字化為導向,因而對實體保藏、掃描、編目都進行了面向數字化的規范設計。
整理實務中,圖書館館員們歸納了文獻整理的標準流程,即初次編號、殺蟲除塵、二次編號、修復、掃描、歸庫。上交大圖書館入藏的地方歷史文獻來自文物市場,在入藏前經過了一定的流轉過程。流轉過程中,書商通常只是用報紙等對文獻進行簡單包裝,并且流轉過程中的受潮、蟲蝕等問題都在所難免,文書間的位置關系也比較復雜。上述整理流程正是針對這樣的現狀提出的。2009-2012年間,入藏的資料暫存于上海交通大學歷史系山極晃文庫,使用密集書架放置。2012年之后轉入圖書館以開放式書架保存。
(一)初次編號
文書搜集過程中以“包”和“袋”為單位。“包”是書商在收集過程中形成的文獻群單位,“袋”則是收集者在不同時間收集到文獻的聚合單位。文獻入藏后,登記“包”和“袋”的收集時間,以及文獻所保留的地點、人物等來源信息,并制作文獻的編號卡片。這在整理流程中稱為初次編號。
(二)殺蟲除塵
文書整理初期使用冰箱除蟲,此后改用沖氮殺蟲法。所有文書在清點及二次編號前以原始狀態進行殺蟲、除塵。
(三)二次編號
文獻轉入整理流程后,拆去原始包裝,逐漸清點文書,噴水后用鬃刷刷平整,之后進行二次編號。每件文書的編號為14位號段。編號由“來源人物碼(2)—收集日期編號(6)—包排列序號(2)—件排列序號(4)”組成。來源人物碼的含義是文書市場中的搜集來源人,收集日期編號即入藏日期,也即“袋”的編號,包排列序號指書商收集過程中的順序編號,件排列序號則是在打開每一包時,順序清點賦予的流水號。編號用宣紙裁成的紙條貼于文書背面。由以上步驟形成的14位編號是每一件文書的唯一身份識別號碼。操作中,單件文書每一頁計為1件,簿冊文書每一冊計為1件。
每完成一包編號,需及時登記,登記內容包括操作時間、包號、單張件數、成冊件數、需修復件張數等,據此撰寫《上海交通大學地方文獻編號工作日志》。流程管理員登記每天編號工作進度,統計工作總量和速度,根據《編號工作日志》填寫《上海交通大學地方文獻需修復文獻跟蹤表》。
(四)依據不同破損程度確定流程
本流程規范在制定初始即劃分“需修復文獻”和“不需修復文獻”。“需修復文獻”修復完成后,需轉入掃描包裝流程,而“不需修復文獻”可能在掃描時受到損傷,需轉入修復流程。所以,兩項工作的交叉無可避免,如何在修復掃描完成后有序地匯總整理成為整個流程暢通有效的重要問題。依據破損程度設計流程的核心原則是完成整批次修復后才能進入下一批次修復。
(五)修復
在清點與編號過程中,工作人員發現大量文書存在破損情況,因此也制定了修復流程。修復管理的難點是要保持多流程平行協作。整理流程中,文書清點、編號后將直接掃描,但破損文書則需要修復后再掃描。因此,修復流程管理中,需要同時在掃描文書流程中登記修復中的待掃描文書,并在修復文書流程中登記修復文書所屬的待掃描序列,也即管理兩個平行工作的流程。
(六)掃描
上交大圖書館新藏地方歷史文獻以電子化利用作為文獻整理與資源建設的主要方向,因此,文獻清點后全部進行掃描。掃描的難點是出圖的規格與質量。正式掃描前,需要平整文書,這樣平板掃描時,圖片上不會有褶皺的痕跡。掃描質量應根據后期用途決定。尤其值得注意的是,單件文書如果紙張背面也有字跡,也應當掃描,正面與背面的掃描圖合并為一個圖檔,方便使用者閱讀。
(七)歸庫
文書完成編號、修復、掃描后,將歸入庫藏保存。文書使用宣紙、塑料儲存箱及開放式書架(樟木柜)保存。文書以“包”為單位保存,每一個來源的“包”在保藏時歸并在一起,單件文書每10件用1張宣紙包裹,簿冊每冊用1張宣紙包裹,全部文書依編號順序放入儲存箱。再將儲存箱按照初次編號順序排列在開放式書架上。倉庫中配有溫度、濕度檢測,保證恒溫恒濕環境。
地方歷史文獻為何要按照以上方法進行整理?筆者提出的文獻整理方法論是來源原則。來源原則是檔案學中的概念。檔案學的全宗原則(respect des fonds)指同一機構或個人創建、積累、維護、使用的資料必須按照原始順序(如果有的話)放在一起(視為屬于同一集合體)。[9]也就是說,應以文獻產生時的來源單位作為文獻保管的基本單位,從而避免打破文獻之間既有的有機聯系。經典的檔案學理論認為,“向文件中心或檔案館移交文件之前,在事務活動過程中形成、保管和/或利用文件的組織或個人”,即構成來源。[10]此外,檔案學理論認為,文件具有生命周期,包括文件從產生直至因喪失作用而被銷毀或者因具有長遠歷史價值而被檔案館永久保存的整體運動過程。[11]
地方歷史文獻具有與檔案相似的性質。本文所說的地方歷史文獻主要指兩類材料:一類是民間日常生活中形成的文書,亦可稱之為民間文書;一類是基層政府行政中形成的檔案。前者往往具有功能性,是為了應對民間生活中的具體事務書寫形成,如土地買賣、借貸、婚喪、宗教儀式等。具體事務結束后,文書也就完成其使命,永久或半永久地放置不用,這正如檔案學所說的文件生命周期。也正因此,事實上,人們今天所面對的民間文書僅僅是漫長歷史過程中保留下來的一小部分,絕大多數民間文書已經在使用結束后自然消亡了。至于后者,則本身即為檔案,完全可以使用檔案學的整理方法。
來源對于地方歷史文獻具有特殊的意義,它區別于物理形態、內容信息,屬于文獻身份識別的本質屬性之一,它獨立于文獻實體和內容信息,存在于歷史流傳過程中。簡言之,來源包括文獻產生、流轉,以及保存的時間、地點、人物、事由和狀態。整理實務中,我們在歸戶欄中登記文獻來源的人或社會組織及其所屬的行政區劃、家族信息,由此反映文獻與文獻之間的關系,有助于整理者回溯文獻形成的過程。
地方歷史文獻可以應用來源原則進行整理,整理實務中,以收購方式或田野調查方式獲得的文獻應使用不同的來源登記方法。對文獻內容進行編目及元數據處理時,人名、地域等能反映來源的信息也應采用標準化的提取與描述,以便于后續的數據庫開發與研究利用。
目前,地方歷史文獻類的館藏,主要有通過收購渠道獲得,通過田野調查獲得實物或電子檔復制品等途徑。通過收購渠道獲得的文獻,以上海交大館藏為例,多數在入藏時仍然保留著來源信息。實際上,采購者在收購時就傾向于購買來源信息完整的文獻。在某些地域甚至已經形成了固定的來源信息標準化格式,如交大館藏的部分福建文獻,其來源信息包括歸戶、收藏時間、包數、每包件數,每一次收購來的文獻都記載以上詳細信息,其歸戶格式為“省—縣—鄉—村—姓氏”。
通過田野調查獲得的文獻,其保存類型分為入藏文獻實物與入藏文獻復制品兩種。為了保留文獻原有的保存脈絡,最大程度地還原來源,上海交大將大多數田野采訪所得文獻留在當地,將原件掃描、修復后返還原有主人。
前文未詳細介紹的有數字化的核心環節,即元數據組織,也是通常所說的編目,它是數字化與數據化的中間環節。地方歷史文獻數字化工作不僅僅是對文獻掃描,更是一個集合了整理、分類、修復、掃描、編目和數據庫建設的完整流程。因此,除掃描和修復等技術外,描述性元數據的設置與組織也是整理中的難點。圖書館學中,描述性元數據是組織揭示文獻資源的技術工具,通過描述文獻資源的內容、范圍、權限等信息,在文獻資源與用戶之間構建起使用的橋梁。描述性元數據可以定義為“描述和識別信息資源的特征以及分析信息資源知識內容的數據”,一般包括用于識別某信息資源的數據(如題名、作者、制作或出版日期、支撐數字對象的原始對象信息)、知識組織數據(如責任者控制、姓名、主題等與相關主題的搭配,多個實體之間關系的識別),以及知識訪問數據等。[12]通常,元數據可提供發現、識別、選擇、獲取文獻資源的信息,并提供資源互操作的途徑。
從數字化的終端成果看,建立專業的分析型數據庫是目前被廣泛接受的形式,而編目與數據庫的功能設計緊密相連。數據庫蘊含的分析功能能否實現,取決于數據庫功能的設計與編目質量,編目字段的設計與數據庫功能框架相關。
上海交大圖書館在整理地方歷史文獻的過程中遵循了來源原則,由此進行了一系列整理及加工利用,每一個環節的操作都是為了保護文獻和它的來源脈絡。來源形成于文獻的形成過程,但需要整理者建立針對性的整理方法以及設計標準化的元數據描述才能得以體現,并使研究者可以觀察、檢索、應用文獻的來源信息。
對來源信息的考辨也將有助于發展地方歷史文獻針對性的文獻學方法。地方歷史文獻與傳統古籍具有不同的文獻學性質。在傳統文獻學中,重視考據古籍的年代、序跋、牌記、紙張、墨色和避諱等信息,從而形成古籍的版本脈絡。而在地方歷史文獻研究中,從來源切入,考據文獻的形成過程,也是發展與豐富針對性的文獻學方法的有效途徑。
來源信息還將有效推進文獻的數據化分析。標準化描述的來源信息有助于挖掘文獻之間的關系,包括同一歸戶下或不同歸戶之間,通過對檔案號實施分段截取,可以獲得同一來源的文獻,即同一收集日期以及同一歸戶(地方文獻產生來源的人或社會組織及其所屬的行政區劃、家族信息)的文獻,以此類推,保留了契約文書的原始獲取信息及順序關系。這些信息將在后續的數據庫開發中發揮重要作用。
[1]曹樹基.石倉契約的發現、搜集與整理[J].客家學刊,2009,(6):146-172.
[2]李芳,陳進,王昕.上海交通大學圖書館新藏地方歷史文獻的數字化建設規劃與實踐[J].大學圖書館學報,2015,32(2):77-83.
[3]趙思淵.上海交通大學新藏地方歷史文獻的分類法及其依據[J].上海交通大學學報(哲學社會科學版),2015,22(3):76-87.
[4]趙思淵.地方歷史文獻的數字化、數據化與文本挖掘——以《中國地方歷史文獻數據庫》為例[J].清史研究,2016,(4):28-38.
[5]趙思淵.19世紀徽州鄉村的土地市場、信用機制與關系網絡[J].近代史研究,2015,(4):82-97.
[6]賈曉陽,章毅.清代初期的徽州田價:《乾隆休寧黃氏置產簿》研究[J].農業考古,2016,(3):62-68.
[7]劉伯山.民間文書檔案整理的“三尊重”原則[J].安徽史學,2015,(6):16-19.
[8]張應強.清水江文書的收集、整理與研究芻議[J].原生態民族文化學刊,2013,5(3):33-38.
[9]馮惠玲.論檔案整理理論的演變與發展[A].吳寶康,丁永奎.當代中國檔案學論[M].北京:中國檔案出版社,1988.115-167.
[10][11]馮惠玲,張輯哲.檔案學概論(第二版)[M].北京:中國人民大學出版社,2001.198.201.
[12]王松林.信息組織工具論[J].山東圖書館季刊,2008,(4):5-9.
【責任編輯:周 丹】
G254.1
A
1673-7725(2016)12-0219-04
2016-10-20
湯萌(1986-),女,山東煙臺人,助理館員,主要從事圖書館學研究。