段榮婷
(南京政治學院上海校區信息管理系,上海,200433)
近日,中共中央辦公廳、國務院辦公廳印發了《關于加強和改進新形勢下檔案工作的意見》,強調指出了要建立健全覆蓋人民群眾的檔案資源體系,建立健全方便人民群眾的檔案利用體系[1]。而檔案規范控制是檔案知識管理的重要內容,關系到檔案資源體系與檔案利用體系等的建設。
對檔案規范控制的研究可分別從檔案專業視角與概念邏輯視角進行。
從檔案專業視角對檔案規范控制的實質進行分析,可以得出:
*檔案規范控制是一種情報控制,能夠確保檔案情報價值的實現。檔案規范控制是廣義檔案著錄的重要組成部分(如下圖1所示),它通過創建者著錄,實現對實體(機構團體、個人或家族)名稱檢索點的控制。
*檔案規范控制(主要是實體名稱)是一種背景控制(如下圖2[2]所示),能夠確保檔案憑證價值的實現。檔案規范控制通過創建者來源背景的著錄,實現對檔案的前端乃至全程控制。檔案規范控制的背景控制屬性是檔案規范控制區別于圖書規范控制的核心,也代表著檔案規范控制的發展方向。
從概念邏輯視角對檔案規范控制的實質進行分析,可以得出:檔案規范控制是對實體(機構團體、個人或家族)概念的控制[3],這也包括兩個層面:
*概念的語義控制:檔案規范控制通過對檔案機構團體、個人或家族實體概念本身內涵的描述,及對檔案實體之間、檔案實體同信息資源之間外部關系的描述,來明確檔案實體概念的語義。
*概念的語詞控制:檔案規范控制通過對檔案機構團體、個人或家族實體概念名稱的規范化形式的確定,來確保概念語詞標識的唯一性,使標識與概念盡可能一一對應,從而達到控制檢索點、提高檢索效率的目的。
檔案規范控制研究的檔案專業與概念邏輯這兩個視角均為檔案工作者明確了實施檔案規范控制的需求,即應側重背景控制,為檔案可信網的構建奠定基礎;同時在情報控制方面,應側重明確檔案機構團體、個人或家族實體的概念體系,并將其形式化,即構建檔案規范記錄本體,為檔案知識組織系統、語義網的構建奠定基礎,為檔案關聯數據的利用奠定基礎。
在檔案規范控制理論的指導下,國際檔案規范控制的實踐應用也取得了較快進展。
國際檔案規范控制應用主要體現于檔案規范記錄檢索系統的構建,其總體上可分為兩大類,即:檔案規范記錄嵌入集成式檢索系統與檔案規范記錄專門獨立式檢索系統。

圖1 檔案規范記錄與檔案著錄的邏輯關系示意

圖2 檔案規范控制與背景控制關系示意
檔案規范記錄嵌入集成式檢索系統的典型代表是國際檔案理事會的記憶存取(International Council on Archives“Access to Memory”,簡稱ICAAtoM)[4],及美國國家檔案館(NARA)最新的“在線公共存取”(Online Public Access,簡稱OPA)。此處以國際檔案理事會的記憶存取(ICAAtoM)檔案規范記錄應用研究為典型案例。
國際檔案理事會的記憶存取(ICAAtoM)檔案著錄開源軟件是檔案界目前唯一的國際性項目。ICAAtoM作為生成與發布規范記錄工具的原因在于:
-該軟件運行于網絡環境;
-該工具使用簡便,易于操作;
-規范記錄的生成與其網上出版幾乎是同步的;
-輸入的數據既可被用戶輸出至 XML/EAC-CPF[5],亦可被重新輸入至其它信息系統。
正是基于如下圖3所示的數據模型,ICAAtoM能夠提供規范記錄(authority records)的添加(著錄)、檢索瀏覽等功能。
ICAAtoM的瀏覽頁面,創建者的名稱與其它執行者實體能夠通過事件實體(同時還記錄了同事件相關的日期與其它信息)由檔案著錄鏈向規范記錄,提供名稱(names)的檢索入口項,檢索結果以EAC格式輸出,即支持規范記錄輸入與輸出的EAC XML模板,提供與相關實體的關聯鏈接。同時在ICA-AtoM中,創建者信息,如行政管理歷史與存在日期等均保存于獨立的規范記錄中,并通過向現存或新建ISAAR(CPF)[6]規范記錄鏈接而添加至檔案著錄。

圖3 ICAAtoM的數據模型
檔案規范記錄專門獨立式檢索系統的典型代表則是美國等的社會網絡與檔案背景(Social Networks and Archival Context,簡稱SNAC)計劃的成果。
2.2.1 SNAC規范記錄原型檢索系統的結構功能
(1)SNAC原型系統的基本檢索結構與功能
SNAC原型系統提供了機構團體(Corporate)、個人(Personal),及家族(Family)檔案規范記錄(檔案背景記錄)的檢索與瀏覽。
SNAC原型系統所提供的規范記錄的基本檢索途徑包括以下:
①統一檢索(search)框,可輸入機構團體、個人或家族的名稱或關鍵詞(目前已有128,787個名稱,所有名稱以字順索引排列);
② 名 稱 索 引(A ll Names→Alphabetical Index),所有個人、機構團體和家族的名稱均以字母排序;
③ 特 色 記 錄 (Featured Records)列表,可通過個人、機構團體和家族名稱的特色記錄列表直接從中選擇鏈接,從而實現快速瀏覽與檢索;
④ 高 頻 職 業 (Top Occupations)列表;
⑤ 高頻主題(Top Subjects)列表。
其中②、④和⑤都隨著機構團體、個人或家族具體選項卡的專指選擇,而相應有所不同。
(2)SNAC原型系統的高級檢索結構與功能
SNAC原型系統所提供的規范記錄的高級檢索功能包括以下:
①可通過限定匹配EAC-CPF的某著錄項而精煉檢索結果,如可僅檢索
②通過職業(Occupation)或主題(Subject)縮檢。
③通過關聯款目(Related Entries)及其鏈接,提供檔案檢索與圖情等資源檢索兩種科研功能。
2.2.2 SNAC規范記錄原型檢索系統的優點小結
SNAC的發展趨向是國家檔案規范合作計劃(National Archival Authorities Cooperative, 簡 稱NAAC),并成為國家檔案規范基本 設 施 (National Archival Authorities Infrastructure)的有機組成部分。在檔案規范控制及其合作發展方面,其具體優點可概括總結如下:
對于檔案工作者而言,成功維護共享規范記錄:
*能夠最終實現檔案規范控制。
*能夠確保在著錄中對同一實體名稱使用的一致性。
*檔案規范控制合作著錄具有經濟效益:
*共享的國家規范記錄將是一個充實的歷史資源庫。
因此,對于檔案利用者而言,檔案規范記錄是其工具書:
*能夠統一集成檢索存取利用分散的檔案資源;
*能夠獲取檔案文件及其它一切文化遺產資源的背景信息;
*能夠獲知實體(如人物)所生存與工作的社會-職業-情報網絡;
*能夠獲取歷史沿革或生平資源;
*不僅服務于學者,還滿足于終生學習者對歷史軼事、家譜等的好奇心。
從以上分析可知,檔案檢索系統建立規范記錄是科學有效地開發檔案信息資源的關鍵性措施。無論是檔案規范記錄嵌入集成式檢索系統,還是檔案規范記錄專門獨立式檢索系統,它們都以特有的結構使其具有很好的檢索功能,極大地優化了檔案檢索系統的檢索效率。總體的,從其構建的共性中我們都可以得到有益的借鑒。
檔案規范控制的國際實踐證明,建立檔案規范記錄檢索系統必須要標準先行,這也是檔案規范控制應用頂層設計的重要需求。
國際檔案規范記錄標準化取得了快速發展,如美國檔案就制定了符合國際標準《國際標準—團體、個人和家族檔案規范記錄(簡稱 ISAAR(CPF))》(第二版)[7]的《檔案著錄內容標準》(Describing Archives:a Content Standard(Second Edition)(DACS))(2013年最新的第2版),尤其是其將檔案規范記錄(Archival Authority Records)獨立作為標準的第Ⅱ部分[8],加拿大也制定了《檔案著錄規 則 》(Rules for Archival Description)(2008年7月修訂版),對人物、機關團體的標目及參照等進行了規范[9],再如歐洲檔案門戶網站則應用了符合國際標準ISAAR(CPF)的《團體、個人與家族檔案背景編碼》(Encoded Archival Context for Corporate Bodies,Persons,and Fam ilies,簡稱 EAC-CPF)[10],并將其最佳實踐本地化為 apeEAC-CPF[11]。
目前,國內檔案界也開始重視檔案規范控制及檔案規范記錄標準化的理論研究[12],但在應用研究方面卻仍有所欠缺。國內除香港、臺灣(例如,明清檔案人名權威系統[13]等)外,大陸地區僅有的檔案著錄參考依據——《DA/T 18-1999檔案著錄規則》,僅僅對著錄進行規范,而沒有相應的具體規范控制。這恐怕也就是我國目前檔案計算機檢索系統中缺乏規范記錄檢索途徑的重要原因。
因此,根據國際檔案規范記錄應用及其標準化研究結論,建議必須遵循國際標準,為我國檔案規范記錄構建標準體系。

圖4 三個世界視角下的檔案規范記錄著錄概念模型的地位,檔案規范記錄著錄的基本數據需求,及檔案規范記錄著錄標準的邏輯關系示意

圖5 檔案規范記錄概念模型

圖6 檔案規范記錄數據模型實例化構建
實踐證明,檔案規范記錄著錄標準的制定,必須首先構建檔案規范記錄概念模型。從檔案著錄的三個世界視角來看,檔案規范記錄概念模型的邏輯作用如下圖4[14]所示,即建立概念模型能夠通過明確實體及其關系而明確檔案規范記錄著錄的基本數據需求及最佳實踐需求,并進而據此制定檔案規范記錄著錄標準。
具體做法可以目前國際最權威的《規范數據功能需求(Functional Requirements for Authority Data,簡稱 FRAD):概念模型》(2013年修訂)為依據,構建檔案規范記錄概念模型(如下圖 5[15]所示)。
如上圖所示的檔案規范記錄概念模型,實質是一種實體-關系方法,體現了著錄實體同名稱/標識符,及受控檢索點之間的關聯。如從檔案文件背景及其憑證價值的角度可細化建立以下關系類型的概念模型:文件與機構團體、個人或家族實體的關系;機構團體、個人或家族實體與業務的關系,及機構團體、個人或家族實體之間的關系,等等。僅以人名規范記錄文檔與機構團體規范記錄文檔之關聯為例,可具體構建檔案規范記錄數據模型如下圖 6[16]所示:
如上所述,通過檔案規范記錄概念模型的構建,可以更清晰地分析出檔案規范記錄著錄所涉及實體及其屬性之間的關系。這為確定檔案規范記錄數據層面的功能需求奠定了基礎。而檔案規范記錄系統的整體構建與實現不僅包括數據層面的功能需求,還包括系統層面的功能需求。綜合檔案規范控制的國際應用案例,檔案規范記錄需求規范的完整的內容要素如表1所示:
檔案規范記錄著錄標準不僅需以實體著錄的基本數據需求為基礎,還需以國際標準ISAAR(CPF)為基礎,即我國也有必要據此而制定出本土化的相關標準。我國檔案規范記錄格式標準不僅需要與本國的《DA/T 18-1999檔案著錄規則》相協調,更需同《國際標準——檔案著錄規則(總則)》(ISAD(G))等相對應。
我國檔案規范記錄需與相關的檔案元數據(Metadata)格式相對應,應以國際標準ISAAR(CPF)(語義標準)結合EAC-CPF(語法標準)為基礎,制定我國檔案規范記錄編碼標準,并與EAD標準、“規范記錄的功能需求與編號(FRANAR)”[17]等兼容與一致,并加強檔案與圖書、博物館規范控制的互通[18]。
此外,目前國際上已有檔案規范記錄EAC-CPF本體應用的實踐案例,如意大利檔案界就通過檔案規范記錄EAC-CPF本體編碼及外部RDF詞表引用,實現了關聯檔案數據的檢索利用。檔案規范記錄EAC-CPF本體應用代表著國際檔案規范控制的最新發展趨勢,即知識組織、語義網,這也應是我國檔案規范記錄及其標準化的重點發展方向。
廣義地,檔案規范記錄是個體系,其標準化具有不斷細化的特征,如國際檔案規范記錄標準,除ISAAR(CPF)外,還逐漸分化出《國際標準——檔案職能著錄規則》(ISDF)[19]和《國際標準——檔案保管機構團體著錄規則》(ISDIAH)[20]等,這就要求體系配套,也符合檔案規范控制向背景控制發展的趨勢。
一般而言,國際檔案規范記錄標準(如 ISAAR(CPF)、ISDIAH等)屬于數據結構標準,國家檔案著錄規則(如《DA/T 18-1999檔案著錄規則》)屬于數據內容標準,而具體的名稱規范檔(如《美國國會圖書館名稱規范檔》(LCNAF))、敘詞表,及ISDF等則屬于數據值標準。在我國規范記錄標準制定與應用過程中,應在檔案著錄標準體系內做到數據結構標準、數據內容標準及數據值標準的配套[21],這也符合檔案著錄標準開發模型[22]。
*本文系2010年國家社科基金青年項目“網絡環境下的檔案規范記錄系統研究”(批準號:10CTQ020)的研究成果之一。

表1 檔案規范記錄需求內容要素
[1]中共中央辦公廳.國務院辦公廳印發《關于加強和改進新形勢下檔案工作的意見》[EB/OL].[2012-07-19].http://www.saac.gov.cn/zt/2014- 05/04/content_44880.htm。
[2]Jean Dryden,From Authority Control to Context Control.Respect for Authority:Authority Control, Context Control,and Archival Description.Journal of Archival Organization,Volume 5,Numbers1/2 2007:5.
[3]注:從概念邏輯的視角分析,機構團體、個人或家族的具體實體均可被看作是個別概念.
[4]ICAAtoM:open source archival description software [EB/OL].[2012-10-16]。 http://ica-atom.org/.
[5]注:EAC-CPF是國際標準《團體、個人與家族檔案背景編碼》(Encoded Archival Context for Corporate Bodies,Persons,and Families)的簡稱.
[6]注:ISAAR(CPF)是國際檔案理事會2004年修訂的《國際標準—團體、個人和家族檔案規范記錄(International Standard Archival Authority Record for Corporate Bodies,Persons and Families)》(第二版)的簡稱.
[7]ICA.ISAAR(CPF)International Standard Archival Authority Record for Corporate Bodies,Persons and Families(Second Edition)[S].2004:1-70.
[8] SAA.Describing Archives:a Content Standard(DACS)(Second Edition)[S].2013.
[9]Canadian Comm ittee on Archival Description.Rules for Archival Description (RAD) (Revised version)[S].2008.7.
[10] Encoded Archival Context Working Group of the Society of American Archivists and the Staatsbibliothek zu Berlin.Encoded Archival Context—Corporate Bodies,Persons,and Fam ilies(EAC-CPF)Tag Library(Version 2010(initial release))[S/OL].[2012-10-15].http://www3.iath.virginia.edu/eac/cpf/tagLibrary/cpfTagLibrary.ht -m l#d1e8025.
[11]APEx project-Standards[EB/OL].[2013-07-01].http://www.apexproject.eu/index.php/outcomes/standards.
[12]注:國內已發表了相關學術論文:張文友,徐維。《國際標準——團體、個人和家族檔案規范記錄著錄規則》的制定及其結構特點[J].檔案與建設,2001(2):55-56;李超,常曉茹.檔案檢索系統中的規范記錄研究[J].檔案時空,2009(2):16-18;馮留燕.圖書與檔案的規范控制工作研究[J].云南檔案,2011,(4):56-58.等等.
[13]洪一梅,王蕉.中國人名權威控制之建置與應用:以明清檔案人名權威系統為例:174-186.
[14] 注 :據 Abelardo Santamaría.Report on the work of CNEDA(2007-2012):toward a conceptualmodel for archival description in Spain[R].(July 11,2012):8.修改.
[15]注:據 IFLA Working Group on Functional Requirementsand Numbering of Authority Records(FRANAR).Functional Requirements for Authority Data: A Conceptual Model [R].2008.12:7.修改.
[16]注:該圖反映了個人同機構團體之間的成員關系,二者之間是通過個人實體的“經歷”屬性與機構團體的“機構團體首長”屬性進行關聯的.
[17]IFLA UBCIM Working Group on Functional Requirementsand Numbering of Authority Records(FRANAR).Functional requirements for authority records:a conceptualmodel,draft 2005-06-15.[2013-02-12].http://www.ifla.org/VIId40FRANAR2Conceptu -al2M 2Draft2e.pdf.
[18]馮留燕.圖書與檔案的規范控制工作研究[J].云南檔案,2011(4):56.
[19]ICA.ISDF International Standard for Describing Functions(First edition),2007.5
[20] ICA.ISDIAH International Standard for Describing Institutions w ith ArchivalHoldings,2008.3
[21]段榮婷.國際檔案規范記錄標準化研究[J].檔案學研究,2013(5):70-71.
[22]段榮婷.論國際檔案信息標準化現狀、發展趨勢及我國的對策[J].檔案學研究,2008(1):45.