文/上海申通地鐵集團有限公司 沈潔
企業檔案是指企業在生產經營和管理活動中形成的對國家、社會和企業有保存價值的各種形式的文件材料。企業檔案隨著企業生產和經營活動的開展而持續產生,隨著時間的推移而不斷積累和匯聚,形成了龐大并且分散的信息資源。這些信息資源是企業的財富,也是檔案做好服務工作的立檔之本。要使檔案工作不被企業邊緣化、弱化、減少,就要豐富檔案內容,拓展服務空間,最終目的是實現檔案資源的高效利用,實現檔案價值,為企業經營、管理等工作提供高質量服務。
企業檔案利用的效率來源于檔案檢索的效率。檔案檢索是指對檔案信息進行系統存儲和根據需要進行查找的工作。作為檔案管理的重要組成部分,檔案檢索水平是檔案服務利用水平的重要標志。目前在企業檔案的查詢和利用過程中主要有以下幾類檔案檢索的手段:
(一)傳統的檔案查詢方式——手工檢索。此類檢索方式主要依據人工建立的檔案目錄進行,包括:案卷目錄檢索、全引目錄檢索。查詢過程需要檔案專業人員完成,效率較低,耗費人工和時間較長。
(二)辦公自動化場景下的檔案查詢方式——計算機檢索。主要通過關鍵字對查詢目標進行檢索,包括:簡單檢索、位置檢索、邏輯組合檢索、漸進檢索、歷史檢索等。用戶在檢索中可設置個性化檢索參數,機檢滿足了個性化需求,但由于關鍵字選擇不適當或關鍵字模糊,查不到、查不全的情況時有發生。
(三)信息化場景下的檔案查詢方式——全文檢索。基于信息化技術下檔案全文電子化和檔案全文電子化系統的投用,檢索工具已可升級為檔案全文電子化共享查詢利用。全文檢索的方式給用戶帶來海量的查詢結果,查全率得到大幅提升。但由于“最小努力原則”和網絡環境下用戶的求便心理、路徑依賴等特征,在海量的查詢結果前,篩選無用信息和較低的查準率會降低用戶的體驗滿意度。同時隨著企業檔案資源庫的日益龐大,整個資源庫的全文檢索將耗費系統大量資源,查詢效率將面臨不斷遞減的窘況。
(一)標簽理論的介紹。標簽理論,即符號互動理論,源于20世紀30年代美國實用主義哲學和行為主義心理學傳統,以理論者關注個體行為的社會學理論被提出。持這一理論的學者薛深認為,人有了“初級越軌”之后,周圍的人會以貼標簽的形式對其行為進行定義或標定,將其貼上標簽。如今,“符號互動理論”在其含義和運用上發生了翻天覆地的變化,例如:標簽(TAG)被運用于抖音、火山等網絡視頻平臺,以提高小視頻或直播間的流量。筆者受其啟發,嘗試將此理論運用于檔案信息化系統,探索對檔案信息中的各類資源賦予標簽,通過擴大資源之間的關聯度來提高檔案資源檢索效率。
(二)標簽理論應用的背景。標簽理論的運用是基于“檔案數據(資源)觀”的基礎之上的,即:將數據視為檔案的一種存在形態,長期被查閱(被利用的次數和頻率)的數據信息自然而然就是數據資源體系的重點內容,成為具有保存價值的檔案資源。通過“標簽賦予”,可以確保檔案資源長期地、更廣泛地可用可理解;而在長期的、更廣泛的利用過程中也將對檔案資源增添更多的“標簽賦予”工作,形成檔案層面“產業界——資源界”和諧發展的檔案利用生態環境。
(三)“標簽賦予”的介紹。標簽賦予,就是在電子文件的屬性中增加“標簽”一項。它有以下幾個特征:一是標簽將伴隨著電子文件從生成、流轉、辦結、歸檔、利用直至銷毀全過程;二是電子文件可以被賦予多個不同性質和屬性的標簽,同一標簽下的文件在邏輯上屬于同一類別,因而,一個電子文件因被賦予多個標簽而在邏輯上屬于多個類別,這種方式打破了傳統檔案分類的概念:即物理分類(檔號)唯一,而邏輯分類不唯一。
(四)“標簽賦予”的優勢。由于傳統的數字檔案資源來源分散、結構差異大,有些歸檔文件來自OA系統、門戶系統等綜合性管理信息系統,也有些歸檔文件來自質量、人事、財務、合同等專業系統;當傳統的數字檔案信息系統接收這些文件時,由于缺乏有效的資源描述對其規范,不同來源的文件歸檔成為檔案資源后常常獨立存在于檔案信息系統的某一分類中,形成一個個“資源孤島”。在用戶查詢時由于缺乏經驗沒有找到合適的關鍵字,導致未能查到需要的資料。對數據檔案賦予“標簽”(TAG),一方面可以提高檔案的查全率、查準率;另一方面可以解決數字檔案資源之間的分散異構的障礙,即:無論這個文件是什么格式、來源于何種系統,只要賦予其標簽,既可實現和同一標簽下其他文件的多方關聯,使檔案資源之間建立邏輯聯系,充分共享。
(一)“標簽賦予”功能貫穿文件全業務流程圖

圖1 “標簽賦予”業務流程圖
(二)“標簽賦予”流程的解析和實例。1.在文件生成的過程中,由業務平臺的文件收發人員根據文件的標題選取關鍵字并對文件賦予標簽。筆者將根據實際工作中的某個文件為例做具體闡明,如:文件的發文名稱為《關于上海市軌道交通17號線工程可行性研究報告的批復》,收發人員在生成該文件時,可根據文件名關鍵字將“17號線”“可行性研究報告”兩個標簽添加到該文件的標簽屬性中,完成“標簽賦予”的操作。2.文件在流轉環節中,由業務平臺中的批示人員、經手人員、處理人員等在對該文件進行辦理過程中,結合工作實際對該文件賦予標簽。如:《關于上海市軌道交通17號線工程可行性研究報告的批復》在流轉過程中,處理人員考慮到可行性研究報告屬于軌道交通工程項目的前期證照性文件,將“前期文件”標簽添加到該文件的標簽屬性中。3.文件流轉完畢進入歸檔階段時,由檔案人員綜合業務和檔案經驗對該文件適當賦予標簽。如:軌道交通工程項目的可行性研究報告可取代軌道交通項目建議書,換言之,部分軌道交通工程項目是沒有項目建議書的,因此將“項目建議書”標簽添加到該文件的標簽屬性中,則在日后查詢項目建議書時將搜索出可行性研究報告。同時,該文件在從業務平臺通過接口導入檔案信息系統歸檔的過程中,檔案信息系統的“標簽收集”功能模塊自動將文件的標簽屬性信息更新至標簽數據庫。4.當用戶在檔案信息系統中查詢文件時,用戶的檢索行為會被檔案信息系統的“用戶模型”功能模塊記錄下來。系統將這些自動收集的用戶識別、信息辨別、查詢數據關聯的準確性信息等形成檔案利用報告,推送給檔案人員,由檔案人員對這些信息進行分析、識別和抽取標簽信息,完成檔案資源的“標簽賦予”。如:檔案人員發現用戶在查閱《關于上海市軌道交通17號線工程可行性研究報告的批復》時檢索使用的關鍵字是“青浦線”而非17號線(青浦線為規劃時用名,在建設階段更名為17號線),故將“青浦線”標簽添加到該檔案的標簽屬性中。5.檔案人員定期完善標簽數據庫,補充更新標簽索引關聯。檔案人員通過建立標簽數據庫中的同義詞庫,使標簽索引服務具備“自主學習”能力,提高不同標簽之間的相關性。如:將17號線、十七號線、青浦線進行索引關聯等。當用戶輸入關鍵字17號線進行查詢時,標簽數據庫將完成自動關聯,將十七號線和青浦線也作為可選關鍵字進行更廣范圍的搜索,并將相應查詢結果向用戶呈現。
(一)全業務流程的全員配合。國家檔案局經科司蔡盈芳處長在數字經濟會給檔案公司帶來管理能力的挑戰中提到:檔案工作越來越依賴于外部力量。雖然企業檔案是組織在生產經營實踐中形成并具有保存價值的信息資源,但是歷史的原因使得檔案之前一直處于企業信息資源的邊緣,得不到關注和開發。基于標簽理論的數字檔案資源共享是一種合作化發展服務模式。它借助“標簽賦予”這個契機,使得檔案資源作為一個載體突破檔案領域的局限,推向企業的公眾視野,本著需求合作的目的,利用網絡和信息技術等完善檔案資源的共享服務,建立起全面覆蓋的資源體系。這就要求檔案人員轉變理念和思路,對檔案工作賦予新的內容。檔案人員要加強主動性,將傳統的檔案工作向前延伸,正確處理與前端業務部門的關系,還要提前介入,讓前端工作融入檔案工作,成為檔案工作的一部分。比亞迪公司在介紹檔案工作融入業務生產的經驗時就提到堅持檔案向工作延伸,將文件材料形成過程延伸到業務端,延伸到研發現場、生產現場、設計現場、建設現場四大業務現場,使得檔案在業務實踐中自然形成。所提及的延伸內容就是要管好各種類型、各種載體的企業記錄,目標還是為了做好文件的“標簽賦予”工作。
(二)企業信息化條件背景下,標簽理論要在檔案利用中產生效益、發揮作用,需要提高檔案人員的專業素養、業務素養和信息化素養,培養檔案復合型人才。“標簽賦予”與一般性著錄工作存在較大差異。“標簽賦予”不僅應對文件名進行關鍵字的簡單歸納與抽取,更重要的在于建立檔案內容的語義表達、業務描述與關聯建設等,為后續的各門類數據整合和知識性服務奠定基礎。同時,在企業實際運行中,檔案部門將會收集很多新型文件材料,如果不知道業務規則,不了解技術特征,是無法做好標簽的賦予和管理的。所以檔案人員要融入企業生產經營中,掌控檔案信息資源的實時狀況,尋找不同板塊業務之間的關聯,制定規則,進而發揮“標簽賦予”前端控制的價值,提升“標簽賦予”的合規性和關聯質量,提高后期利用效率。這就需要檔案人員運用所積累的檔案知識背景、擴大學習企業業務知識、了解信息化實現原理、提高信息化技術手段運用的能力。
美國哈佛大學教授齊普夫于1949年所著的《人為與最小努力原則——人類生態學引論》一書中提出“最小努力原則”的理論,揭示了人們在進行各種社會活動時總想以最小的代價獲得最大的效益。如今的檔案工作身處信息爆炸的數據時代,要體現自身為企業做出貢獻的最直接、最顯著的方式就是尋找一種途徑,能通過最少的搜索步驟、最簡便的關鍵字、最快地速度獲得相對更全面、更精準、更有效的信息資源,進而為企業的決策提供參考。通過“標簽理論”開展的全業務流程“標簽賦予”,實際上就是將檔案意識貫穿文件全過程,有助于提升企業全員檔案意識;同時,檔案人員使用“標簽賦予”功能模塊進一步對檔案管理系統的利用效率持續改進和提優。如其能保質保量地實施,則高效的查詢結果和檔案利用,亦有助于改善檔案部門在企業的重要性,提升檔案工作的站位和地位。
綜上所述,“標簽賦予”是標簽理論在提高檔案資源利用效率上的一個關鍵步驟,也是一個應用上的難點;而“標簽賦予”全業務流程得以實施的前提,是解決“標簽賦予”難題的重要核心所在。如果能設法達到前置條件,則可以較好地實現“標簽賦予”,從而有效應提高企業檔案資源利用效率。