檔案館館藏機(jī)讀電子文件命名是電子文件管理工作的基礎(chǔ)性環(huán)節(jié)。隨著館藏機(jī)讀電子文件數(shù)量的不斷增加,如何使館藏機(jī)讀電子文件的命名更科學(xué)、更有利于電子文件管理工作的開展,是一個(gè)需要認(rèn)真探究的問題。下面是筆者對(duì)這一工作的幾點(diǎn)粗淺認(rèn)識(shí)與不成熟的做法。
1 電子文件命名是指各歸檔單位向檔案館移交后檔案館使用的機(jī)讀文件的命名
本文所說的電子文件的命名,不是指電子文件形成時(shí)由形成者(包括使用計(jì)算機(jī)起草文件的工作人員、打字員或?qū)I(yè)文件輸入者)命名的機(jī)讀文件名,而是指各歸檔單位向檔案館多交后檔案館使用的機(jī)讀文件的命名。
所以提出這一問題,是因?yàn)槟壳斑€沒有嚴(yán)格的電子文件命名的規(guī)范與要求,電子文件的命名大都由文件形成者根據(jù)單位慣例或個(gè)人習(xí)慣自行實(shí)施。這樣,在一個(gè)單位內(nèi)計(jì)算機(jī)應(yīng)用范圍越廣,工作人員使用計(jì)算機(jī)的水平越高,形成電子文件的點(diǎn)越多,電子文件的命名就越不統(tǒng)一。如果各單位直接將這些沒有統(tǒng)一命名規(guī)律的文件移交給檔案館,將給檔案館在接收、整理、管理與利用這些電子文件時(shí)造成困難。即便是各單位在移交前對(duì)本單位的電子文件進(jìn)行了統(tǒng)一命名整理,但如果所有進(jìn)館單位沒有一個(gè)統(tǒng)一的命名規(guī)則,同樣會(huì)給檔案館的管理工作造成困難。
這樣就有必要對(duì)進(jìn)館單位的電子文件命名進(jìn)行規(guī)范與統(tǒng)一。在國家與省級(jí)檔案行政管理部門尚沒有制定與頒布具體的命名規(guī)范前,市(地)縣(市)檔案行政管理部門可以根據(jù)本地的實(shí)際情況,先行制定一個(gè)地方性、區(qū)域性的規(guī)范,這樣做既有利于本地區(qū)進(jìn)館電子文件的管理,也為日后執(zhí)行國家或省級(jí)檔案行政管理部門制定的電子文件命名規(guī)范奠定了基礎(chǔ)。
筆者認(rèn)為,一個(gè)移交到檔案館供檔案館保存和提供利用的電子文件完整的名稱應(yīng)該包括如下4個(gè)方面的信息:電子文件形成者的信息、電子文件本身的信息、電子文件形成者與電子文件(檔案)保管者的相關(guān)信息、與不同載體、不同稿本、不同格式同一文件的區(qū)別和一致性。
1.1 電子文件形成者的信息。指電子文件形成單位的名稱。這一名稱應(yīng)是該單位的全稱,與其公章上的名稱相一致。
1.2 電子文件本身的信息。包括該文件的發(fā)文字號(hào)、發(fā)文時(shí)間、頁數(shù)等信息。至于文件題名信息,在電子文件沒有向檔案館移交前形成單位為查找與利用方便,可以直接使用文件題名來命名電子文件,也可以在電子文件名的相關(guān)信息中包括文件題名。但是,由于檔案館保存的電子文件的文件名中要包含一些形成單位沒有的信息,而且要用盡可能少的字符表達(dá)盡可能多的信息。因此,在檔案館歸檔保存的機(jī)讀電子文件名中以不包括文件題名為宜。
1.3 電子文件形成者與電子文件(檔案)保管者的相關(guān)聯(lián)信息。指電子文件形成單位與檔案館的行政級(jí)別與所在的行政區(qū)劃。在一個(gè)單位由于其主要保存的只是本單位形成的文件,因此,沒有必要在文件名中顯示單位的行政級(jí)別與所在的行政區(qū)劃。保存上下級(jí)與平行單位的文件也可以通過設(shè)立相關(guān)文件夾來實(shí)現(xiàn)。但在檔案館就必須區(qū)分每個(gè)歸檔單位的行政級(jí)別與所在的行政區(qū)劃,且不易通過設(shè)立相關(guān)文件夾來實(shí)現(xiàn)。
1.4 與不同載體、不同稿本、不同格式同一文件的區(qū)別和一致性。文件在形成過程中有不同稿本的區(qū)別,電子文件在形成時(shí)同樣有稿本的區(qū)別,同時(shí)還有類別、格式的區(qū)別。因此,電子文件名稱中應(yīng)當(dāng)包括稿本、類別、格式等信息。
2 館藏機(jī)讀電子文件名稱組成結(jié)構(gòu)與編碼規(guī)則
電子文件的命名一般使用漢字、數(shù)字和字母組成的字符串。由于檔案館保存的機(jī)讀電子文件名需要包含上述四個(gè)方面的信息,如果單獨(dú)使用漢字命名,必然造成文件名稱過長(zhǎng),不利于管理與利用。因此,電子文件的命名應(yīng)使用字母、數(shù)字組成的代字、代碼與編碼。本文以市(地)級(jí)檔案館為例,談一談館藏機(jī)讀電子文件名稱組成結(jié)構(gòu)與編碼規(guī)則。
2.1 館藏機(jī)讀電子文件名稱的組成結(jié)構(gòu)。指電子文件名稱應(yīng)該或必須包括的信息。以筆者的觀點(diǎn),電子文件名稱應(yīng)該或必須包括的信息有:文件形成單位所在行政區(qū)劃、級(jí)別、名稱、發(fā)文字號(hào)、發(fā)文時(shí)間、頁數(shù)、稿本、類別、格式等信息。
2.2 館藏機(jī)讀電子文件名稱各組成部分的編碼規(guī)則。要保證館藏機(jī)讀電子文件命名的標(biāo)準(zhǔn)統(tǒng)一,和文件名稱的唯一性,就有必要為電子文件名稱各組成部分的編碼確定一些規(guī)則。這些規(guī)則既要方便使用,又要方便日后與國家、省級(jí)標(biāo)準(zhǔn)的對(duì)接、轉(zhuǎn)換。
2.2.1 行政區(qū)劃。本文所指的行政區(qū)劃只包括省、市(地)、縣(市)三級(jí)。其編碼方式有如下幾種:
一是使用車牌的編碼方式。即漢字+字母+數(shù)字方式。省為漢字,市(地)為字母,縣(市)為數(shù)字。如:河南省為豫、陜西省為陜、上海市為滬;河南省鄭州市為豫A、河南省開封市為豫B、河南省新鄉(xiāng)市為豫G,陜西省西安市為陜A。使用車牌的編碼方式有一個(gè)突出的問題,由于省會(huì)所在城市政府機(jī)關(guān)與省政府機(jī)關(guān)同在一地,其車牌的編碼的前兩位相同。如河南省政府與鄭州市政府的車牌前兩位都是豫A,陜西省政府與西安市政府的車牌前兩位都是陜A。
二是使用身份證或郵政編碼的編碼方式。即數(shù)字方式。如身份證編碼方式:河南省為41;河南省開封市為4102、河南省開封市鼓樓區(qū)為410203。
三是使用組織機(jī)構(gòu)代碼的編碼方式。即字母+數(shù)字方式。
四是自行編制代碼的編碼方式。
前三種方式有現(xiàn)成的編碼可供參考,而且容易被人們記取與運(yùn)用,但編碼的數(shù)位較多,一般在6至8位。后一種編碼方式,如果采用數(shù)字編碼,省級(jí)5位,市級(jí)3位,縣級(jí)1位;如果采用字母編碼,則省級(jí)3位,市級(jí)2位,縣級(jí)1位。
2.2.2 名稱。指文件形成機(jī)構(gòu)的名稱。其編碼方式一是使用漢語拼音縮寫,一般使用兩位字母,重復(fù)的擇一單獨(dú)確定,通常為2位;二是使用檔案館已經(jīng)為各歸檔單位確定的全宗號(hào),即數(shù)字編碼,通常為3位。
2.2.3 發(fā)文字號(hào)。發(fā)文字號(hào)使用字母+數(shù)字的編碼方式。發(fā)文“字”使用拼音,即指定一個(gè)“字”的漢語拼音縮寫為代碼,通常為1位;“號(hào)”使用原文件的序號(hào),通常為2-3位。市、縣兩級(jí)發(fā)文數(shù)較少,通常多數(shù)單位每年不超過100件,可設(shè)為2位,考慮到有些單位發(fā)文數(shù)量大,超過了100件,為避免日后的數(shù)位不夠,被逼修改碼制,應(yīng)當(dāng)設(shè)為3位。省級(jí)發(fā)文數(shù)較多,多數(shù)單位年發(fā)文量均超過100件,部分單位超過了1000件,應(yīng)該設(shè)為4位。
2.2.4 發(fā)文時(shí)間。發(fā)文時(shí)間使用數(shù)字編碼方式。為了避免類似“千年蟲”的問題,應(yīng)選擇4位碼,如:1998、2001、2005等。不用98,01,05等省略的2位碼。
2.2.5 頁數(shù)。頁數(shù)使用數(shù)字編碼方式。占2位碼。此項(xiàng)在不同類別的電子文件中可以有不同的含意。如:在文本文件中指與文本文件對(duì)應(yīng)的紙質(zhì)文件的總頁碼數(shù);在圖像、圖形、影像、聲音文件中指該圖像、圖形、影像、聲音文件在整個(gè)文件中的順序;在程序文件中指該程序的版本號(hào)等。
2.2.6 稿本。稿本使用字母編碼方式,1位。M-草稿性電子文件;U-非正式電子文件;F-正式電子文件。
2.2.7 類別。類別使用字母編碼方式,1位。T-文本文件;I-圖像文件;G-圖形文件;V-影像文件;A-聲音文件;O-超媒體鏈接文件;p-程序文件;D-數(shù)據(jù)文件。
2.2.8 格式。格式信息直接由文件后綴表示,3位。隨著信息技術(shù)的飛速發(fā)展,操作系統(tǒng)與應(yīng)用軟件對(duì)文件名稱長(zhǎng)度已經(jīng)沒有什么限制了,十幾個(gè)乃至幾十個(gè)字符的文件名稱都是允許的;但從工作的實(shí)際情況看,文件名稱越長(zhǎng),出錯(cuò)的概率就越大。因此在可能的情況下,應(yīng)優(yōu)先選擇占用位數(shù)少的編碼方式。
2.3 電子文件名稱各組成部分的分段數(shù)位。上述8項(xiàng)信息按照功能可以分成4個(gè)部分。
2.3.1 館際交流標(biāo)識(shí)。包括行政區(qū)劃1項(xiàng)。此部分是為日后檔案館之間電子文件信息交流時(shí)區(qū)分信息來源時(shí)使用的。如果采用字母編碼,在省際之間交流需要3位碼位,在省內(nèi)交流市級(jí)需要2位碼位,在縣際之間交流需要1位碼位。如果目前暫時(shí)不進(jìn)行館際交流,可暫不設(shè)此項(xiàng)。
2.3.2 館內(nèi)定位標(biāo)識(shí)。包括名稱1項(xiàng)。此部分其編碼使用漢語拼音縮寫時(shí)為2位,需要專門對(duì)進(jìn)館單位名稱進(jìn)行編碼,并對(duì)重碼進(jìn)行改編。使用數(shù)字編碼時(shí)為3位,雖然比漢語拼音編碼多用一位,但可以與館里已有的全宗號(hào)統(tǒng)一起來,并且沒有重碼問題。最多可設(shè)定999個(gè)全宗,完全可以滿足目前省、市、縣三級(jí)綜合檔案館的需要。2.3.3 文件信息標(biāo)識(shí)。包括發(fā)文字號(hào)、發(fā)文時(shí)間和頁數(shù)3項(xiàng)。此部分的碼位最多,占9-10個(gè)編碼位。在實(shí)際應(yīng)用時(shí)的排列順序是,發(fā)文字代碼+發(fā)文時(shí)間代碼+發(fā)文號(hào)代碼+頁數(shù)代碼。
2.3.4 文件特征標(biāo)識(shí)。包括稿本、類別2項(xiàng)。此部分使用字母編碼只占2個(gè)編碼位。
下表是一個(gè)文件的機(jī)讀文件按上述編碼規(guī)則編制的機(jī)讀文件名稱

從上表可見,市縣級(jí)檔案館進(jìn)館電子文件的機(jī)讀文件名稱為16-17位制,省級(jí)檔案館為17-18位。在沒有開展電子文件館際交流時(shí)可以設(shè)置為15至16位。
3 實(shí)施機(jī)讀電子文件命名時(shí)應(yīng)該注意把握的幾個(gè)要點(diǎn)
目前,我們尚無關(guān)于館藏機(jī)讀文件命名的統(tǒng)一標(biāo)準(zhǔn)與規(guī)則,這樣各級(jí)檔案館可以根據(jù)各自的實(shí)際情況自行制定館藏檔案機(jī)讀文件的命名規(guī)則,但在具體實(shí)施過程中應(yīng)該注意把握如下幾個(gè)要點(diǎn):
3.1 代碼與編碼規(guī)則應(yīng)形成正式文件歸檔保存。館藏檔案機(jī)讀文件名稱的命名方法、代碼與編碼規(guī)則,是檔案館管理工作重要的依據(jù)性文件,一旦形成就必須歸檔保存,既為當(dāng)前的工作提供依據(jù),也為日后修改、調(diào)整、充實(shí)規(guī)則提供參考與憑據(jù)。如果保存不善,或者丟失,就會(huì)給館藏檔案機(jī)讀文件的管理帶來不利影響,甚至造成混亂。
3.2 保證文件名稱的唯一性。代碼與編碼規(guī)則的制定,要盡量使用少的碼位數(shù),但首要的是保證文件名稱的唯一性。如果為減少碼位數(shù),造成重碼的大量增加,就得不償失了。
3.3 維持代碼與編碼規(guī)則的穩(wěn)定性。館藏檔案機(jī)讀文件的命名方法、代碼與編碼規(guī)則的制定要科學(xué)、嚴(yán)謹(jǐn)、慎重,一旦確定,不應(yīng)輕易改動(dòng),并保持相對(duì)的穩(wěn)定性。輕易或頻繁的改動(dòng),不僅增加了工作量,而且極易造成混亂,給館藏檔案機(jī)讀文件帶來危害。
3.4 制定統(tǒng)一的重碼解決方案。為了減少重碼率,使用過多,過長(zhǎng)的碼位數(shù),會(huì)給管理工作增加工作量,造成管理效率下降,甚至使錯(cuò)碼率上升。因此,在確定一定的碼位數(shù)后,應(yīng)當(dāng)預(yù)先制定統(tǒng)一的重碼解決方案,為日后出現(xiàn)重碼時(shí)提供解決的方案與途徑。一定要避免隨意為重碼指定新碼的方式,同時(shí)為重碼調(diào)整設(shè)立記錄,為日后查詢提供憑據(jù)。
3.5 建立新老系統(tǒng)電子文件名稱的轉(zhuǎn)換方案與記錄。對(duì)由于管理系統(tǒng)升級(jí)造成的館藏檔案機(jī)讀文件目錄的不一致,應(yīng)根據(jù)確定的館藏檔案機(jī)讀文件的命名方法、代碼與編碼規(guī)則,對(duì)舊系統(tǒng)的館藏檔案機(jī)讀文件目錄實(shí)施轉(zhuǎn)換。轉(zhuǎn)換前應(yīng)制定轉(zhuǎn)換方案;實(shí)施時(shí),先進(jìn)行少量的實(shí)驗(yàn),確定沒有問題時(shí),再進(jìn)行大批量轉(zhuǎn)換;轉(zhuǎn)換還應(yīng)對(duì)舊系統(tǒng)的館藏檔案機(jī)讀文件目錄進(jìn)行備份;同時(shí)對(duì)轉(zhuǎn)換過程進(jìn)行記錄,以備日后查考。
(作者單位:開封市檔案局)