劉麗梅
摘 要:第二次全國地名普查檔案是近三十年來全國地名工作的嶄新成果,具有資料新、數量大、現實性強的等特點,在我國的新一輪數字化經濟建設中有著不可替代的作用。建設能夠適合互聯網、物聯網、云計算意義的應用型數據庫,則是實現地名檔案全社會應用的全新引擎。為了全面推進地名檔案數據庫建設,筆者從數據庫設計的基本要素出發,對“二普”地名檔案數據庫建設中的界面設計和數據庫模塊設計進行了粗淺的分析,意在為全國地名檔案工作提供借鑒。
關鍵詞:普查工作;地名檔案;數據庫
第二次全國地名普查工作于2018年底結束,形成了大量的地名檔案資料。根據《全國第二次地名普查檔案管理辦法》和《全國第二次地名普查成果轉化規劃(2015--2020)》關于“建設地名信息社會服務平臺,創新應用電子地圖、遙感影像、三維仿真等技術手段,拓展利用云平臺、大數據、物聯網等技術方式,向社會提供權威、及時、準確的地名信息服務”的系統要求,地名檔案數據庫建設則成為當前工作的重點。但是,時間已經進入2020年,各地的地名檔案數據庫建設工作仍比較遲緩。為了加快“二普”地名檔案數據庫建設,筆者從數據庫建設的基本原理出發,對地名檔案數據庫建設的框架結構進行了粗淺的研究,提出了地名檔案數據庫界面和模塊設計的基本思路。
1 主要界面的設計
根據數據庫的界面工作原理,數據庫的界面設計主要分為應用層、數據層和管理層。地名檔案數據庫的界面設計意在通過人、機交互,實現感知信號和實際地名信息的交互,通過指令——輸出命令——結果反饋——輸出結果等一系列的計算機運算實現信息的提取與共享,進而達到地名檔案數字化服務社會的目標。地名檔案數據庫的界面則屬于軟件界面設計。軟件界面是系統功能的延伸,是指軟件中面向操作者而設計的用于操作使用及反饋信息的指令部分,包括系統啟動界面、系統整體架構、菜單、圖標、按鈕、滾動條等。在地名檔案數據庫的設計中,應本著“簡約、通用、易行、大眾”的設計理念,積極開展設計工作。功能界面應包括著錄、掃描、借閱、質檢、統計、編輯著錄等。
1)著錄界面。著錄界面是整個系統的信息形成的核心界面之一,其功能是通過該界面的命令導引進入工作界面,進而開展著錄工作。該界面以Excel的形式展開,第一行為著錄項目,下方為表格填充項。其中著錄項目包括地名檔案的所有項目,而且在有新的需求時還可以拓展,進而為地名檔案的著錄打開了廣闊空間。
2)掃描界面。掃描是全國第一次地名普查檔案數字化的重要內容之一,是檔案真實性、原始性的集中反應,沒有掃描件作為參照,著錄的數據的真實性將遭到質疑。為了確保掃描工作的完整性、檔案的原始性、數據比對的真實性,在軟件的設計中,我們采用點陣數據庫的形式,將掃描件存入圖形數據庫。在界面展示上則呈現出橫縱向排列的圖形界面,只顯示檔案的紙張形態,和按照規則進行排列的整體圖案。
3)查閱界面。檔案查詢借閱是對外服務功能的核心,檢索功能的強弱,調閱速度的快慢,檢全率的高低,直接考驗軟件使用功能的成敗。查閱界面的圖標以書頁的圖案表示,當你點擊這個圖標后,將顯示一個對話框,讀者可以根據自己的需求,按照專名、通名、區劃類別、地名類別進行查閱。
4)質檢界面。質量檢查是核驗著錄準確率的重要環節,是保證著錄內容與掃描件完全一致的重要手段。沒有全面、系統、準確的質檢,檔案的真實性將大打折扣,也意味著檔案數字化工作的失敗。為了提高著錄工作的準確率,在質檢界面的設計中,著重體現了國家檔案局關于質量標準的要求和規范,在界面表示上,數據庫內的數據以電子表格的形式呈現,以區縣為單位建立數據庫,實施分列,按排列順序和檔號加以區分。當點擊要質檢的條目時,可同時打開檔案原件的掃描件,進行對照。查驗后,發現錯誤,可在機上立刻修改,完成質檢。
5)統計界面。檔案統計是檔案工作的重要內容,是制定檔案工作發展規劃、實施目標任務,指導檔案工作健康發展的重要環節。因此,在統計界面的設計上,要體現獨特的功能。為實現上述目標,在統計界面的設計上,應本著“科學使用,項目齊全、功能完備”的原則,設計多功能的統計界面。通過總按鈕打開后,可以按照下拉式菜單的方式,分別鍵入通名、類別、專名、曾用名、行政區劃、全稱、簡稱等進行統計。
6)編輯界面。這里提及的編輯功能并不是對掃描件、原著錄內容的修改,并不是修改數據庫中的原件,而是可以將其中著錄原文下載,然后編輯利用。為了實現這一功能,在地名檔案數據庫軟件的設計中,應突出下載功能,為用戶提供更加廣闊的利用空間,也可為檔案管理者修史編志提供極大便利。
2 數據庫的設計
“二普”地名檔案數據庫是以多個分支數據庫為支撐的系統數據源,其核心是通過融合多個數據庫的感知信號和實際地名信息的交互,完成輸出、輸入指令的信息系統。為了實現功能的互聯互通,在第二次全國地名普查檔案數據庫的設計中,至少應建立以下基礎數據庫。
1)目錄數據庫。目錄數據庫就是對檔案目錄進行存儲、處理和維護的軟件系統。對現存目錄的電子化,是其中的核心要素。地名檔案目錄的電子化主要包括以下內容:一是對檢索目錄項的設置,要體現長遠性、統一性和實用性;二是要保證電子目錄字段的多樣性和全面性。為了確保關鍵字查詢的有效性,其字段應包括以下內容:全宗號、檔案號、保管期限、責任者、文號、題名、日期、頁數、備注9個字段。三是設置電子目錄中檢索項題名項中任意關鍵詞進行自動標引和檢索,形成友好、方便、使用的檢索界面。
2)圖形掃描數據庫。圖形數據庫,是地名檔案數據庫的重要數據庫之一,它的意義在于實現著錄檔案內容與實體檔案內容的比對,是確保檔案真實性的重要環節。從內容來看,主要包括圖形文件和文書文件兩部分,它們在總數據庫下又分為多個分支區塊。二者的數據庫建設的標引和著錄體系均體現了地名的核心要素,其中包括名稱、漢語拼音、曾用名、地名由來、地理概況、區劃屬性、隸屬關系、類別等。
3)全文著錄數據庫。全文著錄數據庫,是二普地名檔案數據庫的根數據,是數據庫建設的核心,其巨大的容量、海量的數據構成了數據庫的有力支撐。在全文著錄的系統設計過程中,應著重考慮全國第二次地名普查檔案進館后的容量空間和詞條新的變化情況,一是留足了空間,二是為新增的地名標志、地名成果圖、名稱審定、地名標準化處理、少數民族地名譯寫、行政區域界線標繪做好了先期設計等。
4)照片數據庫。在這次地名普查中形成了大量的照片檔案,是地名檔案中的寶貴資料。為了實現二普照片檔案數據庫開發的專屬性,既要完善其數量體系,又要實現檢索和存儲路徑的互通。在檢索系統設計上,要依據二普檔案——圖片——屬地——名稱——內容說明,等標引項,展開設計。在路徑設計上,盡量與圖形掃描數據庫區別開來,防止二者混淆。數據庫中的每一張圖片均與其相應的地名檔案相對應,并與地名著錄數據庫相關聯。當用戶查閱某一條地名時,該照片也同步實現相應的組合展示,使地名檔案的圖形實感效應立現。
5)圖書資料數據庫。圖書資料是地名檔案的重要內容之一,是地名普查工作的真實記錄,是地名普查成果轉化的具體表現,其主要包括地名志、地名錄、地名詞典、地名圖和地名工作的其他資料。為了提高利用率,在軟件開發中應開辟專門的地名圖書資料數據庫。數據庫的主要按圖書的類型設立文件夾,夾內再進行細分到每本圖書,并建立單獨目錄和檢索工具,便于檢索利用。