趙 鵬,李雙建,王江濤,孫瑞杰
(國家海洋信息中心 天津 300171)
海洋規劃信息查詢系統的設計與實踐
趙 鵬,李雙建,王江濤,孫瑞杰
(國家海洋信息中心 天津 300171)
文章在研究海洋規劃信息查詢系統用戶工作特點和需求的基礎上,系統論述了使用內嵌TRS全文數據庫的新科光盤出版系統開發海洋規劃信息查詢系統的過程,包括數據字段的定義、查詢系統和數據庫的結構設計和查詢界面的設計;介紹了該查詢系統的功能和未來的發展方向。
海洋;規劃;查詢系統
海洋規劃是國家和沿海各地發展海洋事業,促進經濟社會可持續發展的指導性文件?!笆晃濉币詠韲液透鞯胤匠雠_了大量海洋事業、海洋經濟等方面的規劃,這些規劃的出臺和實施為“十一五”期間我國海洋事業健康有序地發展提供了必要的保證。我國在2011年啟動第十二個五年計劃,國家和沿海各地方開始了新一輪海洋規劃的編制和實施工作。在編制海洋規劃的過程中,快速查閱和參考其他領域和地區已有相關規劃的內容,對協調海洋規劃與其他領域規劃,科學合理地編制規劃有著重要的意義。因此,有必要設計和開發海洋規劃信息查詢系統,以滿足海洋規劃編制工作的需要。該系統還可服務于各級政府的電子政務公開工作,方便人民群眾了解和掌握當地海洋事業的發展趨勢。
在電子信息發布中,互聯網已成為信息發布的重要途徑,而以光盤或其他便攜式介質為載體發布信息則是互聯網信息發布的重要補充。光盤在收費方式、保密、方便攜帶、可移動、使用簡單和特殊環境等方面有不可替代的作用和優勢?;谟脩艄ぷ鳝h境和實際需要,海洋規劃信息查詢系統采用新科光盤出版系統進行開發。
新科光盤出版系統是一個以光盤等便攜式介質為載體的信息發布系統。它基于text retrieval system(TRS)信息發布檢索系統,集成了數據管理、界面設計和光盤制作等功能。TRS系統的功能包括信息采集、發布、分類導航和查詢等,廣泛地用于各種信息數據庫和信息門戶的建設[1]。
內嵌TRS全文檢索數據庫的新科光盤出版系統在系統穩定性、查詢速度、數據壓縮、數據和軟件加密、信息檢索和排序等方面具有明顯優勢。此外,該系統可提供W indow版、單機Web版和局域網Web版檢索界面;提供多種檢索方式、顯示風格,無需編程即可實現,大大降低了開發成本。該系統已廣泛應用于出版社、圖書館、網站、信息中心、研究所和檔案室等部門。
海洋規劃信息查詢系統面對的用戶主要包括各級海洋行政主管部門、海洋規劃編制和研究機構,以及其他海洋規劃相關機構的管理和研究人員。他們從事的工作既具有很強的專業性和行業特點,又涉及海洋領域的方方面面。然而,由于海洋領域已有的規劃成果較少,在編制規劃時往往要借鑒和參考其他領域的規劃成果。因此,設計和選取數據時,既要注重信息的廣泛性和多樣性,也要保證信息的針對性和有效性。要在對各類已有規劃數據進行分析、篩選的基礎上,對規劃數據進行分類,使無序的數據有序化、繁雜的數據專業化和分散的數據集中化[2]。
海洋規劃信息查詢系統選取的規劃數據包括海洋規劃和涉海規劃。其中,涉海規劃被限定為國家規劃、地區規劃和沿海11個省級行政單位及沿海地市制定的規劃。海洋規劃的編制過程往往面臨時間緊、任務重的局面,為了快速、準確地查詢規劃信息,不但要檢索規劃數據的全文,還需要提取規劃數據的關鍵信息,并對規劃數據進行分類。因此,本查詢系統按照規劃的級別、行政區域、所屬領域及是否為海洋規劃等進行分類,并能檢索規劃題目、時效和發布單位等關鍵信息。
海洋規劃原始數據主要來自于各級政府部門、研究機構和行業組織網站上發布的規劃文本,以及國家海洋信息中心海洋規劃研究部保存的規劃文本。規劃文本的格式主要為Word和PDF格式。
海洋規劃信息主要由三部分組成:第一部分是海洋規劃信息的外部特征,包括規劃標題、生效日期、失效日期和發布單位等;第二部分是依據規劃的級別、區域(國家、地區、省、市)、涉及領域和是否為海洋規劃對規劃信息進行的分類及分類代碼;第三部分是規劃信息的全文。這些信息的主要內容和字段見表1。

表1 規劃信息字段
其中,級別分為國家級、地區級、省級和市級。為便于用戶查閱,簡化數據庫結構,縣一級規劃入所在市的規劃中。區域一項中,省及省級以下的規劃按照所屬區域進行劃分,如東北、華北、華東和華南等;對于涉及多個省的規劃,按照規劃標題中出現的區域進行劃分,如環渤海、長江三角洲、珠江三角洲和長江流域等。
領域一項中,區分海洋規劃和涉海規劃。用阿拉伯數字0~9標注海洋規劃,用英文字母A~Z標注涉海規劃,將海洋規劃劃分為11個領域,涉海規劃分為13領域。具體劃分方法見表2。

表2 規劃所屬領域的劃分方法
本系統裝庫一般采用批量模式,即需要先準備好裝庫數據格式文件,然后一次性導入系統,也可使用系統提供的“導入”功能,將規劃文本批量導入。TRS裝庫文件通常使用標準格式:
<REC>
<字段名1>=字段值1……
<字段名2>=字段值2……
<字段名n>=字段值n……
……
<REC>
<字段名1>=字段值1……
<字段名2>=字段值2……
<字段名n>=字段值n……
……
海洋規劃信息查詢系統主要由管理端、數據庫和用戶端3部分構成。管理端作為規劃信息查詢系統的提供方和維護方,設計查詢系統的結構和功能,對原始數據進行搜集和整理,并將數據導入到數據庫中。同時,在查詢系統運行的過程中,負責對查詢系統進行維護,及時更新數據庫,搜集用戶反饋以完善查詢系統。基于TRS全文檢索數據庫的海洋規劃信息數據庫存儲經加工的海洋規劃數據,并對用戶端的請求進行應答。用戶端通過瀏覽界面、查詢界面和輸出功能為用戶提供查詢和保存海洋規劃信息的服務。用戶端與數據庫之間通過加密和設置訪問權限等方式對用戶及其使用查詢系統的方式加以限制。查詢系統的結構見圖1。

圖1 海洋規劃信息查詢系統結構
海洋規劃信息數據庫中,國家級、區域級和省級作為數據庫的第一級結構。國家級和區域級規劃的第二級結構均分為海洋規劃和涉海規劃;省級規劃下的第二級結構以省級行政單位劃分,順序按照從北至南海岸線的走向編排。為避免數據庫的結構過于繁冗,將沿海各市規劃編排為各省規劃下的第三級結構。數據庫結構的第三級為各省的省級海洋規劃、涉海規劃和地市級規劃。第四級結構為各沿海地市規劃,順序按照從北至南海岸線的走向編排。第五級結構為沿海各地級市及所轄縣的海洋規劃和涉海規劃。數據庫的結構見圖2。

圖2 海洋規劃信息數據庫結構
根據海洋規劃編制工作的實際需要,用戶端界面采用出版系統提供的W indow s單機版界面。該界面具有設計簡單、界面統一、結構固定及使用方便的優點。Window s單機版采用了流行的3-frame結構,界面與Outlook exp ress等大眾化軟件一致,因此用戶操作會比較熟悉。用戶端瀏覽界面包括導航欄、概覽欄和細覽欄。
導航窗口的數據庫分類以導航樹方式顯示,導航樹中的每一個結點記錄了檢索條件及固定賦值選項等信息,選中一個結點將根據檢索條件重新進行檢索,并在概覽窗口中顯示檢索結果。概覽窗口中顯示所有滿足條件的記錄,顯示記錄的那些字段,字段排列的先后次序。細覽窗口顯示某條記錄的詳細內容,點擊細覽窗口中Wo rd圖標可在查詢系統中打開相應的Word原文件(其他文件類型對應其他圖標)。用戶可通過檢索欄對檢索字段,篩選出符合條件的數據。
查詢系統提供“搜索”和“高級檢索”兩種信息檢索方式。使用搜索功能可檢索所有字段信息;而高級檢索功能可根據對特定字段進行檢索,并能按檢索表達式、在上次結果中進行檢索。
用戶可根據需要對命中的信息進行排序,其中數值型和字符串型字段可進行升降序排序,而短語型和文檔型字段僅支持相關性排序。此外用戶還可使用排序命令對多個字段進行組合排序。用戶還可保存和打印指定記錄。
光盤制作者指定最終發布的光盤進行注冊碼驗證,最終用戶進行光盤安裝時會出現“輸入注冊碼”的提示信息,如果用戶沒有取得合法的注冊碼,則安裝失敗。查詢系統的制作方,定期向用戶提供“增補數據包”,對數據庫進行更新。
海洋領域在國民經濟和社會發展中扮演越來越重要的角色。海洋規劃對沿海地區科學規劃海洋和沿海產業布局、合理利用海洋和海岸帶資源等方面發揮著重要的作用。建設海洋規劃信息查詢系統為海洋規劃編制和研究工作提供了必要的技術支持和保障。然而,限于技術水平和開發條件,現有的查詢系統存在著功能尚顯單一,數據庫規模略小等缺陷,這需要在未來的工作中加以完善。
在未來的工作中,我們將進一步增加規劃信息的數量,調查研究用戶的需求,提高技術水平。未來的海洋規劃信息查詢系統在檢索規劃文本的基礎上,還將納入自然、經濟和社會數據,國家和地方的法律、法規等信息;增加用戶反饋、用戶交流協作平臺等功能;增加網絡版、電子政務查詢系統等。
[1] 馬建玲.基于TRS系統構建網上專題閱覽室[J].圖書館理論與實踐,2005(6):121-122.
[2] 黃長.利用TRS全文檢索系統建設專題數據庫的研究和實踐[J].圖書館論壇,2005,25(3):213-214,210.
一項中,以《沿海行政區域分類與代碼(HY/T094-2006)》中各省、市的6位數字代碼作為分類代碼的前6位;海洋規劃在6位數字代碼后標注Y,涉海規劃在6位數字代碼后標注N。如,遼寧省的海洋規劃標注為210000Y,北海市的涉海規劃標注為450500N。國家級規劃前6位數字代碼統一為000000,區域級規劃前6位數字代碼統一為111111,海洋規劃和涉海規劃仍分別標注為Y和N。如,國家級海洋規劃標注為000000Y,區域級涉海規劃標注為111111N。正文是文檔型字段(文本),支持自動分詞,允許按詞檢索,支持相關性排序。