王軍,李陽東,李玉偉
(1.上海市海洋管理事務中心 上海 200050;2.上海海洋大學海洋科學學院 上海 201306;3.上海海洋大學大洋生物資源開發和利用上海市高校重點實驗室 上海 201306;4.大洋漁業資源可持續開發教育部重點實驗室 上海海洋大學 上海 201306)
?
遠洋漁業數據庫設計和索引探究
王軍1,李陽東2,3,4,李玉偉2,4
(1.上海市海洋管理事務中心 上海 200050;2.上海海洋大學海洋科學學院 上海 201306;3.上海海洋大學大洋生物資源開發和利用上海市高校重點實驗室 上海 201306;4.大洋漁業資源可持續開發教育部重點實驗室 上海海洋大學 上海 201306)
我國遠洋漁業已經走過30個年頭,通過漁業生產、海區調查等方式積累了大量的遠洋漁業數據??梢灶A見的是,隨著時間的推移以及科學技術(如RS、GIS等技術)在遠洋漁業方面的應用,遠洋漁業數據必將具有海量特征。如何高效管理這些海量的遠洋漁業數據是本研究要解決的關鍵。文章通過對遠洋漁業中3種經濟魚(金槍魚、竹莢魚、魷魚)的生產、調查、地理等相關方面數據的分析,基于SQL Server 2000設計了遠洋漁業調查數據庫,基于Geodatebase設計了遠洋漁業空間數據庫。通過數據庫的形式,實現了遠洋漁業海量數據的高效管理。同時,針對所建立的遠洋漁業數據庫的空間數據建立了G樹索引,為高效查詢相關空間數據提供了支持。
遠洋漁業;數據庫設計;空間索引;漁業管理
遠洋漁業作為海洋經濟的重要組成部分,已經涉及國家的海洋權益、經濟利益、食物供應安全等方面,我國對遠洋漁業給予了高度的重視。同時,海洋漁業管理是海洋管理的重要內容,做好漁業管理,對海洋漁業資源開發與管理起到重要的積極作用。
自1985年來,我國海洋工作者在進行遠洋捕撈的同時,對多數海區進行了大規模的調查,積累了大量的遠洋漁業數據。他們對這些數據進行分析處理,獨立開發建設了很多數據庫。畢健等[1]利用來自于舟山、上海、煙臺、大連、寧波等17個漁業公司(或單位)提供的1994-1995年漁獲量統計資料建立了西北太平洋魷魚釣數據庫,利用Foxpro數據庫系統準確快速處理魷魚釣漁獲量數據,利用經濟領域中的預測方法來預測產量、可投入船數、平均日產量等,指導漁業生產與管理。李小恕等[2]利用1997-2001年對海洋生物資源與生物棲息環境調查數據,建立了海洋生物資源與生物棲息環境數據庫,該數據庫在海洋漁業資源與環境的研究、評價中得到廣泛應用。袁騏等[3]利用中國水產科學院黃海、東海和南海水產研究所1999-2002年多個航次的調查數據,設計了海洋漁業生態環境監測數據庫系統,針對海洋漁業生態環境監測特殊需要,增加了污染物質生物體殘留量子數據庫以及多種水質、底質和生物污染程度綜合評估模型,為海洋漁業生態環境質量評價和海洋生態環境保護提供相關數據和信息。陳衛忠等[4]在系統收集東海區歷年海洋捕撈產量、捕撈努力量統計資料、主要經濟魚類生物學參數以及漁業資源研究文獻報告等資料基礎上,對數據資料進行整理和補充,建立了漁業資源研究數據庫。張寒野[5]在對海洋生物資料調查信息分析與整理的基礎上,將涉及的數據分為屬性數據和空間數據兩種,分別建立了海洋生物資源數據庫和矢量圖層;最終利用這些數據庫建立了海洋生物資源信息管理系統,通過該系統用來準確評估海洋漁業資源現狀。

依據現有的數據庫且結合上海海洋大學海洋漁業遙感GIS技術實驗室的數據,兼顧當前RS以及GIS技術獲得資料,擬對遠洋漁業數據庫進行設計開發,設計一個規范、全面、實用性強的遠洋漁業數據庫。并利用該數據庫對這些多源異構的海量遠洋漁業信息進行管理,以便為海洋漁業科研奠定更好的基礎,為海洋漁業生產提供多面服務,為漁業資源合理利用提供科學指導,為海洋資源管理做出科學決策。
在前人的基礎上,對遠洋漁業涉及生產、環境、資源、地理、船舶等數據進行了分析和梳理,將涉及的數據分為調查數據和基礎數據兩種形式,分別設計了遠洋漁業調查數據庫和基礎數據庫(即空間數據庫)。
遠洋漁業調查數據庫在SQL Server 2000的環境下,根據需求創建的調查信息數據庫。該數據庫本著信息規范、系統性能穩定、數據安全、信息完整、系統可擴展等原則,創建了包括魷魚、金槍魚、竹莢魚生產信息和生產調查生物學數據信息專題,以及生產調查環境信息專題等的11個數據庫表以及若干字典表。
遠洋漁業地理空間數據庫在ArcGIS的環境下,基于Geodatabase根據實際漁業調查或者生產中涉及的數據創建的空間數據庫。該數據庫包括經緯網、FAO漁區、海區、捕撈點等具有特定地理意義的數據。這些包含地理信息的空間數據大多以矢量數據格式存在,通常采用“圖層”來對它們進行組織和管理,各個圖層分別存儲不同專題的空間信息。在本數據庫中,包含捕撈點、觀測點、航線、漁區、海區、洲等6個含有基礎空間數據的圖層。
1.1 遠洋漁業數據庫需求分析
遠洋漁業數據庫的數據信息包含調查數據和空間基礎數據,隨著今后調查和漁業生產活動的執行,積累的數據會不斷增長。該數據庫的調查數據包括與調查相關的數據,如調查時間、調查經緯度、網次、溫度、深度、鹽度、漁獲物量以及漁獲物生物學方面的數據;基礎空間數據主要指海洋功能區劃信息這類代表特定地理意義的數據,包括經緯線、漁區、海區、海陸邊界、觀測點、作業地點等。這些數據在數據庫中以圖層的形式出現,同時調查數據中涉及空間的數據(如經度、緯度)均屬于空間數據。該數據庫中的調查數據(是指基本上與空間位置沒有直接關系的數據)存放于SQL Server數據庫中。
1.2 遠洋漁業調查數據庫建立
1.2.1 遠洋漁業調查數據庫概念結構設計
概念結構設計是將分析得到的用戶需求抽象為概念模型的過程。即在需求分析基礎上,設計出能夠滿足用戶需求的各種實體以及它們之間的相互關系概念設計模型。概念模型是對信息世界建模,能夠方便、準確地表示信息世界中的常用概念[10]。概念結構設計能真實、充分地反映現實世界及其事物與事物之間的聯系,易于理解和更改,以及易于向關系、網狀、層次等其他數據模型轉換。
在遠洋漁業數據庫中,每艘船舶會在不同的漁區從事不同的作業,這些作業包括對不同經濟魚種進行生產以及生產時的環境調查等。在生產的過程中,對捕獲物進行統計和測定。不同的捕獲種類有著不同的生物學特征,并且不同的經濟魚種在生產過程中有著不同的生產方式。所以,在本數據庫中涉及對象有:金槍魚、魷魚、竹莢魚生產信息,環境調查信息,生物種類,生物學信息,海區信息,船舶信息等。用E-R圖表示它們之間的關系如圖1所示。

圖1 遠洋漁業數據庫E-R圖注:長方體表示實體,菱形表示實體間的關系.
1.2.2 遠洋漁業調查數據庫邏輯結構設計
E-R模型是用戶的模型,它獨立于任何一種數據模型。因此,需要將用E-R圖表示的概念模型轉換為某個具體的數據庫管理系統所支持的數據模型,然后建立用戶需要的數據庫。
根據數據庫概念結構設計階段得到的遠洋漁業地理屬性數據庫E-R模型,我們可以設計以下遠洋漁業調查數據庫邏輯結構模型,其中實體標志碼用*標出(下同)。
(1)魷魚生產信息,包括:日期*,漁業公司*,經度,緯度,作業漁船數,漁獲量,作業類型,備注。
(2)魷魚生產調查生物學信息,包括:日期*,船名*,漁業公司,船舶呼號,經度,緯度,胴長,體重,性別,性成熟度,攝食等級,胃含物,備注。
(3)金槍魚生產信息,包括:作業日期*,船名*,船舶狀態,投繩船速,投鉤起點時間,投鉤起點經度,投鉤起點緯度,投鉤終點時間,投鉤終點經度,投鉤終點緯度,起鉤起點時間,起鉤起點經度,起鉤起點緯度,起鉤終點時間,起鉤終點經度,起鉤終點緯度,兩浮子間釣鉤數量,投鉤數量,投繩長度,支繩長度,兩支繩間主繩長度,投放主繩長度,魚種,漁獲尾數,加工重量,兼補海龜狀況,備注。
(4)金槍魚生產調查生物學信息,包括:日期*,船名*,漁業公司,船舶呼號,經度,緯度,胴長,體重,性別,性成熟度,攝食等級,胃含物,備注。
(5)金槍魚生物學統計信息,包括:日期*,船名*,漁業公司,船舶呼號,經度,緯度,漁獲種類,平均體長,平均體重,備注。
(6)竹莢魚生產信息,包括:日期*,船名*,網次*,漁業公司,船舶呼號,放網時間,放網緯度,放網經度,起網時間,起網經度,起網緯度,產量,CPUE,拖速,拖向,網位深度,網口高度,網型,手綱,沉力,浮力,水平擴張,曳繩長度,魚群下緣,魚群上緣,魚群水深,魚群高度,魚群影像,網位儀水深,備注。
(7)竹莢魚生產調查生物學信息,包括:日期*,船名*,漁業公司,船舶呼號,經度,緯度,叉長,體重,純體重,體寬,體高,體周,性別,性成熟度,攝食等級,胃含物,備注。
(8)海況氣象,包括:日期*,船名*,時間*,漁業公司,船舶呼號,經度,緯度,天氣,氣溫,氣壓,流速,流向,風速,風向,能見度,浪高,浪向,干球溫度,濕球溫度,總云量,低云量,備注。
(9)溫鹽深觀測,包括:日期*,船名*,時間*,漁業公司,船舶呼號,經度,緯度,深度,溫度,壓力,密度,鹽度,葉綠素-a,溶解氧,備注。
(10)海流觀測,包括:日期*,船名*,時間*,漁業公司,船舶呼號,經度,緯度,水深,速度x,速度y,速度z,溫度,速度,方向,備注。
(11)船舶檔案,包括:船名*,船舶呼號*,所屬公司,船籍港,船籍國,船型,作業許可證,全長,功率,總登記噸位,巡航能力,造船時間,冷凍能力,倉容量,作業方式,船舶照片,備注。
(12)漁區:包括:漁區ID*,漁區名稱。
(13)海區:海區ID*,海區中文名稱,漁區英文名稱。
1.2.3 遠洋漁業地理數據庫物理結構設計
數據庫在實際的物理設備上的存儲結構和存取方法稱為數據庫的物理結構,與給定的硬件環境和DBMS軟件產品有關。本數據庫是在Windows XP的操作系統下,磁盤320 G的環境中,利用SQL Server 2000建立。
1.3 遠洋漁業空間數據庫設計
本數據庫是基于Geodatebase建立。在Geodatebase中,要素類是具有相同的屬性集、相同的行為和規則的空間對象的集合。所有的數據都在同一數據庫中存儲并中心化管理,實現地理數據的統一存儲管理。同時,還可以實現無縫、無分塊的海量要素的存儲[11]。
根據空間數據的特征,對空間對象建立的邏輯結構如下:
航線信息,包括:要素ID*,形狀,要素類型,航行航次,航行船名,開始航行時間,終止航行時間,航行海區。海區信息,包括:要素ID*,要素類型,陸地中文名,陸地英文名。漁區信息,包括:要素ID*,形狀,要素類型,漁區號,漁區所屬海區,面積。洲信息,包括:要素ID*,形狀,要素類型,洲中文名,洲英文名,面積。影像信息,包括:影像名稱,影像ID*,存儲路徑,文件格式,空間分辨率,影像格式,拍攝時間,左上角經度,左上角緯度,右下角經度,右下角緯度。
根據空間數據的邏輯結構,建立空間數據庫的物理結構如表1至表3所示。

表1 航線和海區信息

表2 漁區和洲信息

表3 影像信息

續表
針對不同的圖層,在方便管理和儲存的前提下,利用Geodatebase建立了遠洋漁業空間數據庫。在該數據庫中,要素類型共分為3種:點狀、線狀和面狀,共有7個圖層。捕撈點、觀測點屬點特征圖層;航線屬線特征圖層;漁區、海區、經緯線、洲等屬于面特征圖層。在Geodatebase中的個人數據庫中,利用ArcGIS Catalog工具,將鹽度、溫度和葉綠素的影像存儲在該數據庫中。
漁業調查數據庫中涉及大量的空間調查數據,這些數據是具有點實體特征,并且均與時間有關。實際應用中,經常需要對這些漁業數據進行空間和時間的查詢訪問。為了快速而又準確的查找到所需目標,作者根據遠洋漁業數據庫中的調查時間數據建立了順序索引,對空間數據庫建立了G樹索引。
由于調查數據都會有時間的字段記錄,因此可以針對時間建立順序索引。順序索引建立的方法有B-樹、B+-樹索引等。這樣,要查找某一時間的調查數據,按照順序檢索或者折半檢索,就可以快速定位滿足條件的數據。
G樹格網索引將海區作為第一層次,漁區作為第二層次,點狀實體、線狀實體、多邊形實體等作為第三層次。
在檢索過程中,先對數據進行過濾:先檢索第一層次,找到目標實體所在的區;將此層次中目標實體所在的海區的格網投影到第二層次的格網中,找出目標實體所在的漁區;再將第二層次中目標實體所在的漁區格網投影到第三層次中,然后在第三層次中進行精確查找,直到精確查找出該目標實體。
本研究以現有的遠洋漁業生產數據、調查數據以及地理數據為基礎,在詳盡分析了遠洋漁業中金槍魚、竹莢魚和魷魚等數據資料之后,依據分析結果進行了遠洋漁業數據庫的設計與探究。本數據庫分為兩部分,利用SQL Server 2000建立了遠洋漁業屬性數據庫,利用ArcGIS建立了遠洋漁業空間數據庫,使得基礎數據與空間數據得以連接在一起。另外,還對遠洋漁業空間數據庫的索引進行了研究并針對該數據庫建立了G樹索引,提高了空間數據查詢的效率。遠洋漁業數據庫的建立,為海洋漁業科研奠定更好的基礎,為海洋漁業生產提供多面服務,為漁業資源合理利用提供科學指導,為海洋資源管理做出科學決策。
該遠洋漁業數據庫設計目前僅考慮金槍魚、竹莢魚、魷魚3種經濟魚,下階段的工作是把其他經濟魚種也考慮進來,同時在該數據庫的基礎上開發遠洋漁業數據庫系統,實現遠洋漁業有關的分析和統計等功能。
[1] 畢健,陳新軍.西北太平洋魷魚釣數據庫的開發和應用[N].上海水產大學學報,1996,5(3):205-208.
[2] 李小恕,李繼龍,賈靜,等.數據庫技術在海洋生物資源與生物棲息環境數據管理中的應用[J].上海水產大學學報,2002,11(4):371-377.
[3] 袁騏,沈新強.海洋漁業生態環境監測評估數據庫的設計和實現[C]//中國水產學會2003年學術年會,2003.
[4] 陳衛忠,李長松,胡芬,等.東海區海洋漁業資源研究數據庫系統的設計和實現[J].中國水產科學,2001,7(4):91-94.
[5] 張寒野.東海海洋生物資源信息管理系統開發[D].上海:上海水產大學,2006:1.
[6] 黃巧珠,呂俊霖,麥麗芳.我國漁業科學數據庫的現狀與發展趨勢[J].安徽農業科學,2009(5):15977-15978,16127.
[7] 杜云虎,周成虎,邵全琴,等.海洋漁業數據庫質量控制研究[J].中國圖像圖形學報,2002,7(3):276-281.
[8] 楊寧生.現階段我國漁業信息化存在的問題及今后的發展重點[J].中國漁業經濟,2005(2):15-17.
[9] 岳昊,歐陽海鷹,曾首英,等.淺談中國魚類多樣性數據庫建設現狀:以FishBase為例[J].中國農業通報,2013,29(8):59-63.
[10] 王珊,李勝恩.數據庫基礎與應用[M].北京:人民郵電出版社,2002:1-6.
[11] 王新生,王紅,朱超平.ArcGIS 軟件操作與指南[M].北京:科學出版社,2010:25-27.
On the Design and Index of Pelagic Fisheries Database
WANG Jun1,LI Yangdong2,3,4,LI Yuwei2,4
(1.Shanghai Administration Center for Ocean Affairs,Shanghai 200050 China;2.College of Marine Sciences,Shanghai Fisheries University,Shanghai 201306 China;3.The Key Laboratory of Shanghai education commission for Oceanic fisheries resources exploitation,College of Marine Sciences,Shanghai Fisheries University,Shanghai 201306 China;4.Key Laboratory of Sustainable Exploitation of Oceanic Fisheries Resources (Shanghai Ocean University), Ministry of Education, Shanghai 201306 China)
Lots of pelagic fishery data had been accumulated by fishing production and ocean surveys during the passed 30 years development of pelagic fisheries of our country.It could be predicted that with time going on and science and technology (such as RS,GIS and other technologies) applying in pelagic fisheries,there would be a flood of data.It is the key point that how to effectively manage these vast quantities of pelagic fishery data in this paper.The data of three economic fish species (tuna,mackerel and squid) had been analyzed,which included production,research,geography,and other related data.Survey database of pelagic fishery had been designed based on the SQL Server 2000 and spatial database had been designed based on Geodatebase.Efficient management of huge amount of data was implemented by this form of database.Simultaneously,a G-tree index for this database of pelagic fishery was established to query data quickly and efficiently.
Pelagic fisheries,Design of database,Spatial index,Fishery management
王軍,助理工程師,碩士,研究方向為海洋綜合管理、魚類行為學,電子信箱:kingjun_2011@163.com
F592.7;X321
A
1005-9857(2016)01-0098-05