朱文斌, 劉文博, 戴 乾, 盧占暉, 王 晶
(1. 浙江海洋大學海洋與漁業研究所, 浙江 舟山 316021; 2. 浙江省海洋水產研究所,浙江省海洋漁業資源可持續利用技術研究重點實驗室, 農業農村部重點漁場漁業資源科學觀測實驗站, 浙江 舟山 316021; 3. 浙江海洋大學水產學院, 浙江 舟山 316021)
漁業捕撈生產監測數據和漁業科學調查數據是漁業資源評估與管理的兩類基礎數據,其中生產監測數據伴隨著漁業生產活動產生,是獲得捕撈量、捕撈能力、最大日捕撈量等信息的關鍵來源,其數據的真實性與準確性至關重要。針對漁業生產活動開展全面調查,如強制使用捕撈日志,可對每艘漁船每次捕撈的產量進行統計,可以得到全面的監測數據,然而這種方式耗費大量人力物力,實際操作可行性低,尤其是在近海漁業生產中,捕撈類型多樣,小規模漁船多,即使開展全面調查統計,其數據真實性與可靠性也有待商榷[1]。在成本有限的情況下,抽樣調查為獲取相對真實有效的生產數據提供了可能。
進行捕撈生產的漁船類型多樣、功率組成復雜,為了得到更好的調查樣本,通常采用分層隨機抽樣調查方案[2-7]。分層隨機抽樣是按照規定的性質將總體劃分為多個異質層,層內同質性較高,在每層中進行隨機取樣。分層隨機抽樣具有樣本代表性好、所需樣本數較少、抽樣誤差小等優點[8],目前關于漁業生產抽樣調查的研究,大都傾向于采用分層隨機抽樣方法,如王繼隆[3]等比較了分層隨機抽樣與簡單隨機抽樣的誤差,表明分層隨機抽樣誤差小、精度高,袁興偉等[4]通過漁業信息數據進行漁獲量統計,提出可利用分層隨機抽樣方法為中國漁業數據校正提供參考。在漁業生產監測中存在較多因素影響了分層抽隨機樣的準確性,如漁船作業類型、漁船功率、漁船作業時間等。因此,優化分層抽樣方法對于提高漁業生產監測數據質量至關重要。當前研究者主要從分層方案的設定[9-15]和樣本量的分配角度[16-19]來提高數據精度。如甘喜萍等[5]比較了面積比例分配、最優分配和奈曼分配3種樣本分配方案,提出最優分配法可以滿足抽樣誤差要求,同時還能降低調查過程中的經濟成本。Cao等[20]基于不同分層方案評估了緬因灣龍蝦豐度指數,表明分層方案設計對調查采樣精度有明顯的影響,合理的分層方案可有效提高調查精度。
為推動中國海洋捕撈統計調查方法的改革,探索漁業生產監測調查采樣方法在我國海洋捕撈統計中的可行性,2017年農業部在浙江省開展了海洋捕撈生產調查采樣試點工作。本文根據浙江省海洋捕撈漁船的生產數據,基于分層隨機抽樣方法,采用計算機模擬再抽樣過程,對海洋漁業捕撈生產監測抽樣進行優化,以期進一步改進調查采樣方法,降低監測成本,兼顧數據質量,以求更為客觀、真實地反映海洋捕撈生產情況。
數據來源于2017年1—12月浙江省10個重點海洋漁業縣市,262艘(對)樣本船的漁業生產監測數據,涉及刺網、單拖、雙拖、桁桿拖蝦、圍網、張網、釣具、籠壺和其它9種作業方式,共獲取樣本船信息3 144條。各作業方式從5月1日起執行3.0~4.5個月的伏季休漁,釣具不休漁(見表1)。其中,釣具和籠壺漁船數量少,一并歸入其它作業方式(見表2)。

表1 2017年浙江省漁業監測捕撈漁船各作業類型的休漁期Table 1 Fishing moratoriums of sampling vessels for fishery monitoring in Zhejiang Province in 2017

表2 2017年浙江省漁業監測捕撈信息漁船類型及數量構成Table 2 Type and quantity composition of sampling vessels for Zhejiang fisheries monitoring and fishing information in 2017
本研究選取海洋捕撈生產過程中的主要經濟種類作為研究目標物種,包括鯧魚(Pampus)、帶魚(Trichiuruslepturus)、海鰻(Muraenesoxcinereus)、藍點馬鮫(Scomberomorusniphonius)、中國毛蝦(Aceteschinensis)、棘頭梅童魚(Collichthyslucidus)、三疣梭子蟹(Portunustrituberculatus)、鮐鲹類(Mackerel and Scad fish)、小黃魚(Larimichthyspolyactis)共9個目標物種。上述物種除在伏季休漁期外各月份均有捕獲,且占所選監測船總產量的59.56%、占經濟物種總產量的77.46%。其中,帶魚和小黃魚屬于東海區傳統的四大重要經濟物種(大黃魚、曼氏無針烏賊產量較低)。以各目標物種單位漁船每月的捕撈產量以及總產量作為估計目標,未對每一月份調查漁船數量進行優化(5—7月的伏季休漁期除外)。
本研究假設當前漁業捕撈生產監測漁船信息能夠反映目前浙江省海洋捕撈生產情況,研究中將每一月份單位漁船各單一目標物種的總捕撈產量以及所有目標物種的總產量作為模擬抽樣的對照“真值”。以漁船作業方式作為劃分依據將漁船劃分為7個層,以各層信息漁船的構成比例作為重抽樣過程中樣本數量的基本分配準則。采用計算機模擬,進行不同漁船數量下的分層隨機抽樣。本研究中,漁船數量梯度設置為30~260,間隔為10。本研究中,基于四舍五入原則對各層漁船數量進行取整,同時為保證各層數據具有統計學意義,各層漁船數量少于3時設置為3;為避免取整原則對模擬再抽樣過程參數估算的影響,以原監測漁船各類型的數量構成比例作為計算估計值的權重依據。
本研究基于分層隨機采樣方法,“真值”與模擬調查估計值的計算公式如下:
(1)
(2)
(3)
式中:X為各研究目標的估計值,也即各月份中目標物種單位漁船產量以及總產量;N為漁船類型數量,本文中為7;Xn為第n個漁船類型的單位漁船捕撈產量;Wn為第n個漁船作業類型的權重,等于第n個漁船作業類型的漁船數量Mn與本次模擬研究的總漁船數量M的比值;xi為第i次模擬再抽樣過程中根據再抽樣數據計算的各研究目標的“模擬估計值”。
本文選擇相對估計誤差(Relative estimation error, REE)來評估模擬估計值的精度和準確度[21]:
(4)
選擇相對估計偏差(Relative bias, RB)來評價模擬估計值與真值的偏離情況[21]:
(5)
式中:Xtrue為根據原始數據計算的各研究目標的“真值”;Xi為第i次模擬再抽樣過程中根據再抽樣數據計算的各研究目標的“模擬估計值”;R為模擬次數,本文設為1 000次。根據計算公式可以得出:REE值越大,精度與準確度越低;RB的絕對值越大,“模擬估計值”與“真值”的偏離程度越大。

圖1 監測漁船樣本量優化流程圖
在各月份的模擬調查研究中,各目標物種產量及總產量估計值的REE值變化范圍差異較大(見圖2),各目標物種捕撈產量估計值的REE值均隨漁船數量增加呈下降趨勢,且漁船數量越多時下降趨勢越緩(見圖2)。總漁獲產量估計值的REE值在每個調查月均是最低,不超過50%;除3月外,小黃魚產量估計值的REE值在每個月均最高,帶魚產量估計值的REE值介于中間(見圖2)。

圖2 目標物種捕撈產量及總產量估計值的REE值隨監測漁船數量的變化
通過方差分析得出隨著樣本船數量的增加,各目標物種產量及總產量估計值的REE值顯著減少。以1月的帶魚、小黃魚及總產量為例,其方差分析的結果如表3所示。

表3 帶魚、小黃魚和總產量的相對估計誤差在不同樣本量下均值表現Table 3 Average performance of relative estimation error of Trichiurus lepturus, Larimichthys polyactis and total under different sample sizes
各研究目標估計值的RB值均在0上下波動(見圖3),這表明模擬調查采樣得到的各研究目標物種的產量以及總產量的估計值結果均為無偏估計。且隨著調查漁船數量的增加,RB的絕對值越來越小。

圖3 目標物種捕撈產量及總產量估計值的RB值隨漁船數量的變化
為探究隨著監測漁船數量的增加調查精度提高的效率,以10艘(對)為間隔,分析REE值降低情況。隨著漁船數量的增加,REE值不斷下降,其下降幅度不斷變小。可以看出,漁船數量增加至70時,每增加10艘(對)漁船,各月份中每一目標的估計值的REE值下降量也即估計值精度的提高均不超過5%;當監測漁船數量大于110時,每增加10艘漁船提高的REE差值的精度均不超過1%(見圖4,小黃魚除外)。這表明隨著監測漁船數量的增加,調查精度趨于穩定。

(圖中紅色線為5%精度線, 黑色線為1%精度線。In the figure, the red line is the 5% accuracy line and the black line is the 1% accuracy line.)
本文通過計算機模擬對浙江省漁業監測漁船的數量進行優化,綜合單物種產量及總產量的估計值優化結果,可將監測漁船數量從262艘優化至110艘,在兼顧了相對穩定的調查精度與準確度條件下,監測漁船數優化了58.11%,這可大幅度節約調查成本。抽樣調查優化研究在漁業資源科學調查中應用廣泛且效果顯著,如孟新翔等[22]、潘邵媛等[23]、吳楨等[24]、戴黎斌等[25]、Zhang等[26]均在保證調查數據精度滿足需求的前提下,優化漁業資源調查方案,有效地減少調查成本的投入,實現了調查效益最大化。在漁業生產監測調查優化研究中,馬亞宸等[27]通過計算機模擬技術優化了山東省海洋捕撈生產監測信息船數,優化過程中對全年數據進行了分析,按照全年數據分析可以得到較為宏觀的結果,但是由于不同作業方式在不同季節的產量有差異,進行全年數據分析產生的誤差會影響優化結果。因此,本文按照9個月的數據進行分析,降低了時間變化對優化結果的影響。分層抽樣中在考慮各層樣本量分配問題時要兼顧抽樣成本和抽樣精度,目前有三種層樣本量分配方法:比例分配法、最優分配法和內曼最優分配法,其中最優分配法和內曼最優分配法雖然在成本和精度上有優勢[28],但在實際操作中較難滿足各種因素;比例分配法在多階段的抽樣調查中精度會有所降低,但因其抽樣形式較為簡單,其仍具有普遍適用性與實用性[29]。
在本研究中,綜合考慮計算方便及經濟成本,選擇5%和1%的精度線作為每減少10艘(對)監測漁船調查精度下降的臨界值。如以5%作為臨界值,監測漁船數量可優化為70;以1%作為臨界值則可優化至110。該結論可為其他省份,或全國開展海洋捕撈抽樣調查的優化研究提供參考根據不同的精度要求及不同的經費支撐選擇不同的臨界標準。
本研究中不同月份以及不同研究目標間同一模擬調查估計值的REE值有不同的表現。如以帶魚及小黃魚產量為優化目標,綜合各月份REE值的變化情況,監測漁船為110時即可獲取穩定的精度,而以總產量為優化目標時,漁船數量為90時REE即可達到穩定趨勢。針對原始數據變異程度不同的調查目標,優化結果存在較大的差異,原始數據變異程度較低,使用較少的監測漁船即可獲得相對高精度的估計;反之對于分布變異較高的物種,應提高監測漁船數才可獲得相對高精度的估計。這表明在抽樣調查項目開展之初需要明確所調查的物種,這樣才能在不影響調查數據精度的同時有效節約調查成本。
原始數據的真實可靠性對優化結果有較大影響。本文數據是根據FAO分層等距抽樣的方法按浙江省所有海洋捕撈漁船的1.5%進行抽取,研究的基礎假設是原始監測漁船數據可以代表整個研究海區的漁船生產情況,以及各個不同類型的漁船數量分配比例也符合實際情況。本文基于以上假設僅從漁船類別角度對監測漁船數量進行優化,尚存在一些不足,如捕撈作業的空間分布是非常重要的信息,但由于本次抽樣調查的設計原因,未收集生產空間信息,后續需要在抽樣調查設計的過程中重點考慮,進一步提高漁業生產監測數據的準確性。
本研究通過分析目標魚種的REE和RB與監測漁船數的關系,將2017年浙江省監測漁船調查數從262艘優化至110艘,在保證調查精度的情況下有效節約了調查成本,可作為最優的漁船監測數量設計方案。本研究方法的操作性強,可為其他省份或全國開展海洋捕撈抽樣調查的優化研究提供參考,同時對改進海洋捕撈生產統計、掌握漁業資源動態變化及實施限額捕撈管理具有重要意義。