袁紅春,王敏,劉慧,陳冠奇









摘要:長鰭金槍魚是南太平洋漁業生產中主要的捕撈對象,準確預測其漁場分布對提高漁業捕撈效率具有重要意義。針對傳統漁場預測方法預測精度低的問題,本研究提出一種基于特征交互與卷積網絡的漁場預測模型——CNN-Cross。該模型引入Embedding層對數據進行處理,解決了One-Hot Encoding(獨熱編碼)帶來的特征稀疏性問題以及手動特征工程對結果的影響。同時,引入Cross網絡提取特征之間的交互信息,消除了單特征對目標擬合不足的問題,并且結合CNN網絡對Embedding層生成的二維特征圖進行高階隱藏信息提取,最后將兩部分網絡提取到的特征融合,輸出分類結果。使用漁業數據對模型預測效果進行驗證,結果表明,模型預測南太平洋漁場總召回率達到87.4%,中心漁場召回率達到89.4%。表明,將特征交互網絡與卷積神經網絡相結合可以明顯提高漁場預報精度,且精度能夠較好地滿足現實漁業作業需求。
關鍵詞:長鰭金槍魚;Cross網絡;卷積神經網絡;特征交互
中圖分類號:S931.41文獻標識碼:A文章編號:1000-4440(2021)06-1501-09
Fishing ground prediction model based on feature interaction and convolutional network
YUAN Hong-chun 1,2,WANG Min 1,LIU Hui 1,CHEN Guan-qi 1
(1.College of Information Technology, Shanghai Ocean University, Shanghai 201306,China;2.Key Laboratory of Fisheries Information,Ministry of Agriculture and Rural Affairs,Shanghai 201306,China)
Abstract:Thunnus alalunga is the main fishing target of fishery production in the South Pacific Ocean. It is of great significance to accurately predict the fishery distribution of T. alalunga for improving fishery efficiency. In view of lack of accuracy of traditional fishery prediction methods, this paper proposed a fishery prediction model based on feature interaction and convolutional network—CNN-Cross. In this model, the Embedding layer was introduced to process the data, which solved the problem of feature sparsity caused by One-Hot Encoding and the influence of manual feature engineering on the result. At the same time, the Cross network was introduced to extract interactive information between different features to eliminate the problem of insufficient target fitting by single feature, and the two-dimensional feature map generated by the Embedding layer was extracted with the CNN network for high-order hidden information extraction. Finally, the features extracted by two networks were fused and the classification results were output. The effect of the model was verified by fishery data. The results showed that the predicted total recall rate of the South Pacific fishery reached 87.4%, and that of the central fishing ground reached 89.4%. The research results show that the combination of feature interaction network and convolutional neural network can obviously improve the accuracy of fishery forecast, and the accuracy can better meet the needs of practical fishery operations.
Key words:Thunnus alalunga;Cross network; convolutional neural network;feature interaction
長鰭金槍魚作為一種大洋性中上層高度洄游生物,具有較高的經濟價值、營養價值[1]。長鰭金槍魚廣泛分布于各熱帶海域與溫帶海域[2],尤以南太平洋海域分布較廣。近年來,長鰭金槍魚已成為南太平洋金槍魚延繩釣的主要捕撈對象之一[3-5]。因此,準確預測南太平洋長鰭金槍魚漁場,對于降低漁業作業成本、提高尋找漁場效率具有極大的意義。
目前國內外學者仍然使用傳統的方法與模型對漁場進行預測,并沒有對漁場預測與深度學習結合進行進一步探究。如Zainuddin等[6]分別利用廣義加性模型(GAM)和廣義線性模型(GLM)對長鰭金槍魚漁場進行回歸預測。崔雪森等[7]利用樸素貝葉斯建立漁場預報模型對西北太平洋柔魚漁場進行預測,對高產區預報精度達到69.9%。張孝民等[8]利用MAXNET模型預測西北太平洋秋刀魚潛在漁場。宋利明等[9]采用SVM研究了水中環境因子與長鰭金槍魚漁獲關系,建立了金槍魚棲息環境綜合指數模型。但由于海洋數據存在數據維度高、環境數據復雜等情況,目前傳統方法無法很好地擬合復雜數據,對特征信息提取不夠充分,且在數據預處理過程中,人為因素也會對最后的預測準確度造成影響,存在預測精度較低的問題,導致預測結果對漁業作業的指導具有局限性。
現有的特征選擇方法都忽略了特征之間的交互作用。某一特征可能與目標沒有直接關聯,如果將該特征與其他特征結合,就可能與目標密切相關[10]。目前特征交互在廣告點擊率預測領域已有較多的研究。如Guo等[11]提出DeepFM模型可以對特征進行二階交互,解決了特征稀疏情況下的特征組合問題,成功提高了廣告點擊率預測精度。Cheng等[12]提出wide & deep模型,該模型使用wide部分提取特征交互信息,并與DNN相結合,明顯提高了google play應用的獲取率。由于海洋數據與廣告數據都具有高維稀疏特性,故本研究將特征交互技術應用于漁場預測領域,從而進一步提高漁場預測精度。
隨著漁業捕撈技術的提高與科技的發展,漁業數據規模也變得越來越大。傳統方法對于大規模數據擬合效果欠佳,而深度學習可以挖掘出復雜動態場景中重要的語義特征,可以擬合高維復雜數據。CNN作為深度學習領域的代表,已在圖像識別、語音識別等方面取得巨大成功。CNN網絡從圖像中提取局部有效特征,可以有效提高模型的泛化性。因此,本研究將特征交互技術與CNN相結合,提出了一種全新的漁場預測模型——CNN-Cross網絡。模型采用Cross網絡部分提取顯式低階交互特征,采用CNN部分提取隱藏高階特征,然后對兩部分網絡的輸出結果進行融合,最后通過sigmoid函數輸出分類結果。
1材料與方法
1.1數據來源
本研究選取南太平洋110°E~135°W、5°S~40°S為研究區域,采用2000-2015年共16年數據進行試驗。
其中,漁業作業數據來自于中西太平洋漁業委員會(Western and Central Pacific Fisheries Commission, WCPFC)的南太平洋延繩釣數據。該數據包括空間坐標位置、漁業作業時間、平均釣鉤數以及平均漁獲量(質量和尾數)。本研究對該數據以月為時間單位進行統計,并將產量按5°×5°空間范圍進行歸并。部分漁業作業數據如表1所示。
環境因子選取海面高度(SSH)、海表溫度(SST)和葉綠素a濃度(Chla),3種環境因子數據均來自美國國家海洋和大氣管理局(Nation Oceanic and Atmospheric Administration, NOAA),并且3種環境因子數據以月為時間分辨率,空間分辨率為1°×1°網格。由于漁業作業數據與環境因子數據空間分辨率不匹配,所以需要將環境因子數據取在漁區網格中心點上,歸并為5°×5°空間分辨率,消除量綱。部分數據如表2所示。
1.2數據預處理
1.2.1單位捕撈努力量漁獲量(CPUE)在漁業生產當中,通常使用單位捕撈努力量漁獲量(CPUE)作為評估漁業資源密度的指標[13]。CPUE通過公式(1)計算:
CPUE(m,n)=F(m,n)H(m,n)(1)
其中,CPUE(m,n)代表經緯度為(m,n)漁區范圍內的月平均CPUE,F(m,n)和H(m,n)分別代表該月該漁區漁獲尾數和某月該漁區總千鉤數。
1.2.2漁場等級劃分為了適應模型的需要并使漁場等級劃分更加合理,本研究采用陳雪忠等[14]的漁場等級劃分方式,計算了各月各個漁區的CPUE三分位數,并將大于上三分位數的漁區劃分為中心漁場(分類標簽用1表示),小于上三分位數的漁區劃分為非中心漁場(分類標簽用0表示)。試驗使用了2000-2015年共16年南太平洋長鰭金槍魚作業數據,把漁區按5°×5°空間分辨率進行劃分,最終得到10 603個樣本,其中,中心漁場數為3 584個,非中心漁場數為7 019個。
1.2.3分類標準的定義由于本試驗是二分類問題,而Sigmoid函數輸出(y)在0~1,優化會相對穩定方便,所以將Sigmoid函數作為最后輸出層的激活函數,結果會更加合理。在樣本分布均勻的試驗中,定義當y>0.5時,為正樣本(在本研究中為中心漁場)。但在本研究中,由于樣本分布不均勻,其中訓練集中中心漁場數為2 669個,非中心漁場數為5 182個,故分類閾值應按照公式(2)劃分:
y1-y=TF(2)
其中,T和F代表中心漁場與非中心漁場個數。故按照上式,最終的分類閾值為0.339。
1.2.4數據歸一化處理由于不同數據的單位、數量級以及量綱不同,故需要將月份、經緯度、海面高度、海表溫度和葉綠素a濃度歸一化到0~1。計算公式如公式(3)所示:
x*=xi-xminxmax-xmin(3)
其中,x*表示某一樣本歸一化后的值,xi表示該樣本初始值,xmax、xmin分別表示樣本中某一類特征值中的最大值和最小值。
1.3模型結構
本研究模型分為4部分,分別為Embedding層、Cross網絡、CNN網絡和輸出部分。首先Embedding層對one-hot編碼后的時空因子數據進行重新空間映射,然后CNN網絡對Embedding層生成的二維特征圖進行高階隱藏信息提取,同時將Embedding層生成的數據展平后與環境因子數據結合共同作為Cross網絡的輸入,在Cross網絡部分提取所有特征之間的顯式交叉信息。最后,在輸出部分將CNN網絡與Cross網絡提取到的特征進行融合,并通過Sigmoid激活函數輸出預測結果。
1.3.1Embedding層在回歸、分類等機器學習任務中,特征值之間的距離以及相似度計算的準確性對于模型的性能有顯著的影響,大部分算法計算距離和相似度都是基于歐氏空間。然而離散特征無法映射到歐氏空間導致無法計算距離和相似度,因此,對于離散特征需要進行One-Hot處理。使用One-Hot編碼,可以使非偏序關系的變量取值不具有偏向性,而且到原點的距離是等距的,能夠讓特征之間的距離計算更加合理,但數據在One-Hot編碼后會變得非常稀疏,不利于模型對相關信息的提取。針對One-Hot編碼帶來的稀疏問題,本研究使用Embedding技術來解決。
Embedding在數學上可以看作一種空間映射。該映射是單射,且映射前后結構不變,即函數f被稱為單射函數時,對每一個y至多存在一個定義域內的x使得f(x)=y。對應到Embedding就是尋找一個單射函數,將原始數據特征生成新的空間表示。
Embedding向量是動態生成的,無需繁瑣的手動特征工程, Embedding向量會隨機初始化得到一組隨機向量,接著該向量會像其他權重參數一樣隨著網絡訓練最終確定,即Embedding向量會隨著網絡的訓練得到優化。本研究學習的是一個4維的Embedding向量,最終每一項都會映射到4維空間中的一個點,這樣相似項就會在該空間內彼此鄰近。Embedding向量計算公式如式(4)所示:
xembed,i=Wembed,ixi(4)
其中,xembed,i是生成的嵌入向量,xi是離散特征(時空因子)生成的One-Hot編碼,Wembed,i∈ 瘙 綆 ne×nv是對應的嵌入矩陣,該矩陣將會與其他網絡參數一起隨著訓練進行優化。ne是每一個特征中不同類別的個數,nv是嵌入的維度。
引入Embedding層可以避免繁瑣的手動特征工程,而且還可以解決One-Hot編碼帶來的特征稀疏性問題。
1.3.2Cross網絡模塊特征交互又名特征組合,是一種合成新特征的方法,可以在具有多維數據的數據集上很好地擬合非線性特征。由于單一特征不能很好地表達目標信息,所以數據中的各個特征往往需要以不同的維度展現不同的信息,因此,需要對特征進行交叉,獲取特征之間的交互信息,從而更充分地擬合目標。
傳統的特征交叉是由專業人員通過手工進行組合的,這種方法常常存在局限性,并且成本較高,難以應用。因此,許多學者開始研究使用神經網絡模型自動學習交叉特征,彌補傳統特征交叉方法的不足。如Rendle[15]于2010年提出的因子分解機,該算法可以顯式自動組合二階特征交叉,但該算法無法提取更高階的特征交互信息。2017年Wang等[16]提出了DCN網絡,該網絡解決了因子分解機的缺陷,可以對特征進行更深層次的交互,從而可以挖掘到更深層次的信息。
Cross網絡是DCN網絡的一個模塊,該模塊可以以一種顯式、可控且高效的方式,自動構造有限高階顯式交叉特征。Cross網絡由交叉層組成(圖1),其中每層的計算公式見公式(5):
xl+1=x0xTlwl+bl+xl=f(xl,wl,bl)+xl(5)
其中,x0表示初始輸入向量,xl、xl+1為列向量,分別代表第l和第l+1個交叉層的輸出,wl和bl分別代表第l層的權重和偏置值。每次完成特征交叉后,交叉網絡都會將原來的輸入(xl)再輸入,作為下一次交叉網絡的輸入。這里借鑒了殘差網絡的思想,可以提高權重的敏感度,并且使網絡更易于反向傳播,提高訓練效率。
經過試驗驗證,模型設置5層Cross網絡層,可以獲得最好的預測效果,因此本研究設置5層Cross網絡層對經過Embedding層編碼后的時空因子數據和環境因子數據進行特征交叉,提取6種因子之間的特征交互信息。
xl、xl+1:列向量;x0:初始輸入向量;wl:第l層的權重;bl:第l層的偏置值。
1.3.3卷積神經網絡模塊卷積神經網絡由Lecun等[17]提出,主要用于對圖像中的信息進行提取。卷積神經網絡基本結構由輸入層、卷積層、池化層、全連接層以及輸出層組成[18],具有權值共享、局部連接等特點。
傳統的卷積神經通常會采用卷積層與池化層交替使用的結構,池化層用于選擇特征和減少特征數量,以達到減少參數量的目的,但池化操作后可能會存在信息丟失的問題。卷積層通過卷積核在特征圖上進行滑動操作,提取一個局部區域的特征,不同的卷積核相當于不同的特征提取器[19]。假設給定1張圖片X∈ 瘙 綆 M×N(M、N為原圖像尺寸)和1個濾波器W∈ 瘙 綆 U×V(U、V為濾波器尺寸),那么此時卷積按公式(6)計算:
yij=∑Uu=1∑Vv=1wuvxi-u+v,j-v+1(6)
其中,wuv表示卷積核矩陣,xi-u+v,j-v+1表示特征圖中與卷積核對應的矩陣,yij表示卷積之后的結果。
二維卷積層的卷積過程如圖2所示:
本模型卷積部分的輸入為Embedding層生成的3×4×1的矩陣,由于矩陣的尺度較小,故CNN部分使用全卷積網絡[20]結構,同時對特征圖邊緣使用0填充,以便能更加充分提取到特征圖的邊緣信息。經過多次試驗,卷積層設置為3層,卷積核數目為32,卷積核大小為2×2,步長為1,可以更好地適應本研究模型的需求。
1.3.4模型總體結構本研究模型的總體結構如圖3所示。其中,在數據處理部分,將原始時空因子數據進行one-hot編碼后輸入到Embedding層,經Embedding層動態生成3×4×1矩陣。在Cross網絡部分,將Embedding層的輸出與環境因子數據結合(即圖3中的x0代表Embedding層輸出展平后與環境因子數據拼接的結果),共同作為Cross網絡的輸入,然后通過5層Cross網絡進行交叉特征信息提取,并在最后輸出一維特征向量。在CNN網絡部分,輸入Embedding層生成的3×4×1矩陣,通過滑動窗口操作提取特征圖的高階隱藏信息,并在最后將二維特征圖展平為一維向量。在輸出部分,將CNN網絡部分與Cross網絡部分提取得到的兩組一維向量進行融合,最后輸入全連接層,通過sigmoid激活函數輸出最后的分類結果。
1.4評價指標
分類任務中通常把準確率(Accuracy)作為衡量分類準確性的評價指標,但在樣本分布不均衡的時候,該評價指標存在明顯缺陷,假設正樣本數占總樣本數的90%,分類器只要全部預測為正,分類器的準確率就可以達到90%,但其實際泛化性能非常低。因此本研究采用召回率(查全率)、準確率(查準率)和F1分數作為綜合漁場等級評估標準。由于漁業實際作業中,主要選擇中心漁場作為作業區域,故本研究將中心漁場看作正樣本,非中心漁場看作負樣本,以更好滿足漁業作業需求。
1.5試驗設計
本研究所使用的工作站顯卡型號為NVIDIA GeForce RTX 2070 Super,中央處理器(CPU)型號為Intel Core i7 10750H,操作系統為Windows 10,并搭建了基于Python 3.6的Tensorflow 2.1.0框架。
試驗數據集為2000-2015年期間南太平洋110°E~135°W、5°S~40°S時空因子、環境因子數據以及漁業作業數據。將2000-2014年的9 860條數據分別按照15%和85%劃分為驗證集和訓練集,同時將2015年的743條數據作為測試集。
公式變量含義同公式(5)。
為了提高整體訓練速度,初始學習率(lr)=0.01,并采用學習率動態調整策略,當循環迭代1 000次后,損失值仍不下降時,按0.96的衰減率調整學習率,動量參數(momentum)=0.9。并設置batch_size=32,epochs=150。
本研究設置了3組對比試驗,第一組試驗研究模型中各組成部分對模型精度的影響與作用;第二組試驗驗證引入Embedding層對模型精度的影響;第三組試驗與現有主流漁場預報模型進行對比,驗證本研究模型的合理性與有效性。本研究統一采用方法1.4的評價指標對試驗結果進行評估,其中中心漁場召回率和總召回率為主要參考指標。
2結果與分析
2.1模型各模塊組成對比分析
本研究對模型組成部分合理性進行驗證,通過模型自身結構對比試驗可以驗證本研究模型各部分構成的合理性和有效性。其中CNN模型通過Embedding層對數據進行處理,輸入到CNN網絡中進行試驗,Cross網絡也使用Embedding層對數據進行處理,輸入到Cross網絡中進行試驗。
分析表3可知,使用CNN網絡對漁場進行預測,中心漁場召回率最低,這是因為僅通過CNN網絡對特征進行提取,并不能有效提取到特征之間的交互信息,所以最后的預測結果并不理想。而使用Cross網絡對漁場進行預測時,雖然中心漁場召回率高于CNN網絡,但在總召回率上偏低,這是因為該網絡加強了特征交互信息的提取,但忽略了對高階隱藏信息進行提取,對數據擬合不夠充分。因此本研究將兩部分網絡進行組合,既能有效獲得特征交互信息,又能提取到高階隱藏信息,分析表4得出,本研究模型相較于單一使用某一部分網絡,在所有評價指標上均有較大幅度的提升,驗證了本研究模型的合理性與有效性。
2.2Embedding層對模型精度的影響
本小節共設置了2組試驗,以驗證引入Embedding層對模型產生的影響。一組為BP神經網絡模型,另一組為本研究模型的Cross網絡模塊。通過設置2組對比試驗,可以消除試驗中可能存在的偶然性,從而保證試驗的真實有效。在2組試驗中分別使用Embedding層和不使用Embedding層驗證其對模型精度的影響。試驗結果如表4所示。
分析表4可知,無論是BP神經網絡模型,還是Cross網絡模型,通過使用Embedding層對輸入的時空因子特征進行處理,相較于將原始特征作為網絡的輸入,在評價指標上都有不同程度的提高。通過對時空因子特征進行Embedding處理,相較于將原始時空因子特征作為網絡的輸入,試驗結果在各項評價指標上都有不同程度的提高。這是因為Embedding層對時空因子特征進行了重新的空間映射,將在歐氏空間中距離相近的特征信息聚集在一起,消除了one-hot編碼的稀疏性問題,同時又避免了手動特征工程對結果的影響,后續特征提取將會更加充分,提取的特征信息也將更具代表性。
2.3本研究模型與現有模型對比分析
為了驗證本研究模型的優勢,我們選擇了3種主流的漁場預測模型進行對比,分別為BP神經網絡模型、SVM機器學習模型以及F-CAN深度學習模型。其中,BP神經網絡模型采用6-512-1網絡結構,SVM模型采用文獻[21]中的模型參數,即采用徑向基函數(RBF)為核函數,F-ACN模型[22]采用one-hot編碼方式對數據進行處理,并使用全卷積網絡結構。
如表5所示,BP神經網絡模型中心漁場召回率為72.2%,總召回率為75.7%,該模型在漁場預測中的精度最低。這是因為BP神經網絡模型結構簡單,可訓練參數量較少,因此對于大規模數據的擬合能力十分有限。
SVM模型中心漁場召回率為83.0%,總召回率為80.6%,相較于BP神經網絡模型有提升,但預測精度仍然較低。SVM模型針對小樣本具有較好的擬合能力,具有較強的泛化能力,但是面對大規模復雜海洋數據,SVM模型的效率會下降很多,而且SVM核函數對于高維數據的映射解釋力不強,尤其是徑向基函數。因此采用SVM模型進行漁場預測的精度并不理想。
F-ACN模型使用了深度學習模型——全卷積網絡,因此中心漁場召回率達到84.0%,說明深度學習對大規模非線性復雜數據的擬合能力較強。但是,該模型使用one-hot編碼對數據進行預處理,因此數據會變得非常稀疏,不利于特征的提取,從而使得總召回率為78.3%,預測精度偏低。
本研究模型(CNN-Cross)在各個評價指標上相較于上述模型都有很大程度的提高。中心漁場召回率為89.4%,總召回率為87.4%,相較于F-ACN模型分別提高了5.4個和9.1個百分點。在真實的漁業捕撈作業中,漁獲量和捕撈效率與漁場的等級密切相關,通常漁業作業會選擇中心漁場,最大程度地提高漁獲量。而本研究模型中心漁場召回率達到了89.4%,遠遠高于現有模型,這對于縮短尋找漁場時間、節省作業成本可以起到很大的作用,可以較好滿足真實漁業作業的需求。
3討論
本研究針對傳統漁場預測模型預測精度低、難以擬合海洋大數據的問題,提出了一種基于特征交互與卷積網絡的漁場預測模型——CNN-Cross,該模型引入Embedding層,避免了手動特征工程以及解決了one-hot編碼帶來的特征稀疏性問題。Cross網絡通過線性時間復雜度提取特征之間的交互信息,消除了單一特征對目標值表達不足的問題。同時通過CNN網絡對高階隱藏信息進行提取,提高了模型對復雜數據的擬合能力,提高了模型的泛化性和魯棒性。研究結果顯示,CNN-Cross模型的南太平洋長鰭金槍魚漁場中心召回率達到89.4%,總召回率達到87.4%,相較于現有的主流漁場預測模型預報精度有較大的提升,且預測精度可以較好地滿足現有漁業作業的需求,可以為南太平洋長鰭金槍魚漁業捕撈作業提供有效的指導。
CNN-Cross模型是一種“黑盒模型”,原理和實現較為簡單,通用性較強,對漁業數據不需要過多手動特征工程,僅需對數據進行簡單的one-hot編碼即可輸入到模型中進行訓練,所以應用于其他漁場也不會對模型泛化性產生較大影響。但CNN-Cross模型僅使用了3種易于獲取的環境因子數據對長鰭金槍魚漁場進行預報,而長鰭金槍魚是一種高度洄游性生物,其漁場分布必然會受到許多環境因子的影響,而且漁場分布也必然會與時間和空間有緊密的聯系,所以在下一步工作中需要收集更多環境因子數據,同時考慮漁場的時間序列因素和空間相關性,從而進一步提高模型的精度和泛化性。
參考文獻:
[1]范永超,陳新軍,汪金濤. 基于多因子棲息地指數模型的南太平洋長鰭金槍魚漁場預報[J].海洋湖沼通報,2015(2):36-44.
[2]郭剛剛,張勝茂,樊偉,等. 基于表層及溫躍層環境變量的南太平洋長鰭金槍魚棲息地適應性指數模型比較[J].海洋學報,2016,38(10):44-51.
[3]王德芬,王玉堂,楊子江,等. 我國漁業多功能性的研究與思考[J].中國水產, 2012(1):15-17.
[4]苗振清,黃錫昌. 遠洋金槍魚漁業[M].上海:上海科學技術文獻出版社,2003.
[5]BRIAND K, MOLONY B, LEHODEY P. A study on the variability of albacore (Thunnus alalunga) longline catch rates in the southwest Pacific Ocean[J]. Fisheries Oceanography, 2011, 20(6): 517-529.
[6]ZAINUDDIN M, SAITOH K, SAITOH S E I I. Albacore (Thunnus alalunga) fishing ground in relation to oceanographic conditions in the western North Pacific Ocean using remotely sensed satellite data[J]. Fisheries Oceanography, 2008, 17(2): 61-73.
[7]崔雪森,唐峰華,張衡,等. 基于樸素貝葉斯的西北太平洋柔魚漁場預報模型的建立[J].中國海洋大學學報(自然科學版),2015,45(2):37-43.
[8]張孝民,石永闖,李凡,等. 基于MAXENT模型預測西北太平洋秋刀魚潛在漁場[J].上海海洋大學學報,2020,29(2):280-286.
[9]宋利明,周建坤,沈智賓,等. 基于支持向量機的庫克群島海域長鰭金槍魚棲息環境綜合指數[J].海洋通報,2017,36(2):195-208.
[10]ZHOU P, LI P, ZHAO S, et al. Feature interaction for streaming feature selection[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020,10:1-12.
[11]GUO H F, TANG R M, YE Y M, et al. DeepFM: a factorization-machine based neural network for CTR prediction[C]//SIERRA C. Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence. Melbourne: International Joint Conferences on Artificial Intelligence, 2017: 1725-1731.
[12]CHENG H T, KOC L, HARMSEN J, et al. Wide & deep learning for recommender systems[C]//KARATZOGLOU A, HIDASI B, TIKK D, et al. Proceedings of the 1st workshop on deep learning for recommender systems. New York: Association for Computing Machinery, 2016: 7-10.
[13]周為峰,黎安舟,紀世建, 等. 基于貝葉斯分類器的南海黃鰭金槍魚漁場預報模型[J]. 海洋湖沼通報,2018(1):116-122.
[14]陳雪忠,樊偉,崔雪森,等. 基于隨機森林的印度洋長鰭金槍魚漁場預報[J].海洋學報(中文版),2013,35(1):158-164.
[15]RENDLE S. Factorization machines[C]//HINCHEY M, BERGMAN L A, WANG W P, et al. 2010 IEEE International Conference on Data Mining. Los Alamitos: IEEE Computer Society, 2010: 995-1000.
[16]WANG R, FU B, FU G, et al. Deep & cross network for ad click predictions[C]//ACM Special Interest Group on Knowledge Discovery in Data. Proceedings of the ADKDD′17. New York: Association for Computing Machinery, 2017: 1-7.
[17]LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[18]周飛燕,金林鵬,董軍. 卷積神經網絡研究綜述[J].計算機學報,2017,40(6):1229-1251.
[19]邱錫鵬. 神經網絡與深度學習[M]. 北京:機械工業出版社,2019:110-115.
[20]AYZEL G, HEISTERMANN M, SOROKIN A, et al. All convolutional neural networks for radar-based precipitation nowcasting[J]. Procedia Computer Science, 2019, 150: 186-192.
[21]崔雪森,唐峰華,周為峰,等. 基于支持向量機的西北太平洋柔魚漁場預報模型構建[J].南方水產科學,2016,12(5):1-7.
[22]袁紅春,陳冠奇,張天蛟,等. 基于全卷積網絡的南太平洋長鰭金槍魚漁場預報模型[J].江蘇農業學報,2020,36(2):423-429.
(責任編輯:陳海霞)
收稿日期:2021-04-08
基金項目:國家自然科學基金項目(41776142);國家重點研發計劃項目(2018YFD0701003)
作者簡介:袁紅春(1971-),男,江蘇海門人,博士,教授,主要從事專家系統、智能計算、智能信息處理等研究。(E-mail)hcyuan@shou.edu.cn