作者簡介:張耀洪(1996-),男,安徽阜陽人,碩士研究生,主要研究方向為粒計算、三支決策和計算機視覺;茍光磊(1980-),男(通信作者),重慶人,副教授,碩導,博士,主要研究方向為模式識別與人工智能(ggl@cqut.edu.cn);呂艷娜(1998-),女,河南洛陽人,碩士研究生,主要研究方向為粒計算、三支決策和計算機視覺;楊雨(1995-),男,重慶人,碩士,主要研究方向為深度學習和計算機視覺.
摘 要:基于序貫三支決策的圖像識別方法僅考慮測試樣本與支持向量機(SVM)分離超平面的符號距離,忽略了已有粒度層的信息,圖像識別性能有待提高。提出一種新的置信度評價(dual confidence score and ensembling,DCE),將符號距離結合測試樣本與特征空間中每一類訓練樣本中心的距離作為基本置信度,用于序貫三支決策時,將較粗粒度層無法識別圖像的置信度與當前粒度層的置信度合并進行評價,有效地利用已有信息,提高識別準確度,在粒度層較粗時也能進行決策,提升了識別效率。在Caltech-101和Caltech-256數據集上使用兩個經典預訓練模型進行驗證,與現有三支決策圖像識別方法相比,實驗結果表明該方法能有效提升識別的準確度和效率。
關鍵詞:序貫三支決策;圖像識別;相似性度量;支持向量機
中圖分類號:TP391 文獻標志碼:A
文章編號:1001-3695(2023)04-050-1268-07
doi:10.19734/j.issn.1001-3695.2022.06.0387
Abstract:The image recognition method based on sequential three-way decisions only considers the signed distance between the testing samples and the support vector machine (SVM) separating hyperplane,ignoring the information of the existing granular layer,which can further improve the performance of image recognition by this means.This paper proposed a new dual confidence score and ensembling(DCE),which synthesizes signed distance with the distance between the testing samples and the center of each class of training samples in the feature space as the basic confidence score.The current granularity layer integrated with the confidence score of coarse-granularity layer which insufficient to recognized images.DCE improved the accuracy of recognition by the existing information between granularity layers.Meanwhile,DCE enhanced the recognition efficiency as making decisions at the coarser granularity layer.Finally,this paper utilized two classical pre-trained models for experimental verification on Caltech-101 and Caltech-256 datasets.The experimental results show that this approach can effectively improve the recognition accuracy and efficiency.
Key words:sequential three-way decisions;image recognition;similarity measure;support vector machine
0 引言
近年來隨著人工智能的快速普及,越來越多的領域需要用到計算機視覺算法,如電商行業中根據圖片搜索類似的商品、根據人臉識別實現刷臉支付、交通行業中根據圖像自動識別違規的駕駛員、醫療行業中借助圖像實現臨床診斷和病理研究等。在這些場景中,系統的主要任務就是圖像識別。圖像識別[1]是將圖像中的對象劃分到C個類別的其中一個類。在小樣本學習中,目前常見的解決方案為遷移學習和域自適應。遷移學習是在一個非常大的外部數據集(如ImageNet)上預先訓練一個卷積神經網絡(convolutional neural network,CNN)。然而最近的研究表明,增加卷積神經網絡的層數可以得到更高的準確度,但與此同時,也會出現很多問題:除了更容易過擬合、難以訓練收斂以外,網絡層數的增加也會導致神經網絡架構中參數數量顯著增多,無疑提高了推理的代價。雖然隨著深度學習的飛速發展,圖像識別已經取得了驚人的進展,但是推理通常會產生較高的計算代價和較長的處理時間,因此效率仍然是一個關鍵的問題。如自動駕駛汽車較長的推理延遲可能會影響其控制速度的能力從而導致事故的發生。
粒計算是一個信息處理的結構化方法,將有用的信息或知識粒化,以粒為運算對象進行問題的求解或推理。作為粒計算[2]的產物,序貫三支決策(sequential three-way decisions,S3WD)[3,4]具有提高圖像識別性能的潛力,是解決多步動態決策問題的有效方法[5]。借助多層粒度結構[6],將對象描述為L個粒度,并在每個粒度層上劃分為三個集合,即正域、負域和邊界域。從粗粒度到細粒度依次進行三支決策,直至邊界域為空。隨著粒度的細化能獲取更多信息,但同時會產生更多決策代價,序貫三支決策能在序貫分析過程中權衡決策過程代價和決策結果代價,這正是序貫三支決策的優勢所在。
最初的序貫三支決策模型是應用在信息表或者決策表中,利用屬性約簡的方法構建多層粒度特征表示,將信息表中的屬性視為特征。近年來序貫三支決策在圖像識別中的應用逐漸增多。2016年,Li等人[7]提出了基于粒計算的圖像數據集的序貫粒度方法的正式定義,在每個決策過程中尋求最小化錯誤分類代價。2017年,Li等人[8]提出了一種基于深度神經網絡從輸入的人臉圖像中序貫提取分層粒度結構的方法。該方法考慮了不同決策階段的誤分類代價和測試代價,減少深度神經網絡的訓練時間以獲得最優的表示。2019年,文獻[9]利用預訓練的CNN的特征對整個CNN進行推理,基于主成分分析(principal component analysis,PCA)將深度CNN特征中的信息定義為粒,在類別數和訓練樣本較大的情況下,提高了最近鄰分類器在CNN中的圖像識別速度。2020年,Zhang等人[10]采用由堆疊受限玻爾茲曼機(restricted Boltzmann machine,RBM)組成的自編碼器網絡提取多粒度特征,通過序貫的過程平衡了錯誤分類代價和訓練時間代價,尋求最小的總代價。同年,Liang等人[11]在代價敏感的人臉識別框架中引入了序貫三支決策方法,將半監督學習的每次迭代作為決策步驟,訓練得到誤分類代價和測試代價最小的分類器。2021年,Savchenko[12]利用粒計算的思想將卷積神經網絡的不同層作為粒度層,并在每個粒度層上提取特征同時計算分類器的置信度,在每個粒度層上使用三支決策算法,降低圖像識別中CNN推理的時間,權衡圖像識別的準確度和識別推理的時間。
圖像識別的性能不僅依賴于所提取的圖像特征,在圖像的顏色、形狀和紋理等特征被提取出后,圖像識別的關鍵還在于相似性度量,其直接關系到圖像識別的結果和效率。2017年,Snell等人[13]提出了原型網絡,通過使用神經網絡學習的表示空間中每個類的原型之間的距離來分類。Gormez等人[14]為了降低計算的代價,提出了一種基于樣本均值的早期退出技術。該方法不需要對內部分類器進行基于梯度的訓練,從而在計算代價和網絡準確性之間權衡。Lakshminarayanan等人[15]嘗試在神經網絡的不同層進行集成,極大地改進了深度神經網絡上預測不確定性估計的校準。Scardapane等人[16]設計了深度神經網絡,在骨干網絡之外增加了多個輔助分類器并自適應地利用所有內部分類器的輸出。Phuong等人[17]在計算量未知的情況下提出一種通過匹配其輸出概率支持早期退出模型后期更準確地退出的多出口架構的訓練方法。不幸的是,這些方法都沒有設計用于預訓練模型。
由于在網絡的早期層學習到的特征通常足以對許多數據進行分類,基于序貫三支決策的圖像識別方法利用這一結果大大降低了推理時間,這正是基于序貫三支決策的CNN推理的潛力。基于序貫三支決策的圖像識別方法在權衡識別的準確度和推理速度時犧牲了可控的準確度,造成準確度的降低。在多層粒度結構的圖像識別中,相似性度量只考慮到當前粒度層的置信度,忽略了粒度層之間的圖像置信度的傳遞。因此,為了緩解上述問題,提出一種相似性度量方法DCE,用于使用預訓練模型的基于序貫三支決策的圖像識別中。該方法首先通過預訓練模型對圖像提取特征,訓練SVM分類器輸出判別式置信度,引入先驗置信度,作為當前粒度層基本置信度評價。然后集成將粒度層之間的基本置信度集成,作為當前粒度層最終的置信度,有效利用已有信息。
1 預備知識
作為傳統二支決策的擴展,三支決策引入了除接受決策和拒絕決策以外的第三種決策,即延遲決策。在信息不充足不足以作出可靠的決策時,對某些對象作出延遲決策,可以在很大程度上降低直接作出接受或拒絕決策的代價。三支決策為三種決策行為賦予了語義解釋。其中,劃分到正域中的對象作出接受決策,劃分到負域中的對象作出拒絕決策,劃分到邊界域的對象作出延遲決策。這三種決策行為在二元分類任務中得到了很好的解釋。接受決策表示接受第一類,拒絕決策表示拒絕第一類而接受第二類,延遲決策則表示不接受第一類和第二類。將類的概念映射到三支決策理論上,每個第c類分別用成對不相交的正域POS(c)、負域NEG(c)和邊界域BND(c)表示。
2.2 置信度評價
現有的用于序貫三支決策CNN推理的相似性度量方法的不足如下:
a)最近鄰中以距離作為置信度效率較低,對訓練數據的依賴性較高,而且對于較高維度數據的處理效果不是很好。SVM作為置信度評價的分類器只能反映支持向量的樣本到分離超平面的幾何分布,并不能反映輸入圖像到樣本簇之間的距離。如果一張圖像距離超平面很近卻遠離訓練樣本的中心,那么在這種情況下給這張圖像較高的置信度是不合適的,因為其他非支持向量的訓練樣本也應該在相似性度量中發揮作用。
b)現有用于序貫三支決策的置信度評價只考慮到當前粒度層特征之間的相似性,忽略了粒度層之間的置信度的傳遞,造成CNN早期層信息的丟失,浪費了已有信息。因此,現有用于三支決策中圖像識別的相似性度量方法不足以表示相似性。
本文將提出一種用于序貫三支決策在CNN推理中的相似性度量方法,即在SVM背景下基于距離的置信度評價DCE。根據三支決策中處理多分類問題的一對多模型[20],將C類決策過程轉換為C個二分類問題。在分類階段,訓練帶有線性核的SVM作為分類器。SVM是一個二分類的模型,并且在分類問題中的性能表現較好。SVM的基本思想是將實例的特征向量映射為特征空間中的一些點,然后尋找一個超平面能將不同的實例劃分開,同時使得樣本集中的點到分類超平面的最小距離最大化。超平面的線性方程可以表示為
在計算置信度的過程中,為了減少計算先驗置信度而額外增加的計算量,因此考慮使用PCA技術。PCA技術是一種無監督的為了在盡量保證信息量不丟失的情況下通過線性變換將數據映射到低維子空間的降維方法。在式(9)計算每個類別中心的時候,首先使用PCA技術將通過CNN在每個粒度層輸出的特征向量進行降維,其次再計算降維后的類別中心。先驗置信度PScl的計算為降維后的測試樣本與降維后的類別中心的歐氏距離。雖然應用PCA技術不可避免地丟失了信息,但是先驗置信度僅僅考慮了SVM中非支持向量樣本簇的作用,反映了到每個類別中心的歐氏距離,較之判別式置信度的可靠性偏低,在置信度評價中占的比重并不高。因此,降維后的先驗置信度損失的信息對圖像識別的準確度基本沒有影響,但是大大減少了先驗置信度的計算量。
2.3 置信度評價的集成
現有的基于序貫三支決策的圖像識別方法在CNN推理的時候將分類器連接在多層粒度結構的每一層,而每一層分類器返回的置信度如果足以作出可靠的預測,則返回結果;否則,將樣本傳遞到下一個粒度層。盡管在更細的粒度層上獲得了更多的信息,但是在評估分類器的時候,忽略了上一粒度層已經獲得的置信度。舍棄的上一粒度層的置信度存在著潛在有價值的信息,包含著部分下一粒度層所沒有的信息,并且浪費了已有的計算工作。早期的層能夠為后期的層部分錯誤識別的樣本給出正確識別的類別,因此丟棄的信息還會導致性能下降。
機器學習中的集成可以提高模型的性能和魯棒性,但是由于訓練多個模型來處理相同的樣本,導致需要大量的額外計算,并且在每個粒度層上使用的分類器的預測是相關的,細粒度層上的分類器比粗粒度層上的分類器具有更好的性能。受到集成學習的啟發,將當前層的置信度與上一粒度層的置信度進行集成,并且提出的方法不存在計算量大的問題。DCE是組合上一粒度層已經計算過的置信度,幾乎沒有額外的計算代價。置信度的集成主要是提高了細粒度層上分類器的性能,細粒度層上的置信度結合了粗粒度層分類器的信息。在整個序貫結構中,置信度的傳遞過程如圖3所示。
2.4 三支決策
根據式(1)~(3)在閉集圖像識別任務中為CNN的推理制定序貫三支決策的分類規則。首先,對輸入的圖像進行預處理,并將其輸入到CNN模型中,然后在每個粒度層計算出最終的置信度Pcl(xl)。推理過程中三支決策閾值Ptl是通過整個決策過程的錯誤接受率(1 acceptance rate,FAR)來估計的。如果整個CNN中的推理精度降低不超過1%是合適的,那么FAR則設置為0.01。然后為遞進過程使用Benjamini-Hochberg校正[19]獲得l層的FAR,即FARl=FAR·l/L。FAR用于計算所有粒度層l∈{1,…,L}的閾值Ptl。基于三支決策的多類別分類模型對于統一的閾值也有顯著的表達能力。因此對于所有類的正域和負域將使用相同的閾值。這種定義的好處是對象在每個粒度層上只能屬于一個正域類,避免決策沖突的問題。不同的決策類在同一個粒度層l上具有相同的閾值Ptl,不同粒度層上的閾值不相同。
每個具有較小置信度Pcl(xl)的類別c將會被劃分到負域。如果最終預測的類別只有一個,即正域中只有一個結果,則返回該類別;否則識別過程將會進行到下一個粒度層l+1進行推理提取特征。這些特征對應來自集合Ul+1中類別的一對多分類器并進行分類。如果中間的所有粒度層都沒能作出可靠的決策,那么將會在最后一個粒度層通過式(5)返回具有最大置信度的類別。
3 實驗與分析
3.1 研究環境
1)實驗環境 本文實驗已在Python中使用TensorFlow和Keras實現。實驗是在裝有Intel CoreTMi5-10500 CPU @ 3.10 GHz和NVIDIA GeForce GTX 1660 SUPER的惠普臺式機上進行的。
2)實驗數據 為了研究本文方法(以下稱為S3WD(DCE))在圖像識別任務中使用預訓練的CNN性能改進的有效性,實驗驗證過程沒有選擇MNIST和CIFAR等分辨率較低的數據集,而是選擇了以下高分辨率的基準數據集進行了實驗驗證:
a)Caltech-101數據集[21]是用于圖像識別的經典數據集,包含101個普通物體的類別,其中每個類別大約含有40~800張圖像,大部分的類別大約含有50張圖像。
b)Caltech-256數據集[22]是比Caltech-101更復雜的圖像物體識別數據集,包含256個物體類別,每個類別的圖像最少80張。
實驗中使用了InceptionResNet v2[23]和ResNet-152[24]兩個經典的CNN模型。所有的CNN架構都是由其作者在ImageNet數據集中識別1 000個類別圖像訓練的。因此這些版本的模型都可以在官方網站下載。
3)實驗過程 在本文方法中,預訓練CNN被表示成多個粒度層,將圖像輸入到預訓練模型中,使用預訓練模型在特定粒度層上對圖像進行特征提取,通過本文提出的置信度評價以及置信度評價的集成輸出每張圖像的置信度。接著利用遞進過程中Benjamini-Hochberg校正過的FAR估計每個粒度層上的三支決策的閾值。將輸出的置信度與閾值進行比較,根據式(1)~(3)獲取三支決策的正域,如果正域為空,則在下一粒度層繼續推理重復上述過程。
3.2 評價指標
采用圖像識別的平均(宏)準確度(%)和平均每張圖像識別推理的時間(ms)以及錯誤率和識別時間的加權和作為評價指標。由于所有的數據集都是不平衡的,所以分別計算每個類別分類的準確度,并采用隨機子采樣交叉驗證計算平均(宏)準確度。每個數據集分別三次被隨機分為訓練集和測試集,并使每類訓練樣本的數量等于固定的數量。訓練集的大小選擇如下:Caltech-101每類2~30張圖像;Caltech-256每類2~70張圖像。由于要驗證本文方法在小樣本的有效性,所以選擇了訓練樣本較少的情況。算法中訓練和驗證的拆分比例為0.5。
為了比較各種方法的性能,使用以下目標函數[25]:
3.3 實驗結果
S3WD(DCE)已經與Scikit-learn庫的傳統分類器進行了比較:a)具有100棵樹的隨機森林(RF);b)以一對多訓練的線性SVM,最小化平方合頁損失函數(LinearSVC);c)使用徑向基函數(RBF)為損失函數的SVM分類器;d)具有三個鄰居數的最近鄰(NN)分類器。此外,還與最新的基于序貫三支決策的CNN快速推理方法[12]進行了對比(以下稱為S3WD(SVM))。由于其他序貫三支決策技術都不能應用到預訓練CNN模型中,所以實驗并未涵蓋這些技術。
在實驗中,首先圖4、5展示了針對Caltech-101數據集在不同預訓練CNN模型上的性能隨著每個類的訓練樣本的數量變化趨勢。結果為宏平均準確度和平均每張圖像識別的時間以及通過式(16)給出對錯誤率和識別時間的min-max規范化的加權和。實驗中計算先驗置信度使用PCA技術將主成分降為12。由于使用SVM分類器能夠取得更可靠的結果,所以式(13)中的參數β設置了較高的權重0.8。參數λ設置為0.6。結果包括序貫三支決策技術的性能和分類器在特定粒度層提取特征分類的性能,如“RF,l=3”表示在第3個粒度層提取特征,并使用隨機森林分類器對其進行分類。從本文的實驗結果可以看出,最好的分類器是LinearSVC,即使在訓練樣本較少的情況下,與RF、NN以及帶有RBF核的SVM相比,LinearSVC都能得到更高的準確率,并且LinearSVC也是分類最快的分類器,在相同的粒度層上,LinearSVC較其他分類器推理的時間最少。在早期粒度層(如l=1)雖然比后期粒度層推理的速度更快,但是識別的準確度較低。而基于序貫三支決策的方法是綜合考慮選擇的所有粒度層的性能。從實驗結果來看,基于序貫三支決策的圖像識別方法的性能是優于非序貫的方法性能。
從表1可以看出,在Caltech-101數據集上,對于每個類別30個訓練樣本的情況,S3WD(DCE)在預訓練的Inception-Res-Net v2上的準確率為94.56%,比深度卷積神經網絡的空間金字塔池化的方法[28]準確度高了1.16%。在Caltech-256數據集每個類別60個訓練樣本的情況下,本文方法比兩個CNN結合集成[29]的結果(86.2%)提升了1.23%。
圖4所示的實驗是Caltech-101數據集在InceptionResNet v2模型粒度層(block17_16_ac,mixed_7a,block8_10)上的性能。在這組實驗中,式(10)中的超參數α設置為5。S3WD(DCE)比S3WD(SVM)在不同的訓練樣本個數上準確率提高了1%~1.9%,除了在訓練樣本個數為2的情況下,推理時間大致相當,其余情況推理時間減少2%~5%。其中在30個訓練樣本中,準確率為94.56%。為了更直觀地展示實驗的結果,Caltech-101在InceptionResNet v2上的準確度和平均識別時間如表2所示。圖5所示實驗是針對Caltech-101數據集在ResNet-152模型粒度層(conv4_block36_out,penultimate)上的性能。其中α設置為15。準確率比S3WD(SVM)提高1.16%~1.9%,推理時間減少3%~4%。
圖6和7是針對更復雜的數據集Caltech-256分別在InceptionResNet v2和ResNet-152模型上的識別性能。與S3WD(SVM)相比,圖6的性能除了在兩個訓練樣本和S3WD(SVM)大致相當以外,其余準確度和推理時間分別提高了1.6%~2.2%和2%~4.6%,圖7的準確度和推理時間總體上分別提升了1.1%和1.7%。由于每組實驗的參數是固定的,所以導致在樣本較少的情況下,準確度稍低。通過調節參數α,S3WD(DCE)在樣本較少的情況下也能得到有競爭力的結果。除了在ResNet-152的2個樣本的實驗中,通過式(16)計算的f*在所有的實驗中均是最低的。
從上述結果可以看出,后期粒度層的識別性能優于早期層提取的特征識別性能。這是由于早期粒度層提取的特征信息較少,導致識別錯誤率較高。由于S3WD(SVM)犧牲了可控的準確度,所以S3WD(SVM)的識別準確度比之LinearSVC在最后一個粒度層稍低,但是識別的時間大大降低。而S3WD(DCE)的準確度總體是高于LinearSVC,但是比S3WD(SVM)的識別時間稍低。由于本文提出了采用更可靠的相似性度量的方法,提高了識別的準確度,改變了每個粒度層測試樣本決策的比例,早期層作出決策的比例增加,降低了推理的時間。雖然額外計算了先驗置信度,但是使用了PCA技術降維后,額外增加的計算量并不多。隨著訓練樣本數量的增加,識別的準確度逐漸升高,識別的時間隨之降低。
在表3中,本文給出Caltech-101數據集在InceptionResNet v2模型粒度層(block17_16_ac,mixed_7a,block8_10)上的實例結果。從表3中第1張圖像所在的列可以看出,第1張圖像在粒度層block17_16_ac通過S3WD(DCE)得到的置信度為0.555 7,大于當前粒度層的閾值pt1,預測了正確的類別faces_easy,從而退出序貫的過程,無須在粒度層mixed_7a和block8_10上繼續推理,由此加快推理速度。盡管表中有些圖像在粒度層block17_16_ac預測的類別不正確,但是這些圖像的置信度小于閾值pt1,此時S3WD(DCE)并不會立即進行決策,而是繼續推理。如第5張圖的wild_cat在粒度層block17_16_ac上置信度最高的類別是cougar_face,但是置信度0.252 6小于閾值0.495 4,不足以作出決策,繼續在下一粒度層mixed_7a推理,直至作出決策。
4 結束語
本文通過特征提取、相似性度量以及序貫三支決策的三支分類規則構建了一種圖像識別的方法,研究了利用序貫三支決策在深層CNN圖像識別推理的準確度和速度權衡的問題。在訓練過程中得到訓練樣本簇中心,利用測試樣本到訓練樣本簇中心距離的度量減小異常樣本的影響。通過粒度層之間置信度的集成,將每個粒度層的信息充分利用,提高了識別的準確度。同時,使用序貫三支決策權衡了識別的準確度和速度,從而提高了圖像識別的性能。在Caltech-101和Caltech-256數據集上的實驗結果表明,在未調整數據集和微調預訓練模型的情況下,均能達到較高的準確度和較快的識別速度。
參考文獻:
[1]陳燁,周剛,章夢禮,等.基于圖像識別的跨模態實體鏈接模型[J].計算機應用研究,2022,39(5):1422-1426,1431.(Chen Ye,Zhou Gang,Zhang Mengli,et al.Cross-modal entity linking model based on image recognition[J].Application Research of Compu-ters,2022,39(5):1422-1426,1431.)
[2]王國胤,張清華,胡軍.粒計算研究綜述[J].智能系統學報,2007,2(6):8-26.(Wang Guoyin,Zhang Qinghua,Hu Jun.An overview of granular computing[J].CAAI Trans on Intelligent Systems,2007,2(6):8-26.)
[3]Fang Yu,Gao Cong,Yao Yiyu.Granularity-driven sequential three-way decisions:a cost-sensitive approach to classification[J].Information Sciences,2020,507:644-664.
[4]Yao Yiyu.Granular computing and sequential three-way decisions[C]//Proc of International Conference on Rough Sets and Knowledge Technology.Berlin:Springer,2013:16-27.
[5]劉盾,李天瑞,苗奪謙,等.三支決策與粒計算[M].北京:科學出版社,2013:1-13.(Liu Dun,Li Tianrui,Miao Duoqian,et al.Three-way decisions and granular computing[M].Beijing:Science Press,2013:1-13.)
[6]王國胤,于洪.多粒度認知計算——一種大數據智能計算的新模型[J].數據與計算發展前沿,2019,1(2):75-85.(Wang Guoyin,Yu Hong.Multi-granularity cognitive computing—a new model for big data intelligent computing[J].Frontiers of Data and Computing,2019,1(2):75-85.)
[7]Li Huaxiong,Zhang Libo,Huang Bing,et al.Sequential three-way decision and granulation for cost-sensitive face recognition[J].Know-ledge-Based Systems,2016,91:241-251.
[8]Li Huaxiong,Zhang Libo,Zhou Xianzhong,et al.Cost-sensitive sequential three-way decision modeling using a deep neural network[J].International Journal of Approximate Reasoning,2017,85:68-78.
[9]Savchenko A V.Sequential three-way decisions in multi-category image recognition with deep features based on distance factor[J].Information Sciences,2019,489:18-36.
[10]Zhang Libo,Li Huaxiong,Zhou Xianzhong,et al.Sequential three-way decision based on multi-granular autoencoder features[J].Information Sciences,2020,507:630-643.
[11]Liang Yuwei,Li Huaxiong,Huang Bing,et al.Semi-supervised incremental three-way decision using convolutional neural network[C]//Proc of IEEE International Conference on Networking,Sensing and Control.Piscataway,NJ:IEEE Press,2020:1-6.
[12]Savchenko A V.Fast inference in convolutional neural networks based on sequential three-way decisions[J].Information Sciences,2021,560:370-385.
[13]Snell J,Swersky K,Zemel R.Prototypical networks for few-shot learning[C]//Proc of the 31st International Conference on Neural Information Processing Systems.Cambridge,MA:MIT Press,2017:4080-4090.
[14]Gormez A,Koyuncu E.Class means as an early exit decision mechanism[EB/OL].(2021-03-01).https://arxiv.org/abs/2103.01148.
[15]Lakshminarayanan B,Pritzel A,Blundell C.Simple and scalable predictive uncertainty estimation using deep ensembles[C]//Proc of the 31st International Conference on Neural Information Processing Systems.Cambridge,MA:MIT Press,2017:6405-6416.
[16]Scardapane S,Comminiello D,Scarpiniti M,et al.Differentiable branching in deep networks for fast inference[C]//Proc of IEEE International Conference on Acoustics,Speech and Signal Processing.Piscataway,NJ:IEEE Press,2020:4167-4171.
[17]Phuong M,Lampert C.Distillation-based training for multi-exit architectures[C]//Proc of IEEE International Conference on Computer Vision.Piscataway,NJ:IEEE Press,2019:1355-1364.
[18]Yang Xin,Li Tianrui,Fujita H,et al.A sequential three-way approach to multi-class decision[J].International Journal of Approximate Reasoning,2019,104:108-125.
[19]Benjamini Y,Hochberg Y.Controlling the 1 discovery rate:a practical and powerful approach to multiple testing[J].Journal of the Royal Statistical Society:Series B(Methodological),1995,57(1):289-300.
[20]Xu Yi,Tang Jingxin,Wang Xusheng.Three sequential multi-class three-way decision models[J].Information Sciences,2020,537:62-90.
[21]Li Feifei,Fergus R,Perona P.One-shot learning of object categories[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2006,28(4):594-611.
[22]Griffin G,Holub A,Perona P,et al.Caltech-256 object category dataset[DB/OL].(2007).http://authors.library.caltech.edu/7694.
[23]Szegedy C,Ioffe S,Vanhoucke V,et al.Inception-v4,Inception-ResNet and the impact of residual connections on learning[C]//Proc of the 31st AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2017:4278-4284.
[24]He Kaiming,Zhang Xiangyu,Ren Shaoqing,et al.Deep residual lear-ning for image recognition[C]//Proc of IEEE Conference on Computer Vision and Pattern Recognition.Piscataway,NJ:IEEE Press,2016:770-778.
[25]Savchenko A V.Search techniques in intelligent classification systems[M].Berlin:Springer,2016.
[26]Zeiler M D,Fergus R.Visualizing and understanding convolutional networks[C]//Proc of European Conference on Computer Vision.Berlin:Springer,2014:818-833.
[27]Chatfield K,Simonyan K,Vedaldi A,et al.Return of the devil in the details:delving deep into convolutional nets[C]//Proc of British Machine Vision Conference.Nottingham:BMVA Press,2014:1-11.
[28]He Kaiming,Zhang Xiangyu,Ren Shaoqing,et al.Spatial pyramid pooling in deep convolutional networks for visual recognition[C]//Proc of European Conference on Computer Vision.Berlin:Springer,2014:346-361.
[29]Simonyan K,Zisserman A.Very deep convolutional networks for large-scale image recognition[C]//Proc of International Conference on Learning Representations.2015:1-14.