潘春光



摘 要: 為了提高體育商標識別的正確率,針對傳統模型識別效果差的不足,提出基于神經網絡的體育商標識別模型。采用Canny算子對體育商標的邊緣進行檢測,提取不同類型特征,然后采用神經網絡對每一種特征分別建立體育商標識別模型,得到相應的識別結果,采用支持向量機確定每一種模型識別結果的權值,根據權值得到體育商標的最終識別結果。仿真對比實驗結果表明,該模型的體育商標識別正確率達到95%以上,體育商標的識別率要遠遠低于其他體育商標的識別模型,同時滿足體育商標識別的實時性要求。
關鍵詞: 體育商標; 識別模型; 神經網絡; 廣告牌
中圖分類號: TN711?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)01?0049?04
Abstract: In order to improve the accuracy of the sports trademark recognition and remedy the deficiency of poor recognition effect of the traditional model, a sports trademark recognition model based on neural network is proposed. The Canny operator is used to detect the edge of the sports trademark, and extract the different type features. The neural network is adopted to establish the sports trademark recognition model for each feature, and obtain the corresponding recognition results. The support vector machine is employed to determine the weight of the recognition result of each model. The final recognition result of the sports trademark was obtained according to the weight. The experimental results of simulation contrast show that the accuracy of the sports trademark recognition model can reach up to 95%, the sports trademark recognition rate is much better than that of other sports trademark recognition models, and the model can meet the real?time requirement of the sports trademark recognition.
Keywords: sports trademark; identification model; neural network; billboard
0 引 言
隨著我國體育事業的迅速發展,體育產品越來越多,體育競賽中的體育產品廣告增多,競爭日益激烈[1]。商標是識別產品的重要標志,因此,如何準確地識別體育產品商標具有十分重要的研究意義[2]。
針對體育產品商標的識別問題,專家們進行了相關研究,涌現了一些體育產品商標的識別模型[2]。最初采用人工方式對體育產品商標進行識別,該方法簡單,但耗時長、無法自動識別,對于多樣的體育商標識別效率低[3]。隨著信息處理技術應用的不斷深入,有學者提出一些體育產品商標自動識別模型,將體育產品商標看作是多種類型的識別問題,通過一定的規則將體育產品商標歸劃到相應的類別中[4]。由于是多分類問題,必須建立體育產品商標的多分類器,當前可以建立多分類器的算法有神經網絡、貝葉斯網絡等[5?7],在所有算法中,神經網絡的學習速度最快,可以滿足實時性要求,在體育產品商標識別中應用最廣[8]。體育產品商標的特征可以描述體育產品商標的特點,當前特征有顏色、紋理、SIFT特征等[9],受到運動員以及其他物體對商標遮擋的影響,單一特征僅能描述體育商標某一方面的信息,識別正確率難以滿足體育商標識別的實際要求。近年來,有學者提出了多種特征的體育商標識別模型,分別對單一特征建立體育商標識別模型,然后通過加權獲得體育商標的最終識別結果,但權值均采用人工方式確定,具有盲目性,權值無法描述特征對體育商標識別結果的貢獻,因此如何進行體育商標的精確識別仍然面臨巨大的挑戰。
為了提高體育商標識別的正確率,提出一種基于神經網絡的體育商標識別模型,結果表明,本文模型的體育商標識別正確率達95%以上,識別結果要優于其他體育商標識別模型。
1 相關理論
1.1 Canny算子
1.3 神經網絡
BP神經網絡能夠以任意精度逼近函數,學習過程分為兩階段:信號正向傳遞、誤差反向傳遞。第一階段信號從輸入層經過隱含層到達輸出層,如果輸出誤差不符合實際要求,便進入第二階段。第二階段信號的誤差從隱含層向輸入層傳遞,并根據信號的誤差不斷修正各神經元的權值,直到誤差滿足實際要求為止。
基于神經網絡的體育商標識別模型的工作步驟為:
(1) 收集體育商標圖像,并對其進行灰度化處理。
(2) 采用Canny算子對體育商標圖像中的目標邊緣進行檢測,提取商標輪廓。
(3) 分別提取體育商標的顏色、紋理以及SIFT特征,并采用式(7)對它們進行歸一化處理:
(4) 設和分別為輸入和輸出神經元的數量,根據式(8)確定神經網絡的隱含層神經元數量:
(5) 對神經網絡反復訓練,直到訓練誤差達到實際要求為止。
(6) 利用訓練好的神經網絡對體育商標進行識別,輸出相應的識別結果。
1.4 支持向量機
2 本文的體育商標識別模型
本文體育商標識別模型綜合考慮特征間的互補性,避免單一特征信息量少的缺陷,同時合理確定權值,解決人工方式確定權值的不足,具體工作步驟為:
(1) 采用Canny算子檢測體育商標邊緣、提取特征;
(2) 采用神經網絡的體育商標識別模型;
(3) 最后采用支持向量機估計模型的權值,輸出體育商標的識別結果。
本文模型的框架如圖2所示。
3 實驗結果及分析
3.1 體育商標樣本
選擇體育產品商標類型為:LG,BRIDGESTONE,TISSOT,VISA和ADIDAS,它們的類別標簽分別采用1~5進行描述,樣本數量的分布情況見表1。選擇權值人工方式確定多特征權值的識別模型進行對比實驗。
3.2 結果與分析
3.2.1 單一特征的識別正確率
采用BP神經網絡分別對顏色特征、紋理特征以及SIFT特征分別建立體育商標識別模型,得到的識別正確率見表2。從表2可以看出,單一特征的體育商標識別正確率均低于85%,不能滿足體育商標識別的實際應用要求,這主要是由于它們只能提供片面信息,識別結果沒有太多的實際應用價值,同時也證明了本文采用多特征建立體育商標識別模型的思想是正確的。
3.2.2 估計單特征的權值
將單一特征的體育商標識別結果輸入到支持向量機中進行學習和回歸,得到單一特征的權值見表3。從表3可以看出,在所有特征中,SIFT特征的權值最大,其次是顏色特征,最小為紋理特征,說明SIFT特征對體育商標識別結果的貢獻最大,這與實際情況相符。
3.2.3 與對比模型結果對比
本文模型與對比模型的體育商標識別正確率和識別時間分別如圖3和圖4所示。從圖3和圖4可知,相對于對比模型,本文模型的體育商標識別正確率大約提高了5%,而且識別時間也大大減少,符合體育商標識別的實時性要求,這主要是由于本文模型采用支持向量機對單一特征權值進行合理確定,建立了更加合理的體育商標識別模型,能夠準確地描述體育商標類別與特征之間的變化關系,具有更高的實際應用價值。
4 結 論
體育商標識別非常復雜,傳統模型無法準確描述其變化特點,本文利用支持向量機和神經網絡的優點,提出基于神經網絡的體育商標識別模型,首先采用神經網絡根據單一特征建立相應的體育商標識別模型,然后采用支持向量機確定它們的權值,并通過對比實驗對其性能進行分析。結果表明,本文模型的體育商標識別效率大幅度提高,識別正確率可以滿足體育商標識別的應用要求。
在實驗過程中發現一些問題有待解決,如支持向量機的參數設置影響識別結果,今后將解決支持向量機參數的設置問題,產生更加合理的權值,以獲得更優的體育商標識別效果。
參考文獻
[1] PELISSON F, HALL D, RIFF O, et al. Brand identification using Gaussian derivative histograms [J]. Machine vision and applications, 2004, 16(1): 41?46.
[2] WATVE A, SURAL S. Soccer video processing for the detection of advertisement billboards [J]. Pattern recognition letters, 2008, 29(7): 994?1006.
[3] PHAN R, ANDROUTSOS D. Content?based retrieval of logo and trademarks in unconstrained color image databases using color edge gradient co?occurrence histograms [J]. Computer vision and image understanding, 2010, 114(1): 66?84.
[4] LIU W Y, SUN X M, WANG L. Trademark contour extraction based on improved snake model [J]. Journal of computational information systems, 2009, 5(3): 1253?1260.
[5] LI D D, KWONG C P. Understanding latent semantic inde?xing: a topological structure analysis using Q?analysis [J]. Journal of the American Society for Information Science and Technology, 2010, 61(3): 592?608.
[6] HALIN A A, RAJESWARI M, RAMACHANDRAM D. Shot view classification for playfield?based sports video [C]// Proceedings of 2009 IEEE International Conference on Signal and Image Processing Applications. Kuala Lumpur: IEEE, 2009: 410?414.
[7] 王三虎,姚望舒,凌興宏.基于SIFT和角點特征的商標檢索算法[J].計算機應用,2011,31(7):1841?1843.
[8] 卜江,老松楊,白亮,等.一種體育商標中廣告牌商標的實時識別算法[J].自動化學報,2011,37(4):418?426.
[9] 孫林,吳相林,周莉,等.對扭轉魯棒的SIFT圖像匹配在商標識別中的應用[J].計算機工程與設計,2011,32(4):1406?1410.
[10] 林傳力,趙宇明.基于SIFT特征的商標檢索算法[J].計算機工程,2008,34(23):275?277.