







基金項目:咸陽師范學院2022年省級大學生創新創業訓練項目;項目編號:S202210722081。
作者簡介:李耀明(2001—),男,本科生;研究方向:圖像處理,軟件工程。
摘要:為利用計算機技術識別錢幣,實現對世界文化的弘揚、錢幣的保護和知識普及,文章提出了一種基于卷積神經網絡的錢幣識別模型,詳細描述了數據采集、模型搭建和訓練的過程。實踐結果證明,該模型在錢幣識別方面具有較高的精度。這意味著可以通過計算機技術快速準確地識別錢幣,從而促進對錢幣的保護和傳承,豐富人們對世界文化的了解。同時,這項研究成果還可應用于博物館、收藏界等領域,為相關專業人員提供實用工具,提高錢幣知識的普及程度。
關鍵詞:古錢幣;卷積神經網絡;數據采集
中圖分類號:TP39141;TP183文獻標志碼:A
0引言
近年來,隨著深度學習技術的發展,基于內容的圖像檢索成為主流的圖像識別方法。卷積神經網絡(ConvolutionalNeuralNetwork,CNN)[1]是一種深度學習神經網絡,廣泛應用于圖像分類、圖像檢索和圖像分割等計算機視覺任務中[2],在一些重要領域取得了實質性研究成果。眾多實驗結果表明,CNN能夠在科學研究和實際應用中取得較好的結果。
中國是世界上最早使用貨幣的國家之一,有3000多年的古錢幣發展史[3]。古錢幣的形制有貝幣、布幣、刀幣、圓錢、方孔圓錢、無孔硬幣等,其中方孔圓錢形制占絕大多數。一枚古錢幣上承載著當時的歷史、政治、經濟、文化、冶煉和民俗民風等相關信息,利用計算機圖像技術對古錢幣形制進行識別、文字提取、版別判定等工作,對于弘揚中國錢幣文化、便于錢幣收藏愛好者的入門以及防止古錢幣走私流失等都具有重要的意義。
1圖像收集與處理
11數據集的來源
課題研究中使用的古錢幣圖像數據來自3個部分:第一部分來自數據集kaggle的ancientcoin(https://www.kaggle.com/datasets/syedabbasraza/ancient-coin-classification),該數據庫收錄了來自各個博物館、收藏家以及學術機構的古錢幣圖像資源。第二部分來自古代錢幣收藏家社區中的部分藏家自行拍攝及分享的錢幣圖像和直接拍攝采集的古錢幣圖像。第三部分使用kaggle的WorldCoins(https://www.kaggle.com/datasets/wanderdust/coin-images)中的現代錢幣和網上的游戲幣作為非古錢幣類數據集。為了保護數據集的隱私和版權,本文對所有圖像進行了匿名化處理,盡量避免使用涉及個人信息的圖像。
在圖像采集過程中,筆者充分考慮了古錢幣的角度和光線因素。因為古錢幣的形狀和圖案在不同角度和光線下會呈現出不同的特征。為了驗證所提出方法的有效性,提高模型的魯棒性[4],確保樣本的多樣性和覆蓋范圍,本文收集的中國圓形方孔古錢幣包括秦漢、唐宋、明清等不同歷史時期的錢幣,國外的古錢幣和非古錢幣,如現代錢幣、游戲幣等。
12訓練樣本和測試樣本
實驗圖像共15000張,其中5000張中國圓形方孔古錢幣、5000張國外硬幣圖像和5000張非古錢幣類圖像。這種方式劃分是為了確保模型在面對不同背景和類別的古錢幣時能夠獲得相對準確的分類結果。實驗過程中,80%的圖像作為訓練樣本,20%的圖像作為測試樣本。
2模型設計
21卷積神經網絡概述
卷積神經網絡作為一種常用的深度學習模型,在圖像識別領域具有廣泛的應用,卷積神經網絡的基本結構包括輸入層、池化層、卷積層和輸出層(見圖1)。其中,卷積層通過滑動卷積核提取古錢幣圖像中的局部特征,能夠捕獲到不同圖案、紋理和形狀等關鍵信息[5]。池化層通過滑動池化窗口來提取古錢幣圖像中的空間特征,能夠捕獲到不同尺寸、方向和位置等關鍵信息。池化操作可以有效地減少計算復雜度,同時保留圖像中的重要特征,有助于提高模型的泛化能力。
22模型架構
網絡模型使用了Sequential模型,它是一種線性的模型堆疊方式,依次添加各個層次的網絡結構[6]。整個模型的設計為4大層,首先2組卷積層與池化層的組合用來提取圖像特征;然后通過1個卷積層對特征數據抽象化處理;最后2個全連接層對特征數據線性變換映射到另一個特征空間并輸出。網絡模型及訓練過程如下所示。
(1)輸入尺寸大小為224×244的RGB格式圖像。
(2)使用32個3×3的卷積核對圖像進行特征提取以后,得到形狀為222×222的32通道的特征數據輸出。
(3)將(2)得到的圖像作為輸入送到池化層。使用2×2的池化窗口進行特征下采樣,得到形狀為111×111的32通道的特征數據輸出。
(4)再次將(3)得到的圖像作為下一卷積層的輸入,卷積層使用64個5×5的卷積核進行特征提取,得到形狀為107×107的64通道的特征數據輸出。
(5)下一個池化層處理卷積層輸出的特征數據,同樣使用2×2的池化窗口進行特征下采樣,得到53×53的64通道的特征數據輸出。
(6)第五層(卷積層)使用128個3×3的卷積核處理上一層的輸出,得到51×51的128通道的特征數據輸出。
(7)第六層(鏈接層)將第五層的特征數據轉化為一維向量,得到一維長度為332928(51×51×128)的數據輸出。
(8)第七層(第二鏈接層)使用256個神經元對上一層的一維數據進行線性變換和非線性激活[7],得到一維長度為256的數據輸出。
(9)第八層(輸出層)使用3個神經元,通過softmax激活函數分類輸出[8]。
網絡模型構建完成后,通過編譯模型以配置訓練過程。模型結構如圖2所示。
23訓練準備
模型采用的神經網絡模型有3-3-3-3、3-5-3-3、3-7-3-3的3種網絡結構對圖像進行分類訓練,本文主要對模型結構為3-5-3-3進行詳細說明,其他模型類似。訓練參數配置如下:訓練批次batch_size大小為64,訓練次數epochs為100次,學習率learning_rate設置為000001,采用Adam優化算法[9],損失函數使用分類交叉熵函數。卷積層和全連接層均采用relu激活函數[10]。
通過以上的模型參數設置,對模型進行訓練前準備,通過model.summary()輸出模型的基本結構。輸出結果如表1所示。
24訓練過程
經過上述的模型配置,對模型進行最后的參數設置如表2所示,使用Adam優化器,設置學習率,損失函數設置為多分類交叉熵損失函數,評價指標設置為準確率。此后,可以開始正式模型訓練。對15000個訓練樣本,進行時長10多個小時的訓練,最終達到了90%的準確率。
表2設定參數
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=learning_rate),
loss=“categorical_crossentropy”,
metrics=['accuracy']
)
3實驗結果與分析
31網絡模型分析
通過訓練3種網絡模型,分別是3-3-3-3,3-5-3-3和3-7-3-3,如表3所示為3種網絡模型對圖像識別后的準確率平均值和均方差。如表3所示,當網絡結構使用不同大小的卷積核時,網絡的識別準確率不同。其中,當網絡模型為3-7-3-3時,網絡識別效果更加理想。
3種網絡模型的準確率如圖3所示,損失值如圖4所示。通過觀察圖3、圖4,x軸為訓練次數,y軸分別代表準確率(圖3)、損失值大小(圖4)。從圖3和圖4可以看出,3-7-3-3的網絡模型在準確率上基本保持在最高的水平,損失值收斂相對更快,說明較大的卷積核具有更好的性能。以上數據表明,3-7-3-3的網絡模型更適合本課題研究的錢幣識別。
通過對比使用3×3、5×5和7×7卷積核的網絡結構(分別為3-3-3-3、3-5-3-3和3-7-3-3),發現7×7卷積核能夠提供更大的感受野,能夠更好地捕捉到古錢幣圖像中的細節和特征,平均準確率達到了09591。使用3×3和5×5卷積核的網絡結構的平均準確率分別為09501和09580。此外,在實驗過程中,發現隨著訓練迭代次數的增加,3種卷積核的訓練準確率都逐漸提高,但使用7×7卷積核的網絡結構在相同訓練迭代次數下達到了更高的準確率,收斂速度更快。這些結果說明,卷積核大小對模型性能具有顯著影響,較大的卷積核可以提供更好的特征提取能力,從而提高古錢幣圖像識別任務的準確率。
32實驗結果驗證
如圖5、圖6和圖7所示為對不同錢幣的識別結果,實驗圖像中包括有遮擋的古錢幣實拍圖、外國錢幣和非古錢幣類。其中,圖5表示對中國圓形方孔古
錢幣的識別結果,如“CH09176”中的“CH”表示中國,“09176”表示該張圖片的準確率約為09176;圖6表示對外國古錢幣的識別結果,如“FO09954”,“FO”表示該圖片屬于外國古錢幣,“09954”表示圖片的準確率約為09954;圖7表示對非古錢幣的識別結果,如“NOT09992”,“NOT”表示該圖片屬于非古錢幣,“09992”表示圖片的準確率約為09992。從實驗的識別結果可以看出,本模型對各類錢幣的識別率較高。
4結語
本文通過直接輸入古錢幣圖像數據,由卷積神經網絡對古錢幣圖像數據進行自動特征提取,避免人為提取圖像特征的缺點,從而達到959%的準確率,表明卷積神經網絡對古錢幣圖像識別分類具有較高的準確率。在本文古錢幣識別分類算法的應用中,通過對卷積神經網絡參數調整與相關方法的比較,從而得到了適合古錢幣圖像識別的分類算法。在未來的研究中,應該考慮將卷積神經網絡與其他深度學習技術相結合,如圖像分割、目標檢測和圖像生成等,以構建更加全面和強大的古錢幣分類算法。同時,系統還應對模型在實際應用場景中的魯棒性多加注意,考慮不同環境因素可能對古錢幣的識別性能的影響,如光照、角度和尺度變化等。盡管卷積神經網絡在古錢幣圖像分類中取得了良好的性能,但仍然存在一些局限性。數據集的樣本數量較少,模型學習效果會受到限制。后續的研究中需要搜集更多的古錢幣數據集樣本,以提高樣本的多樣性,讓模型的學習效率更高。
參考文獻
[1]弓佳明.基于卷積神經網絡的圖像識別技術研究[J].現代計算機,2023(1):63-68,94.
[2]周雨薇.深度卷積神經網絡在醫學圖像分割中的應用研究[J].信息與電腦(理論版),2023(6):200-202.
[3]王瀚.中國古錢幣美學中的傳統文化元素賞析[J].北京印刷學院學報,2018(11):82-85.
[4]張立軍,陶璐.多指標綜合評價模型魯棒性度量方法研究[J].統計與信息論壇,2011(5):16-20.
[5]劉道華,崔玉爽,趙巖松,等.一種改進卷積神經網絡的教學圖像檢索方法[J].西安電子科技大學學報,2019(3):52-58.
[6]胡文楠.基于內容圖像檢索的機器人障礙物檢測方法[J].計算機工程與設計,2021(3):822-829.
[7]孫景榮,謝林昌,杜夢欣,等.一種非線性變換的自適應透射率去霧算法[J].西安電子科技大學學報,2022(1):208-215.
[8]劉海章,黃大池.淺析激活函數SoftMax的設計與實現[J].西部廣播電視,2021(17):201-206.
[9]李敏,李紅嬌,陳杰.差分隱私保護下的Adam優化算法研究[J].計算機應用與軟件,2020(6):253-258,296.
[10]蔣昂波,王維維.ReLU激活函數優化研究[J].傳感器與微系統,2018(2):50-52.
(編輯王永超)