歐陽世波 王磊 張清友



摘 要:隨著技術的進步,特別是機器視覺技術的迅猛發展,條碼的讀取與識別已經不再依賴于傳統的條碼掃描器。機器視覺為條碼的快速、準確和自動化讀取提供了新的技術路徑。然而,復雜的物流環境、不同的包裝材料以及各種環境因素(如光線、遮擋)會影響機器視覺系統的性能。文章對基于機器視覺的物流包裝條碼特征快速提取與識別方法展開深入研究,以期為實際物流場景中的條碼識別提供一種更為高效和準確的技術手段。
關鍵詞:機器視覺;物流包裝條碼;條碼特征快速提取
中圖分類號:F259.27文獻標志碼:ADOI:10.13714/j.cnki.1002-3100.2024.08.012
Abstract: With the advancement of technology, especially the rapid development of machine vision technology, the reading and recognition of barcodes no longer rely on traditional barcode scanners. Machine vision provides a new technological path for the fast, accurate, and automated reading of barcodes. However, complex logistics environments, different packaging materials, and various environmental factors (such as light and occlusion) can affect the performance of machine vision systems. This paper conducts in-depth research on the fast extraction and recognition methods of logistics packaging barcode features based on machine vision, hoping to provide a more efficient and accurate technical means for barcode recognition in practical logistics application scenarios.
Key words: machine vision; logistics packaging barcode; fast extraction of barcode features
0 ? ?引 ? ?言
條碼作為一種數字或代表特定信息的視覺形式,可通過一系列線條和空隙或其他圖形符號表示。這些代表信息的符號可以被專門的讀取設備掃描并解碼,從而實現自動數據捕獲,大大提高了數據錄入的速度和準確性。隨著計算機技術和圖像處理技術的飛速發展,機器視覺逐漸在條碼識別領域嶄露頭角。不同于傳統的激光掃描技術,機器視覺依賴攝像頭或其他圖像傳感器來捕獲物體的數字圖像,并使用軟件算法進行圖像分析和處理。利用機器視覺進行條碼識別在處理損壞、模糊或部分被遮擋的條碼時具有明顯優勢。
從傳統的激光掃描到基于機器視覺的智能識別,條碼技術的演變反映了科技進步給現代社會帶來的巨大變革。然而,也出現了新的挑戰和問題,如何更好地利用機器視覺技術進行條碼識別、實現更高的識別速度和準確性,將是該領域持續探索的方向。楊文科(2023)對條碼技術與RFID技術的特點及應用方式展開闡述,并對物流行業中存在的問題進行闡述[1]。王永桐(2023)以自動識別技術作為研究對象,分析技術的分類及應用特點,探究自動識別技術在物流管理中的應用策略[2]。曾王平(2023)對物流倉儲管理系統與RF系統的數據交互、倉儲策略進行研究,探索了優化業務流程、優化揀選路徑、保障倉儲作業準確高效的方法[3]。孫東 (2022) 指出:引入4尺度檢測、多尺度特征融合結構、GIOU損失數的新的深度學習算法與傳統算法相比具有較大優勢,同時在檢測速率上滿足實時性要求,有一定的實用性及有效性。[4]林雯(2014)針對物流過程中對物品包裝嚴密程度檢測的問題,提出使用計算機視覺檢測的方法,以求突破傳統檢測方法的限制,提高物品包裝檢測的精度和速度[5]。本文對基于機器視覺的物流包裝條碼特征快速提取與識別方法展開研究,期望為相關工作人員提供一定的理論支持和實踐指導。
1 ? ?機器視覺技術概述
1.1 ? ?機器視覺的基本原理
機器視覺技術正日益成為現代自動化系統中的核心組成部分,它的基本原理包括如何賦予機器“看”和“理解”環境的能力。機器視覺結合光學、電子、計算機科學、數學和生物學等多個領域的知識,意在將捕獲到的圖像數據轉化為有意義的描述或決策。在這個過程中,會涉及圖像捕捉設備的使用,如數字相機或其他傳感器,以獲得環境或目標物體的二維圖像。這種圖像其實是由大量的像素組成的,其中每個像素都記錄了一個特定位置的亮度或顏色信息。為了從這些原始圖像中提取有用的信息,通常需要進行圖像預處理,如濾波、去噪和增強,以改進圖像的質量。當圖像預處理完成后,需要進行圖像分析,識別圖像中的關鍵特征。這些特征可以是明顯的邊緣、角點、紋理或其他明顯的圖像屬性。隨著特征的提取,圖像的進一步識別和解釋將成為可能。
1.2 ? ?機器視覺系統的主要組成部分
機器視覺系統作為一個綜合性的技術體系,在實現圖像數據的獲取和解析中需涵蓋多個核心組件。圖像捕獲設備,如數字相機、CCD(電荷耦合器件)或CMOS(互補金屬氧化物半導體)傳感器,為系統提供了視覺信息來源。它們能夠高效地捕捉到環境或目標物體的二維圖像數據。照明系統同樣是關鍵組成部分之一。這是因為適當的光線條件是獲取清晰、高質量圖像的先決條件。通過調控光源的類型、位置和強度,照明系統能夠確保傳感器可以在最佳條件下工作。
圖像處理和分析軟件能夠將原始圖像數據轉換為有用的信息。這涉及使用各種算法和技術,如圖像增強、特征提取和模式匹配,識別圖像中的關鍵信息。為了進行準確的圖像分析,通常需要使用高性能的計算平臺和存儲系統。這些硬件能夠支持機器視覺算法的實時運行,確保系統在各種應用環境中都能進行快速、準確的響應。系統通常還包括一個接口或控制單元,以實現與其他設備或系統的通信。這使機器視覺系統能夠與自動化設備、機器人或其他信息系統協同工作,實現高度的自動化操作。主要組成部分如圖1所示。
2 ? ?基于機器視覺的條碼特征提取
2.1 ? ?圖像預處理技術
2.1.1 ? ?去噪與增強
去噪與增強是圖像預處理過程中的關鍵步驟,在物流包裝條碼特征提取環境下其作用尤為重要。機器視覺中處理的圖像常常受到多種噪聲源的影響,如傳感器噪聲、環境噪聲或傳輸過程中的干擾。這些噪聲不僅會降低圖像的質量,更會導致后續的條碼識別過程出現誤差。
去噪的主要目的是減少或消除圖像中的這些噪聲。常用的去噪方法包括中值濾波、高斯濾波、雙邊濾波等。中值濾波通過將每個像素的值替換為其鄰域內的中值來消除噪聲,尤其適用于處理椒鹽噪聲。高斯濾波則使用高斯函數對圖像進行平滑處理,主要用于消除高斯噪聲。雙邊濾波則結合空間濾波與灰度值相似性的考慮,能夠在去噪的同時保留圖像邊緣信息。
圖像增強旨在提高圖像的可視性和可分辨性,通過調整圖像的對比度、亮度或銳化來實現。直方圖均衡化是一種常用的增強方法,它能夠提高圖像的對比度,使圖像中的條碼更突出。銳化處理通過加強圖像中的邊緣信息進一步提高條碼的可識別性。
2.1.2 ? ?二值化與分割
二值化是將圖像轉化為僅包含兩種像素值(通常是0和1或黑與白)的過程。在條碼圖像處理中,由于條碼通常是由黑白條紋構成的,所以二值化能夠明確地分離條碼與背景,使后續處理變得簡單而高效。常見的二值化方法有全局閾值法、局部閾值法和自適應閾值法。全局閾值法是為整個圖像選擇一個統一的閾值。局部閾值法則是為圖像的不同區域選擇不同的閾值,更加靈活。自適應閾值法則是根據圖像的內容自動調整閾值,適用于光照不均勻的情況。
分割是在二值化后,將圖像中的目標區域(如條碼)從背景中分離出來的過程。這一步驟確保了僅條碼部分被進一步分析,排除了其他可能的干擾元素。常用的圖像分割方法包括基于閾值的分割、基于邊緣的分割和基于區域的分割。在條碼處理中,由于條碼具有固定的幾何形狀和結構特點,基于閾值和邊緣的分割方法往往更為有效。
2.2 ? ?特征提取方法
2.2.1 ? ?邊緣檢測
邊緣檢測在機器視覺中是一個關鍵步驟,特別是在物流條碼的特征提取中,它為正確識別條碼中的信息提供了基礎。邊緣檢測旨在識別圖像中亮度快速的變化區域,這些區域通常代表物體的邊界或其他重要的信息特征。條碼通常由一系列的黑白條紋組成,這些條紋在亮度上有明顯的變化。因此,邊緣檢測算法可以有效地揭示這些條紋的位置和結構,從而為后續的解碼工作提供重要的信息。常用的邊緣檢測方法包括Sobel算子、Canny邊緣檢測器和Prewitt算子。其中,Canny邊緣檢測器是一種多階段算法,它使用高斯濾波來平滑圖像,然后計算圖像的梯度強度和方向。接下來,使用非最大值抑制來消除梯度值上的假響應,最后通過雙閾值處理來確定真正的邊緣。Canny算法具有高度的準確性和魯棒性,常被用于條碼邊緣檢測。
2.2.2 ? ?輪廓分析
輪廓可以被視為圖像中對象的外部形狀或邊界,它能為對象的識別、分類和后續的特征提取提供有價值的信息。對于條碼,輪廓分析的重要性在于,條碼本身是由一系列精確的線條或塊構成的,這些線條或塊代表特定的信息編碼。輪廓分析能夠準確地檢測、跟蹤和測量這些線條或塊的形狀、位置和大小,從而為解碼條碼提供必要的數據。輪廓分析的流程如圖2所示。
2.2.3 ? ?信息編碼提取
信息編碼提取在條碼識別中起到關鍵作用,它將條碼的視覺形式轉化為可以被機器解讀的數據。條碼的設計原理是利用不同的線條寬度、間隔和排列來存儲信息,準確地從條碼圖像中提取這些特征成為關鍵。首先,系統需要確保已經準確定位到條碼的主體部分,這通常依賴前期的輪廓分析和邊緣檢測兩個步驟。其次,針對條碼中的每個線條(無論是黑色還是白色),系統會測量其像素寬度,這是因為不同的寬度往往代表不同的信息編碼。最后,結合標準的條碼解碼規則,系統可以解析出代表的數字或字符,從而完成信息的解讀。這一過程需要高度的準確性和速度,因為條碼在很多實時應用中,如超市結賬和物流追蹤,都需要被快速地識別和解析。
3 ? ?條碼識別方法與技術
3.1 ? ?模板匹配技術
模板匹配技術的核心思想是使用預定義的模板在一個大圖像中搜索和定位特定的特征或對象。在條碼識別的過程中,模板匹配可以定位條碼的位置,特別是當條碼與周圍環境存在顯著差異時。進行模板匹配首先需要一個參考模板,這通常是條碼的一個特定部分或整體。通過在目標圖像上滑動這個模板,模板與圖像局部區域之間的相似度就能被計算出來,從而確定最佳的匹配位置。相似度的計算可以采用多種方法,如相關系數、均方誤差或其他統計方法。對模板和圖像進行預處理,如去噪、增強和標準化,可以提高模板匹配的魯棒性和準確性。多尺度和多方向的模板匹配技術也得到了廣泛的研究。
盡管模板匹配技術在很多應用中都表現良好,但它對圖像中的噪聲和畸變較為敏感。當目標對象的外觀因光線、角度或遮擋發生變化時,匹配效果就會受到影響。因此,在復雜場景或高度變化的環境中,更先進的方法,如基于深度學習的技術,更適合用于條碼識別。
3.2 ? ?深度學習方法
3.2.1 ? ?卷積神經網絡 (CNN)
卷積神經網絡(CNN)是深度學習領域中的一種強大的模型,特別適用于進行圖像分析和識別。其具有獨特的結構和運算方式,因此CNN能從圖像中自動提取出重要的特征,這在傳統圖像處理技術中通常需要進行手動設計。CNN的基礎是卷積操作,該操作通過滑動窗口(或稱為卷積核)在輸入圖像上執行,以檢測特定的特征。這些窗口負責從圖像中提取局部信息,并保留空間關系。隨著網絡深度的增加,卷積層能捕獲從簡單的邊緣和紋理到更復雜的結構和模式的各種特征。
池化層常在連續的卷積層之間插入,用于減少數據的維度并提高網絡的計算效率。此外,它還提供了某種程度的位置不變性,這對圖像識別任務非常有利。全連接層位于網絡的末端,將高級特征進行組合,并輸出最終的分類結果或回歸預測。
在條碼識別的上下文中,CNN可以被訓練用來識別各種類型的條碼,無論是一維還是二維。通過學習大量的樣本,網絡能區分不同的條碼編碼,并準確地讀取信息。與傳統的特征工程方法相比,CNN的自動特征提取能力使其在面對各種扭曲、噪聲或低分辨率的條碼圖像時仍具有出色的魯棒性。
3.2.2 ? ?循環神經網絡 (RNN)
循環神經網絡(RNN)是一種為處理序列數據而特別設計的神經網絡結構。與傳統的神經網絡不同,RNN具有處理時間序列或連續數據的能力,這歸因于其內部的循環結構,使網絡可以保存前一時刻的信息,并將其用于當前的計算中。這種特性使RNN特別適合被用于處理如文本、語音、時間序列數據等具有順序性的任務。
RNN的基本單元接受當前時間步的輸入和前一時間步的隱藏狀態,并輸出一個新的隱藏狀態。這使RNN可以捕獲序列中的時間依賴性和長期依賴關系。然而,傳統的RNN在處理長序列時會遇到梯度消失和爆炸的問題,這限制了它們捕獲長期依賴關系的能力。因此,RNN變體被研究人員提出,如長短時記憶網絡(LSTM)和門控循環單元(GRU)。這些變體設計有特定的門控機制,可以更有效地學習和記住長序列中的依賴關系。
在條碼識別的場景中,考慮到條碼本質上是一串有序的編碼,RNN及其變體可以在識別過程中考慮編碼之間的順序關系。例如,當處理橫跨多個圖像區域的長條碼或連續讀取流式視頻中的條碼時,RNN能夠有效地捕獲和利用這些連續性信息,從而提高識別的準確性和魯棒性。
4 ? ?性能評估與對比
4.1 ? ?實驗設計
實驗首先需要定義一個明確的目標,即驗證所提出的條碼特征提取與識別方法的有效性和準確性。為此,實驗設計包括以下幾個核心環節。
數據集選擇:選擇一個包含多種物流包裝條碼的數據集,確保數據集包含各種形態、大小、分辨率、清晰度、光照條件下的條碼圖像,以驗證所提方法的魯棒性。
預處理:對數據集中的圖像進行必要的預處理,如去噪、大小調整、色彩平衡等,以準備進行特征提取和識別。
實驗分組:將數據集隨機分為訓練集和測試集,確保二者分布均勻,通常可以采取80%的數據作為訓練集,20%的數據作為測試集。
模型訓練:使用訓練集對提出的特征提取與識別方法進行訓練,調整模型的參數直至達到最佳性能。
模型驗證:使用獨立的測試集對訓練好的模型進行驗證,記錄其在各種條件下的識別準確率、速度、魯棒性等關鍵指標。
對比實驗:為了證明所提方法的優越性,可以選擇一些現有的條碼特征提取與識別算法作為基線,進行同樣的實驗流程,并與所提方法的實驗結果進行對比。
4.2 ? ?實驗數據集
本研究選擇綜合性的條碼數據集進行測試。該數據集的具體描述如表1所示。
該數據集覆蓋大部分實際應用中會遇到的各種場景和條件,從低分辨率到高分辨率,從不同的光照條件到多種條碼類型,這樣就可以在一個真實且具有代表性的環境中測試和驗證所提出的條碼特征提取與識別方法的效果。
4.3 ? ?評估指標
本研究選擇以下主要指標(見表2)全面評價提出的條碼特征提取與識別方法的性能。
其中,TP:True Positives,真正例;TN:True Negatives,真負例;FP: False Positives,假正例;FN:False Negatives,假負例。
4.4 ? ?結果與討論
在實驗過程中,本研究針對各種條碼類型和不同圖像質量進行了測試,實驗結果如表3所示。
從表3可以看出,無論是對于一維條碼、二維條碼還是其他特定類型的條碼,基于機器視覺的識別方法都達到了較高的準確性。其中,一維條碼在所有評估指標上均達到了最優表現,這是由于其結構簡單,信息量相對較少的特點。與此相比,二維條碼和其他特定類型的條碼的識別精度稍低,但仍在可接受范圍內。
識別速度在各類條碼中略有差異。一維條碼的識別速度最快,這再次證明其具有結構簡單、處理速度快的特點。二維條碼和其他特定類型的條碼的識別時間略長,這與它們復雜的結構和更大的信息量有關。
總的來說,本研究方法在多種條碼類型的識別上均展現出了較好的穩定性和效率。可以考慮進一步優化算法,以提高其對更復雜條碼的識別精度。同時針對具體的應用場景還可以對算法進行微調,以適應不同的環境和需求。
5 ? ?結 ? ?論
隨著現代物流、零售和其他行業的迅猛發展,條碼技術在商品管理、資產跟蹤以及各種自動化操作中扮演著越來越重要的角色。本文深入探討了機器視覺在條碼特征提取與識別中的應用。從機器視覺的基本原理到其在條碼識別中的實際應用,涵蓋圖像預處理、特征提取和深度學習等多個關鍵技術領域。實驗部分對比了不同的識別方法,并在多種數據集上驗證了其效果。經過深入研究,本文為如何利用機器視覺技術提高條碼識別的準確性和速度提供了有益見解,期望這些研究成果能夠為相關領域的實踐者提供指導,并進一步推動條碼技術與機器視覺的整合與創新。
參考文獻:
[1] 楊文科.條碼技術與RFID技術在物流中的應用前景分析[J].科技資訊,2023,21(13):27-30.
[2] 王永桐.自動識別技術在物流管理中的應用[J].產業創新研究,2023(10):101-103.
[3] 曾王平.基于企業的物流倉儲信息化建設內容及思路研究[J].現代信息科技,2023,7(8):168-170,174.
[4] 孫東.快遞包裹信息碼視覺定位與識別技術研究[D].哈爾濱:哈爾濱商業大學,2022.
[5] 林雯.基于計算機視覺的物流包裝嚴密程度檢測系統[J].物流技術,2014,33(1):332-335.