

中圖分類號:TP399;TU564.2 文獻標志碼:A 文章編號:1000-5013(2025)04-0393-07
Color Matching Method for Stone Tessellation Process Based on Convolutional Neural Network
XIE Biaofeng CHEN Shouhong HUANG Jixiang LI Jian xin HUANG Shengui
(1.Institute of Manufacturing Engineering,Huaqiao University,Xiamen 36lO21,China; 2.Nan'an-HQU Institute of Stone Industry Innovations Technology,Quanzhou 362342,China; 3.College of Mechanical Engineering and Automation,Huaqiao University,Xiamen 361o21,China)
Abstract:To addres the problem of time-consuming manual material selection and unstable product quality in the stone tesselation process,a color matching method based on convolutional neural network model is proposed. Stone samples scanned from the production workshop were preprocessed to construct the stone image dataset. Diferent convolutional neural networks were trained to screen out the best stone classification model. In order to validate the models effectiveness,the color region of the target image was extracted and used as the input for actual production. The results demonstrated that the products produced using the proposed method were excellent in terms of color consistency,and the visual perception effect was highly similar.The proposed method significantly improve the eficiency of stone selection and ensure the stability of product quality.
Keywords:tessellation process;stone classification;convolutional neural network;process optimization
石材鑲嵌產(chǎn)品具有深厚的歷史與文化積淀,活躍于許多公共藝術舞臺及家庭裝飾中[1-3]。將不同顏色、質(zhì)地的石材拼接組合成精美圖案,能使石材鑲嵌產(chǎn)品具有色彩豐富、持久度高、環(huán)保等優(yōu)點[4-6]。在石材鑲嵌工藝流程中,目前采用的人工選料法雖簡單直觀,但主觀因素很難保證作品的一致性和整體視覺效果。因此,如何從龐大的石材數(shù)據(jù)庫中檢索出顏色匹配的石材,是石材鑲嵌工藝急需解決的問題。
匹配顏色合適的石材可以歸類為石材的顏色分類問題,目前石材的顏色分類研究大多基于傳統(tǒng)機器學習,通過對石材圖片特征提取,并對經(jīng)典分類算法加以改進實現(xiàn)分類。杜金華提出在HSV顏色空間里采用等間距和非等間距等方式提取顏色特征,對顏色特征進行主成分分析降維,并采用分類器對提取的顏色特征進行處理,以實現(xiàn)花崗石圖像分類。康利娟[8提出基于圖像顏色的石材分類方法,對圖像的顏色空間進行轉換后提取特征值進行量化處理,采用歐式距離和改進的距離來計算圖像之間的相似度值。楊杰等[9]采取基于全局和局部的石材圖像顏色直方圖技術進行分類,將 HSV 色彩空間分別與直方圖相交法和環(huán)形直方圖、角度直方圖法相結合,對不同通道給予不同的權重,對不同通道分量進行非等間隔量化以提高石材圖像匹配的效率。盡管基于傳統(tǒng)機器學習在石材分類上取得了不錯的準確率,但傳統(tǒng)機器學習依賴于手工特征提取,其準確率在一定程度上依賴于特征工程的質(zhì)量和數(shù)據(jù)預處理的效果[10]。而深度學習中卷積神經(jīng)網(wǎng)絡(CNN)具有自動從圖像中提取多層次的特征,在大規(guī)模、復雜的石材分類任務中具有更高的分類準確率[11-13]。
近年來,深度學習等前沿技術與工業(yè)生產(chǎn)的耦合越來越緊密,使得工業(yè)向智能制造方向轉型,從而提高了生產(chǎn)效率和自動化水平[14-15]。基于當前工業(yè)生產(chǎn)智能化的趨勢,本文利用實際生產(chǎn)中的石材數(shù)據(jù)庫建立一個高質(zhì)量的數(shù)據(jù)集,通過卷積神經(jīng)網(wǎng)絡實現(xiàn)鑲嵌工藝流程中石材顏色匹配,以提升石材鑲嵌工藝的智能化及自動化水平。
1算法介紹
ResNeXt是由Facebook AIResearch 的研究人員于 2017 年開發(fā)出的一種卷積神經(jīng)網(wǎng)絡,它在VGG 和ResNet等網(wǎng)絡基礎上進行擴展和改進,豐富了深度學習模型的設計空間,使模型擁有更高的性能和更好的泛化能力[16]。作為一種高效的深度學習模型,ResNeXt通過分組卷積和基數(shù)組的設計,能夠在減少計算復雜度的同時,提升分類精度和特征提取能力。
ResNeXt核心思想在于提出的“基數(shù)\"參數(shù)的概念,即在同一層中使用多個并行路。ResNeXt模塊通過增加并行路徑的數(shù)量(基數(shù))來提高網(wǎng)絡的表達能力,而每條路徑的結構與 ResNet模塊中的相似(圖1)。這種設計允許網(wǎng)絡在保持計算復雜度不變的條件下,通過增加基數(shù)來提高性能。

Fig.1Comparison of ResNet and ResNeXt residual module structures
以 ResNeXt-50(32×4d) 為例,它表示一個包含50層、每個殘差模塊使用32個分組卷積、每組通道數(shù)為4d的卷積網(wǎng)絡。ResNeXt殘差模塊結構采用3層卷積結構,首先通過 1×1 卷積將輸人特征通道數(shù)降維;然后通過 3×3 卷積進行主特征提取操作;再通過 1×1 卷積升維以恢復通道數(shù);最后將并行路徑的輸出結果聚合到一起求得最終的輸出。一組聚合轉換可以表示為

式(1)中: F(x) 表示一組聚合轉換的輸出; Ti(x) 表示任意一個可以將輸入數(shù)據(jù)進行映射轉換的函數(shù); c表示基數(shù)參數(shù),決定網(wǎng)絡的并行路徑個數(shù)。
2試驗方案
2.1 石材圖像的掃描
用于石材分類模型訓練的圖像數(shù)據(jù)均來自南安市水頭鎮(zhèn)某石材企業(yè)實地生產(chǎn)的圖像數(shù)據(jù)。從礦山上開采的原料經(jīng)過切割、磨削、拋光等加工工序處理后變成一系列規(guī)格尺寸的石材大板,通過鏈石007智能掃描儀(圖2)拍攝記錄這些石材大板的顏色、尺寸等圖像信息。智能掃描儀總功率為 1 000W ,最大掃描尺寸為 4000mm×2200mm×40mm ,最大掃描速度為 15m ·min-1 ,線陣分辨率為 8 192px ,鏡頭畸變率不超過 1% ,最高采樣速率為 50kHz ,輸出的圖像格式為JPEG。
2.2 數(shù)據(jù)集的建立

石材大板掃描輸出的初始數(shù)據(jù)集示例,如圖3所示。掃描圖中的石材輪廓復雜,數(shù)據(jù)信息參差不齊,對模型訓練存在干擾,需要對掃描的石材圖片進行訓練前預處理,剔除石材圖像冗余的黑色背景及標尺信息,最大化保留石材部分圖像以作為模型訓練的數(shù)據(jù)集樣本。

采用截取石材部分的最大內(nèi)接矩形圖像的方案,石材圖像截取程序,如表1所示。
石材圖像數(shù)據(jù)集有169種類別,共12539張石材圖像,其中包括訓練集10067張和測試集2472張。
3 試驗結果與分析
3.1分類模型參數(shù)
為驗證卷積神經(jīng)網(wǎng)絡在石材圖像分類中的有效性,采用ResNeXt網(wǎng)絡作為主干結構,進一步探討其在圖像目標區(qū)域顏色選材方面的可行性。考慮網(wǎng)絡深度對特征提取能力與計算復雜度的影響,對ResNeXt50、ResNeXt101和ResNeXt152三種不同深度模型進行訓練,比較其在石材分類任務中的表現(xiàn)。同時,將ResNeXt與經(jīng)典網(wǎng)絡模型AlexNet、VGG 和ResNet進行對比,分析深層網(wǎng)絡在該任務中的優(yōu)勢與局限。其中,AlexNet作為較早推動深度學習圖像分類突破的模型,結構較為簡潔,適用于中等規(guī)模數(shù)據(jù)集[17;VGG通過堆疊大量 3×3 卷積核加深網(wǎng)絡,提高了特征提取的細致度[18];ResNet引人殘差連接,緩解深層網(wǎng)絡訓練中的梯度消失問題,支持更深的結構構建[19]。為確保實驗的公平性,在訓練不同網(wǎng)絡時統(tǒng)一了數(shù)據(jù)預處理、訓練環(huán)境、超參數(shù)和策略,確保性能差異主要源于模型結構本身。

算法采用ResNeXt作為主干網(wǎng)絡,使用多分類交叉熵損失函數(shù)衡量模型的預測概率分布與真實標簽分布之間的差異,從而訓練和優(yōu)化網(wǎng)絡模型。優(yōu)化過程采用隨機梯度下降(SGD),以最小化損失函數(shù)并優(yōu)化模型參數(shù)。學習率和動量系數(shù)為模型訓練的超參數(shù),初始設置為0.01和0.9。學習率采用階梯式下降策略,每30個訓練周期后,學習率衰減為原來的0.1倍,以幫助加速收斂并減少振蕩。訓練過程共進行300次遍歷,每個批次的樣本數(shù)設置為32。模型訓練實驗流程,如圖4所示。

3.2 訓練分析
不同石材圖像分類網(wǎng)絡模型訓練結果,如表2所示。由表2可知以下2點結論。
1)VGG和ResNet等網(wǎng)絡模型都在 50~100 次的迭代周期間實現(xiàn)收斂,而ResNeXt網(wǎng)絡模型在50 次之內(nèi)就完成收斂。
2)在基于收集的石材圖像數(shù)據(jù)集進行的圖像分類訓練實驗中,ResNet系列網(wǎng)絡模型的準確率為70%~80% ,VGG系列網(wǎng)絡模型的準確率為 90%~95% ,而ResNeXt系列網(wǎng)絡模型的準確率均達到97% 以上。

3.3 模型效果評估
采用石材圖像數(shù)據(jù)集的測試集對訓練后的模型進行驗證,通過Top-1準確率 (ηA1 )、Top-5準確率1 ?ηA5? )、平均準確率
、平均召回率
和 F1得分 (SF1)5 項指標來評估模型的分類效果。
Top-1準確率用于衡量模型預測的第一選擇是否正確,其計算式為

Top-5準確率用于衡量模型在前5個預測中是否包含正確答案,其計算式為

平均準確率是指所有類別的分類準確率的平均值,反映模型對各類別的整體表現(xiàn),其計算式為

式(4)中: C 是類別數(shù)。
平均召回率用來評估模型對正類樣本的識別能力,關注對正樣本的覆蓋程度,其計算式為

弋(5)中: TPi 為類別 i 的真正例樣本數(shù)量; FNi 為類別 i 的假負例樣本數(shù)量。
F1得分結合準確率和召回率,綜合評估模型的分類性能,其計算式為

式(6)中: ηP,i 為類別 i 的精度; ηR,i 為類別 i 的召回率。
各網(wǎng)絡模型對應的5項指標評估結果,如表3所示。

由表3可知:AlexNet網(wǎng)絡模型未收斂未記錄;ResNet系列網(wǎng)絡模型對應的5項評估值都較低;VGG系列網(wǎng)絡模型的 ηAl 值在 89%~95% 范圍內(nèi),
和
值在 90%~95% 范圍內(nèi);而 ResNeXt系列網(wǎng)絡模型的所有指標都達到了最高值。由此可知,相比AlexNet、VGG和ResNet 等網(wǎng)絡模型,ResNeXt系列網(wǎng)絡模型更加適用于文中采集的石材圖像數(shù)據(jù)集,說明ResNeXt網(wǎng)絡模型的多分支架構和組卷積設計能夠更高效地捕獲石材圖像中的復雜特征,進一步驗證了ResNeXt網(wǎng)絡模型在石材圖像分類領域的適用性。而ResNeXt系列網(wǎng)絡模型中,分類效果最好的是ResNeXt1O1,ResNeXt101擁有適中的深度,相比ResNeXt50,它能更好地捕捉到復雜特征;受限于實際車間建立的訓練數(shù)據(jù)規(guī)模,ResNeXt152的過深網(wǎng)絡帶來了噪聲訓練和參數(shù)冗余,使其分類效果反而不如ResNeXt101。
3.4 工程驗證
采用具體實例驗證基于ResNeXt網(wǎng)絡模型實現(xiàn)石材大板顏色匹配的可行性及有效性。樣例測試圖,如圖5所示。圖5中包含3種主要顏色,采用ResNeXt101訓練的分類模型對樣例圖中的每種顏色逐一處理。
首先,借助圖像處理技術對樣例圖中的顏色區(qū)域進行標記,明確需要進行分類的具體位置,確保后續(xù)處理的針對性和準確性。依據(jù)標記區(qū)域的坐標從原樣例圖中裁剪出對應的子圖,獲得包含單一顏色區(qū)域的圖像數(shù)據(jù)。為滿足分類模型的輸人要求,所有裁剪后的子圖被統(tǒng)一調(diào)整為固定規(guī)格(大小為 224px×224px) 。通過標準化處理,消除因圖像大小不一致對模型輸入造成的干擾,提高預測的穩(wěn)定性。其次,將這些裁剪并標準化后的圖像輸人到預先訓練好的ResNeXt1O1網(wǎng)絡模型中。模型輸出該圖像最大概率可能的石材類別,選定為該區(qū)域圖案的預測結果,如圖6所示。


為驗證研究的必要性,將模型選材與人工選材進行了樣例測試的橫向?qū)Ρ取嶒炛校涗浟硕嗝と烁鶕?jù)顏色在石材數(shù)據(jù)庫中進行選材所花費的時間及選擇出的石材種類。結果表明,工人在檢索數(shù)據(jù)庫時所用的時間與其選擇的石材種類存在顯著差異。具體來說,由于數(shù)據(jù)庫龐大且種類繁多,工人在從數(shù)據(jù)庫中選擇相匹配石材時,通常需要花費較長時間,且選擇的石材種類較為多樣。而使用基于深度學習模型的自動選材系統(tǒng)能夠根據(jù)顏色特征自動匹配數(shù)據(jù)庫中的石材類型,模型選材的時間明顯減少,且選擇出的石材種類具有一致性。
通過上述流程,根據(jù)樣例圖生產(chǎn)出來的鑲嵌實物圖,如圖7所示。ResNeXt101網(wǎng)絡模型實現(xiàn)了對樣例圖中每種顏色的精準識別與分類驗證,證明了其在石材大板顏色匹配任務中的適用性和可靠性;與傳統(tǒng)人工選材進行了橫向?qū)Ρ龋砻鱎esNeXt1O1網(wǎng)絡模型能夠顯著提高選材效率和產(chǎn)品一致性,驗證了采用ResNeXt1O1網(wǎng)絡模型選材的必要性。

4結論
石材鑲嵌產(chǎn)品歷史悠久,具有豐富的文化內(nèi)涵,同時也能帶來較高的經(jīng)濟效益。針對在石材鑲嵌產(chǎn)品的制作工藝流程中如何從龐大的石材數(shù)據(jù)庫中快速挑選出顏色匹配的石材這一實際需求,提出一種基于卷積神經(jīng)網(wǎng)絡模型的石材鑲嵌工藝顏色匹配方法。首先,對石材數(shù)據(jù)庫中復雜多樣的石材大板圖像進行預處理構建數(shù)據(jù)集;然后,對比不同卷積神經(jīng)網(wǎng)絡的訓練結果,篩選出在該數(shù)據(jù)集上分類效果最好的網(wǎng)絡模型。實驗結果表明,ResNeXt1O1網(wǎng)絡模型在文中構建的數(shù)據(jù)集上的分類性能最佳。
基于ResNeXt1O1網(wǎng)絡模型進行工程驗證,提取樣例圖中的各個顏色區(qū)域片段進行標準化處理,作為模型輸入,模型輸出為該顏色區(qū)域片段最大概率歸屬的石材類別。實際生產(chǎn)表明,輸入的顏色圖像片段與歸類的石材類別在顏色一致性方面表現(xiàn)優(yōu)異,生產(chǎn)的鑲嵌成品與目標圖案高度一致。將文中方法運用于石材鑲嵌行業(yè),為在大規(guī)模石材數(shù)據(jù)庫中進行精準石材匹配提供了高效、實用的解決方案。
參考文獻:
[1]熊瑛子.石材鑲嵌藝術在中國當代壁畫創(chuàng)作中的運用[J].天工,2022,36(1):90-92.DOI:10.3969/j.issn.2095-7556.2022.01.024
[2]熊瑛子.石材鑲嵌藝術風格研究[J].美術文獻,2019(5):9-11.DOI:10.16585/j.cnki.mswx.2019.05.005.
[3]熊瑛子.石材鑲嵌藝術材料與創(chuàng)作手法分析[J].藝術品鑒,2019,15(12):294-295.
[4] 陳瑤.中國傳統(tǒng)家具鑲嵌藝術及現(xiàn)代化技術的研究[D].長沙:中南林業(yè)科技大學,2006.
[5]陳韞如.清代宮廷家具中的鑲嵌工藝[J].文物鑒定與鑒賞,2022(8):116-119.DOI:10.2000/j.cnki.issn.1674-8697.2022.08.
[6]李佳明.傳統(tǒng)鑲嵌工藝在當代漆藝中的運用[D].沈陽:魯迅美術學院,2019.
[7] 杜金華.基于顏色特征和邏輯回歸的飾面花崗石圖像識別技術研究[D].廈門:華僑大學,2018.
[8] 康利娟.基于圖像顏色的石材分類算法及測試平臺研究與實現(xiàn)[D].武漢:武漢理工大學,2009.
[9]楊杰,楊靜宜.基于顏色直方圖的石材圖像檢索[J].武漢理工大學學報(信息與管理工程版),2009,31(2):173-176.DOI:10.3963/j. issn. 1007-144X. 2009.02. 001.
[10] 黃士真,耿棟.基于神經(jīng)網(wǎng)絡的建筑裝飾石材智能分類研究:以天然大理石分類為例[J].廣西城鎮(zhèn)建設,2023(2):90-97.DO1:10.3969/j. issn.1672-7045.2023.02.011.
[11]AGRAWAL N,GOVIL H.A deep residual convolutional neural network for mineral classfication[J].Advances inSpace Research,2023,71(8):3186-3202.DO1:10.1016/j.asr. 2022.12.028.
[12]TROPEA M,F(xiàn)EDELE G,DE LUCA R,et al.Automatic stones clasification through a CNN-based approach[J].Sensors,2022,22(16) :6292.DO1:10.3390/s22166292.
[13]劉晨,趙曉暉,梁乃川,等.基于 ResNet50 和遷移學習的巖性識別與分類研究[J].計算機與數(shù)字工程,2021,49(12):2526-2530.DO1:10.3969/j. issn.1672-9722.2021.12.020.
[14]程志清.基于深度學習的工業(yè)機器人視覺引導方法研究[J].信息記錄材料,2024,25(12):110-112.DOI:10.16009/j.cnki.cn13-1295/tq. 2024.12. 048.
[15]檀為龍.深度強化學習在智能制造中的創(chuàng)新應用與趨勢展望[J].中國戰(zhàn)略新興產(chǎn)業(yè),2024(33):161-163.DOI:10.3778/j. issn.1002-8331. 2008-0431.
[16]XIE Saining,GIRSHICK R,DOLLAR P,etal.Aggregated residual transformations for deep neural networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE Press,2017:5987-5995.DOI:10.1109/CVPR.2017.634.
[17]BOUDIAF A,BENLAHMIDI S,DAHANE A,et al.Development of hybrid models based on alexnet and machinelearning approaches for strip stee surface defect clasificationJ]. Journal of Failure Analysis and Prevention,2024,24(3):1376-1394.DO1:10.1007/s11668-024-01927-5.
[18]WANG Wei,ZHANG Chengwen,TIAN Jinge,et al. High-resolution radar target recognition via inception-basedVGG(IVGG) networks[J]. Computational Intellgence and Neuroscience,2020,2020(1):8893419.DOI:10.1155/2020/8893419.
[19]MAHAUR B,MISHRA K K,SINGH N. Improved residual network based on norm-preservation for visual recog-nition[J]. Neural Networks,2023,157:305-322.DOI:10.1016/j.neunet.2022.10.023.
(責任編輯:黃曉楠 英文審校:吳躍勤)