999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于T-Apriori算法的紡織品質檢數據分析

2025-07-02 00:00:00呂沿沿薛文良魏孟媛馬顏雪
現代紡織技術 2025年6期
關鍵詞:關聯規則檢測

中圖分類號:TS107 文獻標志碼:A 文章編號:1009-265X(2025)06-0082-08

進口紡織產品在進入中國市場時,需要經過相關部門的檢驗,出具檢測報告,檢測報告的結果在很大程度上可以反映產品的質量。對檢測得到的數據進行深入地挖掘和分析,可以給監管部門提供輔助決策的信息,及時防止質量存在問題的產品流入市場,以免危害消費者的健康及財產安全。

關聯規則挖掘的研究方向主要可分為兩大類:一類是初步探索,旨在針對不同領域的問題,選擇經典的算法并通過應用這些算法得出結論,從而解決實際問題[1]。另一類是深入探索,著眼于算法的改進和優化,針對特定數據提出更具針對性的優化策略。這包括通過提升算法效率來加速計算過程,例如優化算法步驟或改進數據存儲方式[2-3];通過引入新的評價指標,從而使得算法的輸出結果更加符合研究需求,提供更具實用性的結論[4];以及優化算法中的閾值設置,以實現更精準的規則挖掘。目前,針對紡織品質檢數據的關聯規則研究仍較為有限,處于初步探索階段。關于該領域中所采用算法的改進方案,相關研究相對較少,尚未形成系統的優化策略。林宗繆等5使用分布式方法進行質檢數據關聯規則的提取,核心是將海量數據分開進行存儲和挖掘,但是分布式只有在數據量非常大時才能發揮比較好的效果,不適用于樣本數量少的數據。劉蘇銳等對于Apriori算法的連接步驟提出了改進,生成候選項時確保新生成的項不包含重復的信息類型,但是算法效率有待提高。而且對于算法指標閾值的確定僅僅依靠主觀判斷,得出閾值的過程不透明,可信度也有待提升。

本文基于2018—2023年某機構的紡織品進口質檢不合格數據,針對數據的特點提出一種基于三元組的T-Apriori算法,并探究其效果。與此同時,本文還通過候選1項集區間對應1項集數量的變化規律確定支持度,以便更加精準地適應數據的分布特征。使用T-Apriori算法,希望能有效縮短紡織品質檢數據關聯規則挖掘的時間,所挖掘出的強關聯規則可為監管部門提供有效的監管思路與決策支持。

1 關聯規則介紹

1.1 關聯規則算法

在大量的數據中尋找到潛在的關聯性可以給管理者提供思路,確定監管的方向。通過關聯規則算法,可以確定不同項以及項集之間頻繁出現的模式。

假如有一項集 代表一項事務, A 和 都是 ΠI 的一個子集。關聯規則是蘊含式,通常寫作 δAB 。在關聯規則算法中,比較重要的兩個指標是支持度和置信度

支持度(support)的計算公式為:

支持度其實就是 A,B 同時出現的概率,等于 A 和 兩個項集同時出現的事務次數比上 中事務總數的值。

置信度(confidence)的計算公式為:

confidence(A?B)=P(B∣A)

的置信度的就是指在 A 出現的時候, 一定出現的概率,事實上就是一個條件概率,可以用A 和 同時發生的概率與 A 發生的概率之比進行表示。

在實際使用關聯規則的過程中,會根據數據的特性來確定最小支持度和最小置信度,以尋找強關聯規則。但是并不是置信度越高,此關聯規則就一定越強,此時還需要進行提升度的驗證。提升度表示兩個事件同時發生的概率與它們在相互獨立情況下發生的概率之比

提升度(lift)公式為:

提升度反映了關聯規則中 A 和 的相關性,提升度的取值是要求的, liftgt;1 ,認為 A 和 是正相關的,且提升度越大,相關性越高。 lift=1 時,認為 A 和 之間沒有相關性。lif lt;1 時, A 和 是負相關的,且越小證明負相關度越高。關聯規則的目的就是為了觀察 A 和 之間有無關聯,所以必定需要提升度大于1的規則[7-8] 。

1. 2 Apriori算法

關聯規則算法很多,但是最經典的還是Apriori算法,很多后來的算法都是基于此的改良,本文選用Apriori算法進行關聯規則的提取,并對算法進行改進。

Apriori算法主要分成兩個大部分:1)尋找所有大于等于最小支持度的項集,得到頻繁項集;2)得到的頻繁項集去計算置信度,置信度大于閾值的為強關聯規則。其中,一直處于研究重點的為第一部分,尋找頻繁項集的流程如圖1所示。

圖1Apriori算法流程圖Fig.1Flowchart of Apriori algorithm

主要包括以下幾個步驟:

a)首先將數據處理為布爾類型,對數據進行讀取。b)對數據集進行掃描,得到每一個不重復的1項集,其為候選1項集。c)統計每個1項集出現的次數,與數據集中數據個數進行比較得到支持度,與最小支持度進行比較,得到頻繁1項集。d)迭代(連接):通過頻繁 (k-1) 項集構建候選k 項集 Ck k 最開始為2,主要是將 的 (k-1) 項子集進行拼接,得到多個不重復的 k 項集。e)剪枝:已知 Ck 的所有 (k-1) 項子集,判斷其是否都是頻繁的,也就是是否在 中,若不頻繁,則刪除此子集。f)統計篩選后剩余子集在數據集中出現的次數與數據集總事務的比值,得到支持度。再與閾值進行比較,最后得到頻繁 k 項集

g)若 是空集,進行頻繁項集的輸出,若不是,將 k 加1,再執行步驟 d,e,f ,直至 是空集。

1.3 原始數據

原始的檢驗檢測數據包含了產品信息,檢測信息等內容。對于紡織產品,HS編碼非常重要,適用于稅則、統計、生產、運輸、貿易管制、檢驗檢疫等多方面。對于國際貿易產品有明確的分類,包含著原材料、商品用途等信息。有時候在其中蘊含的產品的情況比實際檢驗檢測中列出的更加詳細,將HS編碼歸類為產品信息中

其中關于合格與否的判定:進出口商品抽查檢驗項目的合格評定依據是國家技術規范的強制性要求或者海關總署指定的其他相關技術要求,檢測項目中有一項不合格則判定產品不合格。

檢測項目可以分為兩種,一種需要檢測產品是否存在質量安全風險,是否會對人體健康造成影響;一種則是其不會對人體造成危害,判定其是否符合標準中的最低要求,使消費者購得的產品不是殘次品,不會對大眾的財產安全產生影響,造成消費者權益風險[9]

對2018—2023年的進口檢測數據進行篩選,得到不合格數據2909條,約占總數據的 8.8% 。

在原始數據中出現的不合格項目數量如圖2所示。

1. 4 數據處理

1. 4. 1 概念分層

由于多維數據的稀疏性,直接從最低層挖掘關聯規則很難實現,在多維數據中,引入了概念分層,概念分層定義了一個映射序列,將底層概念映射到高層概念,在較高概念層發現的強關聯規則,可能更加具有普適性。

圖2不合格項目數量的條形圖Fig.2Bar chart of the number of unqualified items

但是還出現另一種情況,從較高概念層無法挖掘更細致的關聯規則,也可以將數據反向處理,映射到低概念層,進行更深人的挖掘,得出相關性結論。

對于紡織品進口檢驗不合格的數據,進行如下的處理:檢測日期,由于過于分散,很難得到強關聯規則,可以將其映射到高層月份。染色牢度可以再進行細分,到低層次映射。此時事務包含的內容結構如圖3所示。

層級結構需要轉換為平面結構,轉換后的平面結構為事務項集{HS 編碼,品牌,進口商,原產地,…,完成日期月,完成日期,質量安全檢驗不合格項目,…,總的檢測不合格項目,色牢度細分},根據挖掘目的的不同選擇合適的項

由于數據具有敏感性,并且有些項過于長不利于關聯規則數據的輸入,可以通過對數據進行編碼處理來避免這些問題。例如項集{HS編碼,品牌,總的檢測不合格項目},其中可以將HS 編碼為 A1- An ,品牌編碼為 B1-Bn ,總的檢測不合格項目編碼為C1-Cn ,如果項集中有更多項,可以以此類推,并根據項的順序調整編碼。

1. 4.2 布爾矩陣的構造

每一條檢測數據也就是一行為一件事務,存儲在Excel表格中,每一格為事務的一項,表1為列舉的部分事務的部分項{HS編碼,品牌,總的檢測不合格項目}。

在轉換為布爾數據前,還需對數據進行如下處理:

圖3不合格數據的層級結構圖Fig.3Hierarchical diagram of unqualified data
表1部分事務中的部分項Tab.1Partial items for partial transactions

a)缺失值處理:對于HS編碼等存在缺失值,可以通過商品名稱等其余信息加以判斷并補充;無法補充的,保留空值。

b)表格中的每一列都必須有不唯一的取值,否則對關聯規則無貢獻,可以直接刪去該列。

將表1列舉的事務轉換為布爾型數據,如表2所示。具體的轉換步驟如下:將原始數據處理為布爾型數據,使數據集僅包含0和1,以便進行邏輯運算,從而將實際的數據庫問題轉化為相應的邏輯值。通過使用Python中的get_dummies 函數,將存儲在Excel表格中的事務數據轉換為布爾矩陣。此操作會為每一列中的唯一取值創建一個新的二元列。當某一項的實際取值與列名一致時,該值被轉換為True(即1);若取值不同或為空,則轉換為False(即0)[10]

表2布爾型數據Tab.2Boolean data

其對應事務布爾矩陣為

2基于三元組的T-Apriori算法

2.1 三元組介紹

在矩陣中,若數值為0的元素數目遠遠多于非

0元素的數目,并且非0元素分布沒有規律時,則稱該矩陣為稀疏矩陣,如圖4的矩陣 N ,紡織品質檢數據包括篩選出的不合格數據都屬于稀疏矩陣

采用二維數組的存儲方法既浪費大量的存儲單元用來存放零元素,又要在運算中花費大量的時間來進行零元素的無效計算,所以必須考慮對稀疏矩陣進行壓縮存儲,三元組法是一壓縮方法。具體操作是:將非零元素所在的行、列以及它的值構成一個三元組 (i,j,v) ,然后再按某種規律存儲這些三元組[1]。圖4展示了矩陣中非零元素的存儲方式。

具體而言,非零元素被存儲在表格中,每一行代表一個元素。表格的第一列記錄該元素在矩陣中的行索引,第二列表示該元素在矩陣中的列索引,第三列則代表該元素的取值。

圖4三元組儲存數據示意圖Fig.4Schematic diagram of triplet storage data

2.2 基于三元組的T-Apriori算法

在算法流程中優化了尋找頻繁1項集的輸入,很大程度上減少了無關數據集的掃描,提高了尋找頻繁1項集的效率,這一改進為后續尋找更高階的頻繁項集奠定了基礎,并進一步提升了整體性能

首先,將原始數據轉化為布爾矩陣后,需要將每行事務中的有效信息提取(即布爾矩陣中取值為1的單項)。

存在某 x(x?1) 行事務在布爾矩陣中為行向量:

假設這行事務中取值為1的項,其列名為 A4 B3,C3 ,那么按照三元組的設定,將這行事務中的單項轉化為集合: (20號

然后,按照上述步驟將布爾矩陣中的每一行事務轉換為三元組集合形式。在消除了所有無關單項后算法的時間復雜度大大下降,這個時候遍歷得到的三元組集合,提取單個三元組中的第二位即列名作為候選1項集。

其次,就來到了算法中的核心函數,尋找頻繁項集函數。在原始Apriori算法中,尋找頻繁項集的函數輸人為:事務集的(transactions),候選項集(candidate),最小支持度(min_support);為了優化這段算法,將輸入事務集替換為了三元組集合,去除了無關單項集,很大程度上提高了算法的效率。在此函數中,首先將按照行號將三元組進行分組,即行號相同的三元組分為一個集合,此集合則為布爾矩陣中的一行事務。之后將遍歷輸入的候選項集,如果候選項集是某個三元組集合列索引的子集,則增加該候選項集的支持度計數,并將候選集和支持度計數存入字典中。

最后,計算支持度比例。支持度比例計算公式為式(1),在算法中此公式的分母即是上述步驟分組過后三元組集合的個數,即事務的行數,分子則為候選項集的支持度計數。在計算得出支持度比例后將與尋找頻繁項集函數中的輸入:最小支持度進行比較。篩選出滿足最小支持度條件的頻繁項集。

三元組作為稀疏矩陣存儲的重要方法,在應用到Apriori關聯規則算法中可以有效地減小算法時間復雜度。在尋找候選1項集以及尋找頻繁項集的函數中替換了原始的事務列表減少了很多不必要的運算,從而顯著地提升了算法的效率。

3 結果與分析

3.1 支持度和置信度閾值

選取的事務中包含的項不同,支持度和置信度閾值會存在差異,本文選取項集{品牌,總的檢測不合格項目},挖掘其中存在的關聯規則。表3為檢測不合格項目編碼對應關系。

表3不合格項目編碼表Tab.3 Code table for unqualified items

支持度和置信度的確定大部分都依賴于專家法、經驗法、試錯法。其實質就是找到相對而言發生次數較多的項以及項集,支持度越高,發生概率越大,頻繁項集產生的越多。最優的支持度能夠產生足夠多的頻繁項集,且篩選掉無用的頻繁項集[12]

支持度的取值可以從候選一項集的頻數區間和1項集的數量做出判斷,通過對候選項集的觀察,可以得出結論:候選 n 項集頻數區間對應項集數量的變化趨勢和1項集是一致的。頻數區間的選擇要根據數據頻數的分布以及頻數對應的支持度來確定,表4為不同頻數對應的支持度,表5為不同頻數區間對應的候選1項集數量

表4頻數對應支持度Tab.4Frequency and corresponding support thresholds
表5頻數區間對應候選1項集數量Tab.5Frequency interval and corresponding number ofcandidate 1-itemsets

通過表5可以判斷出來,相對而言發生次數較多的項集頻數要大于5,對應的支持度為可以設置為0.002。

不同置信度的要求是產生足夠多的關聯規則,且關聯規則是強有力的,文獻中常用置信度區間為[0.5,0.8][13],采用試錯法,調整置信度遞增,遞增長度為0.05,得到最合適的置信度為0.65。

3.2 挖掘效率的改變

與傳統的Apriori算法和優化連接步的C-Apriori算法相比,在挖掘出的關聯規則數目相同的情況下,基于三元組的T-Apriori算法運行效率更佳,圖5為支持度為0.002,置信度為0.65,數據量遞增時各算法所用時間。其中優化連接步的C-Apriori算法復現思路為:在連接步增加判斷條件,進行連接的兩個頻繁 k 項集,前 (k-1) 項相同的情況下,如果第 k 項之間有首字母相同的元素,則跳過該候選項;如果無首字母相同的元素,繼續進行剪枝步。

根據圖5可以看出,T-Apriori算法所用時間明顯更短,運行需要的時間僅為傳統Apriori算法的40% 左右,尤其是在數據量增大的時候,時間差距更加明顯。盡管C-Apriori算法相較于傳統Apriori算法在運行速度上有所提升,但T-Apriori算法在運行效率方面表現出更為顯著的優勢,進一步優化了數據挖掘過程中的計算性能。質檢數據布爾矩陣越稀疏,其中非0值的占比就越小,與傳統Apriori算法的運行時間差值就越大,使用三元組進行數據壓縮的好處體現出來。

圖5不同數據量下的三種算法運行時間對比圖Fig.5Comparison chart of runtimes for three algorithmsunderdifferentdata volumes

紡織品質檢數據往往呈現出高度稀疏的特性,會出現支持度很小的情況,所以算法必須適應支持度閾值較小的環境,算法需要在較低支持度仍然保持良好的運行效率。置信度為0.65,支持度遞增時,處理2500個數據所用時間如圖6所示。

圖6不同支持度下三種算法運行時間對比圖Fig. 6Comparison chart of runtimes for three algorithmsunderdifferent support thresholds

根據圖6可以看出,在支持度相同的情況下,T-Apriori算法的運行時間更短,表明其性能比傳統的Apriori算法和C-Apriori算法更加優異,符合我們的預期。而且可以觀察到,支持度越小,T-Apriori算法和Apriori算法相差時間越多,說明T-Apriori能更好地適應支持度較小的環境,可以實現高效的關聯規則挖掘。

綜上所述,基于三元組的T-Apriori算法相較于傳統Apriori算法以及改進連接步的C-Apriori算法確實運行速度更快,尤其在支持度更小、數據量更高的情況下,可以更加高效地進行關聯規則的挖掘

3.3 挖掘結果分析

當支持度為0.002,置信度為0.65時,從2909條數據中挖掘出72條強關聯規則,支持度反映了關聯的緊密相關性,選取liftgt;3的強關聯規則,并且不合格項目作為后項,最終篩選得到29條數據。其中,后項出現的不合格項目共6項,包括 。強關聯規則中,與 A1 相關的共2條;與A4 值相關的共2條;與 A6 相關的共1條;與 A7 相關的共2條;與 A9 相關的共4條;與 A11 相關的共21條。29條強關聯規則中,前項為2項集的共4條,后項為2項集的共3條。

對強關聯規則進行解讀,值得關注的有3點:

a)在強關聯規則中,出現頻數最高的不合格項目為 A11 ,頻數是其余不合格項目的3倍及以上,說明就總體情況來說,在實際檢測中各品牌使用說明出現不合格的可能性是比較大的。這是因為各國對于使用說明的要求差異較大,而且使用說明存在問題對于人體健康不造成傷害,只會間接損害消費者的財產安全,使生產商和制造商對使用說明的檢測不夠重視,造成使用說明不合規

b)對于不同的品牌,其經常發生的不合格項目是不同的,管控重點不同

c)品牌不合格項目可能存在多項,多項檢測項目之間可能存在關聯。如品牌 B397 和 B56 在檢測時經常發生的不合格項目有兩項,一項為成分,一項為使用說明; B413 常發生的不合格項目為耐久性標簽位置和使用說明。這背后的原因可能有兩點:一就是這三項檢測項目都不會對人體造成很大的危害,輕視使用說明的品牌很有可能對成分和耐久性標簽位置同樣也不重視。二是成分和使用說明的限制要求是在同一標準中提出,也就是GB/T5296.4—2012,品牌對于GB/T5296.4—2012的理解不到位,可能會造成多個檢測項目不合格同時發生。

通過得到的強關聯規則,對監管部門提出2點建議:

a)在監管時注意強關聯規則中出現頻數較高的不合格項目,并警示海外品牌要嚴格遵守標準GB/T5296.4—2012,對于標準進行研讀,只有合規的產品才能進入中國市場。

b)對于需重點監管的品牌,其監管項目側重點不同:對于品牌 B76 和 B89 ,重點監管項目為 A4 ;對于品牌 B581 ,重點監管項目為 ΩA6 ;對于品牌 B319 和B336 ,重點監管項目為 A7 ;對于品牌 B377 和 B413 ,重點監管項目為 A9 ;對于品牌 B397 和 B56 ,重點監管項目為 A1 和 A11 ;對于品牌 B413 ,重點監管項目為 A9 和 A11

4總結

目前針對紡織品質檢數據提出的關聯規則改進算法比較少,而且運行效率有待提高,針對算法指標閾值的確定多數情況下依賴于主觀判斷。本文利用紡織品質檢不合格數據較為稀疏的特點,提出了一種基于三元組的T-Apriori算法,將稀疏的布爾矩陣壓縮存儲在三元組中,降低了算法掃描數據的時間,使整個算法的效率較傳統的Apriori算法和改進連接步的C-Apriroi算法有了較大的提升,所需時間僅為傳統Apriori算法的 40% 。并且對于支持度的確定提出了一種基于1項集頻數的方法,使得支持度的確定更加客觀。

對2018—2023年質檢不合格的數據進行實證分析,挖掘得到72條強關聯規則,解讀規則背后的原因,對監管部門提出2點建議:加強對使用說明的檢測監管力度,警示海外品牌要嚴格遵守標準GB/T5296.4—2012:對于不同品牌的監管項目側重點應存在差別

使用T-Apriori算法作為紡織品質檢數據關聯規則挖掘的工具,極大提高了挖掘的效率,節省時間,同時得到的強關聯規則能給監管部門提供新的監管思路以及監管方向,防止存在風險的紡織品流入市場,危害消費者的健康及財產安全。

參考文獻:

[1]宗萬里,朱習軍.基于Apriori算法的食品抽檢數據的關聯規則挖掘[J].食品安全質量檢測學報,2020,11(4):1334-1337.ZONG WL,ZHU X J. Mining association rules of food samplingdatabased on Apriori algorithms[J].Journal ofFood Safetyamp;Quality,2020,11(4):1334-1337.

[2]馬曉平,曹少中,李旸.基于優化Apriori算法的印刷檢測數據關聯分析[J].北京印刷學院學報,2024,32(6):22-26.MAXP,CAO SZ,LI Y.Correlation analysis of print inspectiondata based on optimized Apriori algorithm[J]. Journal of BeijingInstitute of Graphic Communication,2024,32(6):22-26.

[3]唐學軍,周達謀,李慧蓮.基于改進Apriori關聯規則算法的信令分析[J].郵電設計技術,2024,(9):63-67.TANGX J,ZHOU D M,LI HL.Signaling analysis based onimproved Apriori association rule algorithm[J].Designing TechniquesofPosts and Telecommunications,2024,(9):63-67.

[4]DARRAB S,BRONESKE D,SAAKE G. Exploring the predictivefactors of heart disease using rare association rule mining[J].Scientific Reports,2024,14(1):18178.

[5]林宗繆,郭先超,姚文勇.基于MapReduce的質檢大數據關聯規則挖掘[J].自動化技術與應用,2016,35(8):43-46.LINZM,GUO XC,YAO WY.Association rules mining of qualityinspectbigdatabased onMapReduce[J].Techniques of Automationand Applications,2016,35(8):43-46.

[6]劉蘇銳,李丹丹,龐曉紅,等.基于關聯規則的輕工品涉稅檢驗數據挖掘方法[J].皮革與化工,2022,39(5):20-25.LIU SR,LI D D,PANG X H,et al. Association rule mining fortariffrelatedinspectiondata ofimportedlightindustrialconsumerproducts[J].Leather and Chemicals,2022,39(5):20-25.

[7]李唐振昊,尤筱玥.基于Apriori的裝配式建筑質量影響因素分析[J].同濟大學學報(自然科學版),2022,50(2):147-152.LITZ H,YOU X Y.Impact factors analysis on prefabricatedbuildingqualitybasedon Apriorialgorithm[J]. Journal ofTongjiUniversity(Natural Science),2022,50(2):147-152.

[8]YANGY,LIYT,HUOYH,etal.Alarmlogdata augmentationalgorithmbased on a GAN model and Apriori[J].Journal ofComputer Scienceand Technology,2024,39(4):951-966.

[9]張倩,趙慧.紡織服裝產品的質量安全風險監測體系構建研究[J].化纖與紡織技術,2024,53(6):95-97.ZHANG Q,ZHAO H. Research on the construction of quality andsafetyrisk monitoring system for textile and clothing products[J].Chemical Fiberamp; Textile Technology,2024,53(6):95-97.

[10]郭順利,蘇新寧,房旭輝.融合NER和Apriori算法的游記文本關聯知識挖掘及推薦服務研究[J].現代情報,2023,43(11):123-134.GUO S L,SU X N,FANG X H. Research on travel textassociation knowledge miningand recommendation servicebased onfusion of Named Entity Recognition and Apriori algorithm[J].Journal ofModern Information,2023,43(11):123-134.

[11]黃敏,陳銳,馬軍霞.數據結構:Python語言描述[M].北京:清華大學出版社,2024:60-67.HUANG M,CHEN R,MA JX. Data structures:description inPython language[M]. Beijing:Tsinghua University Press,2024:60-67.

[12]LIUMD,YANGZW,GUOY,etal.Micar:nonlinear associationrulemining based onmaximal information coefficient[J].Knowledge and InformationSystems,2022,64(11):3017-3042.

[13]尤美路,梁回香,阿不都熱西提·買買提,等.基于數據挖掘的棉纖維馬克隆值等級預測[J].現代紡織技術,2024,32(8):85-90.YOUML,LIANGHX,MAIMAITIA,etal.Predictionofcottonfibermicronaire values based on data mining[J].Advanced TextileTechnology,2024,32(8):85-90.

Abstract:Currently,research on association rulesfor textile quality inspection data is stillrelatively limited and mostlyin the preliminary exploration stage.There are few related studies on improvement schemes for the algorithms adopted in this field,and systematic optimization strategies have not yet been formed.Furthermore,using the traditional Apriori algorithm to mine asociation rulescanbetime-consuming in dealing with large datasets,and the determination of rule metric thresholds lacks transparency.Therefore,the purpose of this paper is to address the issue of long computation times when mining association rules from unqualified textile quality inspection data,as well as to solve the problem of the subjective and non-transparent determination of the support threshold.

The T-Apriori algorithm optimized based on the traditional Apriori algorithm was adopted.The core idea of this algorithm lies in compressing and storing the Bolean matrix ofdata inatriplet form.Specificall,each transaction in the Bolean matrix is converted into asetof triplets,where each non-zero element is represented as atriplet ( i , j and v ), with i and j being the row and column indices,and V being the value of the element. The dataset scanned bythe algorithm is theconverted triplet set,and thecalculations of support,confidence,and liftare also performed using data retrieved from these triplet sets. Unqualified textile quality inspection data are very sparse,with most elements being zero,and tripletsonly store non-zero elements,thereby efectivelyreducing storage spaceand enhancingcomputational eficiency.For determining the support threshold,the trend in the number of itemsets corresponding to the frequency of candidate 1-itemsets is analyzed to adjust the supportthreshold,alowing itto better adapt to the characteristics of the data and identify relatively high-frequency itemsets.

The experimental results show that the trend in the number of candidate1-itemsetscan be used to identify relatively high-frequent itemsets,and the support thresholdforthe itemset{brandand total unqualified inspection items} is set to O.OO2.The T-Apriori algorithm demonstrates significant performance improvements compared to the traditional Apriori algorithm and its optimized version, C-Apriori. Its runtime is only 40% of that of the traditional Apriori algorithm.Asthevolume of data increases,thereduction inruntimefor the T-Apriori algorithm is even more pronounced,as shown in Fig.5.The lower the support threshold,the larger the diference in runtime between the T-Apriori algorithm and the traditional Apriori algorithm becomes,indicating a more significant reduction in runtimefor the T-Apriori algorithm,as ilustrated inFig.6.In summary,the T-Apriori algorithm exhibits superior processing performance in environments with large data volumes and low support thresholds.By mining textile quality inspection data from 2018 to 2023,72 strong assciation rules are obtained,and based on these rules,two regulatory recommendations are proposed to the supervision department.The adoption of the T-Apriori algorithm greatly improves the analysis eficiency of textile quality inspection data,providing a more eficient data analysis tool for quality supervision and decision support. This has important practical application value.

Keywords: association rules; Apriori algorithm; triplets; quality inspection; textiles

猜你喜歡
關聯規則檢測
撐竿跳規則的制定
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 午夜国产大片免费观看| 日本高清视频在线www色| 亚洲人成电影在线播放| 国产精品视屏| 丁香六月激情综合| 亚洲无码电影| 国产成人精品视频一区二区电影| 国产福利在线观看精品| 亚洲天堂久久久| 国模粉嫩小泬视频在线观看| 又猛又黄又爽无遮挡的视频网站| 久久成人18免费| 亚洲三级色| 91精品人妻互换| 国产xxxxx免费视频| 久久久久国色AV免费观看性色| 亚洲无码高清一区二区| 国产打屁股免费区网站| 2020国产在线视精品在| 国产福利免费观看| 免费精品一区二区h| 国产粉嫩粉嫩的18在线播放91| 无码人中文字幕| 欧美翘臀一区二区三区| 久久精品一品道久久精品| 四虎永久在线| 久久激情影院| 国产三级国产精品国产普男人 | a级毛片在线免费| 一级毛片免费播放视频| 性喷潮久久久久久久久| 91丝袜在线观看| 国产精品尹人在线观看| 天堂岛国av无码免费无禁网站| 午夜欧美理论2019理论| 免费看美女自慰的网站| 国产欧美日韩综合在线第一| 精品国产美女福到在线直播| 欧美三级日韩三级| 国产一区二区福利| 一级毛片免费高清视频| 毛片在线播放a| 东京热高清无码精品| 激情综合婷婷丁香五月尤物 | 亚洲日韩AV无码精品| 色综合色国产热无码一| 欧美亚洲国产日韩电影在线| 国产精品熟女亚洲AV麻豆| 伊人色在线视频| 精品视频福利| 超碰精品无码一区二区| 成人福利在线视频免费观看| 国产一级在线观看www色| 91探花在线观看国产最新| 国产成人无码AV在线播放动漫| 精品伊人久久久香线蕉 | 91香蕉视频下载网站| 国产一区二区在线视频观看| 日本人真淫视频一区二区三区 | 26uuu国产精品视频| 国产午夜一级淫片| 久久这里只有精品2| 男女男精品视频| 国产一级在线播放| 91无码视频在线观看| 中文字幕在线欧美| 色婷婷国产精品视频| 久草青青在线视频| 91精品情国产情侣高潮对白蜜| 国产欧美日韩综合在线第一| 亚洲成人黄色网址| 黄片一区二区三区| 少妇精品在线| 亚洲成人网在线播放| 亚洲a级毛片| 91精品综合| 91精品伊人久久大香线蕉| 97一区二区在线播放| 国产亚洲精品资源在线26u| 亚洲国产天堂久久综合| 成人字幕网视频在线观看| 国产精品视频导航|