郅芬香,王留芳,梁 碩
(1.鶴壁汽車工程職業學院,河南 鶴壁 458030;2.河南工業職業技術學院,河南 南陽 473000)
粗糙集理論是由波蘭數學家Z.Pawlak 在20世紀80年代初提出的一種處理模糊和不精確性問題的新型數學工具,利用粗糙集理論進行數據挖掘,最重要的就是基于粗糙集理論的屬性約簡。通過約簡操作降低屬性的緯數,總結出適用于決策支持的知識規則,是粗糙集理論最重要的應用之一。數據挖掘是從大量的、不完整的、有噪聲的、模糊的、隨機的大型數據中提取隱含在其中的、人們事先未知的、具有潛在價值的信息和知識的過程,在拖拉機裝配方案的選擇過程中,調度系統為了快速選擇合理的工藝方案,可以采用數據挖掘的方法從多套方案中進行關聯規則的挖掘,指定合理的工藝方案評價方法,提高車間調度系統的作業效率具有重要的意義。
在確定拖拉機裝配工藝路線時,由于可供備選的工藝路線有多種,最好采用數據挖掘的方法對工藝路線進行優選,確定出最佳的評價方法。粗糙集是數據挖掘算法的一種,在進行數據挖掘時可以對信息數據進行屬性簡約,將粗糙集和其他算法進行結合,還可以明顯地提高數據挖掘的效果,如采用遺傳算法。其主要流程是首先對提供的數據缺失的部分進行補充,然后根據數據的特點利用已經定義的可辨識矩陣,通過屬性簡約算法進行簡約和知識發現,最后對知識發現的規則利用遺傳算法進行優化,得到主要的規則。
在進行數據挖掘之前,首先要對待處理的數據進行采樣和整理,因為很多數據是冗余的,要通過數據處理去掉一部分無效的信息,然后是數據的離散化和缺損信息的補充。粗糙集數據挖掘方法在進行數據處理時只能處理離散數據,因此還要對數據進行離散化。在進行離散化時必須選擇合適的斷點,才能進行有效的離散化,斷點的選取可以根據數據的屬性特點,數據的補齊可以通過經驗進行填補,或者利用均值處理和頻率統計等方法進行填補。
屬性簡約是粗糙集數據挖掘的重要步驟,通過屬性簡約可以用最少的屬性區分不同的決策,得到約減集合。經過粗糙集減約后,屬性的個數會減少很多,但得到的規則數量可能還是比較大的,因此還要根據數據的共性來進行關聯規則的提取,這就是數據挖掘過程中數據的優化問題。數據優化可以使用遺傳算法進行優化,其主要步驟如圖1所示。
在數據挖掘過程中,為了得到最佳的關聯規則,采用了遺傳算法。首先是數據的編碼,可以根據拖拉機工藝方案的性質和需求,對其評價的關聯規則進行編碼處理,采用二進制數字編碼對關聯屬性進行編碼。編碼完成后,便可以進行遺傳算法操作:首先選取初試種群,可以用工藝方案的任何一個個體作為初始種群;遺傳算法實現過程中一個非常重要的步驟是確定評價函數,評價函數可以將關聯規則中聯系最多的進行匹配;最后便是遺傳操作,包括交叉和變異,交叉是對編碼數據進行位置變換,變異是對編碼數據進行取反,經過評價函數確定最優后,得到拖拉機裝配工藝方案選取的最佳評價方法。

圖1 關聯規則遺傳算法處理步驟
在先進的現代化裝配車間,生產管理調度是非常重要的。為了實現車間生產部門大量的業務處理工作,必須使用計算機進行現代化的調度管理。在拖拉機裝配車間調度系統功能設計時,需要設計車間裝配的作業計劃、作業拆解、任務排序與自動分配管理等幾個方面的功能,實現全面化的計算機管理。其基本功能框架如圖2所示。

圖2 拖拉機裝配車間調度系統基本功能框架
拖拉機裝配車間調度系統總體的功能主要分為查詢、調度和數據處理等。其中,數據處理包括前邊介紹的粗糙集數據挖掘算法,處理數據包括設備屬性和工藝屬性等。設備屬性框架如圖3所示。

圖3 設備屬性功能框架
設備屬性包括設備的類別編號、類別名稱、使用年限、數量和備注等。設備選用之前,可以利用數據挖掘算法對設備進行篩選,得到最佳的設備類型。
工藝路線信息如圖4所示。拖拉機裝配工藝的路線信息較多,包括一些產品圖號和名稱、工序編號和名稱,還包括標準工時、人工數量、使用設備等,其類型、主鍵和長度信息如表1所示。

表1 工藝路線信息表

圖4 工藝路線信息
拖拉機裝配工藝路線包含的信息量非常大,在工藝路線方案確定時,可以采用數據挖掘方法對工藝路線所包含的信息屬性進行約減,然后通過關聯規則的提取確定最佳評價方案。
基于粗糙集和數據挖掘的調度系統優化如圖5所示。粗糙集和數據挖掘主要是使用在拖拉機裝配系統的數據處理模塊優化設計上,基于粗糙集的數據信息關聯規則挖掘主要分為3步:首先是數據的預處理,然后利用粗糙集對數據的屬性進行約減,最后通過遺傳算法優化,提取關聯規則。通過優化處理后得到最佳的拖拉機裝配工藝評價標準,以對備選的工藝方案進行篩選。

圖5 基于粗糙集和數據挖掘的調度系統優化
為了驗證基于粗糙集和數據挖掘關聯規則在拖拉機裝配工藝設計中使用的可行性,以拖拉機裝配車間(見圖6)調度系統的優化為例進行驗證。在拖拉機進行裝配時,其工藝流程中有許多要注意的問題,如裝配誤差、裝配干涉及工序實現的難易等。為了使拖拉機的裝配達到最優化,在工藝選擇的過程中,需要以某幾個需要注意的問題為重點來決定使用何種工藝方案。

圖6 拖拉機裝配車間示意圖
在進行裝配時,需要通過系統優化選擇合理的裝配工藝方案。在進行裝配工藝設計時,設計企業一般會制定多種裝配工藝方案。為了使裝配工藝方案達到最優,可以制定一套統一的評價標準。在評價標準制定時,有以往的一些裝配工藝方案進行借鑒,本次主要選取幾種以往用過的方案進行評價,并利用粗糙集對屬性進行簡約,然后利用數據挖掘來最后決定使用何種方案,從而使裝配工藝得到優化。
以往用過的8種裝配方案如表2所示。其中“?”表示屬性表中沒有寫明的情況。經過數據預處理后, 對缺失數據進行了填補及屬性離散化后得到了表3所示的拖拉機裝配工藝信息表。

表2 拖拉機裝配工藝屬性表

表3 拖拉機裝配工藝信息表
得到表3的拖拉機裝配工藝信息表后,按粗糙集理論的屬性簡約的算法, 通過數據挖掘管理規則決策表的可辯識距陣, 可以得到算法第3步后的合取范式表達式為
F(d,e,f,a)=(e∨a)∧(d∨e∨a)
∧(d∨e)∧(e∨f∨a)∧(d∨e∨f)
∧(d∨e∨a)∧(d∨e∨a)∧(d∨e∨a)
∧(d∨a)∧(e)(e∨a)∧(d∨e∨f∨a)
∧(d∨e∨f)∧(d∨e∨f∨a)
∧(d∨e∨f)∧(d∨e∨a)
(1)
其中,可辨矩陣中的元素對應每個分析項,d、e、f、a分別對應屬性裝配誤差、工序簡單、裝配錯誤、裝配干涉。按算法簡化后可得
F(d,e,f,a)=(e∧a)∨(e∧d)
(2)
由公式(2)可以看出:對于信息表中的數據,與決策相關的主要有d、e、a。通過粗糙集理論的屬性簡約,可以得到以往使用的拖拉機裝配工藝的重要信息和屬性,然后可以通過遺傳算法得到主要的關聯規則。如表2中某一個裝配工藝上裝配誤差、工序簡單、裝配干涉值為201,其編碼可以表示為10、00、01。假設初始種群的個體為8個,評價函數以可以匹配表中最多行屬性為關聯規則,定義8元組為
SGA=(C,E,P0,M,Φ,Γ,Ψ,T)
(3)
其中,C為對個體采用的二進制編碼;評價遺傳算法適應度函數f(x)用E表示;初始種群的個體8個規則為P0;比例選擇算子為Φ;中間位單點交叉算子為Γ;變異算子為Ψ;迭代計算30次的停止符號為T。通過計算,最終得到了最佳的工藝方案個體為00、01、 01,即裝配誤差為0.1cm,工序簡單,裝配干涉一般為評價標準,通過此標準可以對提供的農機裝配方案進行優化,進而對裝配系統進行優化。
為了提高拖拉機車間裝配調度系統的作業效率,基于粗糙集理論和遺傳算法。提出了一種新的調度系統數據處理挖掘算法。通過對工藝方案數據的屬性約減和關聯規則挖掘,可以快速得到工藝路線的評價參數。為了驗證方案的可行性,以拖拉機裝配工藝路線的選取為例,對其評價方案的制定進行了數據挖掘計算。通過計算最終得到了最佳的工藝方案個體為00、01、 01,即裝配誤差為0.1cm,工序簡單,裝配干涉一般為評價標準,為拖拉機裝配車間調度系統工藝方案的選取提供了重要的數據依據。