陳 飛 朱婷婷 周繼開
(1.新疆維吾爾自治區特種設備檢驗研究院,烏魯木齊 830011;2.新疆工程學院,烏魯木齊 830023)
隨著自動化技術和計算機技術的發展,利用過程工藝本身的海量生產數據對生產工藝優化及機理認識等方面的研究越來越受到大家認可。生物冶金作為含砷、硫難處理金礦的提金主要方法[1~5],近年來被廣泛研究。但大多研究都只基于工藝本身的改進,導致大量工藝過程數據被閑置,使隱含的有價值信息沒有被充分利用進而造成資源的極大浪費。為此,筆者以現場實測數據庫為主要依據,通過對生物冶金工藝進行研究,在不增加硬件成本和改變工藝的前提下提高生物冶金的提金率。
溫度、礦漿pH值、進風量、Fe2+濃度、磨礦細度、礦漿濃度和培養基是影響生物冶金提金率的主要因素[6,7],其中Fe2+濃度、磨礦細度、礦漿濃度和培養基屬不可控因素,溫度、礦漿pH值和進風量屬可控因素。現場通過合適的檢測傳感器件對可控因素進行實時測量、保存,為后續基于數據的生物冶金研究提供保障和可能。
現場實測數據量較大,通過常規方法處理并分析這些數據可以發現,它們都是以時間為節點、以各個因素為字段的天然時間序列。因此,時間序列的分析和處理方法可用于處理這些實測數據。現有的時間序列表示方法主要有移動平均模型和指數平滑模型[8~10]。相比于移動平均模型,指數平滑模型是對所有觀測值的加權平均,權值按照指數規律衰減,距觀測時間點越近權值越大,這比移動平均模型更合理。指數平滑模型如下:
St=αyt+(1-α)St-1
(1)
式中St——在時間t時的研究對象估計值;
yt——在時間t時的研究對象觀測值;
α——平滑系數,α∈(0,1)。
根據工藝過程中工藝參數的變化共性,取α=0.12。對原采集數據進行平滑處理,可得可控參數平滑趨勢數據與平滑差值曲線如圖1~3所示。

圖1 pH值平滑趨勢數據與平滑差值曲線

圖2 溫度平滑趨勢數據與平滑差值曲線

圖3 進風量平滑趨勢數據與平滑差值曲線
關聯規則就是發現數據庫以及其他數據存儲中的大量項集間有價值的模式和項集間的相關性。生物冶金過程是一個生物、物理、電化學和其他因素共同作用的多域復雜過程,其黃金提取率受多方面主觀和非主觀因素影響,且影響關系尚在進一步的精確研究當中。利用Apriori關聯規則算法對工業實測數據庫項集中感興趣的規則進行挖掘,可以得到黃金提取率與可控因素間的可描述關系。
為了提高規則的挖掘效率與速率,在進行規則挖掘之前需要對原始數據庫的數據進行處理。一般將數據分為數值型數據和二進制數據,針對不同的算法要求,數據的轉換格式也不相同。Apriori算法是一種最有影響力的挖掘布爾關聯規則頻繁項集的算法,其核心是基于兩階段頻集思想的遞推算法[11]。該關聯規則在分類上屬于單維、單層、布爾關聯規則,因此,為滿足Apriori算法要求,需將原始數據轉換為布爾型數據。
進行關聯規則挖掘的目的就是為了發現各可控因素對黃金提取率的影響作用。所謂影響作用就是在其他變量都一定或處于某一穩定范圍時,該變量的變化對黃金提取率的影響。一般將影響結果分為升高、降低和不變3種情況。有一項集It={Pt,Tt,Ft,Ot},其中P、T、R是分屬3個不相同域的變量,O是研究對象。在下一時刻,It+1={Pt+1,Tt+1,Ft+1,Ot+1},此時各變量均有3種變化結果,以F為例:若Ft+1>Ft則記F′=1;若Ft+1 表1 生物冶金工藝參數三值狀態變換 生物冶金工藝中黃金提取率難以實時、處處在線測量,因此給相關研究帶來了極大困難。但據相關學者研究發現,黃金提取率與ORP線性正相關,因此研究可控影響因素與黃金提取率間的影響關系可轉化成研究可控影響因素與ORP間的影響關系。在以下的研究中所有ORP項集均取“升高”情況,即三值狀態中的{1}。 在使用Apriori算法挖掘關聯規則時,為了衡量規則的價值(或者稱為興趣度),需要定義兩個指標,即支持度和置信度。一般這兩個指標都是依據經驗人為設定,但筆者研究的內容完全建立在數據分析基礎上,過程中并不摻入現有的非數據經驗,僅將其作為最終規則的工藝驗證標準。因此在下面的規則挖掘中只取支持度和置信度最大的規則作為強關聯規則,當最大支持度和最大置信度不在同一條規則時以支持度最大為準。 依據Apriori算法挖掘工藝參數pH值與ORP間的影響關系,項集X={Pt}、Y={Ot},可得變換如下: (2) (3) Pt取三值狀態,規則X({Pt})?Y({Ot})的置信度和支持度見表2。依據約定的規則關聯強度衡量準則,規則{-1,1}的置信度和支持度最大,是有價值的規則。對其進行解釋即為“pH降低,ORP升高”, pH值的衡量起點為均值2。 表2 pH值與ORP影響關系關聯規則挖掘結果 同上,X({Pt})?Y({Ot})的挖掘方法,Tt取三值狀態,規則X({Tt})?Y({Ot})的置信度和支持度結果見表3。規則{-1,1}的支持度最大,是要尋找的有價值規則。對其進行解釋即為“溫度降低,ORP升高”,溫度的衡量起點為均值42.3℃。 表3 溫度與ORP影響關系關聯規則挖掘結果 X({Pt})?Y({Ot})的挖掘方法,Ft取三值狀態,規則X({Ft})?Y({Ot})的置信度和支持度結果見表4。規則{1,1}的支持度最大,是要尋找的有價值規則。對其進行解釋即為“進風量增大,ORP升高”,進風量的衡量起始點為均值1 584.5m3/h。 表4 進風量與ORP影響關系關聯規則挖掘結果 由細菌活性試驗資料可知,pH在1.0~2.2、溫度在25~45℃、進風量在1 400~2 300m3/h時是生物冶金所用鐵氧化硫桿菌、硫氧化硫桿菌及鐵氧化螺旋桿菌等菌種的最佳環境條件。 由上述挖掘到的規則分析可知,當溫度均值為42.3℃時,已接近細菌活性最佳溫度上限,因此溫度的下降對微生物細菌活性有利,所以規則“溫度降低,ORP升高”符合工藝實際。當pH值均值為2時,已接近細菌活性最佳pH值上限,因此pH的降低對微生物細菌活性有利,所以規則“pH值降低,ORP升高”符合工藝實際。當進風量均值為1 584.5m3/h時,進風量處于最佳環境條件的下半部分,進風量增加對微生物細菌活性有利,所以規則“進風量增大,ORP升高”符合工藝實際。但進風量的增加也有限度,當進風量過大時會使附著在礦粒表面的微生物細菌脫落,不利于預處理過程的進行,從而使黃金提取率降低。 筆者依據生物冶金過程數據,通過對生物冶金工藝的深入分析,由數據挖掘方法得到了ORP與關鍵可控過程工藝參數間的可描述關系,揭示了生物冶金工藝的部分機理,為提高生物冶金提金率和下一步的工藝過程控制優化提供了依據。 [1] 陳飛.基于時間序列數據挖掘的生物氧化提金工藝參數優化[D].烏魯木齊:新疆大學,2014. [2] 南新元,陳飛,孔軍.高寒地區某金礦生物氧化預處理過程溫度控制研究[J].貴金屬,2014,35(2):38~42. [3] 李泉.生物氧化提金預處理過程參數間關系的辨識研究[J].化工自動化及儀表,2014,41(10):1185~1188. [4] 李偉,南新元,吳瓊.生物氧化提金中基于PSO-LSSVM的氧化還原電位建模研究[J].貴金屬,2014,35(4):60~64. [5] 呂重安,安娟.生物氧化預處理提金新工藝研究[J].湖南有色金屬,2010,26(1):28~30. [6] 劉子龍,秦曉鵬.影響生物氧化提金工藝的主要因素與措施[J].黃金科學技術,2010,18(2):58~60. [7] 高丙朋,南新元,魏霞.基于迭代LS-SVM生物氧化提金預處理工藝參數優化算法的研究[J].貴金屬,2012,33(2):40~43. [8] Liao S H,Chu P H,Hsiao P Y.Data Mining Techniques and Applications:A Decade Review from 2000 to 2011[J].Expert Systems with Applications,2012,39(12):11303~11311. [9] Han J W,Kamber M.Data Mining-Concepts and Techniques[M]. Amsterdam: Elsevier,2011:147~149. [10] Ralha C G,Silva C V S.A Multi-agent Data Mining System for Cartel Detection in Brazilian Government Procurement[J].Expert Systems with Applications,2012,39(14):11642~11656. [11] 包震宇.基于粗糙集對Apriori算法的改進[D].上海:上海師范大學,2010.
2.2 規則定義

2.3 Apriori算法關聯規則挖掘





3 挖掘規則評估
4 結束語