程捷,馮天玉,黃世明,郝文彬,霍俊,朱望武
(1. 湖北工業大學,武漢市,430068; 2. 武漢市紅之星農牧機械有限公司,武漢市,430070)
隨著養豬產業的日益成熟,飼養規模逐漸擴大,在高密度集約化的飼養形式下,豬舍環境問題日益突出。目前國內規模性生豬養殖處在一個新的階段,逐漸向配置環境監控器的自動控制方向發展,相比于以前的人工操作提高了生產效率和減少了人工成本[1]。隨著物聯網和人工智能技術的不斷發展,有不少技術同樣應用在豬舍的環境調控上。國外在畜禽舍環控器的精準控制及豬只生長狀態識別等方面取得了顯著的進步[2-3]。近年來,國內學者在這一領域持續展開研究,這些研究實際運用在豬舍環境控制上,降低了豬舍環境控制的難度,實現了無線傳感器組網、物聯網平臺、精準環境控制、狀態識別等技術[4-7],提高了生產效率。在人工智能發展的基礎上,對各種傳統意義的上的調控技術提出了更高的要求,調控的智能化、精細化是今后的發展趨勢。
豬舍環境是一個非線性多變量的系統,只依靠單一傳感器監測不能夠全面把握豬舍的實際環境狀態,而且也割裂了各個傳感器之間的聯系,丟失各個數據組合間內涵的信息特征。采用多傳感器數據融合算法能兼顧各個數據之間的數據特征和內在聯系,有效地識別豬舍真實的環境狀態。
本文基于D-S證據理論融合豬舍環境各維度的特征值,通過生成特征值的概率分配函數、引入證據間距離解決融合沖突問題、最后融合加權后的概率分配函數,得出最終融合結果,即對豬舍環境狀態的識別。
D-S證據理論是由Dempster于1968年提出的,在1976年被Shafer推廣[8],所以該理論被稱之為D-S證據理論。該理論運算規律強,物理意義明確,能夠處理隨機性所導致的不確定性,又能處理模糊性所導致的不確定性[9],能夠將多個證據源提供的證據進行有效融合,直觀地體現證據間的一致性。
在證據理論中,模式識別里可能出現的識別結果組合起來稱為識別框架Θ,表示為Θ={θ1,θ2…θn},其中θ表示證據合成后的識別結果,稱之為焦元,具有有窮性和可列性,并且它們之間彼此互斥。
識別框架是模式識別的重要依據,證據合成在此基礎上得到對應的輸出結果。
對于識別框架Θ,2Θ是Θ的所有子集組合成的冪集,且滿足φ∈2Θ,Θ∈2Θ。在識別框架Θ下,概率分配函數是集合2Θ在[0, 1]之間的映射,記為m:2Θ→[0,1],且滿足
(1)
式中:m(A)——證據對事件A的支持程度概率分配函數;
A——某一特定的事件;
m(φ)——證據對不確定空集的支持程度。
m(A)是某一特征值對命題A的基本概率分配,表示對命題A的支持程度。若有m(A)>0,則稱A為該函數的一個焦元。
Dempster組合規則:在確定的同一識別框架下,概率分配函數融合規則[10]定義為
(2)
(3)
式中:n——概率分配函數總體個數;
mi(As)——第i個概率分配函數里對第s個事件As的置信程度;
k——融合沖突因子,反映概率分配函數融合的沖突程度,k值越大表示證據間的沖突越大。
由于豬舍環境復雜,有多種環境參數可影響到生豬生長,其中包括溫度、濕度、氨氣濃度和硫化氫濃度。由于豬舍環境狀態受多維度因子影響,其環境狀態也不僅僅是單一因子能夠完全概括。參考國標GB/T 17824.3—2008(規模豬場環境參數及環境管理)和結合專家意見后,抽取典型的四種豬舍環境狀態作為識別框架的四種等級狀態:危急、告警、正常和低溫警報。對指定的豬舍環境狀態采取相應的環控措施,實現豬舍環境快速穩定到適宜狀態。則識別框架表示為
Θ={A1(Ⅰ),A2(Ⅱ),A3(Ⅲ),A4(Ⅳ)}
(4)
式中:As(s=1,2,3,4)——豬舍環境的第s個狀態。
其中豬舍環境狀態等級對應的環境狀態評價標準如表1。
表1 豬舍環境狀態評價標準表Tab. 1 Standard table for evaluation of environmental condition of piggery
對于各個豬舍狀態對應的特征值范圍如表2所示。
表2 各狀態下特征值范圍Tab. 2 Range of characteristic valuein each state
概率分配函數存在難以確定的問題,人為確定有一定的主觀性,也難以具體操作和推廣。引入模糊集中隸屬度函數概念來確定概率分配函數,能夠有效減少人為確定概率分配函數的主觀性[12]。其中模糊正態分布可以獲取更多隸屬度高、有價值的評價信息,并且屏蔽更多隸屬度和評價價值較低的信息,提高評判結果的可信度[12-13]。本文選用模糊集中正態隸屬度函數來確定其概率分配函數。引入正態隸屬度函數
(5)
式中:x——監測的證據特征值;
u——各識別區間識別的平均值,u=(x++x-)/2,其中x+為區間上限,x-為區間下限;
a——待定常量系數,它的大小取值決定隸屬度函數的形狀。
函數分布(圖1),當x=u時,函數的隸屬度取到最大為1,意為完全信任某一環境狀態;x+、x-分別為區間上下限值,當x取到上下限值時,δ為其對應的隸屬度值。
依據式(5)構造各特征值的概率分配函數如下。
對基于正態隸屬度函數得到的隸屬度進行歸一化,得到特征值基于識別框架的基本概率分配
m(As)=m*(As)/∑m*(As)
(6)
式中:m*(As)——特征值對應的正態隸屬度函數值。
圖1 正態隸屬度函數分布圖
證據理論合成要求各個證據間相互獨立或者證據間沖突較低,對于沖突值較小的證據源,D-S組合規則可以達到較好的融合效果,但是對于沖突較大或者完全對立的命題,傳統的D-S證據理論就無法正確得到融合結果[14]。
本文對各個概率分配函數分配權重系數,對低信度的證據源分配較小的權重系數,以削減它在證據合成過程中的沖突,保證證據融合結果的有效性和一致性。
假設m1和m2是兩個概率分配函數,由式(7)可求出改進的K-L距離[15]
(7)
式中:l——識別框架焦元個數;
α——趨于零的很小定值常數。
由K-L距離得到證據間距離為:D(m1,m2)=d(m1,m2)+d(m2,m1)。
得出的證據間距離再經過式(8)~式(10)得到對各個證據的質疑程度,最終由式(11)求出權重系數。
(8)
(9)
(10)
Wi=Vc/Vi
(11)
式中:ε(mi)——證據的概率分配函數mi與其他證據沖突之和,衡量單個證據沖突程度;
Vi——證據mi的質疑度,取值越大則質疑度越高,相對應的置信度越低;
Vc——質疑度最小證據,稱為融合系統的中心證據,是所有證據的一致性的體現;
Wi——概率分配函數mi的權重系數。
由式(11)可得出各個證據的權重系數Wi,組合起來有W={W1,W2,…,Wn},表示證據在合成中的重要程度。加權將權重系數和概率分配函數結合,再對新的概率函數進行歸一化,將其他部分分配給不確定集合[16]。
(12)
(13)
由上述可知,加權后的新概率分配函數必然有一項m′(H)=0,再采用原來的D-S證據理論(式(2))導致最終融合結果m′(H)=0,使得融合信息丟失。對此改進D-S證據合成規則,將融合的沖突部分平均分配到各個焦元。
(14)
(15)
為了降低融合過程中的計算量,對于n個證據采用分布式融合機制,應用改進的D-S合成規則對證據m進行迭代融合n-1次后即可得到最終的融合結果。分布式證據合成模型如圖2所示。
圖2 分布式證據合成模型
試驗在武漢市某種公豬舍展開,整個豬舍采用縱向通風結構,布局為一走道兩側豬欄,設有風機、除臭濕簾、降溫濕簾、采暖裝置、小窗等。通過豬舍環境控制器實時監測環境參數,包括有溫度、濕度、NH3濃度、H2S濃度。豬舍環境參數采集時間為2020年10月20日的下午16:00,通過環控器各個傳感器監測溫度、濕度、NH3濃度、H2S濃度如表3所示。
表3 豬舍環境參數Tab. 3 Environmental parameters of piggery environment
按照前文所述方法,用正態隸屬度函數對監測的特征值進行處理,其中設定取臨界點對應的隸屬度值δ=0.45,K-L距離常量α=0.01。基于上述參數,由式(5)正態隸屬度函數臨界點處對應的隸屬度取值δ,對于溫度、濕度、NH3濃度、H2S濃度對應正態隸屬度函數的待定系數常量a如表4所示。
表4 待定系數常量aTab. 4 Undetermined coefficient constants a
由此得到各個證據的概率分配函數并進行歸一化(式6),結果如表5所示。
表5 基于正態隸屬度函數的概率分配函數Tab. 5 Probability distribution function based on normal membership function
為解決融合沖突問題,由K-L距離式(7),算出證據間距離,將其組合成矩陣
(16)
根據式(8)~式(11)由證據間距離計算證據質疑度,進而得到各個證據相應的權重系數如表6所示。
表6 證據權重系數Tab. 6 Weight coefficient of evidence
根據式(12)~式(13),經權重系數加權后的概率分配函數如表7所示。
表7 加權后的概率分配函數Tab. 7 Weighted probability distribution function
最后,根據式(14)、式(15)分別對四個證據進行分布式融合3次,得出結果如表8所示。結果表明,D-S證據理論融合輸出最高為0.629 3(狀態Ⅲ),相比于下一項的0.119 8(狀態Ⅱ)差值為0.509 5,識別效果顯著,識別結果與專家評判豬舍環境相符合。判斷豬舍環境為狀態Ⅲ:正常狀態,豬舍內正常通風即可。
表8 D-S證據理論融合結果Tab. 8 Fusion results of D-S evidence theory
本文設計基于D-S證據理論的豬舍環境識別,有效地綜合各個傳感器監測的數據,避免了單個傳感器的局限性,對豬舍環境狀態進行較為直觀與精確的判斷,由此可通過環控設備的干預實現豬舍環境穩定平衡的狀態。識別系統采用正態隸屬度函數分配基本概率函數具有普適性和可推廣性,引入K-L證據距離分配權重保證了證據內涵特征的一致性,最后用 D-S 理論全局融合各類傳感器得到融合結果。結果表明,D-S證據理論融合輸出最高為0.629 3(狀態Ⅲ),相比于下一項的0.119 8(狀態Ⅱ)差值為0.509 5,識別效果顯著。結果符合理論預期,具有較高的實際應用價值。