張昌爽
(重慶大學資源與安全學院,重慶 400044)
工傷事故灰色預測模型展現工傷事故時間狀態序列數據及其相應變化總體波動趨勢。建立灰色馬爾可夫預測模型,用馬爾可夫預測法確定未來狀態轉移規律,馬爾可夫灰色預測具備顯著優勢。馬爾可夫鏈為狀態可列、時間齊次馬爾可夫過程[1-3]。
由有序聚類法構造工傷人數分級標準,構建馬爾可夫鏈狀態指標值分級空間,確定各時段指標所對應狀態[4-6]。變量x1,x2,x3歸類為{xi,…,xj},j≥i,定義均值向量:

式中,D(i,j)為量化變量段內部各變量間的差異值,以徑向值{xi,…,xj}(j≥i)進行確定;徑向量數值越小,表示區間向量差異越小,彼此越接近。
將n個變量序列分為K類,分類誤差函數如下:

式中,k未知分類數,計算k=1,2,…,n所有最佳分割。
誤差函數e[P(n,k)]通過線性規劃,對應最優分類標準通過在min{e[P(n,k)]}中得以確定,確定分類數K變化趨勢,作出誤差函數e[P(n,k)]與K的關系圖,函數曲線拐點對應的K值為最優分類數。
轉移概率以{x1,x2,…,xn}定義馬爾可夫鏈指標序列,包含m個狀態,指標值序列從狀態i經過1步轉移到達狀態j的頻數以fij表示,i,j∈E,轉移步長是1個時間單位,2個甚至m個時間單位。

式中,fij為轉移頻數矩陣(fij)組成單元,轉移頻數矩陣的第i行第j列元素fij除以對應各行的單元值總和所得,表示為Pij,i,j∈E。
用χ2統計量檢驗離散型序列隨機變量。M表示隨機變量指標值序列存在的演變狀態,fij為指標值序列{x1,x2,…,xn}從狀態i經過1步轉移到達狀態j的頻數值,i,j∈E。

式中,p.j為邊際概率,轉移頻數矩陣第j列之和除以矩陣所有行和列總和。
當n的基數足夠大,統計量驗證指標:

式中,pij為轉移概率。
在顯著性水平a,服從自由度(m-1)2的χ2分布,查表得分位點的客觀數值,計算后得研究指標統計量χ2值。若,則xi符合馬氏性檢驗標準,否則該數據序列不適用于馬爾可夫鏈來預測。
自相關系數rk,k∈e;rk為第k階(滯時為k季度)自相關系數;xl為第l 季度工傷人數;x季度平均受傷人數均值;n季度平均受傷人數序列長度。

式中,rk為各階自相關系數。
規范各階自相關系數,即:

式中,wk步長馬爾可夫鏈權重;m預測最大階數。

以狀態特征值法、線性插值法予以推斷,將預測數據加入原矩陣序列之中,重復上述步驟。

式中,μ為狀態特征值。
其中,i≤μ<i+1,β>0為狀態調整因子,狀態區間下限為,上限為,預測指標值通過上下限兩類算法,結果一致。

式中,x為指標預測值;k=0,狀態值增加與指標值一致;否則,k=1。
非零向量πj={π1,π2,…,πE},使得πjPij=πj,其中Pij為狀態轉移概率矩陣,有πj={π1,π2,…,πE}為馬爾可夫鏈平穩分布,處于平穩狀態。當存在m>0,pm中諸元素皆非負非零,則p為正規概率矩陣。
以2010年1季度至2019年第二季度共38季度工傷人數預測2019年3季度的受傷人數,將2019年3季度實際預測數據加入序列模型中,預測2019年4季度受傷人數,并與社保局實際備案的工傷人數對比,驗證預測效果。
用有序聚類法將序列分5個人數區間比較,工傷人數等級標準以1~5表示,狀態依次由低到高(見表1)。

表1 工傷人數狀態劃分表
2010年1 季度至2019年第4季度共40個季度某企業工傷事故人數序列作馬氏性檢驗。每季度工傷人數頻數轉移矩陣(fij)5×5、步長為1的1步轉移概率矩陣(pij)5×5如下:

由(fij)5×5及(pij)5×5得邊際概率、統計量χ2值(見表2、表3):

表2 邊際概率

表3 統計量χ2計算表
計算χ2為54.5556,在顯著性水平a=0.05下,查表得分位點由于因此工傷人數序列滿足馬氏性檢驗。
2010 年1 季度至2019 年第二季度共38 季度工傷數據,受傷人數序列各階自相關系數為:r1=0.8633,r2=0.6697,r3=0.4693,r4=0.2874,r5=0.0665。自相關系數歸一平均化,作為各滯時馬爾可夫鏈權重:w1=0.3664,w2=0.2842,w3=0.1992,w4=0.1220,w5=0.0282。
根據2010年1季度至2019年第二季度共38個季度工傷數據,馬爾可夫工傷序列統計得不同滯時轉移概率矩陣:


以2018年第二季度至2019年第二季度共5個季度工傷人數、狀態轉移概率矩陣對2019年第三季度工傷人數進行預測分析(見表4)。

表4 2019年第3季度工傷事故人數預測表
2019 年第三季度實際工傷人數為24 人/季度,由表可知,max(pi,i∈E)=0.5776,i=3,即預測2021年第三季度工傷人數狀態為3,工傷人數x滿足:26≤x<39,預測數值與實際受傷人數相近,預測有效。取調整因子β=1,得狀態特征值μ=3.131。下限法得2019年第三季度工傷人數預測值:
x=+此值與實際相對誤差僅有1.25%,以2010年第1季度至2019年第3季度共39個季度工傷人數序列預測2019年第4季度的工傷狀態,得各階自相關系數、各步長馬爾可夫鏈權重(見表5)。

表5 2010.1-2019.3季度序列各階自相關系數及權重
2010年第一季度至2019年第3季度共39個季度工傷事故受傷人數,不同步長(滯時)轉移概率矩陣:


以2018年3季度至2019年第3季度共5個季度工傷人數預測2019年第4季度的工傷人數,預測見表6。

表6 2019.4季度工傷事故人數預測
2019 年 第4 季 度 實 際 工 傷 人 數 為22 人/ 季 度,max(pi,i∈E)=0.4248,i=2,即預測2019年第4季度工傷人數狀態為2,受傷人數x滿足:13≤x<26,預測結果與實際情況完全一致,預測有效。
取調整因子β=0.95,狀態特征值μ=2.0231。下限法得2019年第4季度人工傷預測值:

此值與實際相對誤差僅有1.36%
此鏈狀態關聯互通,對任意i,j∈E,i←→j,(i≠j),非周期,故為不可約正常返鏈。設平穩分布為(πj,j∈E):以步長為2的轉移概率矩陣p(2),平穩分布、極限分布、各狀態重現期見表7。

表7 平穩分布、極限分布及各狀態復現期
狀態j的復現期為Tj,其對應概率pj=1/Tj=πj。各狀態的復現期為T1=19.2678(季度),T2=3.8536(季度),T3=2.7525(季度),T4=5.6721(季度),T5=6.2696(季度)。在中長期預測中,企業工傷人數為狀態3的概率最大,平均每2.7525季度重現,復現概率為0.3633;其次復現的為狀態2,每3.8536季度復現1次,概率為0.2595;復現概率最低的為狀態1為0.0519,復現期19.2678季度。
1)加權馬爾可夫模型狀態的復現期T1=19.2678(季度),T2=3.8536(季度),T3=2.7525(季度),T4=5.6721(季度),T5=6.2696(季度)。長期預測中,企業工傷人數狀態3的概率最大,平均每2.7525季度重現,復現概率0.3633;其次復現的為狀態2,每3.8536季度復現1次,概率為0.2595;復現概率最低的為狀態1,為0.0519,復現期19.2678季度。
2)實際應用價值在于以某城市溫室氣體排放序列來預測未來溫室氣體年排放狀況,以某國家煤炭資源消耗量序列來預測未來煤炭年消耗狀況等。