■趙金蘭
本文通過對某單位90位職工的月薪、工作月數和受教育程度的數據信息,以回歸分析方法中的最小二乘法為基礎,以python軟件為工具,比較細致地討論了職工的月薪隨工作月數和受教育程度的變化規律,建立了一元線性回歸、二元線性回歸和多元非線性回歸模型,最后通過分析、比較和驗證,確定了較理想的多元非線性回歸模型,此模型為該單位優化人員結構,適時招聘適崗的從業人員研判提供了遵循和指導。
職工薪金與人員結構有著直接的關聯,事關一個單位運營效率、經營效益。月齡大、經驗豐富以及高學歷者可擔負重要崗位的重要工作,但需要支付的工資成本相對較高;次要崗位、一般性工作選擇使用月齡小經驗尚有欠缺以及學歷較低者,即可保證完成其崗位需要的工作任務,也可節省一定的工資支出。優化配置合理的人員結構,按照成本至上的原則,優化學歷結構和月齡結構,對有效控制運營成本,提高經營效率具有十分重要的意義。針對“追求高學歷、傾向聘用有經驗的老人、培養新人”等不同價值取向的用人思維導向,經過本數學模型的建立,對一個單位選人用人提供了比較科學的清晰的理論依據,根據本單位經濟基礎和發展目標較好地提出適時適崗適職適薪的招聘方案,有效規避不合理擇人思維,也便于決策層執行層統一思想,提高工作效率。
具體假設如下:
1.月薪與工作月數和受教育程度存在相關性;
2.數據的記錄是客觀的。
在建立月薪、工作月數和受教育程度關系之前,符號做如下約定:
X1,X2是自變量,分別表示工作月數和受教育程度;Y是因變量,表示月薪的自然對數,為了描述方便,以下簡稱Y為月薪,其中X2的類型有大學學歷和研究生學歷及以上,是兩分類的定性變量,也稱為啞變量,定性變量進入模型首先要解決的問題是要把文字信息轉化為數字信息,編碼如下:X2=0(表示大學學歷),X2=1(表示研究生學歷及以上)。
在回歸分析中,以一元線性回歸為基礎,然后推廣到二元線性和多元非線性回歸。在以下模型建立的過程中,首先構建一元線性回歸模型,其次是二元線性回歸模型,最后提升到多元非線性回歸模型。
模型一:首先,利用p y t h o n和一元線性回歸探討月薪隨單個因素的變化規律,建立模型為:

對月薪Y與工作月數X1利用參數的最小二乘估計做一元線性回歸,p y t h o n運行結果為:

同樣,對月薪與受教育程度做一元線性回歸,python運行結果為:
β0=7.3451,β1=0.1159,由于R2=0.240,說明模型擬合效果很不理想,,因為,說明月薪與受教育程度沒有明顯的線性關系。
在模型一的討論中,月薪與受教育程度沒有明顯的線性關系,故一元線性回歸模型不能反應月薪與受教育程度之間的關系,說明月薪與多個因素相互關聯,應由多個自變量的最優組合共同來預測或估計因變量將更有效,更切合實際。
模型二:在模型一的基礎上,再利用python和二元線性回歸分析討論月薪與工作月數和受教育程度的關系,建立月薪與工作月數和受教育程度的二元線性回歸模型為:

對月薪與工作月數和受教育程度利用參數的最小二乘估計做二元線性回歸,python運行結果為:

二元線性回歸模型只是我們自己的假定,Y與X1,X2之間是否真的存在線性關系,需要進行整體顯著性檢驗和單個回歸系數檢驗。下面構造F統計量,
來檢驗整體的顯著性。
第一步 提出假設:
原假設:H0:β1=β2=0(Y與X1,X2之間的線性關系不成立,表示X1,X2不需要進入模型,要從模型中去掉)
備著假設:H1:β1≠0或β2≠0(Y與X1或X2之間的線性關系成立,X1或X2需要進入模型)
第二步 選取檢驗統計量:

即在原假設成立(β1=β2=0)時,統計量服從第一自由度為2,第二自由度為87的F分布。
第三步 計算檢驗統計量的實現值及值如下表所示:

方差分析表
其中,均方是平方和除以自由度,F值即為F統計量的實現值,是兩均方的比值。
F=159.1,F的值增加了,且,說明整體的顯著性也有所提高。另外,由python運行結果可知,在單個回歸系數β1和β2的t檢驗中,p的值都等于0,也就是都小于0.05,所以認為X1及X2與Y的線性關系是顯著的,說明回歸方程是顯著的。
為了進一步弄清楚月薪和工作月數之間是否存在著二元關系,對模型二進行修改。
模型三:通過對模型一、模型二不斷深入地討論,添加上自變量X1的平方項,建立一個多元非線性回歸模型為:

在模型三的基礎上分別加上自變量X2的平方項或自變量X1,X2的交叉項X1X2,分別建立一個多元非線性回歸模型,從python運行結果來看,以及的系數對應的p值都大于0.05,且它們系數的置信區間都包含零點,說明職工受教育程度的二次項本身對他們的月薪沒有顯著影響外,還說明職工的工作月數和受教育程度無交互效應。其它參數的p值都小于0.05,且它們置信區間不包含零點。決定系數R2的值幾乎不變,但F=178.8,F的值又有所下降,說明顯著性又降低了。
經過分析對比上述模型可知,模型三:

最理想,表明只有職工的月數及其二次項和受教育程度本身對他們的月薪有顯著影響。研究人員可以根據職工未來的工作月數及受教育程度,對職工未來的月薪進行預測。同時,人事部門可以核算成本,合理引進人才,進一步優化人員結構。
本文通過對某單位90位職工的月薪、工作月數和受教育程度的數據信息,所建模型只能較好的反映單位90位職工的情況,還有更多的提升空間。為了進一步提高模型的準確性和使用性,可以進一步細化受教育程度以及職工崗位級別,建立一個影響因素更多的多元回歸模型。