張子雪,蘇 艷
(安徽財經大學 財政與公共管理學院,安徽 蚌埠 233000)
移動端考研產品發展的影響因素探討
張子雪,蘇 艷
(安徽財經大學 財政與公共管理學院,安徽 蚌埠 233000)
本文利用主成分分析法和回歸分析法建立影響移動端考研產品發展因素的數學模型,并對計算得出的分析結果進行推廣.通過分析問卷樣本數據,確定影響移動端考研產品發展的因素,運用SPSS和EVIEWS3.1軟件建立影響移動端考研產品發展主要因素的模型,可以為移動端考研產品在市場中的發展提供參考.
主成分分析法;spss回歸分析;Eviews3.1
影響移動端考研產品發展的因素有考研備考期、每天學習時長、地區、年齡、性別等.因地區、年齡、性別等因素難以量化且其影響也可以體現在考研備考期、每天考研學習的總時長和花費在移動端考研時長上,因此選擇考研備考期、每天考研學習的總時長、花費在移動端考研的時長這三個因素進行定量分析,通過多元線性回歸得到最終方程進行預測.
2.1 名詞解釋
多層次分析法:層次分析法是一種定性和定量相結合的、系統化、層次化的分析方法.
2.2 符號說明

序號 符號 符號說明1 Xi(i=1,2,3,) 表示 i個因素的影響值2 Y 表示被解釋的變量3 βi(i=1,2,3) 表示每個因素的系數4 C 表示與影響因素無關的常量系數
3.1 主成分分析[1]
(1)數據來源及處理:將樣本問卷結果量化處理,以1、2、3、4代替問卷的A、B、C、D選項,進行數據處理,在spss中準備好要處理的數據.
(2)共線性診斷:運用SPSS軟件,首先對變量進行多重共線性診斷,觀察變量之間的相關性.有些變量容忍度小于0.1,所以變量之間存在嚴重的相關性,因此需要做主成分分析.
(3)主成分分析法
運用SPSS軟件,按照公因子的方差,平均每天花費在移動端的考研時長提取為0.683,考研的備考期提取為0.498,每天花費在考研的時長提取為0.522,所以選擇第13項考研備考期、第15項考研學習的時長、第19項花費在移動端考研的時長作為主因子X1、X2、X3,進行回歸分析.
3.2 模型Ⅰ的建立與求解 回歸分析
(1)移動端考驗產品市場穩定.
(2)本文所采集的數據真實可靠且都能夠真實反映各因素的影響.
首先我們將以上的各個因素和被解釋的使用移動端考研產品人數分別用字母代替,以便于書寫和美觀.設X1—考研備考期(月)、X2—每天考研學習總時長(小時)、X3—花費在移動端考研時長(小時);Y—使用移動端考研產品的人數;虛擬變量D1—男為0,女為1.第一個模型:通過整理附件中的數據得出各個年齡階段的數據如下:

數據來源:由問卷數據計算得出
建立影響移動端考驗產品因素的函數模型:

3.3 模型回歸結果
根據表1.1給出的數據,利用Eviews3.1軟件對(式1)所設定的模型進行分析結果如下:
3.4 回歸結果的檢驗及修正
1.經濟意義檢驗:從上述回歸結果看,X1、X2、X3參數符號為正,表明考研備考期、每天考研學習總時長、花費在移動端考研時長與使用移動端考研產品的人數變化趨勢相同,符合經濟意義.
2.統計檢驗:R^2=1.0000說明方程總體擬合較好. F=33114.91>F0.05(8,5)=3.69,說明使用移動端考研產品的人數與上述解釋變量間總體線性關系顯著.

Variable Coeffici Std.Err t-Statistic Prob. C 6.298189 7.099956 0.887074 0.5381 X1 0.059290 0.0111215.331254 0.1180 X2 0.035901 0.025998 1.380885 0.3990 X3 0.195678 0.171130 1.143441 0.4575 X1*D1 -0.00628 0.031376-0.200146 0.8742 X2*D1 0.019549 0.0666450.293333 0.8184 X3*D1 -0.01312 0.513716-0.025540 0.9837 R-squared 1.0000 F-statistic 33114.91 DW 2.981136 Prob (F-statisti)0.004206
3.根據T統計量概率值大于0.05的顯著性水平,也大于0.1的顯著性水平,得到結論,接收原假設,認為X1D1、X2D1、X3D1的回歸系數顯著地等于0,即α=a2-a1=0,β= b2-b1=0,這表明男性和女性使用移動端考研產品的人數不存在顯著性差異,因此可以將男性和女性的數據合并一個樣本,估計使用移動端考研產品混合樣本數據估計移動端考研產品的使用人數.

Variable Coeffici Std.Err t-Statist Prob. C 3.867944 12.73544 0.303715 0.7765 X1 0.017348 0.013054 1.328922 0.2546 X2 -0.02771 0.021509 -1.288383 0.2671 X3 0.815919 0.107266 7.606487 0.0016
混合樣本數據結果與男性和女性的樣本數據估計結果比較,發現使用混合樣本數據明顯降低了系統估計誤差.

以第一個模型為基礎,進行模型修正.
3.5 模型的修正
因為可決系數近似1,所以模型可能存在嚴重的多重共線性,采用逐步回歸法消除多重共線性.
第一步:

1、對模型進行多重共線性檢驗,由上表可以看出,解釋變量之間相關系數至少為0.997937大于0.8,表明模型存在嚴重的多重共線性.
2、分別做出Y與X1,X2,X3間的回歸,發現Y與X3擬合得最好.(在附錄中給出了回歸的具體過程,在這里只說明結果.)因此,使用移動端考研產品的人數與花費在移動端考研時長的影響最大,與經驗相符,選擇Y=-1.64450796+ 0.7715484715*X3為初始回歸模型.
第二步:
將其他解釋變量分別導入上述初始回歸模型,尋找最佳回歸方程,如下表.

方程 X3 X1 X2 R2 Y=f(x3) 0.7715 (167.4194) 0.999750 Y=f(x3,x1) 0.7104 (9.6387) 0.0106 (0.8313) 0.999737 Y=f(x3,x2) 0.8561 (7.7462) -0.0162(-0.7658) 0.999732 Y=f(x3,x2,X1) 0.8159 (7.6065) 0.0173 (1.3289) -0.0277 (-1.2884) 0.999767
在初步模型中引入X1,模型擬合優度降低,參數符號合理,變量沒有通過t檢驗,剔除;t0.025(8-2-1)=2.571;引入X2,擬合優度降低,參數符號合理,變量未通過t檢驗,剔除;t0.025(8-2-1)=2.571;引入X2、X1,擬合優度提高,但參數符號不合理,變量未通過t檢驗,剔除;t0.025(8-2-1)=2.571,只有Y=f(x3)滿足條件.
所以最后擬合結果:
(1)引入杜賓瓦特森D.W.判斷自相關標準:若0<D.W.<dl.則存在正自相關;若dl<D.W.<du,則不能確定;若du<D. W.<4-du,則無自相關;若4-du<D.W.<4-dl,則不能確定;若4-dl<D.W<4,則存在負自相關.du,dl的值查表可得查K=2,n=8,的D.W.表可得,dl=0.763.du=1.332,而現在模型D.W= 1.464364,落入不存在自相關的區域,即,前一期的變量對后一期沒有影響.
(2)利用懷特檢驗檢驗異方差nR^2=1.0894,查自由度為1的χ分布,值為3.841461.464364<3.84146,落入接受域,即X1不存在異方差.
所以最優模型為:Y=-1.64450796+0.7715484715*X33.6 模型結果的分析及預測
首先分別對X3的值進行預測,分別建立X3對年齡的回歸

2015年的X1=189.2748,f發現擬合程度很好,則可計算得18歲以下和25歲以上使用移動端考研產品的人數驟減.由此可知,使用移動端考研產品的人數主要集中在18到25歲,而且影響移動端考研產品發展的主要因素為花費在移動端考研產品的時長.
〔1〕趙利,潘志遠,王東霞.勞動就業影響因素的實證研究—基于主成分分析法和VAR模型的分析 [J].宏觀經濟研究,2014(5).
O213
A
1673-260X(2017)08-0003-02
2017-05-14