閆文惠 景菊紅
(河南財經政法大學 河南 鄭州 450000)
大學生消費水平的研究
——以河南某大學為例
閆文惠 景菊紅
(河南財經政法大學 河南 鄭州 450000)
本文通過對高校在校學生的調查問卷,運用Eviews和EXCEL軟件對樣本數據處理,建立多元回歸模型得到初步的估計模型,在對異方差修正之后得到較優良的回歸模型.但是本文為了更好的研究該問題,通過神經網絡模型得到了自變量對因變量的影響程度,還考慮了自變量之間的交叉作用對被解釋變量的影響。
消費水平;多元線性回歸;異方差;神經網絡
本文以高校學生生活現狀和學生關心的消費水平為基點設計問卷調查,著重研究大學生消費行為及影響大學生消費水平的因素的相關問題,并據此提出幫助大學生樹立合理的消費價值觀的建議其中針對個人因素設計的問題包括:性別、年級以及大學生的消費習慣對消費氛圍的感知;針對家庭的因素包括:戶口所在地,家庭的年收入水平以及家庭中子女的個數等.另外被調查者的消費行為包括了餐飲與衣著、學習與娛樂消費等,多種消費來源包括家庭、助學金、兼職等.問卷設計的第一部分主要是為了方便研究大學生的性別與年齡是否與消費水平有關.第二部分則是為了研究家庭因素對其消費的影響.
本文采用分層隨機抽樣的方法,該研究采取匿名方式,在各棟教學樓和大一到大四宿舍樓都隨機發放問卷,讓被調查者當場作答并要求他們按照自己的真實情況填寫以便調查的真實性,最后對調查問卷的整理,剔除無效問卷.
大學生的消費水平是他們在本月的總支出額.在調查人員中,消費水平在100元以內的占比43.6%;而1000-1500的占比41.9%;月消費水平在1500以上的占比14.5%。其中在總的消費支出以及食品和娛樂方面的支出,男生比女生要高,而在衣著及學習方面,女生的消費水平要比男生高;而各年級在總的消費支出以及食品和娛樂還有學習方面的消費水平都相差很少;家庭年均收入提高,學生的衣著與娛樂支出在不斷提高,但餐飲和學習方面的消費增長卻不明顯;此外,戶口所在地影響消費來源,其中非城鎮的大學生消費來源主要是助學貸款、助學金與勤工儉學,而城鎮戶口的學生主要是從父母那里獲取收入來源.而且消費支出的側重點也有區別.
(一)構建模型
根據通過描述性統計分析,進一步將性別、家庭、月收入等影響消費水平的因素建立多元回歸模型:
Y=β0+β1X1+β2X2+β3X3+μ
(4.1.1)
總體回歸方程即Y的期望值與X1、X2、X3之間線性關系的方程是:
E(Y)=β0+β1X1+β2X2+β3X3
(4.1.2)
其中參數β0,β1,β2,β3的估計值是利用最小二乘法得到的,目的是尋求
化簡整理后得到
寫成矩陣形式:
(4.1.3)
(二)模型的實施
上述過程利用Eviews進行實施,模型估計的結果為:
Y=839.7553+0.36334X1-283.4525X2-237.2235X3
(4.2.1)
本文分別進行了不含交叉項與含交叉項的White異方差檢驗.以確定該回歸模型檢驗其是否滿足同方差、隨機誤差項正態性等條件.若不滿足,還需進一步改進估計方法,以避免得出錯誤結論.
懷特檢驗的思想是以Yi=β0+β1X1i+β2X2i+β3X3i+μi模型中的平方序列為被解釋變量建立
這樣的回歸方程,然后看它的統計檢驗模型是否顯著來判斷異方差.不論是含不含交叉項的懷特異方差檢驗均未通過,p值均小于顯著性水平,說明殘差存在明顯的異方差.
1.異方差的修正
為克服異方差,對原模型進行某種變換,其得到的模型滿足最小二乘法的條件.因此考慮用加權二乘法對(3.6)式的模型進行異方差修正.以加權最小二乘法的思想在(3.6)模型兩邊同乘加權序列,即殘差μi絕對值的倒數.估計后新得到的參數模型:
Y=846.1855+0.3603X1-285.9557X2-236.6340X3
R2=0.98968,這說明該模型對樣本的擬合度非常好,
與上述異方差的檢驗相對應,本節也從不含交叉項與含交叉項的White檢驗出發,觀察修正后的模型是否仍存在異方差,兩個結果所得到的F檢驗的p值均大于0.05,說明修正后的模型不存在異方差.
2.多重共線性檢驗
多重共線性是指在回歸模型中解釋變量自身存在慣性,或者說是解釋變量中含有一些滯后值在模型中也被使用,從而導致多重共線性的存在.多重共線性的存在會導致參數的最小二乘估計量不確定,甚至標準差為無窮大,所以為保證參數估計值的準確性,本文利用eviews,做的多重共線性檢驗由差擴大因子:
說明該模型不存在多重共線性.
(三)神經網絡神經網絡包含輸入、隱含還有輸出層,它以人工神經元為基本元素的,能夠處理包含虛擬變量類型的數據,而且可以作為預測器和分類器使用.由它的預測作用,不僅可以得到了自變量的重要程度,也可以得到相應的預測圖.利用了他的分類器的分類作用,可以考慮各因素之間的交叉作用大小.記X1…Xn為輸入信號,Wij表示閥值,它表示從神經元j到神經元i的連接權值,神經元i的輸入輸出關系是:
其中yi表示神經元i的輸出,函數f為轉移函數,net為凈激活函數.以X表示輸入向量,W為權重向量,即:X=[x0,x1,…xn],W=[wi0,wi1,…win]Τ,則神經元輸出就可以表示為:neti=XW,yi=f(neti)=f(XW).這種神經元模型是神經網絡的一個處理模型.
1.各因素對消費水平的重要性
在spss中利用隨機數字生成器對數據進行預處理,可以看出收入對大學生消費水平影響最大,重要性占到了51.9%,而家庭和性別對消費水平的影響比較接近,在24%左右.從樣本的觀察預測圖中可以看出大學生的消費水平集中區域在700-1300左右,僅有很少的一部分是高消費和低消費人群.由上述分析可以看出,在影響消費水平的這三個因素中,最重要的是大學生的月收入水平,其次是性別,但是性別與家庭因素對消費水平影響差別較小.另外,從觀察預測圖中可以看到大學生的消費水平絕大部分都在700-1200左右,低消費和高消費的人群所占比例很小.
2.考慮變量間的影響
由于大學生的月收入水平、家庭戶口所在地以及性別對大學生的消費水平影響較大,這三個字變量之間相互作用以后得到的新的因素可能也會對消費水平產生影響,所以本節為進一步考慮家庭和性別之間是否有交叉作用.在SPSS中運用多層感知器類型的神經網絡中,以家庭戶口所在地為因變量,性別為因子,消費和收入作為協變量,考察它們之間的關系.經分析發現以總消費水平的高低判斷學生家庭類型的準確率最高,它們之間的聯系高達55.2%,從另一面驗證了家庭因素對消費水平有影響.而且從表中也看出以性別和收入也可以判斷家庭類型,即它們之間存在一定的交叉作用,但性別和收入的重要性分別為29%和15.7%,說明它們之間的交叉作用比較小,也就是說上節得到的結論比較可靠.
通過上述數據的分析我們發現該高校大學生的每月消費水平和每個月的收入金額之間關系密切,在僅有變量月收入變動而其他變量不變時,說明當大學生的月收入增加一元時,學生的消費水平大概會提高36%。當虛擬變量戶口所在地變動而其他變量不變時,可以看出城鎮戶口的學生比非城鎮戶口的學生消費更高,當解釋變量性別不同而其他變量不變時,可以看出女生的消費水平要比男生低.
根據調查結果和統計分析,發現大學生的消費行為具有以下特點:
1.消費內容多元化,大學生的消費支出不僅包括飲食、服裝、日用品等電子用品和娛樂方面大的消費支出也很大,尤其是在高消費學生群體中,這兩方面占比更高,因此對于家長來說,要幫助孩子樹立正確的消費觀念和理財觀,減少不必要的消費。
2.大學生的學習環境以及餐飲等生活條件都不斷優化.大學生跟隨時代進步最貼近的先行者,也是時尚消費的引領者,當前大學生的消費受多元化的消費來源與消費支出等因素的影響.所以研究大學生的消費行為,從中發現弊端并找到其原因對提高大學生的自制力有很大幫助.
3.消費個性化.在調查中我們發現各種新型的支付方式在大學校園中備受推崇,如刷卡支付,螞蟻花唄等,他們通過追求個性新潮的消費方式來追求個人品味,引起別人的關注,這是值得關注的問題。而且電子支付方式、信用支付方式等新科技的日新月異使大學生的消費領域擴大,使他們的消費習慣有所變化,“借貸寶”與信用支付等只是作為現在對未來的提前預支而已,這些都加快加深了大學生的不合理消費.
[2]高惠璇.處理多元線性回歸中自變量共線性的幾種方法[J].數理統計與理,2000,20(5):50.
[3]彭芬.影響大學生消費行為的因素探析——以中央民族大學為例[D].中央民族大學,2009.
[4]王迎春.大學生消費狀況的調查與思考[J].長沙航空職業技術學報,2011(6):12-15.
[5]張曉峒.計量經濟學基礎[M].南開大學出版社,2005.
[6]Engel J F.Blackwell R D,Minard P W.ConsumerBehavior[M].New York:The Dryden Press,1995,4:18.
閆文惠(1994.08-),女,漢族,河南周口人,碩士研究生,就讀于河南財經政法大學,研究方向:應用統計;景菊紅(1991.10-),女,漢族,河南焦作人,碩士研究生,就讀于河南財經政法大學,研究方向:應用統計。