沈炎軍 劉欣雨 李亞杰
【摘要】抽樣調查是根據隨機的原則從總體中抽取部分實際數據進行調查,根據樣本數據推算總體相應的數量指標的一種統計分析方法,具有經濟性好,實效性強,適應面廣,準確性高等特點。本文在實際問卷調查的基礎上,對抽樣調查中相關性分析、錯誤數據處理和信息數據化做出了幾點建議。
【關鍵詞】問卷設計 相關性分析 錯誤數據處理 信息數據化
【基金項目】項目名稱:北京市共建項目。項目編號:1111045148
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2012)06-0002-02
當今社會,問卷調查是一種了解大眾對具體事件態度的常用手段。一份好的問卷和分析更是能讓調查者準確把握調查對象的真實想法,甚至預測事情的發展趨勢,做出相應的調整。然而,設計問卷和分析調查結果并不是一件簡單的事情。本文就一份某高校對在校學生對《概率論》課程學習的調查為例,對問卷的設計和分析做出幾點建議。
一、相關性分析
相關性分析定義:
在大多數的問卷中,調查者都會有這樣的想法,想找出兩個或兩個以上的事件的內在聯系,然而,由于問卷調查本身的一些特性,這種內在聯系卻很難得到明確的分析。
在問卷中,為了減少浪費調查對象的時間,調查者通過選用A、B、C、D等選項的形式讓被調查者進行選擇。這樣的方式的確利于答題者回答問卷,在概率層面的分析上也較為清晰,可以得到準確的比例數據,從而知道各類態度人群的比重??墒窃谙嚓P性分析的層面上卻失去了這一優點。
接下來讓我們看一個例子,通過對該例子的分析來說明這一問題。
例1:你對大學期間的數學學習的興趣是:
A. 很有興趣B. 有興趣C. 一般 D. 不感興趣
例2:你目前對《概率論》系列課程的學習狀況是:
A. 很困難 B. 有些困難 C. 能夠應付D. 很順利
在實際做出分析之前,先讓我們對二者的關系做出一個估計。很顯然,大多數人都應會認為,對專業的熱愛程度與課程學習的良好程度應該較為明顯的相關性。那么讓我們來用軟件分析一下統計的數據。
下面兩個圖形是用SPSS軟件為例1、例2做出的散點圖(如圖1)和Pearson相關系數(其中factor1、factor2分別表示例1、例2的選項):
通過分析,我們看到事實上相關性結果的分析結論與我們預想的結果大相徑庭。我們主觀判斷具有非常相關的問題得到的Pearson相關系數僅為0.297,相關性較低。而散點圖的分析上,盡管可以大致看出有一個負相關的趨勢,但由于選項的跳躍性太強,很難具有說服力。
在相關性分析上,用相關系數和散點圖分析是很常用的手段,但是在這種情況下卻很難得到理想的結果?;谶@一問題本身,我們發現解決這一現象的根本途徑應該從調查問卷的設置做起。本文提出兩個可以作為參考的解決方案。
(1)細化選項
(2)主觀打分
在問卷答案的設定上,我們不再選取傳統的A、B、C、D四個選項,而是改換成被調查者主觀打分制,我們規定一個比較寬的范圍,由被調查者根據自己的判斷進行打分,這樣一是結果直接通過數據形式反映,省去了調查者將文字信息轉化成數據的工作;二是數據離散程度較之先前較大,無論是散點圖還是相關性分析都會有一個較好的結果。
在之后的數字信息化的分析中,對于選項的設置問題也會繼續有較為深入的說明。
二、錯誤數據處理分析
問卷統計結果的分析是問卷調查過程中極為重要的一個過程,大多數調查者為了調查數據的正確性都會在隨機抽取之前對問卷結果中出現明顯錯誤的數據進行清理。這些清理可以減少因為錄入錯誤、答題者不認真填寫等因素所造成的無用數據的數量,以達到增加調查結果正確性的目的。
在數據的清理中,最常用的是不正常數據的清理,即對于一些明顯異常的數據進行去除。但是,對于調查過程中出現的答題者不認真填寫,敷衍了事的問卷卻很難做出有效的判斷。
為了能有效的解決這一問題,在問卷中通過相似問題或者邏輯一致性問題的設置來判斷答卷者的認真程度。
具體操作是在問卷設計時設計2-3道較為類似的題目,例如下面兩個問題:
例1.你覺得概率論的學習是應試的嗎?請選擇:
A. 完全為了應試
B. 有實際用途,但應試成分多一些
C. 應試和實際用處對半
D. 有應試成分,但實際用途多一點
E. 完全為了實際用途
例2.你覺得概率論學習讓你得到了什么?
A. 僅僅拿到學分而已
B. 主要是拿學分,也學到一些有用的概率知識,請選擇:
C. 學分和有用的概率知識對半
D. 主要學到了概率知識,學分在其次
E. 非常有用的概率知識
仔細閱讀這兩個題目可以很容易的發現,它們表達的意思具有很強的相似性。如果答題者認真作答的話,這兩個問題的選擇答案不會有太大的出入,基本為同一選項或者相鄰選項。那么,我們可以這樣認為,如果一份試卷在這兩個問題的出入較大,那么說明該答題者并沒有認真做答,只是在敷衍了事,那么我們可以認為他做出的其他選項也是不具有參考性的,可將該問卷內容清除。
當然,必須要指出的是,相似問題的選擇一定要謹慎,爭取做到本質內容一致而表述方式不同。若題目太過相似,有可能引起答題者重復做題不耐煩的心態,反之,題目差異較大時則不能達到篩選問卷的作用。同時,相似題目的位置應該根據問卷本身情況安排適當,不要太近以防答題者對比分辨出來,或者位置不佳影響整體試卷的連貫性。
三、信息數字化
在對問卷結果進行分析時,我們常常會簡單地將選項A、B、C、D記為1、2、3、4,但同樣隨之而來的是除了基本的概率分析之外,卻很難對這些數字進行其他的分析,甚至不能做出有效的散點圖。
因此,我們希望所得到的結果以數字的形式出現,同時,這些數字不僅僅是簡單的標號,而是能代表不同的含義,例如,人們對某一事件的喜好、厭惡程度。這樣,只要我們對這些數字進行相應的分析,就可以得到我們想要的結果。
1.加權求平均值法
對于調查多種因素對某一事件的影響時,我們可以選擇通過設定權值,然后加權求均值,用均值來表示影響強弱的程度。
例3:在學習《概率論》系列課程中,你對于下列學習方法認可程度的打分(0表示完全不贊同,10表示完全贊同):
A. 教學效果太差主要需要自學:()
B. 課堂聽講與課后復習、預習相結合:()
C. 主要以課堂認真聽講為主:()
分析:設定A、B、C的權值分別1、3、5,即最終得到的平均值越大則表明答題者越傾向于上課聽講的來學習,反之,則越傾向于自學。
假設本題A、B、C打分分別為1、4、8,則得到最終均值M=(1*1+3*4+5*8)/6≈9.可見加權平均是將各種因素的綜合作用做了適當的放大(或者縮小),使得最主要的因素得到了突出。同時,比起簡單的選擇某項作為學習方式,這樣得到的結果更為綜合,在相關性分析中能更好的體現出各種因素之間的內在關系。
2.細化分值法
雖然加權求平均值法很好地解決了用綜合性的數字代表答題者態度的這一問題,然而,卻也使得調查問卷的題目數量大大增加,影響了答題者的認真程度,尤其在問卷題目較多時,很可能得不償失。
為了彌補這一缺陷,我們可以選用細化分值的方法,讓答題者直接給出代表其態度的數值,這樣的結果雖然沒有加權平均得到的更具綜合性和說服力,但是卻直觀簡練,也可以得到很好的結果。
同以上題為例來簡單說明這一方法的使用。
例4:在學習《概率論》系列課程中,你對于課堂學習和自學兩種方法認可程度的打分:
(完全自學)0-1-2-3-4-5-6-7-8-9-10(完全課堂學習)
分析:這樣的出題方式保留了加權求平均值法將信息數字化的特征,同時減少了題目的數量和答題者的閱讀量,不會引起答題者的不滿情緒,保證了問卷的質量。
但是,要指出的是,在這種方式的問題上題干意思一定要表述清楚,否則答題者因為未能正確理解0-10的含義,將會導致結果的偏差較大。
對于本篇文章中提出的對于問卷的設計和分析的改進方法,都是在實際調查過程中出現的問題,并通過這些方式得到了較好的解決。因此,這些方法針對具體的調查而言具有很強的實用性,可以得到較為理想的結果。