摘要:使用spss23.0對調查問卷進行數據分析的研究包括變量的定義、數據的錄入和數據的分析的步驟和具體操作方法進行了比較詳細的分析。
關鍵詞:SPSS;頻率分析;數據
中圖分類號:F2
問卷調查法是廣泛應用的科研手段,運用問卷調查法可以清楚明了的獲得想要的數據,從而得到真實的信息,在對數據進行統計分析的過程中,運用SPSS對數據進行處理,從而為項目順利完成提供科學基礎。調查問卷的設計中以選擇題和填空題為主,在實際應用中,對調查問卷進行頻率分析是數據處理常用的分析手段。
1、變量的定義
定義變量是用SPSS進行數據分析的第一步,打開SPSS23.0,會看到類似于EXCEL的界面,在界面的左下方有數據視圖和變量視圖兩個按鈕,用鼠標單擊變量視圖就可以看到一個最上面一行從左到右依次是(變量)“名稱”“類型”“寬度”“小數位數”“標簽”“值”“缺失”“列”“對齊”“測量”“角色”的按鈕,這個界面就是進行變量定義的界面。在SPSS中,調查問卷中的每一個問題作為一個變量進行分析,這樣問卷有多少問題就有多少變量,變量名是給每一個變量賦予的名字,比如調查問卷的第一題,變量名稱可以為P1或者Q1,相應的調查問卷的第二題就是P2或者Q2,變量類型?!白兞款愋汀卑〝底帧⒍禾?、點、科學記數法等,一般調查問卷的類型都是數字型?!白兞繉挾取钡亩x是根據變量視圖里面“值”的大小來定義的,為了便于說明,我們以某個問卷的問題來進行說明,此題為:您2015年家庭人均純收入為( )元,如果被調查對象填的是2400元,那么變量寬度就是4,如果填的是240元,那么變量寬度就是3?!靶滴粩怠敝傅氖恰爸怠钡木唧w數值包括不包括小數位數,上面的例子中,小數位數就為0?!皹撕灐敝傅氖钦{查問卷中每一道題的題干,比如前面的例子,變量的“標簽”就是“您2015年家庭人均純收入為”?!爸怠睂τ谏厦胬又械奶羁疹},在賦值的時候選擇“無”。對于單項選擇題,我們以例子來說明“您家庭的主要收入來源( )A 畜牧業 B 各類政府補貼 C 務工收入 ”對于這道題,我們給選擇項進行賦值,比如用1=“畜牧業”、2=“各類政府補貼”、3=“務工收入”。對于多項選擇題,我們依舊舉例子來說明“您家庭的主要致貧原因( )多選題
A 缺技術 B缺資金 C 缺勞力 D 家庭成員殘疾重病
E 贍養老人或者撫養未成年人壓力 F 草場退化嚴重 G 牲畜少 H 缺土地”
對于多選題,定義的方法主要有二分法和多重分類法,二分法指的是把多選題的每一個選項定義為一個變量,每一個變量值都定義成——“1”代表選中,“0”代表未選中,多重分類法指的是事先定義錄入的數值,因為二分法在實際中應用最廣,在本文中,我們定義多項選擇題時以二分法進行介紹。我們首先在變量名稱中就跟填空題和單選題不一樣,對于這道題,假設是調查問卷的第10題,如果是單選題,變量名稱是P10,因為是多選題,變量名稱就不能這么定義,因為這道題有8個選擇項,所以對于這道多選題的變量名稱就包括8個變量,從“P10_1、P10_2……P10_8”,在給變量賦值時,要分別給8個變量賦值,這八個變量,在定義變量時“值”都是0=“未選”、1=“選中”。相應的標簽是每個選擇項,比如P10_1這個變量的標簽是“P10_1,缺技術”,相應的變量P10_2的標簽是“P10_2,缺資金”。“缺失”在賦值時,直接定義為“無”。 “列”指的是輸入變量的顯示寬度,默認為8,用默認值即可?!皩R”指的是輸入值在單元格的對齊方式,一般選擇左對齊?!皽y量”包括標度、有序、名義三個選擇項,填空題填入具體數值的就選擇“標度”,選擇題就選擇“名義”。角色一般選擇“輸入”即可。調查問卷中的變量賦值后如下圖所示:(注:在變量視圖頁面)
2、數據錄入
變量定義完,要做的就是把調查問卷里面的數據錄入SPSS文件里,錄入數據的方法主要有兩種,一種是先把調查問卷的數據錄入比如EXCEL文件里面,然后從EXCEL文件里面把數據導入SPSS文件里面,另外一種是直接在SPSS文件里面把調查問卷的數據錄入,本文介紹的是后一種。要直接錄入數據,首先打開變量定義好的數據文件,點擊SPSS數據文件里面左下角的數據視圖頁面,你會看到你之前定義好的變量。其中,數據視圖里面的每一列代表一個變量,每一行代表一份調查問卷,為了說明問題,假設這次調查問卷一共有9份,為了更好說明這個問題,如下圖所示:(注:在數據視圖頁面)
從這個圖上可以看出,對于問題“您2015年家庭人均純收入為( )元”這樣的題型,直接錄入相應的數據即可,如2400元。對于多選題,從圖中可以看出,第一份調查問卷的被調查對象選擇的“ABDEHI”,因為根據之前的定義,對于多選題下面的多個選項,根據之前對這個變量的定義,如果選擇了這個選項,錄入“1”,未選擇錄入“0”。對于單選題,根據之前對變量的定義,每個被調查對象都選擇了“A”,所以錄入的時候錄入“1”,如果某一個被調查對象,選擇的是“C”,那么錄入的時候應該錄入“3”。
3、對數據進行頻率分析
頻率分析主要通過頻數分布表、條形圖和直方圖,以及集中趨勢和離散趨勢的各種統計量來描述數據的分布特征,以便我們對數據的分布特征形成初步的認識,才能發現隱含在數據背后的信息。頻率分析主要包括分類變量的頻率分析和連續變量的頻率分析。而就具體的調查問卷而言,分類變量的分析主要指的是單選題和多選題的分析。而連續變量的頻率分析主要指的是對填數值類型的填空題進行分析。我們還用上面的例子分別進行介紹。
3.1 對連續變量的頻率分析
我們還以“2015年家庭人均可支配收入[P9]”這個變量為例進行介紹,首先打開之前錄入的數據文件,進入“數據視圖”頁面,單擊【分析】菜單,選擇菜單欄中【描述統計】菜單,然后選擇【描述統計】菜單中的【頻率】菜單,將“2015年家庭人均純收入[P9]”這個變量移入右邊的變量框里。然后單擊變量框右邊的“統計”按鈕,然后對彈出的統計對話框進行設置,設置完成之后,單擊【繼續】,在彈出的【頻率】對話框中單擊【圖表】按鈕,在彈出的頻率:圖表對話框中的圖表類型里勾選【直方圖】和在直方圖中顯示【正態曲線】這兩項,因為是連續數據,所以勾選直方圖,如果要了解這些數據的機構,就勾選餅圖。然后單擊【繼續】回到頻率對話框,因為我們要分析的是數據的離散趨勢和集中趨勢,所以我們要把【顯示頻率表】勾選掉,然后單擊【確定】,就完成了。
3.2 對分類變量進行頻率分析
對調查問卷的分類變量而言,主要指的是問卷中的單選題和多選題,我們分別舉例進行介紹。單選題我們還是以“您家庭的主要收入來源,P10”為例進行介紹。首先還是打開之前錄入的SPSS數據文件,進入數據視圖頁面,選擇【分析】菜單欄里的【描述統計】,然后單擊【描述統計】菜單欄里的【頻率】,就會出現頻率對話框,把“您家庭的主要收入來源,P11”移入右邊的變量框里。單擊【確定】按鈕,輸出結果就會出現。對于多選題的頻率分析,我們還是以“您家庭的主要致貧原因( )多選題
A 缺技術 B缺資金 C 缺勞力 D 家庭成員殘疾重病 E 贍養老人或者撫養未成年人壓力 F 草場退化嚴重 G 牲畜少 H 缺土地”為例進行分析,首先進入數據視圖頁面,單擊【分析】按鈕,然后單擊【分析】菜單欄里的【定制表】,然后單擊【定制表】菜單欄里面的【定制表】按鈕,進入定制表對話框,同時選定P10_1到P10_8變量,然后把這些變量一起拖動到右側的【行】區域上,等到【行】區域出現紅色方框后,松開鼠標,就完成了拖動,然后右邊的框里就出現了這些變量。單擊【定義】下面的【摘要統計】按鈕,就出現了摘要統計對話框,把【統計】按鈕下面的“未加權計數”、“列數”、“有效列數”移到【顯示】按鈕下面的框里,單擊“摘要統計”對話框里面的【應用于所選項】按鈕,單擊【確定】按鈕,就出現了如下的輸出結果:
這樣就完成了多選題的數據分析。即完成了對分類變量的頻率分析。
作者簡介:趙曉娜,青海師范大學經管學院副教授,青海師范大學生地學院在讀博士,研究方向為區域經濟、區域金融。