【摘要】隨著信息技術的發展,教育調查和統計的方法必然得以優化和改進,我們才能集中更多精力致力于關鍵問題的研究。由于教育研究自身的特點,如學生組織性強,學校的分層結構,調查對象的單一性,豐富的校內資源等,我們可以更好地利用信息技術,設計適合研究教育現象和規律的技術路線。
【關鍵詞】信息技術環境,教育調查和統計,技術路線
【中圖分類號】G465 【文獻標識碼】B【論文編號】1009—8097(2006)02—0011—03
教育問題的研究少不了客觀調查和科學統計的方法。將調查和統計無縫鏈接是保證其得以順利進行及其結果客觀科學的關鍵所在。在信息時代,將信息技術用于教育調查和統計是必然的趨勢。信息技術環境下的教育調查和統計方法,既有別于傳統的教育調查和統計方法,也有別于信息技術環境下其它領域的調查和統計方法。信息技術環境下的教育調查和統計方法既帶有教育技術的烙印,同時也因教育問題自身的規定性而具有其獨特性。
一、信息技術環境下的調查和統計
信息技術的蓬勃發展,研究社會問題的調查和統計方法也應隨之得以優化和改進(或稱之為“革命”)。將信息技術應用到這門成熟、嚴謹的學科上,它就會呈現出前所未有的活力,而且仍不失其原有的嚴謹性。更重要的是人們可以利用這些信息工具從大量的體力勞動中(比如分發問卷、錄入數據等)解放出來,節約更多的資源,科學地接近事實。
在信息技術環境下,人們可以根據設計好的問卷,利用數據庫技術(如Access,VFP,Oracle等),建立完備的數據收集“倉庫”。然后利用動態網頁設計技術(如ASP,JSP,PHP等),設計出收集信息的“數據自動接收器”,即Web服務器應用程序,并安裝在服務器上,繼而按抽樣方案,通過Internet “高速公路”快速地將數據收集到“倉庫”中。再通過統計分析軟件(如SPSS,SAS等)將“倉庫”中的數據快速組織、整理并進行分析(分析過程避免了大量面向公式、耗時的人工計算)。最后利用計算機辦公軟件寫出報告并打印輸出。整個過程簡化成圖1所示。
在問題研究的技術路線上,調查和統計本是一個系統的連貫的步驟。但為了便于作更明了地闡述,本文還是將所涉及的過程抽象為兩步:一是針對所量化的教育問題進行數據收集,即教育調查,二是針對教育調查所搜集的數據進行整理分析,即教育統計。本文主要著重于信息技術對教育調查和統計的實現上,并不太多涉及教育調查和統計的相關理論。另外本文所涉及方法主要適用于信息技術環境較好的地區。
二、信息技術環境下的教育調查
教育調查是指在沒有預定因子、不施行控制的條件下,對現成的教育方面有關客觀事實所進行的觀察和分析[1]。
教育問題量化后,我們就可以通過數據系統(如Access、Oracle等)創建庫和表,然后根據設計好的紙上問卷,利用Web服務器網頁技術(ASP、JSP等)編寫電子問卷并安裝到指定的服務器上,即可在B/S模式下進行問卷調查。
信息技術環境下的調查普遍被稱為網絡調查。與傳統問卷調查相比,網絡調查明顯具有以下幾個優點:第一,組織簡單,費用低廉[2]。無須印發問卷,無須派出大量調查人員,可以實現無紙化調查;第二,效率高。無須錄入人員重新錄入和手動計算,數據直接從服務器上下載,可以不受空間、時間和天氣的限制;第三,客觀性高[2]。首先數據是直接由被調查對象直接錄入到數據庫中的,中間省略了傳統由統計人員重新錄入整理的工序,從而減少了出錯的概率。另外,被調查人是在完全獨立思考環境下接受調查(一人一機),不會受到調查人員及其他外在因素的誤導和干預。第四,廣泛性。可以利用校園網和因特網實現廣泛的跨地區的多層次隨機調查,這是傳統問卷調查很難實現的。廣泛性也可增強其客觀性。
當然,網絡調查也有著自身缺點:一是調查結果真實性較差[3]。比如,缺乏交流與溝通造成調查對象隨意填寫或誤解原意;缺少必要的宣傳造成調查對象不愿填寫真實身份(不利于跟蹤調查);二是調查樣本代表性差[2],不利于分層抽樣。調查者往往集中在有條件上網的人群,特別是男性、教育水平較高、有相關技術、較年輕和收入較高的人群。網絡操作水平較差的人群很難接受和參預網絡調查;三是安全性問題[2];四是無限制樣本問題[2](即同一個人可以重復填寫問卷)。
這些缺陷在教育問題調查時是否依然存在?如存在,是否可以利用教育本身特點予以減少,甚至消除呢?也就是說,在強調信息技術的同時,我們不能忽略教育問題本身的特點,否則就不能充分發揮技術的優勢。下面讓我們一起來看看信息技術環境下針對教育調查的一些特點吧。
1、對象明確
教育調查的對象不象其它網絡調查那樣復雜。其對象主要是學生(當然有時也涉及教師);調查地點主要在學校(有時也包含其它教育機構)。這樣我們可以在考慮樣本代表性時節省更多的時間。
2、層次性好
學校本身具有自然的層次結構,因此我們在分層抽樣調查時可按學生所在年級或學校類型等結構進行抽樣設計并調查,以減少覆蓋誤差。
3、組織性好,可跟蹤性強
學生按班或專業編排,有詳細的檔案資料(特別是學號),在抽樣時可直接對檔案數據庫進行操作。在要求調查質量較高時,我們可以對所有接受調查的對象(學生或教育機構)均給定唯一的代碼和密碼,并將抽樣對象的信息(如學號)提前錄入。只有通過身份論證的對象才能接受相關調查。這種調查方式也提高了安全防范能力,同時還有利于長期跟蹤調查和深入調查。
4、有專門教育管理部門的配合
在開展調查時,我們可以聯系有關教育管理部門。在相關部門的宣傳(比如組織有獎活調查)和動員下,提高調查的效率和數據的客觀性。同時可以與教育部門一起協商,開展形成性評價。從而最大程度上增強了調查的嚴謹性,有效地保證了教育調查的合理性、規范性。
5、良好的硬件環境
在信息技術環境較好的區域,大學、中學甚至小學都有完善的校園網絡系統和網絡機房,很容易實現網絡調查。對于中小型的教育調查,沒必要通過專門的主頁網站,一是考慮費用問題,二是穩定性問題。我們可以利用校園網或機房的局域網,通過管理員對IIS簡單設置即可實現。每次分批調查結束后,我們就將數據備份并關閉系統。這樣也避免了由于采用WEB和Email方式收集數據所帶來的各種問題,如安全性差、代表性少、覆蓋率低等。
6、調查對象的網絡知識和操作水平較高
CNNIC第十六次中國互聯網統計調查報告顯示,18-24歲的年輕人占中國網民的37.7%,18歲以下的占15.8%。可以說網絡知識已在中學和大學得到普及。網絡的滲透率[3]較均衡,因而網絡操作和基本網絡知識已不對調查造成影響。
綜上所述與普通網絡調查相比,教育調查可以較容易實現有組織地通過校園網絡進行分層抽樣調查(而非基于Internet的網絡調查)。并且能保證數據的客觀性,提高調查的可靠性。這樣我們可以把重點集中在更細致的工作上,如宣傳和交流溝通。
另外,對于無限制樣本問題,我們可以通過技術手段加以克服。比如,在數據庫的表中設置一個IP字段,并通過程序實現在指定時間內(30鐘還是1個小時,可根據實際情況通過程序進行調整)不允許出現同一個IP地址記錄。在ASP中,我們可以通過Request.Servervariables(“RemoteAddr”)[3]測試出IP地址并記錄到表中,并測試時間的函數記錄每個IP登錄時間這樣便可避免重復利用一臺機子重復投票的問題。從而大大減少了重復樣本。另外對于有些調查選項,在傳統調查中,被調查者常常漏選或范圍超出實際范圍(比如一天上網25小時等),我們不應在數據收集完畢后將之作為缺失數據或奇異數據進行處理。在ASP程序設計時,我們可通過JavaScript在客戶端進行判斷,以保證所收集數據的有效性。
在多個學校教育問題進行調查時,考慮到程序移植后的路徑問題,在用ASP設計時最好利用Server對象的Mappath方法,將虛擬路徑轉變為實際的物理路徑。
三、信息技術環境下的教育統計
教育統計就是研究教育統計數據的科學[4],即對教育調查獲取的大量原始數據加以處理、分析,可以在一定程序上揭示研究對象的內在聯系,并對理論假設進行檢驗[1]。目前教育行政部門,教育科研單位,各級學校都采用現行教育統計學作為教育現象的量化工具。計算機的強大功能之一就是快速運算。因而信息技術環境下的教育統計自然不能脫離計算機軟件的參預。
在軟件的選擇上,有的習慣用Excel,有的自己編寫小型分析系統。目前比較流行的還是用SPSS和SAS,它們最大的特點就是專業性強。
我們將服務器上的數據下載至本地硬盤上。對于有些版本的統計軟件,我們對存放數據的表還需要通過格式轉換,比如轉換成Excel的數據格式后再導入到統計軟件中。另外,在分析之前,要對數據進行必要的“預處理”(缺失值和異常數據處理、數據轉換處理、數據抽樣和選取變量)。
教育統計的常見問題大致可以分為十類[4]。即(1)一般性統計;(2)兩個總體之間特征數據的差異顯著性;(3)多個總體之間特征數據的差異性;(4)一個或多個因素對結果影響的顯著性;(5)相關性或相關程序研究;(6)變量之間的近似函數關系;(7)某變量是否服從特定分布;(8)研究對象的分類(聚類);(9)如何將多個指標描述的對象簡化成少量指標描述;(10)如何將多個用不同量綱指標描述的研究對象進行綜合排序。其中每一類教育問題可根據數據類型和是否服從正態分布來選擇解決問題的統計方法。
下面通過SPSS13.0對大學生網癮問題的研究為例對常用方法進行簡單說明。
1、計算網癮值
“網癮”量化標準來自美國匹茲堡大學著名網絡問題研究專家、心理學家金波利·楊(Kimberly·Young) 的“20項目檢測標準”[5]。ASP程序將調查數據存入數據庫中。因此預處理后的第一件事就是利用Transform/ compute對每項調查得分進行橫向累加,得到每個人的網癮值。
2、總體分析
通過對所有的有效數據進行均值分析,可得出學生網癮均值為43.6564,均值要大于第二級最低40分的網癮值。而頻數分析(Frequency),可知57.1%的學生屬于第二級(輕度網癮),2.6%的學生屬于第三級(深度網癮)。
3、性別與網癮的差異性
先比較不同性別學生的網癮平均值,然后采用兩獨立樣本t檢驗(Independent-Sample T Test)來分析性別所造成網癮差異性的顯著性。
4、年級與網癮的差異性
對所調查的三個年級的網癮值分析時,采用分組描述可知,大一的網癮值平均為42.5588,大二為44.9470,大三為45.7170,數值逐年遞增。至于“年級”因素是否與“網癮”有顯著影響可采用單因素方差分析。
5、網癮與網游時間、上網時間、上機時間等因素的相關性。對這些數據采用相關分析(Correlations),計算出的相關系數矩陣。如表1所示。
表中相關系數旁邊均有兩個*, 即表示顯著水平a為0.01時可拒絕零假設,也就是說以上因素對網癮均有正向影響(雖然線性關系不明顯),其中,每日玩網游的時間與網癮值的線性關系最強(Pearson簡單相關系數為0.327)。以上數據分析表明,目前國家制定的首個《網絡游戲防沉迷系統》,首選用技術手段直接通過控制網游時間來達到控制網癮是有根據的。
四、總結
綜上并結合教育調查和統計理論,不難得出信息環境下教育調查與統計的基本流程。如圖2所示。當然對于一些特殊調查,如學生就業反饋信息等,也可以采用Email(便于反饋和跟蹤)和Internet Web調查方式收集數據。顯然,以上方法并不適合信息技術環境較差的環境。
為了保證在信息技術環境下教育調查和統計的實現,我們在強調技術的同時必須注意“問卷設計-調查-統計”三者間的一致性、協調性和連貫性。有研究者在研究大學生網絡生存狀況時,曾由于忽略了三者之間的關系,而走了不少彎路。他們在對多項選擇問題的設計時,沒有考慮統計策略就簡單地設計成“多選項二分法”(Multiple Dichotomies Method)[6]的式樣。
例:1、您常使用的互聯網服務/功能有哪些(多選題)?
1)娛樂 2)下載資料 3)Email 4)聊天 … …
按這種設計在統計時只能采用多選項分析中的二分法分解問題,對各變量做頻數分析。雖能很方便分析出每項功能的使用情況,卻不便體現調查對象使用每項功能的優先順序。而該項目統計分析的最初目的是要了解調查對象選擇互聯網服務的優先級,這樣就出現與統計環節脫節的問題。
如果在設計時考慮到了統計的要求,我們就會按“多選項分類法”(Multiple Category Method)方式[6]進行問卷設計。問題分解如下:
1、您常使用的互聯網服務/功能中哪個被認為是第一重要的(單選題)?
1)娛樂 2)下載資料 3)Email 4)聊天 … …
2、您常使用的互聯網服務/功能中哪個被認為是第二重要的(單選題)?
1)娛樂 2)下載資料 3)Email 4)聊天 … …
3、您常使用的互聯網服務/功能中哪個被認為是第三重要的(單選題)?
1)娛樂 2)下載資料 3)Email 4)聊天 … …
“從信息丟失方面考慮,第二種分解方式沒有造成信息丟失”[4]。這對研究的準確性和經后深入研究至關重要。
因此對于一個項目性的教育研究課題,成員組成中最好有熟悉調查和統計技術的人員,以確保技術路線的一致性,確保調查和統計無縫鏈接。
——————————
參考文獻
[1] 王孝玲.教育統計學[M].上海:華東師范大學出版社,2001:1-10
[2] 郭強.網絡調查手冊[M].北京:中國時代經濟出版社,2004:2-3
[3] 蔡翠平,尚俊杰.ASP網絡程序設計[M].北京:清華大學出版社,2004:1-124
[4] 裘雨明.網絡調查的缺陷及其改進[J].經濟師,2004:5-109
[5] Kimberly·Young.網絡心魔[M].上海:上海譯文社,2004
[6] 薛薇.SPSS統計分析方法及應用[M].北京:電子工業出版社,2004:108
On Methods of Educational Survey and Statistic under the IT Environment
Deng Rui1、2Zhou Xingsheng1
1、Hunan Normal University, Changsha, 4100002、 Hunan College of Information, Changsha, 410200
Abstract:With the rapid development of IT, the methods of survey and statistics should be advanced simultaneously, so that we can make the most of the time to concentrate on key questions. The mode of education survey and statistic, based on unique characteristics of education such as a well-organized way, hierarchical structure, rich resources of network, and previously determined subjects of research, also should be improved on its own principle. A questionnaire can be designed with ASP or JSP. Then the e-questionnaire can be set up into a server of a school LAN rather than an Internet website because of several important reasons. So we can organize spot-checked students to survey, collect data from the server, transform the format of the database, at last, channel database into statistical software to analyze and work out a conclusive report. During the process, we can avoid the disadvantages associated with traditional methods to map out a suitable technological approach to deal with the education-oriented research.
Keywords:IT Environment, Educational Survey and Statistic, Technological Approach
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文