張園園
摘要:大數據是研究領域的重要輔助工具。分析了心理學與教育學的大數據特征及獲取方法,闡述了大數據環境下心理學與教育學的研究方法及研究的主要特征,為相關工作人員提供理論參考,發揮大數據的信息整理功能,為心理學和教育學的發展奠定良好的基礎。
關鍵詞:大數據;心理學;教育學;研究變革
大數據即是海量資料,具有規模化、多樣性、效率性和價值密度低等特點,能為社會和學科的研究提供有效的理論依據。現階段,大數據涉及的領域有經濟、生產、科技、教育、管理等,打破了傳統學術研究的局限性,使研究更為高效和準確。
一、心理學與教育學的大數據特征
在價格不變的前提下每隔一段時間,大數據系統就會完成一次升級和優化,該理論相似于著名的摩爾定律,與大數據時代的發展不謀而合。隨著現代化技術的發展,計算機對數據的儲存和處理能力越來越強大,為大數據的發掘和應用奠定了基礎。
在心理學和教育學中,大數據的應用主要體現在結構化、半結構化和非結構化三個方面。前者屬于現階段研究的主題內容,后兩者由于數據量大,內容復雜,未來的發展前景廣闊。
結構化數據主要是利用圖表、數字以及符號等內容呈現的數據,表達類型有縱向、截面和面板三種。縱向是以時間軸為順序縱向排列的數據,可按照發展情況統計數據并加以分析;截面是將同一階段的個體水平截取比較,最終獲得統計結果;面板是通過多個截面數據的分析比較獲得結果的過程,其準確性和客觀性較強。
非結構化數據是將文本、視頻、音頻、圖片、文檔等信息搜集整理,掌握數據的過程。非結構化數據大體上可分為文字、多媒體及行為幾種,文字是指網上交流互動中保存的文字記錄,也可以是留言評論或文學作品等;多媒體是使將發送到互聯網上的視頻、圖片、音頻等內容記錄下來的過程,研究人員可基于此對多媒體中的人物展開分析,獲取其狀態和心理;行為是對個人的日常操作、一舉一動進行監控的手段,如網頁瀏覽時長等。
二、心理學與教育學大數據獲取方法
無論是心理學還是教育學,主體皆為人,所以結構化數據通常來自調查問卷、參考文獻或實驗探究等,而非結構化數據則是通過提取產品使用、服務以及互聯網數據等有價值的信息達到研究的目的。具體研究方法如下。
其一,最小數據庫。顧名思義,最小數據庫是研究主體的某一狀態或某件事,通過具有代表性的情況來分析主體,相比之下數據庫較小,內容較簡。由多個最小數據庫組成的數據庫集需要具備兩種優勢,一方面可將有價值的代表性數據簡化整合,另一方面要求數據完全圍繞研究主體展開,變量保持一致。利用最小數據庫獲取研究信息可避免在大數據中迷失方向,確保數據的客觀性。心理學及教育學主要是研究主體的心理動態、學業水平和動機產生的成就,所以最小數據庫應以此建立并完善,如,將某校學生作為主要研究對象,需要獲取的內容有班級、年齡、性別、身高、體重、成績、父母職業以及人格量表等,還可酌情增加其他變量,如,民族、籍貫等,成績和心理是主要研究方向,建立數據庫后,整合信息即可統計出數據之間的關系。
其二,大數據。隨著大數據時代的到來,結構化數據逐漸轉變為非結構化以及半結構化形式,操作更為簡單便利,數據準確性強,打破了調查問卷、交流訪談等傳統信息搜集方法的局限性,使其適應性更強。大數據獲取有兩種方法,一種是線下獲取,另一種是線上獲取。
線下獲取是對各機構數據的獲取,如,保險公司關于車險開展調查,將各種車型的出險數據及司機的駕駛習慣數據進行統計處理,進而有針對性地提供保險服務;教育部門為了調查青少年心理健康,開始每五年全國范圍大面積地獲取統計數據,這些數據可以作為學術探究的參考。
線上搜集主要利用互聯網技術進行,例如,獲取研究對象頻繁搜索的字詞,了解研究對象的網頁瀏覽速度、網站偏好以及點擊習慣等。與此同時,電子設備也可將用戶的常用詞匯、軟件使用情況、通話時間等內容傳遞給研究人員。再如,智能手環可將用戶的行走步數呈現出來。
其三,數據倉庫。數據倉庫是利用眾多信息采集工具獲取數據后整合而成。其與傳統數據庫相同點在于儲存功能強大,不同點在于支持數據運算處理,為決策提供參考條件。心理學及教育學研究需要將數據采集、篩選、處理、整合等,形成數據倉庫,為研究者提供有效信息。如,張強等三人獲取了所在地高二學生相關信息,建立了數據倉庫并得到了最終研究結果,獲取了學生心理和成績、家庭特征、家長受教育情況等內容。
三、大數據視野下心理學與教育學的研究方法
(一)分類算法
分類算法中包括神經網絡、決策樹、支持向量機以及貝葉斯等分類形式,可為心理學及教育學研究奠定基礎。如,統計高校新生的心理、學習和生活情況建立分類樹,最終有效判斷其初入新環境的適應能力。現階段,分類算法在心理學領域的研究應用日益完善,而對于被研究者掌握的知識技能、答題速度以及考查知識的統計和研究也能作為教育教學的參考標準,幫助教師從學生的角度出發,制定符合學生心理特點和認知能力的教學計劃。
(二)聚類分析法
聚類分析法需要將數據歸類整理,從同一階段的數據中尋找特征,將相似性強的數據集中歸類,與其他類別組間差距較大。例如,將A、B兩市的小學生作為研究主體,研究內容為適應能力,以此為方向將學生一分為三,第一種為交際良好,適應能力強型;第二種為人際關系不佳,孤僻健談型;第三種為自尊心不強型。就此展開調查,幫助教師有針對性地采取教學方法。
(三)關聯分析法
關聯分析要求數據間有必然聯系,如,超市銷售量的研究,其中交易數據即是銷量的最直接體現,但還要分析相關商品之間的關聯性,如,牛奶和被子、泡面和泡面碗、水果和水果盒等,可以此為據關聯銷售,提升經濟效益。關于心理學和教育學的例子,如,將高中學生作為研究對象,選取高一、高二學生的入學成績、現在成績、學習現狀、生活習慣、家庭狀況、自我評價內容等,最終發現家庭狀況會對學生的成績產生影響,表現了心理與教育之間的關聯性。
(四)其他分析法
其一,貝葉斯分析法。將分類轉化為決策,為學術研究帶來了更多的可能性。如,獲取學生學習的行為,判斷其對任務執行的態度;再如,通過學生學習情況,判斷預測學生的成績走向。
其二,數據可視化。若研究變量較少,可通過直方圖、散點圖、莖葉圖、餅圖等形式呈現;若空間數據較多,則可使用等高線、切片圖等形式呈現;數據變量較多,可通過平行坐標系、矩陣等形式呈現。
其三,社會網分析法。社會行為中涉及到的內容較為復雜多樣,研究主體可選擇組織、個體、社區、集體等,通過相互之間的關系和指標來獲取研究結果。教育及心理學研究需要從社會網出發,而網絡技術可作為研究媒介,例如,在微博上利用社會網分析方法,提取個體以及社會結構的相關數據,二者之間的深入探究是未來學術研究的主要發展方向。
四、大數據視野下心理學與教育學研究的主要特征
大數據視野下教育學和心理學研究的特征主要體現在以下幾方面。
首先,抽樣趨近于全面。以往研究多從局部出發,利用抽樣調查的方法,將部分分析作為整體研究的代表,而大數據具有海量信息整合處理的能力,可將成千上萬的樣本采集整合,生成數據結果。這些樣本可實現整體范圍的研究和調查,避免局限性或制約性,防止結果以偏概全。線上及線下數據的整合和積累可使數據參考價值更強,打破時間或空間上的狹隘眭,使目標選擇更為科學合理。
其次,定期調查轉變為實時獲取。傳統研究中的調查問卷、參考文獻或實驗探究需要耗費大量的時間和精力,而且由于抽查的對象自身情況不同,平均水平受到的外界干擾較多;調查環節還可能會受到個體素質、時間、環境、狀態等影響。大數據獲取信息的方式主要源于網絡,研究人員可足不出戶獲取被調查者的相關信息,通過雙向性的交流互動獲取數據。無需面對面訪談,可打破時間和空間上的雙重局限。網絡系統還可直接將采集的信息進行整合處理,在短時間內制得統計圖,為分析提供依據。與此同時,研究者和被研究者進行一對一或一對多的互動,能實時掌握其情況,一旦發現不穩定因素能在第一時間更改數據,避免影響調查結果。
第三,主觀轉為客觀。傳統被調查者或多或少會在問卷中滲入主觀色彩,如,實時情緒的變動,獲取的結果可能也與平時存在較大差距。大數據時代是客觀數據的獲取,通過長時間規律性行為的掌控來判斷被調查者的心理活動,是一種無法自控的行為,這些數據不會受主觀意識所干擾,結果更為準確。
第四,因果轉為精準。傳統學術調查是由因溯果,存在一定的推導性,掌握的只是數據之間存在的關聯性或非關聯性,而大數據時代可以精確地獲得預測數據,根據客觀精準的結果制定調整和控制計劃,使研究方法更為先進科學。
總之,大數據時代給心理學領域和教育學領域帶來了研究變革的契機,研究人員應打破結構化研究的局限性,結合大數據內容探索學術研究的更多可能性,從現階段研究出發,發現數據之間的變化情況和關聯關系,借鑒以往成功經驗,創造出更多有價值的信息內容,確保大數據環境下研究的實效性。