王倩

摘要:SPSS軟件作為一種操作簡(jiǎn)便、功能強(qiáng)大的統(tǒng)計(jì)分析軟件,已經(jīng)在我國(guó)的社會(huì)科學(xué)、自然科學(xué)等領(lǐng)域發(fā)揮了積極的作用。將SPSS應(yīng)用于中職的學(xué)習(xí)評(píng)價(jià)大數(shù)據(jù)分析領(lǐng)域有著顯著的優(yōu)勢(shì),能夠?yàn)橹新殞W(xué)習(xí)評(píng)價(jià)大數(shù)據(jù)的處理分析提供方便,得到所需的結(jié)論。
關(guān)鍵詞:SPSS;大數(shù)據(jù);數(shù)據(jù)分析;中職
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)06-0016-02
1大數(shù)據(jù)
大數(shù)據(jù)是21世紀(jì)信息技術(shù)蓬勃發(fā)展的必然產(chǎn)物。一般意義上,大數(shù)據(jù)是指普通軟件工具難以在可接受的時(shí)間范圍內(nèi)感知、獲取、處理和分析的海量、復(fù)雜、異質(zhì)的數(shù)據(jù)資源。有研究者基于國(guó)內(nèi)外學(xué)者、研究機(jī)構(gòu)、企業(yè)等對(duì)大數(shù)據(jù)的理解,從數(shù)據(jù)規(guī)模、處理工具、利用價(jià)值三個(gè)維度對(duì)大數(shù)據(jù)的內(nèi)涵進(jìn)行概括性釋義:第一,較之于小數(shù)據(jù),其數(shù)量巨大、來(lái)源分散;第二,常規(guī)的數(shù)據(jù)工具不足以應(yīng)對(duì)大規(guī)模數(shù)據(jù),需要引入全新的數(shù)據(jù)計(jì)算工具;第三,大數(shù)據(jù)能夠帶來(lái)巨大的經(jīng)濟(jì)、社會(huì)和科研價(jià)值。將大數(shù)據(jù)技術(shù)引進(jìn)中職學(xué)習(xí)評(píng)價(jià)領(lǐng)域,為中職學(xué)習(xí)評(píng)價(jià)提供了新的思路。
大數(shù)據(jù)的利用涉及數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)分析和得到可利用的反饋四個(gè)步驟。
數(shù)據(jù)采集是大數(shù)據(jù)技術(shù)處理流程中最為基礎(chǔ)的一步,高質(zhì)量數(shù)據(jù)是大數(shù)據(jù)有效的先決條件。數(shù)據(jù)處理包括三個(gè)方面:數(shù)據(jù)集成、數(shù)據(jù)清洗、冗余消除。而數(shù)據(jù)分析是最重要的一個(gè)環(huán)節(jié)。只有可靠的數(shù)據(jù)分析才能使我們得到正確的反饋,實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值。
以數(shù)據(jù)挖掘等先進(jìn)數(shù)據(jù)分析技術(shù)為基礎(chǔ),通過(guò)對(duì)大數(shù)據(jù)進(jìn)行分析處理,發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的有價(jià)值的信息、規(guī)律。因此,借助于軟件對(duì)現(xiàn)有大數(shù)據(jù)進(jìn)行分析就顯得尤為重要。
大數(shù)據(jù)分析往往會(huì)涉及不同時(shí)間和不同空間上的數(shù)據(jù)。時(shí)間維度包含生命周期、數(shù)據(jù)的時(shí)間態(tài)、流化與增量、時(shí)效等元素,空間維度又包含三元空間、粒度、數(shù)據(jù)傳輸與遷移、數(shù)據(jù)空間等元素。針對(duì)這些數(shù)據(jù),一方面要找到它們變化的規(guī)律,了解它們的本質(zhì)特征,然后再對(duì)應(yīng)設(shè)計(jì)計(jì)算模型和算法。
為了更好挖掘中職收集到大數(shù)據(jù)的價(jià)值,得到學(xué)習(xí)分析的結(jié)論,還需要對(duì)大數(shù)據(jù)進(jìn)行篩選、分類、聚類等分析,從中發(fā)現(xiàn)規(guī)律,解決問(wèn)題。
大數(shù)據(jù)的核心是預(yù)測(cè)。大數(shù)據(jù)是把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上預(yù)測(cè)事情發(fā)生的可能性。因此對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行分析以用來(lái)預(yù)測(cè)就顯得尤為重要。只有數(shù)據(jù)分析準(zhǔn)確,才能保證結(jié)果預(yù)測(cè)的準(zhǔn)確性。
在大數(shù)據(jù)時(shí)代,更關(guān)注的是事物之間的相關(guān)關(guān)系,而不是因果關(guān)系。舍恩伯格和庫(kù)克耶提出大數(shù)據(jù)時(shí)代的三大趨勢(shì)之一就是相關(guān)分析對(duì)原來(lái)因果關(guān)系的替代。我們有時(shí)只要知道相關(guān)關(guān)系就可以解決問(wèn)題了。無(wú)論是線性關(guān)系還是非線性關(guān)系,利用他們之間的相關(guān)關(guān)系都可以幫助我們捕捉現(xiàn)在預(yù)測(cè)未來(lái)。
2基于sPSS的大數(shù)據(jù)分析優(yōu)勢(shì)
SPSS(Statistical Product and Service Solutions)軟件是IBM公司推出的一系列用于統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測(cè)分析和決策支持任務(wù)及相關(guān)服務(wù)的軟件產(chǎn)品。它集數(shù)據(jù)錄入、整理、分析功能于一身,基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等,其分析結(jié)果清晰、直觀、易學(xué)易用,而且可以直接讀取Excel及DBF數(shù)據(jù)文件。
1)可用于多種各種操作系統(tǒng)的計(jì)算機(jī)上。客戶端支持Windows XP(32位)、Windows Vista and 7(32位和64位)、Linux和Mac OS。服務(wù)器端支持Windows Server 2003(32位和64位)、Windows Server 2008(32位和64位)、AIX.,HP-UX,Solariso。
2)支持豐富的數(shù)據(jù)源,具備強(qiáng)大數(shù)據(jù)訪問(wèn)和管理能力。數(shù)據(jù)可以來(lái)源于幾乎任意渠道,包括數(shù)據(jù)庫(kù)、調(diào)查和網(wǎng)絡(luò)。SPSS可以同時(shí)打開(kāi)多個(gè)數(shù)據(jù)集,方便研究時(shí)對(duì)不同數(shù)據(jù)庫(kù)進(jìn)行比較分析和進(jìn)行數(shù)據(jù)庫(kù)轉(zhuǎn)換處理。軟件提供了更強(qiáng)大的數(shù)據(jù)管理功能,能將由DBASE,F(xiàn)OXBASE.FOXPRO產(chǎn)生的*.dbf文件,文本編輯器軟件生成的ASC II數(shù)據(jù)文件,Excel的*.xls文件等轉(zhuǎn)換成可供分析的SPSS數(shù)據(jù)文件。SPSS軟件不僅能夠幫助用戶使用其他的應(yīng)用程序和數(shù)據(jù)庫(kù),讀取及輸出多種格式的文件,還能夠支持Excel、文本、Dbase、Access、SAS等格式的數(shù)據(jù)文件,能把SPSS的圖形轉(zhuǎn)換為7種圖形文件,結(jié)果可保存為*.txt,Word,PPT及html格式的文件。
此外,通過(guò)使用ODBC(Open Database Capture)的數(shù)據(jù)接口,可以直接訪問(wèn)以結(jié)構(gòu)化查詢語(yǔ)言(SQL)為數(shù)據(jù)訪問(wèn)標(biāo)準(zhǔn)的數(shù)據(jù)庫(kù)管理系統(tǒng),通過(guò)數(shù)據(jù)庫(kù)導(dǎo)出向?qū)Чδ芸梢苑奖愕貙?shù)據(jù)寫(xiě)人到數(shù)據(jù)庫(kù)中等。在SPSS Statistics 19.0中,新增加了Salesforce.com的數(shù)據(jù)庫(kù)驅(qū)動(dòng)程序,允許分析人員訪問(wèn)Salesforce.com中的數(shù)據(jù),就像訪問(wèn)SQL數(shù)據(jù)庫(kù)中的數(shù)據(jù)一樣。
3)SPSS針對(duì)初學(xué)者,熟練者及精通者都比較適用。可以滿足不同中職教師對(duì)學(xué)習(xí)評(píng)價(jià)數(shù)據(jù)的分析。SPSS提供了從簡(jiǎn)單的統(tǒng)計(jì)描述到復(fù)雜的多因素統(tǒng)計(jì)分析方法,如數(shù)據(jù)的探索性分析、統(tǒng)計(jì)描述、列聯(lián)表分析、二維相關(guān)、秩相關(guān)、偏相關(guān)、方差分析、非參數(shù)檢驗(yàn)、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。提供了數(shù)據(jù)獲取、數(shù)據(jù)管理與準(zhǔn)備、數(shù)據(jù)分析、結(jié)果報(bào)告這樣一個(gè)數(shù)據(jù)分析的完整過(guò)程,因此非常全面地涵蓋了數(shù)據(jù)分析的整個(gè)流程,特別適合設(shè)計(jì)調(diào)查方案、對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,以及制作研究報(bào)告中的相關(guān)圖表。
對(duì)于中職教師來(lái)說(shuō),SPSS軟件提供了一種更加科學(xué)簡(jiǎn)單的統(tǒng)計(jì)方法,并不需要他們懂得深層次的數(shù)學(xué)運(yùn)算過(guò)程,只需要了解使用哪種統(tǒng)計(jì)方法,就可以通過(guò)指導(dǎo)對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行定量分析與定性分析,而不必?fù)?dān)心數(shù)學(xué)功底的問(wèn)題,然后掌握如何對(duì)分析結(jié)果進(jìn)行科學(xué)合理的解釋即可。現(xiàn)在很多稍有統(tǒng)計(jì)基礎(chǔ)的使用者只需要適當(dāng)?shù)呐嘤?xùn)與練習(xí),就能夠掌握簡(jiǎn)單的操作分析,包括繪制圖表、簡(jiǎn)單回歸、相關(guān)分析等。
SPSS采用類似Excel表格的界面與管理法,能夠直接從很多其他數(shù)據(jù)庫(kù)中讀人數(shù)據(jù),同時(shí)該軟件提供了較為常用與成熟的統(tǒng)計(jì)方法,完全可以滿足中職教師學(xué)習(xí)評(píng)價(jià)的工作需要,為中職的帶來(lái)了很大方便,是非專業(yè)統(tǒng)計(jì)人員的首選統(tǒng)計(jì)軟件。
4)SPSS在橫截面數(shù)據(jù)的分析中有很大的優(yōu)勢(shì),適合進(jìn)行從事社會(huì)學(xué)調(diào)查中的大數(shù)據(jù)分析處理。所以對(duì)SPSS提供一系列所需要的產(chǎn)品、方案和服務(wù)以滿足中職學(xué)習(xí)評(píng)價(jià)的多種關(guān)鍵應(yīng)用,能夠幫助中職教師使用各種技巧找出處理大數(shù)據(jù)的最佳統(tǒng)計(jì)方法,從而使用大數(shù)據(jù)快速做出基于事實(shí)的學(xué)習(xí)評(píng)價(jià),進(jìn)一步得到最好的教學(xué)效果。