摘 要:高職院校人才培養工作狀態采集平臺中采集的數據隨著應用的不斷推廣,數據量逐年遞增,對數據分析的工作越來越重要。為實現全省狀態采集平臺數據的統一管理和共享,建設了基于網絡的動態數據分析系統,利用網絡存儲的優勢,擴充數據分析的功能,輔助各高職院校以及省級教育部門完善教學質量保障體系。
關鍵詞:狀態采集平臺;數據分析;圖表
中圖分類號:G717 文獻標識碼:A
1 網絡版高職院校狀態采集平臺動態數據分析系
統建設的必要性
為促進高職院校發展的需要,實現學校管理的科學化、現代化、規范化,提高人才培養質量,江蘇省自2008年開始推進《高等職業院校人才培養工作狀態采集平臺》系統的應用,每年采集一次數據。目前,高職院校的數據采集平臺是由上海行健職業技術學院開發的單機版[1],近兩年推出了網絡版的采集平臺,但網絡版只有數據采集的功能,沒有開發數據分析的功能。
目前狀態采集平臺的數據分析系統使用的是江蘇經貿學院開發的單機版數據分析系統。該系統將全省80多所高職院校的統計數據整合起來,進行分析處理,以人們最能接受的直觀的圖表方式來呈現。界面簡潔,功能相對齊全。但單機版的數據分析系統因為受到各種條件的限制,存在一些缺點。
(1)自動化程度低。單機版數據分析系統的統計數據需要從每個院校的excel表格中獲取,獲取數據的自動化程度低。各個院校提交到省教育部門的是一個excel文檔,其中包括原始數據和統計數據。數據的獲取必須將80多個excel文檔中的統計數據項提取到一個新的excel文檔中,然后通過數據分析系統將這些統計數據以圖表的方式呈現。在數據提取的過程中,需要人為干預,耗費大量的時間和精力,容易出現錯誤。
(2)缺乏狀態采集數據的縱向比較。單機版的數據分析系統處理的都是單個年份的數據,只能對各個院校的數據進行橫向比較,而無法實現每個高校數據的縱向比較。而對于用戶來說,數據分析不僅需要在各個院校之間進行橫向的比較,同時也需要縱向比較。在本系統中,增加了縱向比較功能,通過對歷年的數據對比分析,以折線圖的表現方式直觀表現數據的變化,根據圖表對未來數據項進行預測。
(3)無法實現資源的統一管理和共享。狀態采集平臺目前收集了高職院校的大量數據,這些原始數據作為全社會一個公共的教育資源,應該進行統一管理和共享,不僅為教育部門和高職院校提供決策支持,同時讓更多的人參與了解高職院校的辦學情況、專業狀況等,進一步加強輿論監督的力量。在信息化的今天,資源的統一管理和共享顯得尤為重要。
隨著狀態采集平臺在全省院校中的應用推廣,其作用不僅僅是為了采集數據,更為重要的是對采集到的數據進行統計分析。隨著數據量逐年遞增,數據分析的重要性越來越突顯,分析結果將更具有參考價值。在此情況下,將一些雜亂的大量的沒有規律的數據轉換為有價值的決策信息,輔助各高職院校以及省級教育部門完善教學質量保障體系。因此建設網絡版的省級數據分析系統勢在必行。
2 省級狀態采集平臺數據分析系統的設計
為了增強系統的健壯性,本系統在設計中將狀態采集平臺的原數據與統計匯總的數據完全分開,一方面使得數據相對獨立,另一方面則保證數據分析系統的運行速度。系統的設計框架如圖1所示。
圖1 系統框架
狀態采集平臺的數據項以及狀態采集平臺整個系統還在不斷地完善中,每年的數據項、數據的名稱等會發生變化,比如數據庫表的字段名稱會發生變化,數據表會增加,以及數據庫中表的名稱會發生變化等等。在2013年狀態采集平臺中,數據項“學校代碼”修改為“學校標識碼”,“院校名稱”改為“學校名稱”,“應屆畢業生頂崗實習情況的畢業生錄用比例(%)”改為“企業錄用率(%)”,類似這樣的變化的數據項有很多。狀態采集平臺這些數據項的變化必然會導致數據統計系統的變化。為了使數據分析系統具有穩定性和健壯性,在系統的設計中,我們將統計和分析作為兩個獨立的系統,數據統計系統的主要功能就是根據數據分析系統中的需要分析的數據項進行統計,將統計結果寫入數據分析數據庫。數據分析系統則相對獨立,根據數據庫中的數據對各項指標和數據進行對比分析。
系統的設計具有松耦合性,無論狀態采集平臺中的數據項如何變化,數據統計系統會將所需要的統計數據導入數據分析系統的數據庫中,數據分析系統就負責將統計數據對比分析,以可視化的圖表方式呈現給用戶。
3 數據準備
3.1 數據來源
收集的數據是否準確,是否真實和充分,決定數據分析的直接結果。省級狀態采集平臺的數據分析系統作為狀態采集平臺系統的延續,所使用的數據均來自各高職院校通過單機版或者網絡版狀態采集平臺填報的數據。狀態采集平臺經過近幾年的使用,各高職院校目前都能夠熟練使用,并且各級部門和領導也很重視,保證了采集數據的相對準確,從而使得數據分析結果在一定程度上正確反映學校在教育教學等方面的現狀和不足,有利于針對性整改,提高教學質量。
3.2 數據選擇
高等職業院校狀態采集平臺中采集的數據非常多,其中包括學校的硬件設施、固定資產、產學合作、招生、就業、經費收入支出、校內專任教師、兼課教師、專業狀況、實習實訓、學生獎助學情況、學生社團等大概80多個數據表。在實際的數據分析中,不是要對所有的數據全部進行分析,本系統選擇一些對能夠反映高職院校教學質量情況的數據項進行數據分析。狀態采集平臺數據分析系統對院校概況、辦學條件、監測分析、師資概況等11個大類的數據進行分析。在每個類中都包含了很多的數據項。例如監測分析中包括了高級職稱教師占專任教師的比例,生均占地面積,生均宿舍面積等7個數據項。
3.3 數據處理
高職院校狀態采集平臺雖然具有數據位的校驗,數據格式,關聯數據校驗,報錯和提示功能,但是在實際的采集操作過程中,仍然存在不符合規格的數據,因此就需要對數據進行各種處理。數據處理的過程分以下幾個步驟:
(1)清理數據
主要清理的數據有兩種:不符合格式要求的數據;奇異數據。
不符合格式要求的數據:狀態采集平臺中采集的數據有的在數據格式中沒有限制,比如在收集教師基本信息的表中,有一項是在企業中的時間,有的學校職工在填寫中就寫了1天,有的寫的是1*60,這樣的數據格式在統計中是無法進行數學統計,必須對數據進行清理。
奇異數據:所謂奇異數據,是指在采集的過程中,針對同一類數據,個別院校的數據與其他的數據差別很大,一般我們認為相差三個數量級別時,就認為這是個奇異數據,要對其進行核準、處理,從而保證數據分析結果的準確性。
(2)轉換數據格式
狀態采集平臺數據表中的字段基本都是字符型的數據,在數據分析系統中,對數據的統計匯總要通過數學公式來進行計算,字符型的字段無法計算,因此在數據清理完成后,必須將統計匯總的字段轉換為數值型。具體的處理方法,用JAVA語言寫一個批處理程序,實現對數據字段的批量轉換。
(3)數據統計
在將數據準備好之后,就要對選擇的數據進行統計匯總。本系統中對數據的統計一般包括總和,均值,百分比等。比如在校生人數,需要統計全省在校生總數和全省在校生均值;高級職稱教師占校內專任教師,需要統計的是百分比;院校招生中的實際錄取率,實際報到率等,統計的是百分比。數據統計由數據統計系統來完成。
4 系統的數據分析
狀態采集平臺數據分析系統主要采取圖表對比分析的方法。采用圖表方式的優點,易于閱讀,易于理解,直觀。例如各個學校的數據與全省均值的比較,各種類別院校的均值比較,歷年數據的對比分析。對比分析主要通過以下幾種圖表實現:
(1)儀表盤形式。這種儀表盤的對比方式主要適合于各個院校數據與全省均值的對比,儀表盤顯示院校的指標數據,全省均值則顯示在儀表盤的上方,這樣便于兩個數值的比較。同時數據分析系統還顯示了各院校數據在全省的排名。圖2是某個院校的教師數、全省排名以及與全省均值的比較。
圖2 儀表盤數據對比分析
(2)柱狀圖形式。柱狀圖的圖表形式也是我們最常用的一種對比方法。在本系統中主要用于數據各種均值的比較。例如,全省均值,國家示范院校均值,國家骨干院校均值,省級師范院校均值,一般院校均值,綜合師范民族類均值等。圖3是校內專任教師數量的均值比較。
圖3 柱狀圖數據對比分析
(3)折線圖對比形式。數據分析系統中縱向數據的比較適合用折線圖對比形式,表現簡潔,便于理解,能夠明顯看出數據項在幾年中的變化,從而指導學校的進行科學話管理和決策。由于網絡版數據分析系統今年才開始推廣,數據項是從2012年開始的,目前折線圖的對比方式還沒有完全體現出來。
5 結束語
狀態采集平臺數據分析系統的建設,為省級教育部門的決策咨詢提供詳實有力的數據,有利于科學合理的制定宏觀調控政策,強化宏觀管理和指導的針對性,進一步推進高等職業教育的可持續發展;有利于各高職院校查找辦學差距和薄弱環節,整合教學資源配置,提高辦學治校的科學化水平,不斷加強和改善自身的教育教學管理。
參考文獻
[1] 陳方輝.高等職業院校人才培養工作狀態數據采集平臺研究
[J].安徽電子信息職業技術學院學報,2012(1).
[2] 李暢,陳方輝.高等職業院校人才培養工作狀態數據采集平臺
指標分析[J].江蘇經貿職業技術學院學報,2011(6),79-81.
[3] 李果,等.知識管理視角下高職人才培養工作狀態數據采集平
臺的建設與實施[J].職業技術教育,2013(8):55-57.
[4] 田飛.高職院校人才培養工作狀態數據采集平臺分析策略研
究[J].才智,2011(36):337-338.
作者簡介:
蔡會霞(1973-),女,碩士,工程師.研究領域:多媒體技術,網絡
技術應用.