王 鑫,張曦丹,周曉暢,張 瑋
(東北大學秦皇島分校,河北 秦皇島 066000)
隨著人民知識層次和生活水平的提高,文化素養成為衡量一個人甚至一個國家文明程度的重要標準。大學生即將走向社會,深厚的文化素養可以指導他們的人生方向,幫助他們克服專業之外的困難,確保他們成為合格的社會主義建設者和接班人。但是文化素養與課程成績不同,一直缺乏科學的評價方法和有說服力的數據,難以引起高校的足夠重視。因此,項目組以D 大學的本科學生為對象,構建了定性定量相結合的評價體系,以彌補當前評價體系的缺失,為建立健全教育評價機制提供解決方案,并通過測試問卷統計實證,引導D 大學完善文化素養課群。
關于文化概念的討論頗多,比較權威的是《中國大百科全書》的定義,即廣義的文化是指人類創造的一切物質產品和精神產品,狹義的文化專指語言、文學、藝術及一切意識形態在內的精神產品[1]。學生作為以學習為主要活動的群體,進行物質生產的能力極為有限,因此,更適合采用狹義的文化定義,即文化是指包括一切意識形態在內的精神產品。
一般來說,相同的文化圈,人們的價值觀念、思維習慣和行為方式等也能找到很多相同之處,所以有學者認為,文化是一種包含精神價值和生活方式的生態共同體[2],結合大學生所處文化圈的特點,本文認為,大學生文化素養可以理解為大學生在文化價值觀念的影響下,通過學習人文知識而具有的文化應用能力,以及通過具體行為方式展現出來的文化素質和修養,下文評價體系指標的設計即是基于此理解。
《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035 年遠景目標綱要》第四十三章第五節指出,深化新時代教育評價改革,建立健全教育評價制度和機制,發展素質教育,更加注重學生愛國情懷、創新精神和健康人格培養[3]。這意味著,在教育評價上應創新評價方法,規避過分強調知識教育的弊端,以“發展素質教育”為導向,對大學生文化素養的評價正好符合此政策導向。
遺憾的是,由于高校近年來對文化素養教育重視程度不足和文化素養評價指標設置困難等原因,導致當前的理論研究偏向于以各類成績為主的綜合素質評價,絕少涉及大學生的文化素養評價,這也是項目組進行此項研究的原因之一。
要構建大學生文化素養評價體系,首先要進行評價方法的選擇。文化素養評價不同于理論課考試,難以做到完全量化,也不能簡單定性為高低或者好壞,而應該對定性數據進行科學的量化分析,因此我們選擇了成熟的層次分析法,也稱AHP 方法。
層次分析法是上世紀70 年代由美國運籌學家托馬斯·塞蒂提出的,該方法通過將評價目標的相關元素分解為若干層次,構建評價指標體系和判斷矩陣,同時綜合專業人士的主觀判斷,經定性分析與定量研究,確定指標權重,提出評估方案。它被廣泛地應用于人們生活的各種宏現與微觀決策中[4],比如公共政策評價[5]、政府采購績效評價[6]和學生綜合素質評價[7]等。
項目組邀請了多名德育工作方面的專家,在對大學生文化素養的理解達到共識的前提下,運用德爾菲法進行指標體系和層級的確定,并運用層次分析法構造判斷矩陣進行計算。
結合前文對大學生文化素養的理解和專家建議,我們構建了三層次指標體系(見表1),其中目標層(可理解為最高層)為大學生文化素養總評,準則層(可理解為中間層)為3 個節點指標,決策層(可理解為底層)為25個決策指標。

表1 大學生文化素養評價指標體系
判斷矩陣用來表示同一層次各指標對上一層次指標的重要程度。項目組邀請專家對同一層次各指標的相對重要程度作出綜合判斷,采用五級重要程度標注法(見表2)進行標注,構建判斷矩陣。

表2 五級重要程度標注法
對于一級指標B1、B2、B3,整理專家意見后,用五級重要程度標注法,對三個指標的相對重要程度進行比例標度,結果見表3。

表3 準則層相對重要程度判斷結果
然后按照準則層指標與決策層指標的對應關系,用同樣的方法對決策層指標的相對重要程度進行比例標度(結果略)。
層次排序可以采用冪法、和積法和方根法等多種數學方法,其中冪法最古老最精確,計算也最復雜,建議使用AHP 工具來代替人工計算。這里僅講解最簡單的和積法,用普通計算器即可完成全部計算。
我們把準則層指標比較結果作為判斷矩陣A 中的元素,表示矩陣A 如下

用和積法計算的步驟如下。
第一步,A 中的元素按列歸一化。用aij表示原矩陣元素,用表示歸一化之后的矩陣元素,對應計算公式為,即用各列的元素分別除以本列元素的和,把結果寫到原位置上形成新的矩陣,如a11=a11/(a11+a21+a31)=1/(1+1/3+1/5)≈0.652 2,按順序計算,得到新的矩陣

第二步,將歸一化之后的矩陣按行相加,得到的結果再做一次歸一化處理,用Wi表示各元素的權重,計算如下

我們把權重歸一化之后的矩陣A 用表4 表示。

表4 準則層權重
如果矩陣是完全一致的,即每個指標相互比較的結果并不矛盾,那么計算到這一步就可以得到每一個指標的影響力(權重)了,但事實上當參與比較的指標較多時,專家打分有可能出現自相矛盾的情況,例如在同一層次上,C1比C2明顯重要,C2比C3明顯重要,那么C1比C3應該強烈重要甚至極端重要才對,可是專家打分卻顯示C1不如C3重要,這顯然是不合理的。為了避免不合理的情況發生,各層次排序后,我們還需要對矩陣進行一致性校驗,以證明矩陣可用。
第三步,計算判斷矩陣的最大特征值λmax,公式為。其中AW表示矩陣A 與向量W(由Wi組成的單列矩陣)相乘得到的向量,即

當最大特征值λmax越接近矩陣的階數時(本例階數為3),說明矩陣的一致性程度越高。但由于決策者判斷一致性的難度隨著判斷矩陣階數的增加而增大[8],什么樣的一致性程度是令人滿意的呢?我們引入判斷矩陣的隨機一致性比率,記為CR。
第四步,計算隨機一致性比率CR。理論上當CR 小于0.1 時,可以認為判斷矩陣具有滿意的一致性。如果CR 大于0.1,說明矩陣不一致,則必須調整指標相對重要程度的打分。

表5 平均隨機一致性指標

因此,矩陣的一致性檢驗通過,計算結束。
我們使用杜棟等[9]學者提供的計算工具,用精確度最高的冪法計算矩陣A 的單層次權重為W=(0.637 0,0.258 3,0.104 7)T,λmax=3.038 5,CI=0.019 3,CR=0.033 2,與和積法計算得出的結論基本一致。為保證計算方法的一致性,我們在進行后續計算時采用冪法計算結果,即單層次權重W=(0.637 0,0.258 3,0.104 7)T。
表6、表7 和表8 列出了用冪法計算的決策層單排序結果,可以看出3 組決策層的層次單排序均滿足隨機一致性比率CR<0.1,一致性檢驗通過。

表6 決策層B1 組單排序結果

表7 決策層B2 組單排序結果

表8 決策層B3 組單排序結果
層次總排序就是利用層次單排序的結果計算出每一個決策層指標對于總目標的組合權重,即最終影響力。層次總排序需要自上而下逐層進行,對于目標層A而言,其總排序的結果就是準則層單排序的結果。
在本文中,準則層有3 個指標,即B1,B2,B3,設其對應層次單排序權重為bm(其中m=1,2,3,根據冪法計算結果可知b1=0.637 0,b2=0.258 3,b3=0.104 7),決策層有25 個指標,即C1,C2,…,C25,設它們對應準則層的單排序權重為(j=1,2,…,25,i=m),當C 層次指標與B 層次指標不相關時為0。例如,=0.021 3(C8與B1相關)

表9 層次總排序計算過程示例

表10 B1 組層次總排序計算結果

表11 B2 組層次總排序計算結果

表12 B3 組層次總排序計算結果
從總排序的結果可以看到決策層各指標相對于目標層的綜合權重,這就告訴我們想要提高大學生文化素養,從那些權重高的具體措施入手,往往會收到更好的效果。例如對社會主義核心價值觀的了解(C1)、對文化自信的理解(C2)及對中國特色社會主義制度的認同(C6)占據了權重前三甲,我們要提升學生的文化素養,從這三個方面多下力氣,自然會收到更好的效果。進一步分析,我們發現在與文化相關的行為(B3)中,閱讀經典著作行為(C18)和主動學習語言文化類知識的行為(C19)的綜合權重超過相關的其他指標,這就意味著高校應該提供必要條件,如舉辦經典解讀類講座、開設文化素養選修課等,倡導學生閱讀經典、主動學習語言文化知識。
同理,在很多場合,如方案選擇、素質測評和績效評價時,都可以運用層次分析法來確定綜合權重,用科學的量化方法找到解決問題的關鍵因素,當投入有限時,避開人性弱點,有選擇地放棄非關鍵因素,從而節約大量資源。
我們在指標體系設計上的任務雖然已經完成,但是指標體系及其權重確定之后,只能得出各個指標相對于上一級指標及最終目標的重要程度,必須對各個底層指標賦分并根據其權重進行計算,才能得出量化的最終目標分值,也就是對大學生文化素養的評價結果。
當樣本數量較少時,比如僅對某一個班級的大學生進行文化素養測評,可以通過老師打分,或者學生互評,然后計算平均分的方法,這種方法要求評分者必須非常熟悉該班級學生并能保證客觀打分,但事實上評分往往不是“好”或者“不好”這樣簡單的事情,并且樣本數量越大,評分者了解評分對象的比例越低,評分的結果就越失真。當樣本數量達到整個學校的學生甚至一個省市的學生時,評分的客觀性根本無從談起。
考慮到我們要面對的樣本數量較大,為體現調查的客觀性,我們選擇采取面向學生個人的測試問卷方式,用測試結果作為賦分的基礎。
測試問卷編制時,原則上以客觀問題為主,兼顧程度性主觀問題。我們設計了三種題型,分別為固定分值單選題、判斷題和階梯分值單選題。其中固定分值單選題只有一個選項正確,答對得分,答錯不得分;判斷題回答正確得分;階梯分值單選題用于程度性主觀問題,按階梯打分(如總分為1 分,選A 得1 分,選B 得0.75 分,選C 得0.5 分,選D 不得分)。見表13。

表13 決策層指標測試問題舉例
為了提高測試準確率和效率,項目組為每個決策指標建立了題庫,在每個題庫中抽取兩道題目,編制了五套不記名問卷,每套問卷50 道題,每題1 分,通過“問卷星”生成答題二維碼向D 大學的本科生發放,學生自愿參加并任選一套題進行作答,最后用所有問卷的單項得分匯總計算總得分,當樣本數量足夠多時,可以保證整體測試成績趨近于實際值。在三天的答題日期截止時,收到有效問卷774 份,參加者覆蓋了全部本科專業,符合測試樣本數量和廣度需求。
對問卷的初步統計分析不計權重,以得分作為統計和分析對象,這也是當前多數問卷調查的分析方法。下文按照常用的五級分制對測試成績進行分析。
被測試者個體得分率為80%(含80%)以上的僅占13.31%,評級為良好,個體得分率在60%以下的占22.22%,評級為不合格,這證實了D 大學仍有一部分學生文化素養較低,高校要培養出合格的社會主義建設者和接班人任重道遠。
測試問卷的總得分率為67.71%,僅為合格水平。其中“B1文化價值觀”得分率為72.87%,“B2文化知識和應用水平”得分率為64.71%,“B3與文化相關的行為”得分率為65.92%,目標層及準則層指標得分率均未到良好以上,但“B1文化價值觀”得分率明顯更高。
具體到有代表性的決策層指標,有四個指標得分率達到80%以上,分別是“C1對社會主義核心價值觀的了解(83.28%)”“C2對文化自信的理解(84.04%)”“C12對傳統節日、節氣知識的掌握(80.57%)”和“C23欣賞文化藝術類節目的行為(83.87%)”,說明D 大學思政教育工作成果顯著,近年來大力提倡傳統節日習俗、舉辦文化類競賽節目的措施也取得了預期效果。
得分率較低的如“C14常用公文寫作水平(35.55%)”、“C16標點符號的規范使用(40.12%)”和“C20日常寫作行為(58.95%)”,這說明學生在通用語言文字使用方面的理論和實踐均存在很大不足,D 大學在通用語言文字方面的教學亟待加強,推普工作重心也應向高校通用語言文字的教學實踐方向適當傾斜。此外,D 大學以理工科專業為主,中西方文化比較一類的課程并未做為公選課開放,導致“C3對中西方文化區別的了解”得分率(61.53%)剛剛達到及格線。
獲得了調查樣本的平均分后,根據上文計算的決策層總排序結果計算綜合權重得分、準則層綜合得分和目標層綜合得分,計算方法如下

(注:為方便后續計算,取對應指標兩道題的平均成績,使每個單項滿分為1。)

需要說明的是,因為決策層單項總排序權重的和肯定為1,若單項平均得分滿分為1,根據公式(2)、(4),總目標綜合得分的滿分肯定為1,那么我們可以根據計算結果直接得出得分率并確定成績檔次。各項計算后的結果見表14。

表14 總目標得分計算表
可以直觀地看到總目標“大學生文化素養”得分為0.732 4,因滿分為1,故綜合得分率為73.24%,高于按測試成績統計的得分率67.71%,并且評分檔次從合格提升到了中等,進一步分析可以發現,單項總排序權重排名前兩位的C1、C2單項綜合得分貢獻了0.270 5,占總目標綜合得分0.732 4 的36.93%,受益于決策層指標較高的得分,準則層B1得分0.496 3,占總目標綜合得分的67.76%,高于單排序權重0.637 0(即63.7%),這充分證明了決策層指標總排序權重對總目標綜合得分的影響作用,也證實了定性定量相結合的層次分析法在決策時的科學性。
1.大學生文化素養評價體系具有定量定性相結合、可操作性較強、可復制和可推廣的特點。其評價過程對于深化新時代教育評價改革,建立健全教育評價制度和機制具有較大的參考價值。
2.大學生文化素養評價結果對于高校文化素養類課程體系的建設有一定的指導意義。項目組在探討人文素質類課程體系建設時,基于該評價結果,開發了國家通用語言文字常識及應用和傳承視角下的中西方文化比較這兩門公選課程。
3.限于篇幅,關于“文明”的討論并未深入。在“兩個一百年”奮斗目標的歷史交匯期,“文明”應該是中華民族偉大復興的最終方向,代表了推動人類社會向前發展的最先進的文化。關于“十四五”規劃中首提“提高社會文明程度”和“增強學生文明素養”的意義,將在今后的研究中繼續討論。