牛奉高,王菲菲,邱均平
(1.武漢大學a.信息管理學院 b.中國科學評價研究中心,湖北 武漢 430072;2.山西大學 數學科學學院,山西 太原030006)
中國高等教育評價研究的主題及其演變分析
牛奉高1a,2,王菲菲1a,1b,邱均平1b
(1.武漢大學a.信息管理學院 b.中國科學評價研究中心,湖北 武漢 430072;2.山西大學 數學科學學院,山西 太原030006)
以中國知網(CNKI)中有關中國高等教育評估和評價的35 859篇中文論文為數據源,以共現理論為手段,從社會網絡的視角分析該領域研究的現狀、熱點主題和研究主方向。發現整個領域的研究熱度逐年攀升,且2000年后增長加速。該領域研究主題豐富,且非常集中,高校、教學質量、評估、教學、教學管理和評價指標體系等是研究較多的熱點主題,除去平凡主題“高校”外,教學評估、教學管理、評價指標體系、高校教師和評估等與其他研究主題都有不同程度的共現,處于主題群的核心位置,具有較強的輻射性。通過聚類分析清晰地看到研究方向的三個聚集群;通過關鍵詞的歷時分析,看到評價研究主題不斷拓展和深化的三個階段。
高等教育;評價;評估;主題演變;共現分析;社會網絡分析
科學評價是科學管理的前提,也是推動組織發展的間接動力[1]。中國目前有2 700多所高校、3 000多萬在校生,居世界第一[2],2010年普通高校專任教師人數已超過134萬人,2012年國家財政性教育經費支出達到國內生產總值的4%。對中國如此大規模的高等教育體系來說,科學的評價和管理非常必要。
中國教育評估制度確立于20世紀80年代中期[3-4],此后對高等教育評估和評價的研究越來越熱:研究的主體越來越多,既有官方,也有高??蒲袡C構,還有第三方;評價的范圍越來越廣,從對高職高專到對世界一流大學的評價;評價的對象越來越全面,教學、科研、教師和學生都成為評價對象,目前已形成比較完整的教育評價研究領域。
經過近30年的發展,中國高等教育評價研究取得了很大進步,但也面臨理論和方法創新不足的問題。為了進一步的發展,需要對研究的現狀、特點、發展歷程、成就和經驗進行全面的總結。作者從文獻計量學的角度,試圖從這些理念不一、體系不一、重點各異的評價研究中,宏觀分析中國高等教育評價研究的重點、熱點和演變過程,理出幾條有益的結論。目前計量學方法已經被用于對中國教育研究領域的熱點分析[5-6]、對民辦高等教育的研究[7-8]以及對高等職業教育的蹤跡、特征和走向分析等[9];也有對大學教師發展的研究[10]。但是在對中國高等教育評價和評估的研究中還未曾見到。
對中國高等教育評價的研究,得益于教育改革開放的大環境。中國高等教育的評價工作始于教育改革開放的初期,而對高等教育評價的研究略早。第一篇真正意義上研究高等教育評價的文章是1983年王金凱的《關于高??蒲袡C構及人員的評價指標體系》[11]。這篇文章比較系統地提出了對科研機構和人員評價的指標體系,但沒有引文,或許可以推測之前可能沒有這方面的文章公開發表。
1985年中共中央啟動教育評估。此后經過一系列制度上的完善,如1990年10月發布《普通高等學校教育評估暫行規定》,1993頒布《中國教育改革和發展綱要》,2002年制定了《普通高等本科教學工作水平評估方案(試行)》(2004年進一步修訂)。教育部從2003年開始實施五年一輪的“高等學校本科教學工作水平評估”制度,截止2008年,完成了對592所高校的第一輪評估[12]。
當教學評估在全國高等教育單位開展的同時,對高校教師、課程、教學等評價在20世紀80年代末也開始進行,此后,武書連、邱均平等學者對大學評價的實踐逐漸走入大眾的視野。目前,已有多家大學或機構定期發布多項評價報告,如武漢大學中國科學評價研究中心、中國校友會、上海交通大學等機構。
評價研究經過30多年的探索和發展,已經形成宏大的研究領域,有著一批專業的研究隊伍。但是還沒有對這個領域的作者、機構的合作關系進行全面的分析,也沒有對評價主題進行科學的計量分析和研究,從而使得該學科的發展前沿熱點及其演變不是非常明朗。
共現理論是一種時空相關分析方法,應用非常廣泛。科技文獻的共現分析是指相同或不同類型特征項共同出現的現象,可涵蓋共引(耦合)和共被引分析、共詞分析、主題詞鏈(共篇)分析、合著分析等方法。關鍵詞共現分析即為共詞分析,作者或機構合作或共現分析即屬于合著分析。一般要借助于可視化網絡分析軟件,如 Ucinet、NetDraw、Pajek等,呈現共現的結果。本文通過對高頻關鍵詞的共現探析研究主題的熱點和主方向。
關于社會網絡分析的分析,有的稱之為結構分析,有的稱之為網絡分析[4]。加拿大社會網絡分析家巴里·韋爾曼曾指出:“網絡分析探究的是深層結構——隱藏在復雜的社會系統表面之下的一定的網絡模式?!保?]文中主要構建了高頻關鍵詞的網絡圖,根據不同的中心度測度方式研究它們在共現網絡中的重要性。
NetDraw以其形象直觀的圖形化顯示功能,簡單易學的操作性,優秀的開放兼容性為社會網絡分析注入了新的活力,目前已被廣泛應用于社會網絡分析研究。UCINET軟件集成了軟件 NetDraw和Mage,同時集成了Pajek用于大型網絡分析的Free應用軟件程序,有很強的矩陣分析功能,主要分析計算網絡結構的特征指數。文中利用UCINET和Netdraw呈現高頻關鍵詞的網絡結構及結點中心性,并使用SPSS聚類劃分研究主題的主要方向。
本文分析對象是中國高等教育的評價研究,以中文文獻數據庫CNKI中的中國學術期刊網絡出版總庫為數據來源。核心檢索詞是評價和評估,限定范圍是高等教育,包括高等院校、高校教師、高??蒲泻徒虒W等主題。通過常用概念的比較,選擇了10個檢索詞,檢索式如下:SU=(評價*大學(2)+評價*高校+評價*高等教育+評價*高等學校+評價*高教)+(評估*大學(2)+評估*高校+評估*高等教育+評估*高等學校+評估*高教)。其中檢索詞“大學”的頻次設為2是為了排除不相關文章。截至2011年5月30日,在學術期刊網絡出版總庫中檢索到相關主題的有效文章35 859篇。
經過統計發現:從時間分布看,相關主題文章在2000年后大幅快速逐年遞增,2011年達到4 966篇,且近10年的文章占所有文章的83%;從學科分類看,前15個學科包括了前75個學科相關論文的88%,近60%屬于高等教育,隨后為體育、圖書情報與數字圖書館、教育理論與教育管理、計算機軟件及計算機應用,共約占全部論文的75%;從資助情況看,有1 589篇文章受各類基金資助,其中全國教育科學規劃、國家自然科學基金和國家社會科學基金資助的文章占47.7%。與前述不同的是,單位分布和期刊分布相對平均,變異系數分別為0.36和0.54,未達到“二八律”程度。
關鍵詞是一篇文章的簡單描述,關鍵詞的結構所反映的就是文章研究主題的結構。因此通過關鍵詞的共現結構探析文章主題的結構行之有效。
通過對所采集文章的關鍵詞進行整理和統計,發現頻次在100及以上的有127個,占所有關鍵詞35 593的0.36%,但他們的頻次35 196卻占到了所有關鍵詞頻次138 215的25.5%,說明研究主題非常集中。前20位的關鍵詞及詞頻分布見圖1,詞頻最高的有高校、高等學校、大學生等實體對象,也有高等教育、教育質量等抽象對象,其中“高?!钡脑~頻明顯高于其他高頻詞。進一步研究發現關鍵詞中近義詞或同義詞很多,這是一個很重要的問題,因為這種現象可能掩蓋了重要的主題,也可能產生幾個及其相近的主題,使分析結果不再可信。因此需要做的就是同義詞或近義詞的合并。

圖1 關鍵詞詞頻分布圖(最高的前20位)
同義或近義關鍵詞的合并,可視為一種主題的聚集。本文基于文獻分析和語言表達習慣將高頻關鍵詞進行合并,部分如表1所示。為了區別,我們稱合并前的關鍵詞為基本關鍵詞,由諸多基本關鍵詞合并后的詞稱為相應基本關鍵詞的代表性關鍵詞,簡稱關鍵詞。

表1 基本關鍵詞合并表(部分)
出現如此多的相似詞,或許反映了在該領域的研究中用詞不規范的現象。這種現象會使某些研究熱點淡化。比如對于科學研究的評價和評估是一個熱點,但沒有出現在高頻詞列表中,而是緊隨其后,原因就是其表述過于多樣化。為此,筆者專門將其列為代表關鍵詞之一,以便檢驗。經過合并和增補,最后形成51個代表關鍵詞(表2)。
使用Excel VBA程序,進一步得到了51個關鍵詞的共現矩陣。導入Ucinet后計算網絡及節點(關鍵詞)的特征指數,如中心性等。然后使用Netdraw做出關鍵詞共現網絡圖。為了便于理解,在保證圖形清晰的前提下,圖2中部分代表性關鍵詞采用兩個基本關鍵詞表示。
通過對關鍵詞共現的分析及其圖形展示,可以發現高頻關鍵詞之間的聯系。如高校、教學評估、教學管理、評價指標體系分別與其它代表性關鍵詞都有共現,反映了研究中的主要對象和手段。但要發現網絡中的關鍵點,還要對節點的中心性進行計算并予以表示。圖2即為帶中間中心性的關鍵詞共現圖,圖中黑色圓點為關鍵詞,圓的大小表示節點中心度的大小,連線表示兩者共現的存在。
中心性的定義多種多樣,不同的定義反應節點不同的特性。本文采用三種。其一是點的度數中心性(degree),反應該節點和其它節點的共現次數大小;其二是點的中間中心性(betweenness centrality),反應節點在網絡中控制其它節點共現的能力;其三是點的接近中心性(closeness centrality),反應節點與其它所有節點共現的個數[6-7]。

圖2 代表性關鍵詞共現網絡圖
表2列出了節點三個中心性的數量值,分別按高低順序排列,序號代表相應關鍵詞??梢钥吹蕉葦抵行男愿叩牟灰欢ㄆ渌行男愿?,中間中心性和接近中心性最大的前六個關鍵詞相同。具體來講,“高?!钡闹虚g中心性和度數中心性最高,且接近中心性最小(等于節點數量減1),這說明它是本領域研究的主要對象?!案咝!?、“教學評估”、“教學管理/改革”和“評價指標體系”與其它關鍵詞都有共現關系,說明他們是研究的熱點主題?!翱蒲性u估”和“科研評價”的接近中心性最大,說明對它們研究的獨立性較強。

表2 代表性關鍵詞的三個中心性度量值比較(部分)
通過比較可見,多數詞的中間中心性和度數中心性大小不一,這符合定義本身。但是部分關鍵詞例外,比如“高校”和“高等教育”,說明它們是最平凡的熱點主題。對于有較低度數中心性和較高中間中心性的點,可能是關鍵連接點,比如“教師評價”,盡管還不夠明顯。
通過關鍵詞合并后的主題共現分析,我們發現部分研究熱點,進一步的聚類分析可以幫助了解研究領域的主要方向。圖3為關鍵詞聚類圖,如果取閾值等于13,則可以將其分成四類(各類見圖3標號)。
從圖3可見,第四類的獨立性最強,主要涵蓋教學質量和評估以及實驗室的建設和評估,而主體正是官方,因此這一方向可以概括為“教育部本科教學水平評估研究”。第三類有很多子類,比如“美國”和“啟示”為一類,說明對美國教育評價研究的借鑒較多;“高等教育”與“質量保障”說明當前對高等教育的評價研究較多圍繞質量展開;科研方面與評價指標體系等共現說明科研評價是較重要的研究方向;而“績效評價”和“高校教師”一類說明績效評價的重點對象是教師。這些看似復雜的主題可以概括為“高等教育的質量評價研究”,對應于文獻[9]中的“質量與評估”主題。而其中又有教師評價、績效評價、科研評價等子方向。第二類包含了近一半的關鍵詞,涉及到大學生思想政治教育、人才培養、創新能力、教學改革、課程建設等,可以概括為“高等教育的軟環境評價研究”,軟環境相對于教學設施等“硬條件”而言。而第一類,沒有特別的意義,在任何領域的研究中都要考慮現狀,都為了解決問題而提出對策或建議。
總結而言,我們將對高等教育的評價研究分為三個范疇:最核心的是教育部主導的本科教學水平評估,它起著引導性的作用;比它大一點的是圍繞高等教育質量建設的幾個大的評價方面,如教師評價、績效評價、科研評價等,它是該領域研究的主力;最大的外圍是涉及到高等教育各個層面的評價研究,它是評價研究在高等教育領域研究的觸角。
為了探析研究前沿熱點及熱點隨時間變化,筆者進一步分析了代表性關鍵詞的歷年變化。有關評價和評估的多數關鍵詞都是從1983年開始逐漸出現的,如素質教育、績效評估、教師評價、美國、科學發展觀、科研評價/評估在新世紀才嶄露頭角,逐漸成為新的研究前沿。而幾乎與此同時,傳統的研究主題,如高校、教育改革、評價指標體系、評估、對策/建議等相關文章數量快速增長,成為前沿熱點。通過以上分析,可以將1980年以來的評價研究分為三個階段,分別以1984年和2002年為時間分界線。這也反映了理論研究先于實踐的一般規律。此外,我們也看到了評估/評價方法的文章沒有明顯的增長,說明在方法創新上進展不大。

圖3 代表性關鍵詞聚類圖
其一,在本文中作者的基本觀點不區分評估和評價,但作者并沒有將兩者完全混為一談,而是有意分開,最后檢驗了兩者的一致性。思路是考察圍繞評估的相關主題與研究評價的相關主題在詞頻上的差異是否明顯,如果差異顯著,則可區分。為此作者計算“評估”和“評價”相近的代表性關鍵詞(組)和其它代表性關鍵詞(組)的頻次之間(除去兩者相互之間的共現頻次數后)的相關系數得0.915,可見在用詞的習慣上不易區別。當然微小的區別也有,比如談到教育部的必然是評估,這是一種約定俗成。
其二,進一步分析了共現強度較高的高頻關鍵詞之間的關系。將共現強度閾值設為100,得到圖4。大學(University)必然是研究的中心,并且它與評估、教學質量、教學管理、教學、教學評估、評估指標體系、評價指標體系形成了一個緊密的小團體,因此對教學評估的研究仍然是中國高等教育評價領域研究的主要方向。

圖4 閾值100下的高頻關鍵詞共現網絡圖
作者以在中國知網(CNKI)學術期刊網絡出版總庫中按前述規則截止2012年5月30日檢索到的有關中國高等教育評估和評價的期刊文獻的關鍵詞為數據源,通過共現分析并結合社會網絡分析的解釋,得到以下幾點結論及建議。
第一,研究規模越來越大,但研究主題比較集中。近十年發文量逐年較快增長,2011年超過4 000篇。關鍵詞涉及面很廣,但前0.36%的高頻關鍵詞頻次占全部關鍵詞頻次的25.5%,可見研究主題比較集中。
第二,研究熱點突出。高校、教學質量、評估、教學、教學管理和評價指標體系等是研究較多的熱點主題。除去平凡主題“高?!蓖?,教學評估、教學管理、評價指標體系、高校教師和評估等具有較強的輻射性,與其他研究主題都有不同程度的共現。
第三,研究方向相對明晰,教學評估仍是主要方向。將共現矩陣轉化為相關矩陣后利用SPSS進行聚類,根據聚類結果將主題概括為“教育部本科教學水平評估研究”、“高等教育質量評價研究”和“高等教育的軟環境評價研究”三類。核心是評估,外圍是高校方方面面的軟環境評價。
第四,研究主題演變比較清晰。20世紀80年代以來,中國高等教育評價經過兩次較明顯的發展。第一次是1984年前后,大量新的主題出現,拓展了研究領域。第二次是2002年左右,部分熱點迅速增長,形成前沿熱點。
本文通過對中國高等教育評價研究領域主題的宏觀研究,得到了以上四點結論,通過這些結論,我們對當前該領域的研究做出如下的判斷和建議。其一是抓住高等教育評價研究發展的機遇期,繼續拓展研究對象和范圍,使教育評價更好地為教育管理和改革服務。其二是加強評價理論和方法創新,只有這樣才能給評價研究帶來更大的內生動力。第三是提倡績效評價,在評價中更多地體現效率的思想,使高校在加強規模建設的同時,注重效率和質量的建設。
[1]邱均平,文庭孝.評價學:理論·方法·實踐[M].北京:科學出版社,2010.
[2]MBA 環球網[EB/OL].[2012-03-27].www.mbatrip.com]:http://www.mbatrip.com/news/edu/20120327/28908.shtml.
[3]王戰軍,孫銳.我國高等教育評估制度演進趨勢探析[J].高等教育研究,2000(6):78-81.
[4]王德林.我國高等教育評估制度的合法性審視[J].高校教育管理,2012(4):38-42.
[5]湯建民.國內高等教育研究現狀和發展動向的計量分析[J].現代大學教育,2007(5):45-50.
[6]潘黎,王素.近十年來教育研究的熱點領域和前沿主題[J].教育研究,2011(2):47-53.
[7]王義娜.改革開放30年我國民辦高等教育研究綜述[J].民辦教育研究,2009(1):12-18.
[8]湯建民.近十年來國內民辦高等教育的研究足跡[J].現代大學教育,2009(2):27-33.
[9]范笑仙,湯建民.近十年來中國高等職業教育研究的軌跡、特征和未來走向[J].中國高教研究,2010(10):18-23.
[10]高桂云,王兆瑞.2001—2009年我國大學教師發展的研究現狀及進一步推進此研究的建議[J].高等教育研究,2012(2):55-57.
[11]王金凱.關于高??蒲袡C構及人員的評價指標體系[J].山東工學院學報,1983(1):63-67.
[12]康宏.高等教育評價標準的價值反思[M].青島:中國海洋大學出版社,2011:155-166.
[13]林聚任.社會網絡分析:理論、方法與應用[M].北京:北京師范大學出版社,2009.
[14]BARRY WELLMAN.Network analysis:Some basic principles[J].Sociological Theory,1983(1):157.
[15]劉軍,整體網分析講義[M].北京:世紀出版集團,2009:97-107.
[16]王運鋒.社會網絡分析與可視化工具NetDraw的應用案例分析[J].現代教育技術,2008,18(4):85-89.
[17]余秀蘭.高等教育研究領域中的女性——基于對《高等教育研究》2001-2010年的載文分析[J].高等教育研究,2012(6):52-58.
On Themes and Its Evolution of Chinese Tertiary Education Evaluation Study
NIU Fenggao1,2,WANG Feifei1,3,QIU Junping3
(1.School of Information Management,Wuhan University Wuhan,430072,P.R.China;2.School of Mathematical Sciences,Shanxi University,Taiyuan 030006,P.R.China;3.Research Center for China Science Evaluation,Wuhan University,Wuhan 430072,P.R.China)
Based on the 35859 papers from CNKI(China National Knowledge Infrastructure),and applying the co-occurrence theory, the article analyzes the present situation, hot topics and research direction of the higher education assessment and evaluation in China from the perspective of SNA.Some results were gained.Research in the field has been increasingly hot, and the theme has been richened, but it mainly concentrated on a few topics,such as “universities”, “the quality of teaching”, “evaluation”, “teaching”, “teaching management”and “evaluation index system”, which are most research hot topics.Eliminating the ordinary theme of“university”, there are some keywords like “teaching evaluation”, “teaching management”, “evaluation index system”, “college teachers”and “assessment”.They are strongly radioactive due to some degree of co-occurrence with other research topics.And with further clustering analysis we see clearly the three gathered group of research direction.And from the temporal change of the quantity we also see the three stages of evaluation research themes,which continue to expand and deepen in the past time.
tertiary education;evaluation;assessment;evolution of themes;co-occurrence analysis;social network analysis(SNA);
G40-058.1
A
1008-5831(2013)01-0104-07
2012-09-22
山西大學人文社會科學科研基金(1009031)
牛奉高(1980—),男,山西沁水人,山西大學講師,武漢大學信息管理學院博士研究生,主要從事信息計量與科學評價、應用統計研究;王菲菲(1985-),女,山東濱州人,武漢大學博士研究生,主要從事信息計量與知識管理研究;邱均平(1947-),男,湖南漣源人,武漢大學教授,博士研究生導師,主要從事信息計量與科學評價、知識管理與競爭情報研究。
(責任編輯 彭建國)