大學排行評估起源于美國,1983年《美國新聞與世界報道》(以下簡稱美新社)首次對美國大學進行排行評估,之后英國《泰晤士報》、德國《明鏡周刊》和日本《鉆石周刊》等知名媒體,相繼展開了對大學的排行評估,大學排行評估在世界范圍內掀起了一股新的浪潮。本文力圖以我國國情為基礎,分析我國的大學排行評估體系,在這一基礎上與美國的大學排行評估體系進行比較,分析二者存在的差距,并借鑒美國大學排行評估體系的先進方法,提出使我國大學排行評估體系更加全面、公正、系統和科學的具體路徑。
一、美國大學排行評估體系分析
1.美國大學排行評估的主要機構及其步驟
美國的大學排行評估主要是由民間機構發起,數目眾多。其中比較有代表性的大學排行評估機構有:佛羅里達大學人文與社會科學研究中心,普林斯頓大學,美國研究委員會和美新社。佛羅里達大學人文與社會科學研究中心發布的“最佳研究型大學排行”,以為管理者了解和改進學校的績效狀況為目的,評價內容包括科研經費、捐贈資產等9項;普林斯頓大學發布的大學排行榜,以幫助學生擇校為宗旨,評價內容包括管理、學術、課程等10項。盡管這些大學排行評估機構形式多樣、目的各異、選擇的指標和側重點差異較大,但卻從不同角度、不同層次綜合反映了美國高校的實力。
2.美新社的大學排行評估體系
1983年,美新社(U.S. News and World Report)首次對美國本科院校分類排行。美新社的大學排行體系規模較大,數據來源可靠,具有較高參考價值,在美國乃至世界都得到廣泛應用。該排行的結果綜合反映了院校的教學、科研水平和學生就業等方面的實力,為學生和家長提供了各種可比的數據,為他們選擇大學提供豐富的信息。
美新社的大學排行方法依據美國卡內基教學促進基金會的高等教育分類方法。該基金會提出的高等院校分類,是目前美國高等教育界認可的占主導地位的分類方法。該方法主要根據高等學校的學術水平和辦學水平分出等級,自1973年首次提出分類至2000年的20多年間,先后歷經了五種分類版本。美新社是按照1987年版的分類法將大學分為四類,即全國性大學(National Universities)、全國性文理學院(National Liberal Arts Colleges)、地區性大學(Regional Universities)、地區性文理學院(Regional Liberal Arts Colleges)。美新社在對不同類型的大學進行排行評估時,聘請各大學校長、學院院長和學校招生辦公室主任等參加評估,并要求他們從五個層次進行評分,最后計算出各院校在每項指標上的平均分,與其對應的各項指標權重相乘并加總,最后得到各院校的綜合得分。

美新社2004年大學綜合評價量化的這些指標主要反映高等院校的教育投入和教育產出。其中,一級指標包括:同行評議(peer assessment)、新生情況(student selectivity)、師資情況(faculty resources)、保持率(retention)、財力狀況(financial resources)、校友捐贈率(alumni giving rate)和實際畢業情況(graduation rate performance)。一級指標和二級指標及對應權重見表1。
穩定性是衡量一個大學排行評估體系是否成功的重要標志。美新社自首次推出大學排行至今已有20多年,其指標體系和權重一直保持比較穩定。其中,變化較大的是一級指標“同行評議”(Peer assessment),由最初的“學術聲譽”(Academic reputation)到2003年的“同行聲譽”(Peer reputation),再到2004年的“同行評議”(Peer assessment)。“新生情況”下二級指標的設置與權重也略有變化。由此可見,美新社的大學排行評估體系具有相對比較穩定的指標體系,因此,該大學排行評估體系在美國乃至世界都有著廣泛的影響。
二、中國大學排行評估體系分析
1.中國大學排行評估的主要機構及其方法
現行比較有代表性的大學排行是:網大“中國大學排行榜”、中國校友會的“中國大學排行榜”以及廣東管理科學研究院大學評價課題組的“中國大學評價”。這三個機構的大學排行選取的評估指標和評估方法各異。
2.中國校友會的大學排行評估
2002年9月,中國校友會開始對中國大學進行排行,其主要目標是向社會提供一個公正、客觀、全面的反映中國大學綜合實力的排行榜,為學生及家長選擇理想大學和專業提供更加豐富的信息。2005年,中國校友會和《21世紀人才報.大學周刊》以“大眾參與,大眾評選”為宗旨,以“科學、客觀、公正、公平”為原則,由評估委員會主任、中南大學教授、中國大學評價咨詢專家蔡言厚負責大學排行指標體系的設計。與2003、2004年的評估指標體系相比,2005年的評估指標體系有了進一步的完善,運用金字塔原理和“新聞洞”理論,以全新的視角選取評估指標體系。中國校友會2005中國大學排行的評估指標體系有3個一級指標,9個二級指標,31個三級指標,102個指標參數。一級指標與二級指標及權重見表2。

中國校友會2005年大學排行評估指標體系主要有三大特點:一是指標的選取主要反映高校辦學和科學研究水平指標;二是注重指標數據的時效性。將積累性指標與年度相結合,積累性指標數據排行榜中50%左右的指標數據均反映了高校2004年度的狀況。三是引用中國權威媒體調查數據,獨立進行聲譽調查,保證排行的公正性、客觀性和權威性。
3.網大的中國大學排行評估
1999年,網大推出了中國第一份從消費者角度評價的中國大學排行榜,引起了社會巨大的震動。網大的大學排行評估指標體系較多的借鑒了美新社的大學排行評價指標,具有明顯的“移植色彩”(表3)。

2004年,網大大學排行評估指標體系及權重與1999年相比有了一定的變動。該指標體系的一級指標中,增加了聲譽指標,并把原來的學術分為學術資源和學術成果兩個一級指標,物質資源不僅包括科研經費,還包括圖書總量及生均圖書量和校舍面積及生均面積。二級指標比原來更為具體,其評價指標更多以人均擁有量來衡量。該項目評價指標及權重的確定由三輪問卷調查組成。在問卷調查中,采用了特爾菲法和層次分析法。
4.大學評價課題組的大學排行評估
以武書連為首的廣東管理科學研究院大學評價課題組,自1997年在《中國高等教育評估》按年度發表“中國大學評價”以來,在國內引起了廣泛關注。該課題組評價指標體系龐大,涉及多種類型評估,指標穩定。首先,該評價指標體系將中國的大學分為四個類型:研究型、研究教學型、教學研究型、教學型。其次,該指標體系大量運用數量和規模指標,對人才培養和本專科生指標賦予較大的權重。評估的基礎是以不同類型大學的科研人員平均具有創新能力,并以對社會的貢獻作為唯一衡量的標準。2000年,該評估指標體系做了重大調整,以人才培養和科學研究為一級指標,包括23個二級指標。2001年,該評估指標體系重新做了調整,將二級指標體系改為三級指標體系,使指標體系更加科學(表4)。

三、中美大學排行評估比較
1.評估思想的差異
評估思想的差異主要表現在兩國評估指標及權重上,不同的評估思想側重不同。中國大學排行評估注重“總量”,選取的指標體現的是高校的科研學術能力、師資力量等,評估目標都是以高校的綜合實力來衡量,沒有針對不同高校的個性來衡量,評估模式單一。而美國大學排行評估則是依據不同類型大學、不同的評估目的選取指標。
評估思想的差異不僅表現在兩國之間的排行評估指標體系上,也表現在國家內部各排行機構的評估指標體系上。目前中國大學排行的評估思想各具特色,網大號稱“從消費者角度評估中國的大學,力求反映大學的辦學效益”。廣東科學管理研究院則稱“唯一解決了不同大學相互排行的大學排名”和“以對社會的貢獻作為唯一衡量標準的中國大學評價體系”,中國校友會稱“中國第一個排名指標最全面的排行榜”。由于對中國大學排行評估思想的差異,以至于同一高校在不同的排行榜中名次相差甚遠。
2.評估指標的差異
一是評估指標的側重不同。從整體上看,美國側重同行評議、師資情況和學生保持率;中國側重學術科學研究,在對教師、學生方面的指標過于簡單,如畢業生就業率、學校聲譽、學術論文等社會關注的指標用得甚少。相反,美國大學排行則注重這些指標。
二是評估指標體系的穩定性。評估指標體系的相對穩定性是一個指標體系成功的重要標志??梢员WC評估對象具有可比性,使其具有更大的參考價值。
3.評估方法的差異
中美大學排行評估方法的最大差異在于解決不同類型大學排行的可比性問題上。中國大學排行榜中都沒有對大學分類,雖然武書連借鑒美國做法,在排名中將現有中國大學分為四個類型:研究型、研究教學型、教學研究型、教學型。但是,在具體排行評估上,并未體現不同類別的大學排行。而美國對大學排行的基礎就是對不同大學進行分類,然后針對不同大學的特點進行排行,這樣保證了不同類型大學的可比性。
數據收集的信度和效度方面,國內各大排行都未完全公開采用數據及其數據的來源。很多數據是否有信度難免使人懷疑,只有公開、公正、客觀的數據才能真實反映高校的實際情況。因此,排行公布高校名次之外,有必要公布數據來源。這也是我國大學排行引起爭議的原因之一。美國排行評估的數據有來自權威機構的經過整理加工數據,有調查整理的,在公布排行結果的同時,還公布可比數據,這就保證了數據的真實、可靠。
四、結論與啟示
綜上所述,美國大學排行評估有很多值得借鑒的經驗。首先,借鑒美新社的做法先對大學分類,然后根據類別不同,對指標和權重做相應調整。如對科研為主、教學為主的分別分類評估,充分考慮大學的個性,使得各個大學在評估中能體現自身的優勢,促進大學的發展。其次,大學排行評估指標體系和評估方法要不斷改進。大學排行評估指標體系和評估方法直接影響排行結果,要客觀的體現大學綜合實力,評估指標體系要求相對穩定并且內容符合高校實際,數據收集、處理必須科學,客觀可靠。評估方法上要由定量評估發展到定量與定性結合評估。最后,大學排行是一個不斷完善的動態過程,其變化是永恒的。大學排行的多樣化也是社會多元化的體現,不可能運用某個標準作為尺度,單一的模式評估大學。