蔣玲 施立紅 苗林
大數(shù)據(jù)對人文社科成果評價的價值研究*
蔣玲 施立紅 苗林
論文提出了大數(shù)據(jù)評價方法所帶來的轉(zhuǎn)變以及可能產(chǎn)生的貢獻(xiàn),認(rèn)為這種評價方法將作為目前經(jīng)驗性評價方法的補充,可以得出更準(zhǔn)確的評價結(jié)果。然而大數(shù)據(jù)雖然為人文社科學(xué)術(shù)評價的轉(zhuǎn)變提供了新的機遇,也不能盲目地完全信任新的評價方法,應(yīng)理性并扎實地推進(jìn)評價改革。
大數(shù)據(jù)人文社會科學(xué)科研成果
DOI 10.16810/j.cnki.1672-514X.2016.03.022
互聯(lián)網(wǎng)、現(xiàn)代通訊、社交網(wǎng)絡(luò)和電子商務(wù)將我們帶入了大數(shù)據(jù)時代。大數(shù)據(jù)被定義為以PB(1024TB)為單位的非結(jié)構(gòu)和無序性的數(shù)據(jù)信息,雖然極為龐大,但云計算可迅速地分析目標(biāo)并得到相對準(zhǔn)確的結(jié)果。大數(shù)據(jù)及云計算這兩樣工具使得更多的真相得以在龐大的信息中被加以揭示,而且與以往的因果關(guān)系分析與研究不同,大數(shù)據(jù)中是從相關(guān)關(guān)系的角度進(jìn)行分析挖掘,從而幫助人們做出決策。
相比自然科學(xué)研究成果,人文社會科學(xué)表現(xiàn)出一定的廣泛性、復(fù)雜性、歷史性、社會性和相對性。當(dāng)今,人文社會科學(xué)科研成果的評價方法主要建立在因果關(guān)系的評價方法上,如專家評價方法、期刊級別評價方法、代表性成果評價方法和績效評價方法等,這些方法在很大程度上反映了科研成果的價值[1]。但是,科研成果所預(yù)期的社會效益、專業(yè)研究影響力、與研究熱點的緊密程度、研究人員及社會的關(guān)注程度等信息則很難使用該方法進(jìn)行評價。筆者從大數(shù)據(jù)分析方法中得到啟發(fā),嘗試提出利用相關(guān)關(guān)系的角度評價科研成果,挖掘出大數(shù)據(jù)對于人文社科科研成果評價的價值。
1.1 大數(shù)據(jù)內(nèi)涵
大數(shù)據(jù)就是囊括了包括各方面信息的一個龐大的數(shù)據(jù)總和,其最核心的價值在于對海量數(shù)據(jù)進(jìn)行存儲和分析,并實現(xiàn)預(yù)測某一事物發(fā)展的趨向。相比起現(xiàn)有的其他技術(shù)而言,大數(shù)據(jù)的廉價、迅速、優(yōu)化這三方面的綜合成本是最低的。大數(shù)據(jù)最重要的是如何使用,最大的挑戰(zhàn)在于哪些領(lǐng)域能更好地使用數(shù)據(jù)及大數(shù)據(jù)的應(yīng)用情況如何。
1.2 引用大數(shù)據(jù)評價的契機
有研究人員對人文社會科學(xué)研究成果進(jìn)行了分析,“可以確認(rèn)人文社會科學(xué)學(xué)者的研究產(chǎn)出具有一些不同于自然科學(xué)者的特性,足以支持人文社會科學(xué)學(xué)者研究產(chǎn)出的學(xué)術(shù)評鑒不宜與自然科學(xué)采用同一標(biāo)準(zhǔn)。”人文社會科學(xué)學(xué)者成果種類呈多元化,包括非學(xué)術(shù)性的圖書、雜志、報紙等多元化的出版品型態(tài)。如要完整地將社會科學(xué)學(xué)者所有有影響力的研究成果涵蓋在評價范圍內(nèi),包括轉(zhuǎn)載、引用或延伸出的觀點等有影響的方面,點對點評價難以支撐所有的信息,但大數(shù)據(jù)評價卻可以做到這一點[2]。
2.1 從隨機樣本到全體數(shù)據(jù)
在信息處理能力受限的時代,世界需要數(shù)據(jù)分析,卻缺少用來分析所收集到數(shù)據(jù)的工具,因此隨機采樣應(yīng)運而生。統(tǒng)計學(xué)的一個目的就是盡可能使用少的樣本數(shù)據(jù)反映或證實大群體的事實。隨機樣本是非常成功的統(tǒng)計方法,當(dāng)我們沉溺于隨機抽樣方法的使用和避免主觀偏見的時候,大數(shù)據(jù)時代的到來已經(jīng)使得獲取全體樣本數(shù)據(jù)的可能不再是妄想了[3]。如今,計算和制表不再像過去一樣困難。感應(yīng)器、手機導(dǎo)航、網(wǎng)站點擊被動地收集了大量數(shù)據(jù),而計算機可以輕易地對這些數(shù)據(jù)進(jìn)行處理。
人文社會科學(xué)科研成果的評價屬于社會科學(xué)的范疇,社會科學(xué)大部分工作在于通過樣本分析、研究和調(diào)查問卷分析實證數(shù)據(jù)。大數(shù)據(jù)記錄下了人們的平常狀態(tài),對全體數(shù)據(jù)的分析避免了調(diào)查問卷時可能出現(xiàn)以偏概全的影響;大數(shù)據(jù)收集到了過去無法收集到的信息,跳出了對抽樣調(diào)查的完全依賴。在很多領(lǐng)域,從收集部分?jǐn)?shù)據(jù)到收集盡可能多的數(shù)據(jù)的轉(zhuǎn)變已經(jīng)發(fā)生了[4]。如果可能的話,我們會收集所有的數(shù)據(jù),即“樣本=總體”。
2.2 從精確性到混雜性
當(dāng)我們掌握有限的數(shù)據(jù)時,我們務(wù)必要確定每條數(shù)據(jù)的精確性,以保證分析結(jié)果的準(zhǔn)確,因為收集信息的有限意味著細(xì)微的錯誤會被放大,甚至有可能影響整個結(jié)果,同時在保證數(shù)據(jù)的精確性上要下足功夫。然而,在不斷涌現(xiàn)的新情況里,允許不精確的出現(xiàn)已經(jīng)成為一個新的亮點,而非缺點。因為放松了容錯的標(biāo)準(zhǔn),人們掌握的數(shù)據(jù)也多了起來,還可以利用這些數(shù)據(jù)做更多的事情。這樣就不是大量數(shù)據(jù)優(yōu)于少量數(shù)據(jù)那么簡單了,而是大量數(shù)據(jù)創(chuàng)造了更好的結(jié)果。如果掌握了相關(guān)的大量或全部數(shù)據(jù),就可以從繁雜的大信息量中獲益,并允許錯誤的信息存在,而不是以高昂的代價來避免不確定性[5]。
從大數(shù)據(jù)的完整和混雜的信息中得出的客觀結(jié)果,可以預(yù)期人文社會科學(xué)科研成果效益和價值,突破點對點式的結(jié)論,從更廣闊的維度層面進(jìn)行評價。大數(shù)據(jù)要求我們接受混雜性和不確定性,從中獲得真相的全貌。要想獲得大規(guī)模數(shù)據(jù)帶來的好處,混雜應(yīng)該是一種標(biāo)準(zhǔn)途徑,而不應(yīng)是竭力避免的。
2.3 從因果關(guān)系到相關(guān)關(guān)系
相關(guān)關(guān)系一般指某一事物不論是好的還是壞的,只要發(fā)生就一定與某些人或者物有關(guān)系。包括任何不確定因素成分的存在都和相關(guān)關(guān)系有直接或者間接的聯(lián)系。從科研上來說,相關(guān)關(guān)系是可以讓我們更快地發(fā)現(xiàn)指向因果關(guān)系的風(fēng)向標(biāo),同時更快速地排除不必要的行為,以加快研究進(jìn)度,特別在研究復(fù)雜系統(tǒng)時,使用大數(shù)據(jù)進(jìn)行研究的方法效率很高。
鑒于時代的發(fā)展速度和社會需求,深入研究相關(guān)關(guān)系有時候意義甚于研究因果關(guān)系。大數(shù)據(jù)的核心便是在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測。如果A和B一起發(fā)生,那么B的發(fā)生也預(yù)示著A的發(fā)生,在巨大的信息量中,無數(shù)個A和B相關(guān)性被發(fā)現(xiàn),那么A的發(fā)生也就相應(yīng)有了大概率的預(yù)測辦法[6]。雖然利用相關(guān)關(guān)系的評價有時收到奇效,但大數(shù)據(jù)的評價方法卻無法代替同行評議等主觀和因果關(guān)系的評價方法,主觀和客觀的合一,因果關(guān)系和相關(guān)關(guān)系的合一,雙重評價方法的搭配才可以揭示科研成果價值的真相。
國家人文社科評價在理論和實踐上還存在著諸多問題,尚未形成公認(rèn)的人文社會科學(xué)評價手段,同時在國際上也沒有一套現(xiàn)成的學(xué)術(shù)評價體系可以直接應(yīng)用。大數(shù)據(jù)分析最重要的應(yīng)用領(lǐng)域之一就是預(yù)測性分析,從大數(shù)據(jù)中挖掘出特點,建立科學(xué)的模型,通過模型代入新的數(shù)據(jù),從而預(yù)測未來的結(jié)果,由此大數(shù)據(jù)評價將可以在科研成果的獨創(chuàng)性、社會效益和科學(xué)價值方面起到一定的挖掘分析作用[7]。這些方面,是以往人文社會科學(xué)科研成果評價所無法觸及的,大數(shù)據(jù)評價將對如今現(xiàn)有的評價體系做出有益的補充,更加真實地反映出科研成果的真正價值。
不同的人文社會科學(xué)成果評價內(nèi)容需要不同的大數(shù)據(jù)進(jìn)行分析。對人文社會科學(xué)科研成果獨創(chuàng)性的評價使用反抄襲系統(tǒng),它所包含的信息量在10TB以上,這是科研領(lǐng)域使用大數(shù)據(jù)進(jìn)行成果評價的成功案例,并隨著時間和信息量的累積,大數(shù)據(jù)也在不斷地擴展。對社會效益的評價,可能會使用到更多網(wǎng)絡(luò)的大數(shù)據(jù),如百度網(wǎng)民搜索大數(shù)據(jù);對科學(xué)價值的評價則會使用到學(xué)術(shù)論文大數(shù)據(jù),包括CNKI或萬方數(shù)據(jù)庫[8]。
3.1 人文社會科學(xué)科研成果獨創(chuàng)性的評價
獨創(chuàng)性科研成果是由作者獨立完成的,而并非重復(fù)已有的科研成果,它與其他研究成果之間具有一定的差異性,科學(xué)研究的進(jìn)展尤其作為人文社會科學(xué)中有價值的科研成果多數(shù)都具有鮮明的獨創(chuàng)性。現(xiàn)今,清華大學(xué)已制作出科研論文反抄襲系統(tǒng)軟件,供全國各科研單位在期刊論文發(fā)表和高校畢業(yè)生論文審校時使用,軟件大數(shù)據(jù)庫收納了20世紀(jì)80年代以來所有公開發(fā)表的論文,在大數(shù)據(jù)對成果獨創(chuàng)性評價的使用過程中,有效降低了科研成果的重復(fù)現(xiàn)象。人文社會科學(xué)科研成果具有一定的主觀性和廣泛性,百家爭鳴和標(biāo)新立異才能推動人文社會學(xué)向前發(fā)展,科研成果的獨創(chuàng)性是價值基礎(chǔ),大數(shù)據(jù)評價成果的獨創(chuàng)性可以對同行評議提供參考和補充[9]。
3.2 人文社會科學(xué)科研成果社會效益評價
百度海量網(wǎng)民行為數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)分享平臺——百度指數(shù)正在向公眾開放,利用檢索詞可以通過這個大數(shù)據(jù)分享和搜索平臺獲得一定時間內(nèi)的網(wǎng)民整體搜索指數(shù)和移動搜索指數(shù),從而進(jìn)一步判別其科研成果是否與大眾所關(guān)心的問題有關(guān),并能夠預(yù)期為大眾帶來多少社會效益。雖然現(xiàn)在對社會效益的量化還沒有很好的辦法,但我們已經(jīng)可以從大數(shù)據(jù)中得出科研成果與社會效益的相關(guān)性結(jié)果。
我們以“大數(shù)據(jù)”檢索詞為例,輸入百度指數(shù)中,時間區(qū)間選擇為一年,可以發(fā)現(xiàn)“大數(shù)據(jù)”的需求分布圖譜(見圖1),以及相關(guān)檢索詞(見圖2)。

在趨勢研究的選項中(見圖3)可以看出“大數(shù)據(jù)”檢索詞被人們關(guān)注的程度,從2012年到2014年,大數(shù)據(jù)被檢索的次數(shù)呈階梯式的上漲。

隨著大數(shù)據(jù)研究的發(fā)展,越來越多的檢索庫將公開自己網(wǎng)站的海量數(shù)據(jù)共享,為人文社會科學(xué)科研成果的社會效益預(yù)測和評估開辟了新的途徑。
3.3 人文社會科學(xué)科研成果科學(xué)價值評價
科研成果在制造社會效益和價值外,更多的是被同行業(yè)或相關(guān)行業(yè)學(xué)者專家借鑒和使用,即產(chǎn)生的科學(xué)價值,也稱為學(xué)術(shù)價值。我們可以從眾多不同種類的學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫中下載選擇范圍內(nèi)的涵蓋論文名稱、作者、關(guān)鍵詞 、摘要 、發(fā)表時間及刊物等信息的大數(shù)據(jù),從大數(shù)據(jù)中分析檢索詞學(xué)術(shù)關(guān)注程度,相關(guān)檢索詞熱點等信息。
學(xué)術(shù)文獻(xiàn)大數(shù)據(jù)分析可以采用一些軟件,如CiteSpace,這是一款可視化文獻(xiàn)分析軟件,是大數(shù)據(jù)時代下的產(chǎn)物。它能夠顯示一個學(xué)科或檢索詞的知識域在一定時期發(fā)展的趨勢與動向,輔助對科研人員、成果或機構(gòu)進(jìn)行評價,形成若干研究前沿領(lǐng)域的演進(jìn)歷程。簡單說來,就是找出學(xué)術(shù)文獻(xiàn)中文字(包括作者、雜志、關(guān)鍵詞 、被引用詞匯等等)的關(guān)系,并可視化表示出來(見圖4)。

CiteSpace只是大數(shù)據(jù)分析工具之一,更多的分析軟件會將大數(shù)據(jù)龐大和繁雜的信息通過相關(guān)性的方法分析出來,使人文社會科學(xué)科研成果的學(xué)術(shù)價值在大數(shù)據(jù)分析下得以客觀呈現(xiàn)。
評價和了解研究人員的學(xué)術(shù)研究成果,可以為后續(xù)學(xué)術(shù)質(zhì)量的提升及規(guī)劃發(fā)展提供參考依據(jù),并以此來激勵研究人員進(jìn)一步提高其學(xué)術(shù)研究的質(zhì)量。長期以來,人們在此方面一直是以定性的方法為主,強調(diào)同行互評,并輔之以書目等成果計量方式的定量方法,目前定性與同行互評仍位居學(xué)術(shù)評價的主流地位。同行互評的缺陷在于無法排除評價者的主觀影響,評價者本身的學(xué)術(shù)積累、知識領(lǐng)域和學(xué)術(shù)觀點等都會對被評價者造成一定的影響。計量方式只是對其所發(fā)表的出版物進(jìn)行計量,無法真正計算學(xué)術(shù)成果所帶來的社會影響力。大數(shù)據(jù)的出現(xiàn)使得這些原本難以解決的難題迎刃而解。大數(shù)據(jù)主要的功能之一就是預(yù)測。人文社會科學(xué)科研成果的影響力可能是長時間的,在短時間內(nèi)無法通過有限的數(shù)據(jù)真正反映其價值,大數(shù)據(jù)的預(yù)測使其成為可能,并大幅縮減評價時間和評價成本,將控制評價的主觀隨意性減到最低。
當(dāng)然,在人文社會科學(xué)科研成果中采用大數(shù)據(jù)評價方法也存在很多障礙。如牽頭機構(gòu)、數(shù)據(jù)整合、學(xué)者意識、推廣宣傳等,以及改變現(xiàn)有人文社科學(xué)術(shù)評價的固有理念,使之向大數(shù)據(jù)轉(zhuǎn)移,也是一大難點。辯證地認(rèn)識大數(shù)據(jù)時代評價結(jié)論的相對性,是確保評價變革成果的關(guān)鍵。大數(shù)據(jù)時代評價結(jié)論具有相對的正確性,但不能將大數(shù)據(jù)的評價結(jié)論等同于精確結(jié)論。因為數(shù)據(jù)可能是全面的,但人對大數(shù)據(jù)的掌控力度有限,不可能完全把握。大數(shù)據(jù)的評價結(jié)論也可能出錯,因此不能將大數(shù)據(jù)時代的評價“神化”“萬能化”[10]。首先,我們并不能通過大數(shù)據(jù)預(yù)測出創(chuàng)新的成果一定會成為熱點。如果過度依賴大數(shù)據(jù)的結(jié)果,科研成果反而會受到分析結(jié)果的壓制;同時,分析和評價也需要同行專家的經(jīng)驗進(jìn)行補充。其次,大數(shù)據(jù)因為信息的過于龐大而允許信息的不準(zhǔn)確性,但卻無法估算多少信息是不真實的,因而存在著大量的“臟數(shù)據(jù)”帶來的隱患;最后,大數(shù)據(jù)存在著個人隱私安全的問題,龐大的信息記錄著個人興趣、經(jīng)歷、聯(lián)系方式等信息,對個人隱私的安全帶來威脅。
統(tǒng)計學(xué)的抽樣調(diào)查是經(jīng)典的社會學(xué)統(tǒng)計分析方法,但隨著大數(shù)據(jù)時代的到來,人們獲得全體數(shù)據(jù)已經(jīng)不是不可能的了,因為先進(jìn)的多核計算機可以在短時間內(nèi)分析完成龐大而繁雜的數(shù)據(jù)[11]。所以,我們可以利用大數(shù)據(jù)分析以前所難以評價的結(jié)果。在人文社會學(xué)科研成果的評價方法當(dāng)中,經(jīng)驗性和結(jié)果性評價仍為主流,本文嘗試提出較為客觀性的大數(shù)據(jù)分析方法評價成果的效益和價值,作為經(jīng)驗性評價的補充,讓主觀和客觀統(tǒng)一,相信會得出更準(zhǔn)確的評價結(jié)果。大數(shù)據(jù)雖然為人文社科學(xué)術(shù)評價的變革提供了新的機遇,我們應(yīng)好好把握,但也不能盲目地?fù)肀А按髷?shù)據(jù)時代”,走向“用量化手段代替一切評價”的極端,應(yīng)警惕這種評價變革可能帶來的風(fēng)險,扎實推進(jìn)評價改革。
[1]黃慕萱.人文社會科學(xué)研究評鑒特性及指標(biāo)探討[J].清華大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2010(5):44-49.
[2]高自龍,楊紅艷.學(xué)術(shù)評價:理想與現(xiàn)實之間的優(yōu)化選擇[J].江漢論壇.2011(11):120-129.
[3]阿爾文·托夫勒.第三次浪潮[M].黃明堅,譯.北京:中信出版社,2006:36-42.
[4]MANYIKA J,et al.Big data:The next frontier for innovation,competition,and productivity[EB/OL].[2015 -07-18]http: www.mckinsey.com/insights/mgi/research /technology and innovation/big data the next frontier for innovation.
[5]倪寧.大數(shù)據(jù)時代的傳播觀念變革[J].西北大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2014(1):139-145.
[6]蔣玲,楊紅艷.大數(shù)據(jù)時代人文社科成果評價變革探析[J].情報資料工作,2015(3):92-97.
[7]王通訊.大數(shù)據(jù)與人才的發(fā)現(xiàn)評價[N].光明日報,2014-04-19(11).
[8]維克托·邁爾·舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2012:55-70.
[9]葉繼元.人文社會科學(xué)評價體系探討[J].南京大學(xué)學(xué)報,2010(1):97-110.
[10]羅旭.大數(shù)據(jù)時代,如何評價人才:訪中國人事科學(xué)研究院原院長吳江.光明日報,2014-05-17.
[11]全國統(tǒng)計專業(yè)技術(shù)資格考試用書編寫委員會.統(tǒng)計相關(guān)知識[M].中國統(tǒng)計出版社,2008.
蔣玲中國人民大學(xué)圖書館館員。北京,100872。
施立紅中國人民大學(xué)圖書館館員。北京,100872。
苗林中國人民大學(xué)圖書館館員。北京,100872。
Study on the Big Data Value of Evaluation for the Humanities and Social Science Achievement
Jiang Ling,Shi Lihong,Miao Lin
This paper proposes the transformation and the possible contribution brought by the evaluation method of big data. It believes that this evaluation method will complement the current empirical evaluation method to obtain more accurate evaluation results.However,the big data provides a new opportunity to change the data for the humanities and social sciences academic evaluation.We cannot blindly trust the new evaluation method.It is rational for us to advance the reform of evaluation solidly.
Big data.Humanities and social sciences.Achievements in scientific research.
C34
2015-07-15 編校:方瑋)
*本文系中國人民大學(xué)科學(xué)研究基金中央高校基本科研業(yè)務(wù)費專項資金資助“基于讀者借閱耦合分析的大學(xué)生閱讀傾向研究”(項目編號:14XNE013)研究成果。