薛燕
自媒體環(huán)境下人文社會科學學術文獻的質量評價
薛燕
為彌補在傳統(tǒng)學術交流領域中僅僅通過文章引用和期刊影響因子進行學術質量評價的局限性和時滯性,本文提出并構建了以引文指標衡量學術影響力和以altmetrics指數(shù)衡量網絡影響力的加權模糊運算模型,認為該評價模型適用于對自媒體環(huán)境下的人文社科學術文獻進行質量評價,從而能夠從多個維度全面反映人文社會科學學術文獻的真實狀況和水準。
自媒體人文社會科學學術評價學術質量評價altmetrics指數(shù)
自媒體的出現(xiàn),使得學術研究與學術交流的環(huán)境發(fā)生了很大的變化,不再完全受制于學術出版機構,在學術評價方面也不再完全取決于同行評議,而獲得了更多的空間與自由度。
傳統(tǒng)的媒介環(huán)境中,學術交流和學術出版的流程圍繞“作者—編輯—評審者”這一過程運行,這一學術生產流程基本保障了學術研究內容的公信力和安全性。而在自媒體環(huán)境下,作者通過網絡平臺,可以較為自由地發(fā)布自己的研究、認識,以及對他人研究的理解和評價。從論壇、社區(qū)到博客,再到微博,在媒體越來越個性化與多元化的同時,研究者發(fā)表看法的空間自由度和評論寬松度也在相應擴大。
特別是人文社會科學領域的研究者,他們利用自媒體更為頻繁,也更普遍。一方面,互聯(lián)網已經成為人文社會科學領域研究者獲取信息、發(fā)布成果和交流的重要平臺。另一方面,互聯(lián)網已經從Web網站和BBS發(fā)展到包括博客、微博、貼吧、百科、社交網站和郵件列表服務器等多種類型的網站;在這一過程中,人文社會科學的網絡信息資源日漸增多,例如:越來越多的人文社會科學領域的研究者習慣于隨時將學術思想、信息發(fā)布在博客、微博或個人網站上,接受大眾的評價,收獲追捧、批評或激發(fā)討論。目前國內知名度最高的自媒體“羅輯思維”就是資深媒體人羅振宇[1]打造的一個發(fā)表自己認識社會和學術研究的自媒體平臺,在該平臺上他以貌似輕松的風格來探討具有嚴肅性的學術和社會話題,在優(yōu)酷上收獲了累計超過1.9億次的點擊,其微信公眾賬號以及微博上,也積聚了大量的粉絲。
不可否認,網絡已經成為同行評議之外最有力,同時也是最為廣泛的評價力量,正如“自媒體”這個概念的定義所指出的那樣,普通大眾借助數(shù)字科技手段,可以像媒體一樣生產、傳播并評價內容[2]。由此,也產生了一個新的學術評價的領域——altmetrics①“Altmetrics”是在2012年由北卡羅萊納大學資訊與圖書館學系的博士候選人Jason Priem在推特(Twitter)所創(chuàng)建的。,即所謂的“替代計量學”或“社媒影響計量學”。維基百科中對于altmetrics這一詞條做了如下定義:作為廣泛采用的期刊影響因子和個人引用指標如H指數(shù)的替代。通過追蹤類似Twitter,F(xiàn)acebook等社交網絡和新聞網站提到和分享某篇論文的次數(shù)以及被評論的次數(shù)等,然后根據(jù)網站的重要性給予不同的權重處理,即可得到對于某一研究成果的測度[3]。簡言之,altmetrics的提出就是針對在學術引文之外的社會媒體對于研究成果的評價,以此作為傳統(tǒng)指標“引文”的補充。
通過網絡數(shù)據(jù)共享,altmetrics指數(shù)能夠被迅速收集,可以讓研究者近乎實時地看到某一論文、專著、報告、網頁、演講,簡而言之“作品”被人們關注,包括引用、瀏覽、下載、被提及的次數(shù)和程度,以及哪些人對哪一類研究有興趣。因此,這一指標在一定程度上彌補了在傳統(tǒng)學術交流領域中僅僅通過文章引用和期刊影響因子進行學術質量評價的局限性和時滯性。
目前在人文社會科學評價中,影響最大的單一指標仍然是影響因子[4]和H指數(shù)[5]。影響因子雖然一直備受質疑,但它仍然是學術評價特別是學術期刊評價中最為常用的指標。被引頻次是學術評價中最為人所看重的客觀指標,但被引頻次在用于實際評價的過程中也存在很多例外情況。例如:如果某人曾經發(fā)表過一兩篇被引次數(shù)很高的論文,即使其他論文被引次數(shù)低,他的總體成就也會因此被夸大;修正的做法是總被引用次數(shù)除以總論文數(shù),得到平均被引次數(shù)。但是這種做法對論文少的人有利,而對論文多的人不利。H指數(shù)克服了這兩個方面的弊端,能夠對一個科研工作者學術能力作出的綜合評價。但H指數(shù)自提出伊始,就被認為存在局限性,不適用于年輕的研究者。后續(xù)的文獻計量學家們對H指數(shù)作了種種修正,如Leo Egghe提出了G指數(shù)[6]:將發(fā)表論文按被引次數(shù)降序排列,當被引次數(shù)累計量大于或等于排序位次平方的最大排序時,該位次即是G指數(shù)。綜合現(xiàn)有研究成果來看,盡管有種種不足,H指數(shù)也仍然是學術評價最常用的指標之一。
除了上述兩個影響力最大的指數(shù)之外,還有依據(jù)Elseiver引文數(shù)據(jù)庫Scopus產生的聲望指數(shù)SJR(SCImago Journal Rankings,SJR),即一種期刊越多地被高聲望(或影響力)期刊所引用,則該刊的聲望或影響力就越高。在某種意義上,SJR彌補了影響因子為人所詬病的先天性缺陷,即對所有施引期刊都賦予同等的重要性。
1.1傳統(tǒng)學術性評價:引文指標
傳統(tǒng)學術性評價主要是通過編輯審稿和同行評議來實現(xiàn)的,是建立在主觀的專家評議基礎上的定性方法。就人文社會科學領域的研究而言,專家評價的主要考察點大致可以概括為以下四個方面:某一學術文獻所反映出作者知識積淀的多少,作者所做研究的方法是否有創(chuàng)新性,觀點上是否有獨到見解,以及所用材料是否有突破和創(chuàng)新。對這四方面的判斷主要依據(jù)評審專家的學術眼光和學術經驗,因而是主觀與不可控的;同時,此類質量評價控制方式必然導致評審周期長,時滯嚴重。另外,評價成本因素也是影響學術文獻評價的重要因素。因此,目前學術文獻的質量評價主要依托出版機構、索引機構以及用戶的反饋性評價,在此基礎上結合專家的審讀評議開展進行。
由此不難看出,學術文獻的質量評價很大程度上直接相關于學術文獻的被引用、被下載、被關注情況的統(tǒng)計和測度,核心的評價指標大致可以包括:他引量(Ct)、年均他引量(Ca)、H指數(shù)、論文發(fā)表刊物IF值(IF)、施引期刊種類(Ck)和施引期刊最大影響因子(Cfm)等;近年來人們開發(fā)出了一些用于衡量論文質量的替代指標,如特征因子(Eigenfactor)和IFPA指數(shù)。特征因子以5年為周期進行計算,將“引文質量”納入測評范圍,以類似于PageRank的算法迭代計算出期刊的權重影響值,實現(xiàn)了引文數(shù)量與價值的綜合評價。其計算思想也與社會網絡分析中用于描述節(jié)點在關系網絡中權力和地位的特征向量中心度相似。此外,還有影響因子平均值IFPA指數(shù)(Impact Factor Point Average),IFPA指數(shù)綜合考慮了學科的平均影響因子、期刊的影響因子、一個期刊的影響因子在本學科中的排序等,意在消除由于學科領域不同產生的影響因子和期刊數(shù)量的差別[7]。計算公式如下:
IFPA=(Ij/IA)(1-R/(N+1))n
式中:Ij為某刊的影響因子;IA為學科平均影響因子;R為某刊在本學科的影響因子排序;N為某學科的期刊總數(shù);n為某機構發(fā)表的論文數(shù)量。
這些指標所做出的評價基本都是相對客觀的,但仍然是一種學術文獻發(fā)表后的反饋評價,是一種反饋性的滯后型學術評價方法。雖然引文分析被用于解釋人文社科研究的學術質量和學術影響,在一定層面上已經被證明是可行的,但也一直存在爭議,撇開有關學術管理部門對這些指標的誤讀和誤用因素之外,學界對于目前的學術文獻質量評價其實有一種較為清晰的認識,即認為目前的論文評價只是一種以期刊評價來代替論文評價,這是學術文獻質量評價中無法回避的問題。
1.2媒介補充性評價: altmetrics指數(shù)
面對這一問題,針對學術文獻質量評價的補充性或者說替代性指標的篩選和挖掘日益成為學術評價領域學者研究和關注的熱點。隨著網絡的發(fā)展,E-science環(huán)境日趨成熟,在線學術文獻發(fā)表不斷增加,開放的學術出版被廣泛使用,學術研究者也越來越習慣于在網絡數(shù)字環(huán)境中開展工作,并成為網絡上的學術部落,相應有關的學術評論和學術交流和分享也廣泛地在科學博客、社交網絡、BBS論壇等展開,因此,網絡時代對于學術文獻的質量及其影響力的判斷已經不僅僅局限在傳統(tǒng)學術交流環(huán)境中文獻間正式的引用上了,僅僅采用基于引文的指標也無法精確評估某以學術文獻對于社會和學術界所產生的影響力,網絡的媒介功能使得網絡逐漸成為傳統(tǒng)同行評議之外最廣泛的社會評價力量。所謂的altmetrics指數(shù)[8],就是由網絡媒體對于研究成果的評價而來的。借助數(shù)字和網絡技術,人們可以追蹤學術社區(qū)和學術網站,獲取對某篇論文的被提到、被轉發(fā)、被分享以及被評論次數(shù)的數(shù)據(jù)等,由此形成對于某一研究成果的測度。
Altmetrics指數(shù)的優(yōu)點正好可以彌補傳統(tǒng)引文指標的不足。首先,altmetrics可以獲得對于學術文獻的即時反饋,而不再是一種滯后的評價,不需要像計算期刊影響因子一樣,需要滯后兩年時間,這種文獻計量需要花很長時間來計算,altmetrics提供的是對于學術文獻的質量和影響力的即時反饋。而且,這一反饋不僅包含學術研究人員,也包括了非專業(yè)讀者。傳統(tǒng)引文一定是來源于學術研究人員的,因為學術期刊的主要受眾是研究人員,相應的對于研究成果的評論、分享和批評也只會在與研究密切相關的群體間進行。但是,在網絡環(huán)境中,這一期刊發(fā)生了改變,在線討論的不僅是研究者,也可能包含學生、決策者、業(yè)內代表和非專業(yè)人士等,這一點對于人文社會科學研究而言是極其寶貴的,并且是迫切需要的,因為人文社會科學所關注的研究問題是來自于人的精神和社會的,altmetrics指標極其充分的彌補了傳統(tǒng)引文指標的不足。
Altmetrics指數(shù)并不是一個單一的指標,而是衡量某一研究透過在線平臺(如:Twitter,Blog)被引用、喜愛、分享、收藏、下載、提及、評論或討論的次數(shù),這些數(shù)據(jù)是透過各式各樣的開放式網路服務搜集而來,包含開放存取期刊、學術引用數(shù)據(jù)、學術社區(qū)以及社交平臺。通過altmetrics.org網站和ImpactStory在線申請,就能追蹤所關注的某一研究或學術文獻,或學者自己的影響力。
以Plum Metrics[9]為例,該站點是由Andrea Michalek和Mike Buschman共同建立的,目的是為了跟蹤研究的分享收錄和引用情況。Plum Metrics的評分主要基于社會化媒體和分享,一般包括以下幾方面測度內容指標:(1)使用(Usage):Abstract Views、下載、瀏覽、館藏、館際互借、文獻傳遞;(2)抓取(Captures):喜歡、書簽、保存、閱讀器、分組;(3)提及(Mentions):博文、新聞專題、維基百科條目、評論;(4)社會媒體(Social Media):喜歡(Facebook,Vimeo,YouTube)、+1(Google+)、Ratings(SourceForge)、贊(Figshare,SourceForge)、分享(Facebook);(5)引用(Citations):Cited by CrossRef、PubMed、Scopus、專利(USPTO)等。
Plum Metrics不僅針對期刊論文,還包括很多其他的內容,如博客、書籍章節(jié)、訪談、案例、圖表、數(shù)據(jù)集、會議文獻以及網頁、多媒體、專利等等,因而Plum Metrics可以說是面向的是一個真正意義上的學術文獻。
PLOS Article-Level Metrics[10]的影響指標同樣也包含了相類似的指標:(1)使用:PLOS瀏覽、PDF下載、XML下載,PMC瀏覽、PDF下載;(2)引用:PubMed Central、CrossRef、Scopus、Web of Science;(3)社會書簽與發(fā)布活動:CiteUlike、Mendeley、推特、臉書;(4)媒體與博客覆蓋:Nature博客、ScienceSeeker、研究博文、維基百科、引用通告(trackbacks);(5)討論活動與評級:PLOS的評論、注釋、評級。
由于中國網絡部分限制以及語言隔閡等原因,對于我國論文的altmetrics 指數(shù)統(tǒng)計的客觀性會受到一定程度影響。Altmetrics最近已經開始在數(shù)據(jù)統(tǒng)計中支持新浪微博,鼓勵中國的研究者在微博上更多的分享自己的研究成果。但是,國內尚未有知名社交媒體主動申請加入altmetrics的數(shù)據(jù)統(tǒng)計,如科學網、小木蟲、丁香園、愛思想等。
隨著人們對altmetrics關注度的日益提高,將會有越來越多的研究者習慣于在網絡中跟蹤和關注其他研究者的活動,并發(fā)表自己的觀點和評論,進而產生在線影響力。因此,altmetrics指數(shù)的統(tǒng)計范圍也會越來越廣泛,未來將有可能擴展到國內所有知名學術論壇和網站。
2.1網絡學術文獻質量評價模型構建
Altmetrics目前是文獻計量學領域的關注熱點,引起了研究人員與學術出版界的廣泛關注。盡管有用altmetrics替代引文指標的看法,但更多的研究者和研究人員還是認為引文指標與altmetrics指標互成互補性,誠如德國斯普林格《神經系統(tǒng)科學》期刊出版編輯Martijn Roelandse所說,altmetrics不是要取代傳統(tǒng)指標,而是附加于其上,因為它涵蓋了傳統(tǒng)指標專注于引用而漏掉的其他影響力指標。
無論是傳統(tǒng)的引文指標,還是媒介替代指標,這些評價指標所指向的其實都是單一性的,是源自于人們看待學術研究的某一視角,影響因子是基于期刊的,H指數(shù)是基于科學家績效和成長歷程的,SJR是基于期刊影響力的,altmetrics指數(shù)是基于網絡影響力的,這些單一指標對于評價事物的某一方面無疑都是適用的,可以很快地發(fā)現(xiàn)和揭示出評價對象的主要特點,但與此同時也限制了人們認識事物本質和真相的視角,應該構建指標體系從多維視角去評價學術研究。因此,本文認為有必要建立一個網絡學術文獻質量評價模型,形成多維化的學術文獻評價方案,通過評價的反饋作用,把握學術發(fā)展的狀況,從而達到提高學術質量的目的。
基本的研究思路是以“學術文獻被引統(tǒng)計基準線”及“學術文獻網絡水平基準圖”為基礎,結合引文評價和網絡媒介評價兩種方法,建立一個符合學術研究特點的,重視學術文獻質量和影響力的學術表現(xiàn)評價坐標體系(如圖1所示)。

圖1 學術表現(xiàn)質量評價模型
由此,可以形成四個象限的不同學術文獻質量評價,以論文為例,A區(qū)論文可以被認為是學術質量高,但有可能曲高和寡,網絡社會影響力較弱;B區(qū)論文則無論學術質量和社會影響力都很強;C區(qū)論文是學術質量和社會媒介影響力雙低的論文;D區(qū)是學術質量一般,但具有社會轟動時效的論文;圖中的虛線是通過某一時間段的平均值劃定的質量評價基準線,由此可以得到三類不同質量的論文區(qū)分和界定。
通過這一評價坐標體系,在一定程度上可以更全面地獲得對于人文社會科學學術文獻的基本判斷和認識。
2.2學術文獻質量評價模型的加權模糊運算
本文提出的論文評價模型,是基于加權的模糊綜合運算法[11]。擬根據(jù)各指標的重要程度,分別賦予不同的權重。至于引文指標和altmetrics指數(shù)的具體選取不是本文討論的范疇,本研究所關注的是學術文獻質量表現(xiàn)評價體系,評價的最后總分擬采用如下公式進行計算:

式中:S為學術文獻質量表現(xiàn)評估的最后總分;
λi為一級指標的權重;i=1,2,…,m,m為一級指標的個數(shù);
λij為二級指標的權重;j=1,2,…,n,n,為二級指標的個數(shù);
Sij為二級指標的得分。
本文的論文評價模型中,λi即為所選取的第i個一級評價指標(網絡影響力和學術影響力的各個評價指標)的重要度;λij為第i個指標下的第j個二級指標的Sij重要度。首先,基于網絡影響力和學術影響力的各個判斷指標對人文社會科學文獻進行詳細的分析;然后運用模糊加權算法來分析評判文獻的質量水平高低。
但是,該評價方法也有一定缺陷,例如,圖中小矩形中所示為基準線論文,卻被誤判斷為質量很高的論文,主要原因是其網絡社會影響力很高,被廣泛傳播轉發(fā),從而可能也會被很多學術研究者引用,從而導致其被誤判為高質量論文。例如:“大數(shù)據(jù)”是當下的一個研究熱點,大數(shù)據(jù)相關的文章在網絡上很多,但是仔細分析會發(fā)現(xiàn),網上流傳度較為廣泛的都是那些對大數(shù)據(jù)的介紹性的文章,但是并不能說明這類文章的質量就高。因為這類文章通俗易懂,所以被廣泛閱讀和傳播,從而網絡影響力特別高。而那些討論大數(shù)據(jù)的具體研究內容和方法類的文章,由于其專業(yè)性太強,算法太復雜,關注和點擊率并不是很高,即其在網絡上似乎并沒有太大影響力。
人文社會科學研究本身就具有很大的復雜性、多元性和模糊性,對于以學術文獻為主體的人文社會科學研究成果的評價往往容易受到各種因素的影響和干擾,導致在一定程度上無法真實反映學術成果的影響和效用。
判別一項自然科學的研究,其質量和對于社會生產力的影響都是較為中立客觀,有被驗證的可能,因而比較清楚;而對于人文社會科學研究成果的評價則要模糊的多。一方面,人文社會科學的成果,其學術影響并不是即刻現(xiàn)時顯現(xiàn)的,有時甚至是相當滯后的。不僅如此,在人文社會科學領域,往往經常會出現(xiàn)學術界的認識和社會大眾的理解相左,研究被誤讀,或存在與現(xiàn)時輿論相反的顛覆性價值判斷等復雜情況。因而,在人文社會科學領域,一些極具價值的理論、思想或觀點,往往會出現(xiàn)認識上的幾經周轉,需要經過長期社會實踐和歷史檢驗之后,才可能慢慢為人所理解,因此對人文社會科學領域學術影響的探討,除了應關注同行學者外,還應在更廣闊的社會與空間范疇內對其進行深度審視。
面對多樣性、復雜性的情況,在人文社會科學學術文獻的具體評價中,選定和構建不同的評價指標與維度,確定評價標準,并運用科學的、合適的評價方法是非常必要的。本文所構建的自媒體環(huán)境下的學術文獻質量和影響力的學術表現(xiàn)評價坐標體系有助于完善人文社會科學學術文獻質量評價,以引文評價法為主導,以媒介替代性計量指標作為適當補充、校驗,在一定程度上能夠相對真實的反映學術文獻質量和影響,避免出現(xiàn)過多被片面夸大、抬升,或貶低、忽視,甚至遮蔽的情況,從多個維度反映學術文獻的真實狀況和水準。
[1]張貞.從“羅輯思維”看自媒體傳播特質與生長空間[J].傳媒觀察,2014(10):21-23.
[2]胡吉明.社會網絡環(huán)境下的信息傳播機制[J].情報科學,2015(1):15-18.
[3]余厚強;邱均平.替代計量指標分層與聚合的理論研究[J].圖書館雜志,2014(10):13-19.
[4]邱均平;胡小洋.慶發(fā)文和被引雙增,賀質量和影響齊升:1980—2013年《情報理論與實踐》載文的計量研究[J].情報理論與實踐,2014(12):2-8.
[5]方麗,崔雷.利用雙聚類算法探測學科前沿及知識基礎:以h指數(shù)研究領域為例 [J].情報理論與實踐,2014(11):55-60.
[6]隋桂玲.G指數(shù)與H指數(shù)、e指數(shù)的關系及其文獻計量意義[J].圖書情報工作.2013(23):90-94.
[7]俞立平,潘云濤,武夷山.基于分位數(shù)回歸的期刊影響因子影響因素研究[J].圖書情報工作,2010(16):143-149.
[8]顧立平.論文級別計量研究:應用案例分析[J].現(xiàn)代圖書情報技術,2013(11):1-7.
[9]由慶斌,湯珊紅.不同類型論文層面計量指標間的相關性研究[J].圖書情報工作,2014(08):79-84
[10]黃金霞,陳雪飛,沈東婧.開放資源的利用評價研究[J].圖書情報工作,2013(21):18-23.
[11]沙秀艷,王貞儉.基于快速二維熵的加權模糊C均值聚類圖像分割[J].計算機工程與應用,2012(10):183-187.
薛 燕南京大學信息管理學院博士研究生。江蘇南京,210093。
Academic Quality Evaluation of Humanities and Social Sciences under“We Media”Environment
Xue Yan
The traditional academic quality evaluation of humanities and social sciences has the limitation that it is purely based on article references and journal impact factors,which are often time-lag.In order to make up for such limitations,this paper proposes and constructs a weighted fuzzy operation model which is based on citation index for academic influence and altmetrics index for network influence to make academic quality evaluation of humanities and social sciences under“we media”environment.This model is considered from a number of different dimensions to reflect the real situation of academic quality of humanities and social sciences.
We media.Academic evaluation of humanities and social sciences.Academic quality evaluation.Altmetrics index.
G250.73
(2014-09-03編校:鄒婉芬)