999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于引文內容的科學數據集學術影響力評價模式探析

2024-07-03 04:28:22郭晶晶于璠宋娜
江蘇科技信息 2024年11期

郭晶晶 于璠 宋娜

摘要:開放科學環境下,對科學數據的學術影響力進行客觀評價有利于科學數據提供者了解科學數據的被引用情況,提高科研人員的創新活力,正向推動科學數據的發展和開放。文章以中國綜合社會調查數據為例,基于引文內容,將引文引用行為進行深度標引和揭示,篩選出利用科學數據進行分析研究并產出成果的引文,通過分析該引文集合的產出情況、學科分布等規律來評價該數據的學術影響力情況。

關鍵詞:科學數據;科學數據集評價;中國綜合社會調查數據

中圖分類號:G252.7? 文獻標志碼:A

0 引言

科學數據是指在科技活動時或通過其他方式所獲得的能夠反映客觀世界本質、特征、變化規律的原始基本數據,根據不同科技活動需要,進行系統加工整理的各類數據[1]。隨著科學技術的發展,調查數據的不斷完善,勢必會產生大規模、多元化的科學數據,科研人員利用已有的科學數據產生創新性成果是一種普遍的科研模式。

對科學數據進行評價的意義在于,讓數據提供者感受到被認可,激勵科研人員再生產,從而促進業內共享交流,益于科學發展。歐洲科學數據的高級專家小組在2010年發表的報告[2]中也指出,需要開發和利用新的方法來測量數據的價值,并獎勵那些貢獻數據的研究人員。

科學數據評價內容研究主要涉及科學數據質量評價、科學數據影響力評價、科學數據平臺評價、科學數據安全評估以及科學數據素養能力評價等方面[3]。其中,科學數據影響力是指應用科學數據對學術、社會、經濟、文化、公共政策、環境等多方面產生的有益影響[4]。科學數據影響力評價是客觀判斷科學數據質量的方法,可為數據提供者了解該科學數據被重用程度和為用戶選擇科學數據提供幫助。

目前,對科學數據學術影響力評價主要有兩個研究方向:一是參考傳統出版物評價體系,利用相關引文指標來構建科學數據影響力評價體系;二是通過探究科學數據自身特征,提煉出評價指標實現對科學數據學術影響力的定量化計算。本文采用第一種科學數據學術影響力評價方法,參考科學數據引文指標構建影響力評價模式。科學數據的被引用情況是評價其影響力的重要指標,對科學數據的引用類似于對學術論文的引用,同樣是基于他人的科研成果開展進一步的研究,或是利用他人的科研成果論證自己的結論。數據引用(Data Citation)也是衡量科研價值的重要方式之一,可以激勵科研人員以可持續的方式存檔和管理數據,促進科研人員開放和共享其科研數據。王雪等[5]針對生物信息學領域的文獻對科學數據的引用行為構建了基于引用行為的科學評價數據集/數據倉儲影響力和質量評價模型,測量科學數據的質量與科學文獻質量之間的關系;丁楠等[6]以DCI中的人口調查數據為例,借助引文分析方法,構建了基于引用的數據評價體系,旨在將不同科學數據集放到同一個維度中評價其影響力,發現數據引用可以有效地對科學數據的發布及存儲機構的影響力進行評估;劉闖[7]以引文為基礎、以引用數據的論文發表學術期刊的影響因子為權重作為核心參數的統計方法,提出了“數據影響力積分”的計算模型和案例。

整體來看,我國對于科學數據影響力的評價大多參照論文評價的方法,目前還沒有形成公認的、完整可實施的科學數據學術影響力評價標準,也鮮有學者對引用科學數據的文獻內容進行深度標引和揭示。本文以連續發布類科學數據為例,揭示并標引了引文的內容,將引文的引用行為分為6類,分別是分析研究、轉述、參考文獻、提及、負面引用和其他。通過分析分析研究型引文的產出情況、學科分布等規律來評價該數據的影響力情況和科研價值,為該科學數據提供者和學術評價機構提供參考和決策。

1 研究設計

本文嘗試利用引文分析法,縱向評價單一科學數據集的影響力趨勢。該結果可為科學數據提供者提供參考和決策。

為單獨研究一項連續發布類科學數據的影響力評價模式,本文選取已發布12次年度調查的社會科學領域的數據集——中國綜合社會調查數據(Chinese General Social Survey,CGSS)為例,通過分析引用該科學數據的引文,探討縱向評價連續發布類科學數據的影響力評價模式。

1.1 數據來源

CGSS第1期起止時間為2003—2008年,其間共完成5次年度調查(2007年沒有執行),形成了5套年度調查數據。2010—2019年是CGSS項目的第2期,截至2018年年底,已完成7次年度調查,分別是2010、2011、2012、2013、2015、2017和2018年。2021年是中國綜合社會調查(CGSS)的第14次年度調查。除2004年的調查數據未公布,其他各年度數據都已在中國國家調查數據庫(China National Survey Data Archive,CNSDA)的網站(cnsda.ruc.edu.cn)和中國綜合社會調查(cgss.ruc.edu.cn)的官網上發布,注冊用戶可免費申請使用。

本文選擇中國知網(CNKI)、萬方數據知識服務平臺和讀秀數據平臺為數據來源,在以上數據平臺檢索引用CGSS數據的中文文獻。以CNKI為例,構建如下檢索式:TKA=中國綜合社會調查+全國綜合社會調查+“Chinese General Social Survey”+“China General Social Survey”+“CGSS”+“China GSS”+“Chinese GSS” OR SU=中國綜合社會調查+全國綜合社會調查+“Chinese General Social Survey”+“China General Social Survey”+“CGSS”+“China GSS”+“Chinese GSS” OR RF=中國綜合社會調查+全國綜合社會調查+“Chinese General Social Survey”+“China General Social Survey”+“CGSS”+“China GSS”+“Chinese GSS”。由于CGSS數據第一期于2003年發布,設置檢索時間為2003—2022年。

由于多平臺檢索存在文獻重復和字段不統一等問題,本文對檢索到的相關文獻進行了文獻去重、機構合并等數據清洗。利用NoteExpress和Excel進行去重處理,優先保留CNKI數據庫的題錄,去重后得到引文共14709條。

1.2 研究方法與工具

科學數據的引用行為中,既包括引用主體利用科學數據產出新的科學成果,也包括對引用科學數據論文的再引用以及對科學數據的負面評價。由于CGSS數據提供平臺并未統一要求數據使用者在引用數據時的引用格式,僅通過關鍵詞檢索勢必會產生“噪聲文獻”,例如,通過上一節的檢索式檢索到的引文中,有部分引文在正文中并未提及CGSS數據,而是在參考文獻中列出了標題含有“CGSS”或“中國綜合社會調查”的文獻,這類引文嚴格意義上并不能算基于CGSS數據產出的論文。本文為探討科學數據產生的學術影響力,對引文的引用目的進行甄別,通過逐篇閱讀的方式,將引文的引用行為進行了分類,分類方式和評判標準如表1所示。

標引時若引文同時出現上述多種分類特征,將引文歸屬分類的優先級定為負面引用>分析研究>轉述>提及>參考文獻>其他。

通過上述的引文分類目的可知,真正將CGSS數據用作科學研究并產出學術成果的引文主要是分析研究型引文,轉述、提及和參考文獻型引文并沒有直接基于CGSS數據產出學術成果。因此,本文僅以分析研究型引文(以下簡稱“引文”)進行分析,了解CGSS數據的學術影響力情況。

本文采用Excel和Derwent Data Analyzer(DDA)為主要分析工具,利用Excel實現引文發文數量趨勢變化分析;利用DDA完成引文數據的統計和清洗,包括對CGSS各年份數據的統計、引文所屬機構清洗、學科分類號的一級和二級統計以及關鍵詞清洗,并利用DDA完成矩陣氣泡圖等可視化分析。

2 科學數據影響力評價

在選用影響力評價指標時,考慮從引文逐年發文情況、連續發布類科學數據不同數據年份的影響力情況、在不同學科領域產生的影響力情況、引證主體情況4個角度縱向評價連續發布類科學數據的影響力。

2.1 引文逐年發文情況

經過對引文數據的清洗和引文目的評判,得到利用CGSS數據分析研究型的引文共5374條,主要以期刊論文和學位論文為主,引文中不同類型文獻組成情況如表2所示。

本文統計了2005—2022年引文中最主要組成部分的期刊論文和學位論文的發文量情況,基本呈現逐年上升的趨勢,如圖1所示,2010年引文數量就已超過100篇。

基于CGSS進行研究的期刊論文最早發表于2005年,是由中國人民大學的洪大用在《江蘇社會科學》上發表的題名為《中國城市居民的環境意識》的論文[8]。期刊論文在2009—2010年期間表現出較快的增長速度,年均增長率接近100%。

最早的基于CGSS進行研究的學位論文完成于2007年,是來自上海大學的張文宏教授指導的3篇碩士論文[9-11]和1篇來自中國人民大學洪大用教授指導的碩士論文[12]。2007年之后,學位論文數量逐年遞增,而2020年學位論文數出現了小幅下降,可能是由于學位論文需要較長時間才收錄進數據庫導致的。

2.2 各年份數據影響力情況

CGSS數據基本每1~2年發布一版新的調查數據供研究者使用。對于此類連續發布的科學數據,分析其各年份數據被關注引用程度,有助于了解各年份數據的影響力情況。

截至2022年12月,CGSS項目已經對外發布的數據年份有2003、2005、2006、2008、2010、2011、2012、2013、2015、2017和2018年。引文中CGSS各年數據的使用頻次如圖2所示。

2.3 學科覆蓋情況

以引文文獻類型為期刊論文為例,該類型引文數據來源于CNKI和萬方,這些數據庫平臺普遍使用了《中國圖書館分類法》(以下簡稱“中圖法”)分類號標記文獻所屬的學科類別。本報告通過CNKI數據平臺標記的中圖法分類號來統計分析國內論文的學科分布,以此來揭示CGSS數據的學科覆蓋程度和影響力廣度。

通過中圖法一級大類可以看出4033篇文獻類型為期刊論文的引文在各學科大類的分布情況,如圖3所示。

通過中圖法二級分類對學科進行細分,得到期刊論文引文主要分布的二級學科領域(見表3)。表3中統計了分布在前12個領域的論文數量,其數量之和為3592篇,占全部研究領域的89%,說明CGSS數據的引文所在學科領域比較集中。

2.4 引證主體情況

通過分析引證主體所屬機構,了解不同引證機構的引證方向和目標,也可為科學數據提供者尋找潛在合作機構。以引文文獻類型為期刊論文為例,期刊論文引文的作者來自792所機構。發表引文較多的機構如表4所示。高校構成了機構用戶的主體,參與發表了論文3798篇,占到國內中文期刊論文總量的94%。中國人民大學作為CGSS項目的主要執行單位,是基于該數據發表國內中文期刊論文最多的機構,而且數量是第二位武漢大學的3倍以上。在排名前20位的機構中,只有1家研究院所——中國社會科學院,其余全部為高校。

為了考察主要發文機構對CGSS數據的關注度趨勢,本文選取發文數量排名前10的機構,統計他們CGSS分析研究型引文產出數量在年份上的分布情況,如圖4所示。

中國人民大學于2005年最早發表了采用CGSS數據進行相關研究的國內論文。其他機構中,發文較早的是復旦大學和中國社會科學院,均在2007年首次發表基于CGSS數據的論文;武漢大學發文總量僅次于中國人民大學;其他值得關注的還有南京大學,它在近幾年的發文量相對較多。

3 思考與總結

在科學數據持續增長,數據共享總量不斷擴大的環境下,如何縱向評價科學數據的學術影響力成為新的需求,更多的數據提供者希望通過對數據的科學評價了解其產出的科學數據在業界內如何被引用,學術影響力如何,了解負面評價也有助于為下一次的科學數據生產提供參考和建議。

本文以單一且連續發布的科學數據——CGSS數據為例,探討了縱向評價科學數據的模式和方法,以期從一個新的角度揭示科學數據產生的學術價值,并為科學數據提供者評估科學數據學術影響力提供參考。

根據以上研究,從對科學數據引用規范和科學數據影響力評價結果使用角度對科學數據的科研產出及科學評價單位提出幾點建議。

3.1 規定科學數據引用格式

數據提供者應在提供科學數據的同時規定引用數據的格式,形成良性引用循環,提升科學數據影響力。

研究表明,科學數據引用不僅能夠體現對科學數據工作者的認可,也可以幫助追蹤數據使用狀況,建立數據定位或參考機制,開展數據計量和評價[13],同時科學數據的引用也是實現科學數據共享的重要方式之一。因此,采用規范化的引用格式是科研工作者應具有的科研素質。

為規范引用格式,更多數據中心在提供科學數據服務的同時要求數據使用者按照規定的格式引用,例如Integrated Public Use Microdata Series(IPUMS)和羅珀輿論研究中心 (Roper Center for Public Opinion Research),在官網中都提供了如何引用他們數據的指南來規范引用動作。中國社會狀況調查(CSS)要求數據使用者在正文中按照標準格式注明資料出處,并要求以該科學數據產出的成果公布后通知數據提供方,并提供成果復件,以便為其他數據使用者提供參考。

數據提供中心提出的引用規范要求可以很好地約束數據使用者的引用規范,一定程度上可以保障數據提供者的權益,提高科學數據的回溯率,利于科學數據再傳播和再利用,形成良性循環。

3.2 關注負面引用

本文除了關注利用CGSS數據進行分析研究的引文情況,也關注有些學者對CGSS數據提出的負面評價或建議。其中有學者對CGSS數據內容的研究設計提出建議,例如,趙聯飛[14]在文獻中提到CGSS數據的設計中缺乏針對互聯網鴻溝的研究設計;張弛等[15]提出CGSS數據中將個人消費開支按照家庭為單位合并處理,從而無法獲得個人消費的數據。也有學者從宏觀設計和平臺服務對CGSS數據提出建議,如李磊等[16]提出CGSS數據調查的城市較多,但每個城市調查的個體較少,可能導致樣本選擇的代表性不足;馬得勇[17]提出CGSS數據與美國、日本、韓國等國家的“綜合社會調查(GSS)”相比,該調查在內容上不夠綜合,未能充分考慮社會科學的整體性和經濟學、政治學、社會學各學科之間的關聯性,在數據使用申請、數據庫數量和種類、網站下載服務等方面與歐美等發達國家有較大差距。還有學者建議CGSS的數據調查可以和相關研究聯合開展,以此來節約調查資源,增加調查之間的互補性[18]。

連續發布類科學數據,如氣象數據、地質資料以及本文研究的社會調查類數據,往往需要將數據不斷地更新和豐富。借助負面評價的引文可以得到數據使用者對科學數據的建議,有助于數據提供者在下次設計科學數據內容和采集方式上找到新思路和新方向,不斷豐富科學數據內容,提供更完善的科學數據服務。

3.3 將科學數據評價納入人才評價體系

科研評價單位應考慮將科學數據評價納入人才評價體系。科學數據也是科研成果產出的一部分,也是體現科研人員勞動產出的一項指標,應類同于學術論文。科學數據的影響力越高也證明其越有學術價值,應該納入人才評價體系,讓評價體系更加多元化、全面化,同時也能激勵科學數據的發展,提高科研人員對科學數據的重視程度,產出更高質量的科學數據,加速科學技術的進步和發展。

參考文獻

[1]李慧佳,馬建玲,王楠,等.國內外科學數據的組織與管理研究進展[J].圖書情報工作,2013(23):130-136.

[2]黃永文,張建勇,黃金霞,等.國外開放科學數據研究綜述[J].現代圖書情報技術,2013(5):21-27.

[3]胡惠芳,方向明.國內外科學數據評價研究綜述[J].大學圖書情報學刊,2021(3):131-138.

[4]王毅萍,馬建玲.國外科學數據影響力研究進展[J].圖書情報工作,2017(7):118-126.

[5]王雪,馬勝利,佘曾溧,等.科學數據的引用行為及其影響力研究[J].情報學報,2016(11):1132-1139.

[6]丁楠,黎嬌,李文雨澤,等.基于引用的科學數據評價研究[J].圖書與情報,2014(5):95-99.

[7]劉闖.數據影響力積分(DIS):數據影響力新的計量方法[J].全球變化數據學報(中英文),2018(2):135-143.

[8]洪大用.中國城市居民的環境意識[J].江蘇社會科學,2005(1):127-132.

[9]李鴿.中國家庭網的階層構成及其影響因素[D].上海:上海大學,2007.

[10]段雪輝.城市移民的階層網絡結構與社會融合[D].上海:上海大學,2007.

[11]楊輝英.城市職業女性的社會網絡[D].上海:上海大學,2007.

[12]胡偉.環境關心的年齡差異:基于2003年中國綜合社會調查數據的分析與發現[D].北京:中國人民大學,2007.

[13]屈寶強,王凱.科學數據引用現狀和研究進展[J].情報理論與實踐,2016(5):134-138.

[14]趙聯飛.中國大學生中的三道互聯網鴻溝:基于全國12所高校調查數據的分析[J].社會學研究,2015(6):145-168.

[15]張弛,楊燕綏.基于生命周期的征地補償公共治理:以海南省定安縣為例[J].公共管理評論,2015(2):86-106.

[16]李磊,鄭妍妍,劉鵬程.金融發展、職業選擇與企業家精神:來自微觀調查的證據[J].金融研究,2014(6):193-206.

[17]馬得勇.如何利用互聯網資源來進行跨國比較研究[J].經濟社會體制比較,2008(1):149-155.

[18]范川.借助于CGSS的流動人口抽樣設計[D].上海:復旦大學,2013.

(編輯 何 琳)

Analysis of the academic impact evaluation model of scientific data sets based on citation content: taking Chinese General Social Survey data as an example

GUO? Jingjing, YU? Fan, SONG? Na

(National Library of China, Beijing 100081, China)

Abstract: In the open science environment, objective evaluation of the academic influence of scientific data is beneficial for scientific data providers to understand the citation of scientific data, improve the innovation vitality of researchers, and positively promote the development and openness of scientific data. The article takes CGSS data as an example, based on the content of citations, deeply indexes and reveals the citation behavior, selects citations that use scientific data for analysis and research, and produces results. By analyzing the output situation and disciplinary distribution of the citation set, the academic influence of the data is evaluated.

Key words: scientific data; evaluation of scientific dataset; Chinese General Social Survey

作者簡介:郭晶晶(1990— ),女,館員,碩士;研究方向:科技咨詢。

主站蜘蛛池模板: 在线欧美日韩国产| 美女一级免费毛片| 72种姿势欧美久久久久大黄蕉| 国产91小视频| 日韩欧美国产三级| 中文字幕永久视频| 日韩中文无码av超清| 成人毛片在线播放| 国产精品2| 亚洲午夜福利精品无码| 黄色三级毛片网站| 国产成人精品视频一区视频二区| 在线国产你懂的| yjizz国产在线视频网| 六月婷婷激情综合| 久久精品免费看一| 精品国产成人a在线观看| 美臀人妻中出中文字幕在线| 国产成人午夜福利免费无码r| 思思99思思久久最新精品| 欧美a在线看| 亚洲日韩国产精品综合在线观看| 国内精品视频| 久久香蕉国产线看观看精品蕉| 欧美中文字幕在线二区| 国产人人乐人人爱| 国内精品视频| 亚洲第一视频网站| 999精品在线视频| 夜夜高潮夜夜爽国产伦精品| 男女男免费视频网站国产| 久久久久久久久久国产精品| 欧美国产菊爆免费观看| 亚洲天堂在线免费| 精品国产电影久久九九| 激情视频综合网| 国产精品自拍露脸视频| 欧美精品高清| 亚洲手机在线| 亚洲AV无码不卡无码| 国产香蕉在线| 蝌蚪国产精品视频第一页| 亚洲日韩图片专区第1页| 992Tv视频国产精品| 自拍偷拍欧美日韩| 亚洲第一黄色网| 伊人91在线| 国产XXXX做受性欧美88| 久久国产香蕉| 亚洲乱码在线视频| 91香蕉视频下载网站| 久久精品人人做人人| 日本免费a视频| 亚洲一级毛片在线观| 日韩视频免费| 国产自在线拍| 中文无码日韩精品| 又黄又爽视频好爽视频| 亚洲无码视频图片| 99re在线免费视频| 亚洲欧洲AV一区二区三区| 国产又爽又黄无遮挡免费观看| 国产精品va| 日韩在线第三页| 性欧美精品xxxx| 亚洲精品制服丝袜二区| 97国产一区二区精品久久呦| 婷婷色中文| 亚洲精品无码不卡在线播放| 日韩精品毛片| 99精品高清在线播放| 无码福利视频| 97超爽成人免费视频在线播放| 免费福利视频网站| 国产精品3p视频| 91国内外精品自在线播放| 91午夜福利在线观看| 99在线免费播放| 无码不卡的中文字幕视频| 国产精品女熟高潮视频| 五月激情综合网| 国产福利一区在线|