武文麗
(忻州師范學院圖書館 山西忻州 034099)
隨著互聯網和通信技術的高速發展,大數據時代迎面而來。在大數據時代來臨的同時,數據成為驅動社會創新發展的新興指標,也成為科研人員學術研究的主要對象[1]。在此背景之下,一個以數據為核心的新型科研范式應運而生。新型科研范式的產生需要滿足兩個條件,一是多源異構數據的支撐,二是數據價值實現的保障[2]。學術界一般將數據價值實現的保障稱為數據素養,并認為數據素養是信息素養內涵的最佳延伸和表達[3]。然而,新型科研范式下的科研人員數據素養面臨著一系列問題和挑戰,科研人員數據素質的教育仍處于初級階段。鑒于此,本文嘗試對科研人員數據素養關鍵影響因素識別問題進行研究,以期為科研人員數據素養的提升提供重要決策參考。
目前,關于數據素養影響因素問題的研究,國內外均取得了較為豐碩的成果。Shaffer等人[4]依據科學素養技能測試探討大學生數據素養的影響因素,研究表明,專業成績、年級、能力和培訓教育是大學生數據素養的影響因素。Guenther等人[5]對人類科學研究理事會數據進行研究,結果表明,組織承諾有利于提升科研人員數據素養。Naveed等人[6]選取巴基斯坦科研人員作為研究對象,發現年齡、性別、學歷和學術水平等會影響數據素養的高低。梁宇等人[7]基于扎根理論分析高校博士生數據素養影響因素,并歸納出博士生數據素養影響因素的3個維度,即博士生主體維度、數據維度和數據環境維度。畢達天等人[8]利用結構方程模型對科研人員數據影響因素進行分析,并認為素養氛圍、技術平臺和教育培訓顯著影響科研人員數據素養。孫玉偉等人[9]針對社會科學科研人員數據素養問題展開研究,并得出數據使用動機、機會和能力是科研人員數據素養影響因素。綜合來看,上述成果大多是聚焦于數據素養影響因素的分類研究,尚未有文獻探討科研人員數據素養影響因素之間的內在因果關系,更未有文獻探討科研人員數據素養關鍵影響因素識別問題。
基于上述分析,本文在汲取現有研究成果的基礎上,嘗試引入一種改進的DEMATEL(Decision-making Trial and Evaluation Laboratory,決策試驗與評價實驗室)方法來探討科研人員數據素養影響因素之間的內在因果關系,并以此識別科研人員數據素養的關鍵影響因素。首先,利用文獻檢索法和問卷調查法對科研人員數據素養影響因素進行系統分析,并構建一套較為合理的科研人員數據素養影響因素體系;然后,同時利用三角模糊數和DEMATEL理論的優點,并在此基礎上引入一種改進的DEMATEL方法;最后,利用改進的DEMATEL方法深入分析科研人員數據素養影響因素之間的內在因果關系,并以此識別科研人員數據素養的關鍵影響因素。
首先,利用文獻檢索法進行影響因素的客觀篩選,具體過程如下。
(1)選取中國知網中的中文社會科學引文索引(Chinese Social Sciences Citation Index, CSSCI)和Web of Science中的社會科學引文索引(Social Sciences Citation Index, SSCI)為檢索平臺,并同時以“數據素養”和“影響因素”為主題,對近5年文獻進行檢索,結果分別檢索到CSSCI文獻14篇和SSCI文獻75篇;(2)通過人工篩選,刪除與關鍵詞不相符的文獻,結果分別剩余CSSCI文獻9篇和SSCI文獻31篇;(3)通過人工閱讀上述篩選出文獻的題目、摘要和正文,進一步歸納和總結12種科研人員數據素養影響因素,即年齡、性別、學歷、專業、學術水平、使用動機、教育培訓、技術平臺、素養氛圍、態度表現、懲罰制度和考核機制。
然后,利用問卷調查法進行影響因素的主觀篩選,具體過程如下。
(1)依據上述12種影響因素的評分設計調查問卷,該問卷總共由12個問題構成,其中每個問題分別對應某種因素的評分,評分的選項分別為1分、2分、3分、4分和5分,分數越高則代表該因素影響程度越強,反之則越弱;(2)利用問卷星將該調查問卷發放給30位高校教師和20位研究所工作者,并收集到答題完整的46份調查問卷作為有效問卷;(3)將46份有效問卷中各因素影響程度評分進行集結,取定該評分的算術平均數作為該因素的影響程度綜合得分(各因素的綜合得分依次為2.5、1.2、2.7、1.8、2.8、2.9、3.2、3.8、4.2、3.9、4.1、3.7);(4)將綜合得分小于3的6種影響因素(即年齡、性別、學歷、專業、學術水平和使用動機)刪除,并在此基礎上得到剩余的6種影響因素。
最后,歸納和總結剩余的6種影響因素。將教育培訓、技術平臺、素養氛圍、態度表現、懲罰制度和考核機制構成本文的科研人員數據素養影響因素體系。下面針對上述6種影響因素,給出具體的解釋和說明。
(1)教育培訓。教育培訓是指科研人員通過接受專業的教育方式來提高科學數據素養。Shaffer等人[4]認為,當科研人員接受到一定的教育培訓后,其會更加重視科學數據在學術研究中的寶貴價值,進而在數據處理方面的意識有明顯提升。畢達天等人[8]發現,教育培訓會影響科研人員對待數據處理的主觀態度,并且會有效地加強和提升科研人員數據素養。
(2)技術平臺。技術平臺是指科研人員得到的與科學數據素養相關的技術支撐。例如,科研人員能夠方便地利用、處理和共享科學數據平臺,以及能夠方便地解決科學數據可持續使用、安全保護等問題。Naveed等人[6]認為,當技術平臺水平較高時,科研人員能夠更為方便地接觸和利用科學數據,進而能夠有效地提高數據的使用效率。畢達天等人[8]的研究表明,低水平的技術平臺會使得科研人員數據素養偏低。
(3)素養氛圍。素養氛圍是指科研人員所在單位或相關研究領域具有的數據素養狀態。梁宇等人[7]在研究中指出,當素養氛圍較好時,科研人員會對科學數據素養產生積極向上的態度,這也與態度習得理論中的經典性條件作用相對應。孫玉偉等人[9]的探索性研究表明,積極的素養氛圍能夠提升科研人員數據素養,這也與動機理論相吻合。Tsai等人[10]的研究指出,素養氛圍與科研人員數據素養顯著相關。
(4)態度表現。態度表現是指科研人員對待科學數據素養的個人風格和主觀傾向。潘士美等人[11]的研究表明,態度表現是科研人員科學數據素養發生變化的內在驅動力。畢達天等人[8]的研究指出,態度表現是科研人員科學數據素養發生變化的內在因素,其根本原因在于,教育培訓、技術平臺和素養氛圍等外在因素會使得科研人員態度表現發生變化。
(5)懲罰制度。懲罰制度是指科研人員工作單位針對數據素養水平低給予的相關章程和準則。郝媛玲等人[12]的研究表明,懲罰制度會對科研人員數據素養的提升起到調節功能和監督作用。張路路等人[13]對科研人員數據素養影響因素進行評述,并認為懲罰制度是科研人員數據素養的驅動因素,而且懲罰制度的實施會在一定程度上提升科研人員數據素養。
(6)考核機制。考核機制是指科研人員工作單位對科研人員數據素養的檢驗方式和測試手段。張路路等人[13]的研究顯示,當科研人員工作單位或相關研究領域的考核機制比較嚴格時,科研人員數據素養水平一般偏高,反之則偏低。孫玉偉等人[9]的研究表明,考核機制的嚴格實施不允許科研人員有機會使得其數據素養偏低,反而會促進科研人員提升數據素養水平。畢達天等人[8]的研究表明,考核機制與科研人員數據素養顯著相關。
模糊數是模糊數學的理論基礎,能夠為處理不確定性決策問題提供方法手段和技術支撐[14]。三角模糊數是一類特殊的模糊數,其能夠較好地描述人類思維,以及能夠有效地處理模糊信息,尤其適用于處理語言信息環境下的不確定性決策問題[15]。下面給出三角模糊數的相關定義。
若模糊數A的隸屬函數為:

其中μAL(x):x∈ [a,b]→ [0,1],連續且嚴格遞增;μAR(x):x∈ [b,d]→ [0,1],連續且嚴格遞減;a<b<d且a,b,d∈R。特別地,當μA(x)的表達式為:

則稱A為三角模糊數[16]。三角模糊數通常可記為A=(a,b,d),其中a為取值下限,d為可能取值,d為取值上限。
基于三角模糊數的相關定義,下面進一步給出三角模糊數的運算法則。

DEMATEL法是由美國Gabus和Fontela兩位教授于1971年在日內瓦Battelle會議上提出的。該方法的基本原理是,先由相關領域專家對復雜系統各因素之間的相互影響關系進行評估,再通過矩陣論計算各因素的原因度和結果度,并在此基礎上構造復雜系統因素的因果關系圖,最后識別出復雜系統的關鍵影響因素[17]。近年來,DEMATEL方法在供應鏈管理[18]、醫療設備管理[19]、科研數據共享[20]、社交網絡信息管理[21]和電子商務管理[22]等實際問題中得到了廣泛應用。基于DEMATEL的關鍵影響因素識別方法的基本步驟如下[23-24]。
(1)構造直接影響矩陣。假設某專家針對復雜系統中因素影響因素程度的評分為,則構造的直接影響矩陣為。需要指出的是,矩陣中的元素均使用精確數來刻畫。


其中I為主對角線上元素均為1且其余元素均為0的單位矩陣。
(4)計算各因素的影響度和被影響度。因素的影響度為矩陣中第i行元素之和,被影響度為矩陣中第i列元素之和,即:

其中影響度表征為因素對其余所有因素的影響之和,被影響度表征為因素受到其余所有因素的影響之和。
(5)計算各因素的中心度和原因度。因素的中心度為影響度與被影響度之和,原因度為影響度與被影響度之差,即:

其中因素的中心度能夠反映該因素在整個復雜系統中的相對重要程度,因素的原因度能夠反映復雜系統因素之間的內在因果關系(若>0,則因素為原因因素,否則為結果因素)。
上述傳統DEMATEL方法能夠深入分析復雜系統因素之間的內在因果關系,并識別出關鍵影響因素,但其未能夠考慮決策者語言偏好信息的模糊性和不確定性,難以保證決策結果的可靠性。
考慮到三角模糊數能夠較好處理語言信息,以及DEMATEL方法能夠有效識別出復雜系統的關鍵影響因素。Wu和Lee[25]同時利用三角模糊數和DEMATEL理論的優點,給出改進的DEMATEL方法。本文嘗試利用改進的DEMATEL方法對科研人員數據素養影響因素之間的內在因果關系進行深入分析,以此識別出科研人員數據素養的關鍵影響因素。下面給出改進的DEMATEL方法的基本步驟。
(1)構造基于三角模糊數的直接影響矩陣。假設某專家針對復雜系統中因素Fi影響因素Fj程度的評分為xij,則構造的基于三角模糊數的直接影響矩陣為X=(xij)n×n。值得注意的是,傳統DEMATEL方法的直接影響矩陣中元素均為精確數,而本文研究的基于三角模糊數的直接影響矩陣X中元素xij均為三角模糊數。表1給出語言信息與三角模糊數之間的轉化關系[16]。

表1 語言信息轉化為模糊數的對應關系
(2)計算規范化影響矩陣。首先,依據三角模糊數期望函數將基于三角模糊數的直接影響矩陣X=(xij)n×n轉化為基于精確數的直接影響矩陣X'=(xi'j)n×n,計算式為:


最后,將矩陣G視為本文研究的規范化影響矩陣。

同樣地,I為主對角線上元素均為1且其余元素均為0的單位矩陣。
(4)計算各因素的影響度和被影響度。因素Fi的影響度ci為矩陣T中第i行元素之和,被影響度di為矩陣T中第i列元素之和,即:

類似地,影響度ci表征為因素Fi對其余所有元素的影響之和,被影響度di表征為因素Fi受到其余所有元素的影響之和。
(5)計算各因素的中心度和原因度。因素Fi的中心度pi為影響度ci與被影響度di之和,原因度qi為影響度ci與被影響度di之差,即:

類似地,因素Fi的中心度pi能夠反映該因素在整個復雜系統中的相對重要程度,因素Fi的原因度qi能夠反映復雜系統因素之間的內在因果關系(若qi>0,則因素Fi為原因因素,否則為結果因素)。
需要指出的是,與傳統DEMATEL方法相比,改進的DEMATEL方法能夠考慮決策者語言偏好信息的模糊性和不確定性,進而能夠更為貼切地描述決策者的真實評估信息,最終能夠更為準確地刻畫決策者的豐富經驗和專業知識。因此,改進的DEMATEL方法比傳統DEMATEL方法相對更為可靠。
下面利用改進的DEMATEL方法對科研人員數據素養影響因素進行分析,計算過程如下。
(1)構建基于三角模糊數的直接影響矩陣。首先,邀請10位大學教師和10位研究所工作者對6種影響因素[教育培訓(F1)、技術平臺(F2)、素養氛圍(F3)、態度表現(F4)、懲罰制度(F5)和考核機制(F6)]之間的相互影響關系進行評估,在此基礎上,依據表1得到20位專家的基于三角模糊數的直接影響矩陣,限于篇幅,該結果省略。然后,利用算術平均數將20位專家的基于三角模糊數的直接影響矩陣進行集結,以此得到群體綜合的基于三角模糊數的直接影響矩陣,結果如表2所示。最后,將群體綜合的基于三角模糊數的直接影響矩陣視為本文研究的基于三角模糊數的直接影響矩陣。

表2 群體綜合的基于三角模糊數的直接影響矩陣
(2)計算規范化影響矩陣。本文研究假設決策者持中立態度(既不樂觀也不悲觀),即取定 0.5γ=,在此基礎上,依據式(7)和式(8)計算規范化影響矩陣,結果如表3所示。

表3 規范化影響矩陣
(3)計算綜合影響矩陣。依據式(9)計算綜合影響矩陣,結果如表4所示。

表4 綜合影響矩陣
(4)計算各因素的影響度和被影響度。依據式(10)計算各因素的影響度和被影響度,結果如表5所示。

表5 各因素的影響度、被影響度、中心度和原因度
(5)計算各因素的中心度和原因度。依據式(11)計算各因素的中心度和原因度,結果如表5所示,并進一步構建復雜系統因素的因果關系圖,結果如圖1所示。

圖1 因果關系圖
依據上述計算結果,下面對各因素的中心度和原因度進行分析。
一方面,中心度分析。影響因素的中心度能夠較好地表征該因素在整個復雜系統中的相對重要程度,若某因素的中心度越大,則表明該因素對科研人員數據素養的直接影響越大。由表5和圖1可知,按照中心度由大到小的順序將各影響因素排列為:素養氛圍(F3)>教育培訓(F1)>態度表現(F4)>技術平臺(F2)>懲罰制度(F5)>考核機制(F6),其中素養氛圍(F3)、教育培訓(F1)和態度表現(F4)的中心度分別為0.498 0、0.449 4、0.429 3,該類因素的中心度比較大,且與其他因素之間的差距比較明顯,說明該類因素對科研人員數據素養影響顯著。究其原因主要在于,①當素養氛圍較好時,科研人員會受到周圍良好氛圍的影響,進而使得其對科學數據素養產生積極向上的樂觀態度,最終使得數據素養得到改善;②當科研人員接受到較好的教育培訓后,其會更加地重視科學數據的寶貴價值,以及在處理科學數據的能力上有顯著提升,因此科研人員數據素養會得到明顯提升;③當科研人員以積極的態度對待科學數據素養時,根據動機理論,其會增加提升數據素養的動機,進而實現數據素養的提升。由此可見,與其他因素相比,素養氛圍(F3)、教育培訓(F1)和態度表現(F4)對科研人員數據素養的影響相對較大。值得一提的是,Shaffer等人[4]和畢達天等人[8]也得到了類似的研究結論,這說明本文研究是較為合理的。
另一方面,原因度分析。影響因素的原因度能夠較好地反映復雜系統因素之間的內在因果關系,原因度大于0的因素屬于原因因素,且若該因素的原因度越大,則表明該因素越能夠對其他因素產生影響;原因度小于0的因素屬于結果因素,且若該因素的原因度越小,則表明該因素越能夠受到其他因素影響。由表5和圖1可知,按照原因度由大到小的順序將各原因因素排列為:技術平臺(F2)>教育培訓(F1)>素養氛圍(F3),其中技術平臺(F2)和教育培訓(F1)的原因度分別為0.122 6、0.098 6,該類原因因素的原因度非常大,說明其能夠對科研人員數據素養的其他因素產生顯著影響。究其原因主要在于,技術平臺(F2)和教育培訓(F1)的影響度均相對較大(值分別為0.239 7、0.274 0)、被影響度均相對較?。ㄖ捣謩e為0.117 2、0.175 4)。由此可見,技術平臺(F2)和教育培訓(F1)是科研人員數據素養的關鍵影響因素。值得一提的是,教育培訓(F1)也屬于原因因素,而且該原因因素的中心度非常大(值為0.449 4)。因此,教育培訓(F1)也是科研人員數據素養的關鍵影響因素。另外,按照原因度由大到小的順序將各結果因素排列為:考核機制(F6)>懲罰制度(F5)>態度表現(F4),其中懲罰制度(F5)和態度表現(F4)的原因度非常小(值分別為-0.095 8、-0.135 8),這說明其能夠受到科研人員數據素養其他因素的顯著影響。究其原因主要在于,該類結果因素的影響度均相對較小(值分別為0.123 2、0.146 8)、被影響度均相對較大(值分別為0.219 0、0.282 5)。由此可見,懲罰制度(F5)和態度表現(F4)不是科研人員數據素養的關鍵影響因素。此外,考核機制(F6)的原因度雖然非常接近0(值為-0.018 1),但該因素的中心度非常?。ㄖ禐?.310 0)。因此,考核機制(F6)也不是科研人員數據素養的關鍵影響因素。
綜合來看,教育培訓(F1)、技術平臺(F2)和素養氛圍(F3)是影響科研人員數據素養的原因因素,同時也是科研人員數據素養的關鍵影響因素;態度表現(F4)、懲罰制度(F5)和考核機制(F6)是影響科研人員數據素養的結果因素,而且不是科研人員數據素養的關鍵影響因素。
為了進一步驗證改進DEMATEL方法的合理性,筆者也將傳統DEMATEL方法應用于本文案例。需要指出的是,考慮本文研究是利用算術平均數對20位專家決策信息進行集結,因此這里也采用算術平均數對20位專家的基于精確數的DEMATEL矩陣進行集結。傳統DEMATEL方法計算各因素的影響度、被影響度、中心度和原因度的結果如表6所示。

表6 各因素的影響度、被影響度、中心度和原因度(傳統DEMATEL方法)
通過將表5和表6進行深入對比后發現,本文提出的改進DEMATEL方法和傳統DEMATEL方法所計算的中心度排序結果、原因因素和結果因素的分類結果均為一致,這進一步說明本文提出的改進DEMATEL方法是較為合理的。然而,值得注意的是,這兩種方法計算的各因素中心度和原因度的具體數值是有所差異的。例如,技術平臺(F2)在本文方法中計算的原因度為0.122 6,而在傳統方法中計算的原因度為0.113 9。這兩種方法計算結果有所差異的主要原因是,本文方法采用了三角模糊數來表征決策者的語言偏好信息,以及傳統方法采用了精確數來表征決策者的語言偏好信息,而三角模糊數相較于精確數能夠更好地描述語言偏好信息的模糊性和不確定性,進而使得最終的決策結果更為可靠。
根據本文得出的研究結論,管理者應該著重加強教育培訓(F1)、技術平臺(F2)和素養氛圍(F3)三個方面的投入,以此來針對性地提升科研人員數據素養。下面給出具體的對策建議。
(1)加強教育培訓的支撐。高校、科研機構和科研型企業等應該定期組織相關專家安排針對科研人員數據素養的培訓班或專業講座。通過教育培訓的方式一方面能夠幫助科研人員熟悉掌握處理數據的專業技能,進而有效地提高科研人員的工作效率;另一方面能夠影響科研人員的工作方式,進而積極地改善科研人員數據素養。
(2)加強技術平臺的支撐。政府應該對數據公司給予政策上的大力支持與照顧。政府部門管理者應該鼓勵數據公司開發出高效便捷的軟件,以此來為科研人員提供數據交流便利和數據共享便利等,進而能夠使得科研人員在處理數據時得到較好的體驗,最終來提升科研人員數據素養。
(3)加強素養氛圍的支撐??蒲泄ぷ鞑块T應該營造可持續發展的數據素養氛圍。一方面,高學歷人才通常掌握一些專業知識,其相對要更容易高效處理和分析數據,進而能夠更好地提升數據素養;另一方面,良好的數據活動氛圍能夠積極地影響科研人員,進而使得科研人員能夠自主地培養數據素養,最終實現數據素養的有效提升。因此,科研工作部門應該盡可能地招聘一些高學歷人才,以及營造良好的數據活動氛圍。
目前,關于科研人員數據素養影響因素之間內在因果關系的研究還比較匱乏,更未有研究探討科研人員數據素養關鍵影響因素識別問題。為此,本文引入一種改進的DEMATEL方法,以此來識別科研人員數據素養關鍵影響因素,據此為科研人員數據素養的提升提供對策建議。與已有的其他文獻相比,本文研究具有如下特點:第一,對現有的科研人員數據素養影響因素進行細致梳理,構建了一套較為合理的科研人員數據素養影響因素體系,能夠為科研人員數據素養影響因素問題的后續研究提供有益借鑒;第二,同時利用三角模糊數和DEMATEL理論的優點,引入了一種改進的DEMATEL方法,能夠提高傳統DEMATEL方法決策結果的可靠性;第三,利用改進的DEMATEL方法對科研人員數據素養影響因素之間的內在因果關系進行深入分析,以此識別出科研人員數據素養的關鍵影響因素,能夠為科研人員數據素養的提升提供重要決策參考。
值得注意的是,本文研究采用了文獻檢索法、問卷調查法和改進的DEMATEL方法,該過程需要多個專家進行評分,這可能會使得決策結果存在一定的主觀性。然而,本文研究的決策結果也具有較強的可靠性,一方面,DEMATEL方法的決策機制比較健全,進而使得DEMATEL方法的決策結果具有較好的穩健性,這可以在一定程度上避免抽樣較少帶來的決策結果的不確定性;另一方面,現有關于科研人員數據素養影響因素的文獻還尚不多見,且該類文獻大多具有一定的合理性,這使得本文研究具有較好的繼承性和有效性。另外,未來還可以將改進的DEMATEL方法應用于諸如數據共享關鍵影響因素識別、圖書館績效關鍵影響因素識別、研究生教育質量關鍵影響因素識別等實際問題。