侯雪林 應峻 宋士杰



關鍵詞:數據可視化素養;評價指標;大學生;數字素養;信息素養;信息生態理論
DOI:10.3969/j.issn.1008-0821.2023.07.011
[中圖分類號]G254 [文獻標識碼]A [文章編號]1008-0821(2023)07-0109-13
我國正加快向數字強國邁進,這一進程的推進離不開全民數字素養和技能的提升。與此同時,數據可視化應用日益普及,從而對公眾的數據可視化感知和應用能力即數據可視化素養也提出了更高的要求。作為數字素養的一部分,數據可視化素養被認為與數字素養、文本素養同等重要,因此,在提升全民數字素養的熱潮中,有必要將數據可視化素養作為單獨議題進行研究,以應對大數據時代視覺文化的興起。圖書館作為培養信息素養的主陣地,如何抓住全民數字素養與技能提升的重要契機開展數據可視化素養培育,值得深入思考。
大學生是國家未來發展的主力軍,他們的數據可視化素養不僅與我國數字素養培育成效息息相關,而且還會影響國家高端數字人才儲備以及數字經濟發展,因此,大學生的數據可視化素養培育問題應優先被提上日程。構建數據可視化素養評價指標和評價模型,可為測量大學生數據可視化素養水平提供評價標準和量化評測工具,實現“以評促建”“以評促用”“以評促強”,因此,本文將重點探討大學生的數據可視化素養評價問題。
作為新興的研究領域,目前數據可視化素養的理論研究和實踐探索均處于起步階段,缺乏易于操作且可靠成熟的評價工具。國內外學者主要在概念解析的基礎上,借助心理學、教育學等理論形成可視化素養評估工具,然后采用問卷調查、訪談、實驗等方法評估非專家群體對特定測試任務的反饋情況,以了解他們的數據可視化理解能力。例如,Boy J等基于IRT理論(項目反應理論)提出了一組測試項目(如尋找最大值等)用于評估個人的可視化素養水平。在此基礎上,Lee S等采用心理學和教育學方法開發了可視化素養評估工具( VLAT),共涉及12種不同類型的數據可視化作品,包含8個可視化任務,53個測試項目。目前該工具還被用于特定可視化素養(如Treemap Literacy)的評估。與此同時,部分學者還基于不同實踐場景(如教學、參觀等)研究了用戶對數據可視化呈現的了解及認知程度。大學生群體的數據可視化素養雖然受到部分學者的關注,但尚未開發出完善的評價工具,仍需構建系統全面、簡單易用的大學生數據可視化素養評價指標及評價模型。例如,Maltese A V等僅從認知角度研究了STEM領域的大學生新手和專家群體如何閱讀并解釋可視化呈現。吳曉偉等雖然基于KSAO模型提出數據可視化素養評價框架,并面向大學新生設計數據可視化素養評價量表,但評價維度僅涉及數據可視化知識、技能、通用能力、其他特質四大方面,測量內容有限。綜上可知,已有成果為開展大學生數據可視化素養評價研究提供了有益參考,但在評價維度的全面性、工具的實操性及易用性等方面仍值得進一步探索。具體而言:①在評價內容方面,已有研究主要為面向特定任務的績效評價,涉及的可視化形式單一,任務類型及評價維度有限,且未區分不同維度指標的重要性;②在評價維度方面,學者主要從消費者視角評價了個體的數據可視化閱讀、理解等低層次能力水平,較少關注數據可視化應用、創造等高層次能力要求;③已有研究對評價主體將概念維度轉化為量化指標的能力提出了較高的要求,一定程度上影響了數據可視化素養評價工具的推廣應用。基于此,本文將在已有研究的基礎上,進一步探討適合我國的大學生數據可視化素養評價工具。
數據可視化作為人機數據交互的手段,數據可視化素養與人、信息環境、信息技術等多種要素息息相關。因此,大學生數據可視化素養也是多個要素綜合作用的結果,有必要將其置于數智社會中整體測量。信息生態理論以信息生態系統為對象,可全面反映信息人與其他要素之間的相互聯系、相互影響,從而較好地揭示數據可視化素養的內涵及外延。因此,本文將借助信息生態視角,從信息人、信息、信息環境、信息技術協同發展的角度,構建大學生數據可視化素養評價指標和評價模型,并通過實證研究探討影響大學生數據可視化素養的內外部因素,以期形成穩定、平衡的數據可視化素養信息生態系統,促進大學生數據可視化素養提升。研究結果不僅豐富了數據可視化素養的理論研究,而且為考察大學生數據可視化素養現狀提供了理論指導和實踐指南,有助于推動和創新數據可視化素養培育工作。
1信息生態視角下大學生數據可視化素養概念
信息生態理論(Information Ecology)最早可追溯至20世紀60年代,經過不斷發展,目前該理論已在經濟、政務、圖書情報等多領域得以廣泛應用。信息生態理論借鑒自然生態概念,以信息生態系統為研究對象,通過分析并調節系統內各要素的相關作用,以實現信息資源的合理利用。按照不同的視角和標準,信息生態理論構成有“二要素”“三要素”“四要素”3種觀點。由于“四要素”的構成劃分更為細致,因此,本文借鑒該觀點將信息生態系統劃分為信息人、信息、信息技術、信息環境4個要素。信息人是系統的核心要素,根據角色不同可細分為信息生產者、信息傳遞者、信息消費者等。信息是信息生態系統的關鍵要素,可與系統中的其他因素相互作用,信息能否得以合理配置會直接影響該系統的生態平衡。信息技術是保障系統正常運行的重要條件,會隨著社會發展不斷更新。信息環境指與人類信息活動密切相關的政治、經濟、文化等外部環境要素,以及時間、空間、制度等內部環境要素。具體至信息系統領域,信息生態理論常被應用于系統設計、信息服務、信息傳播等方面的優化研究。圍繞素養評估與提升,學者從信息生態視角解析了素養概念的內涵及外延,將微觀層面的素養概念與宏觀信息環境建立有機聯系。基于此,張長亮等借助信息生態視角,以信息人為評價主體,從信息、信息技術和信息環境3個維度構建了新媒體信息素養評價指標。代磊等基于該理論提出了大學生信息素養測度指標,包括信息生產素養、信息傳遞素養、信息消費素養、信息分解素養4個方面。馬騰等引入信息生態視角構建了大學生數據素養評價指標體系。
綜上所述,信息生態理論從生態系統角度研究了人類意識、活動、環境等多種要素的相互作用及相互影響,有助于宏觀地考察和分析大學生的數據可視化素養,因此,本文將引入信息生態視角來構建大學生數據可視化素養評價指標體系。
數據可視化素養(Data Visualization Literacy)萌芽于視覺素養(Visual Literacy),承傳于可視化素養(Visualization Literacy),發展于大數據時代和讀圖時代,被認為是信息素養、數字素養、數據素養的延伸與發展。雖然學界尚未對數據可視化素養的概念及框架內容形成共識,但已有研究成果相互補充不斷推動著數據可視化素養的理論研究。學者從生產者和消費者雙重視角提出了數據可視化素養涵蓋的能力素質,包括對數據可視化進行閱讀、理解、解釋、提煉的消費能力,和創建、建構數據可視化呈現的生產能力等。正如素養概念的開放性和發展性,數據可視化素養的內涵也在不斷豐富。Solen M提出可視化素養不應局限于解釋與建構兩個能力訴求,還應涉及可信性、參與度等戰略意識層面的內容。由于理解和應用數據可視化是一項復雜的多層次活動,因此,數據可視化素養也應是一個動態、多維的能力集合,不僅要求個體具備數據可視化意識,遵守相關倫理規范,而且應了解基礎知識,掌握數據可視化生產及消費技能等,屬于綜合素質能力范疇。
隨著數字技術和可視化技術的廣泛應用,當代大學生需具備良好的數據可視化素養,以應對視覺時代和后真相時代的可視化陷阱、數據迷失等問題。具體而言,身處信息生態系統中的大學生應具備敏銳的數據可視化意識,能夠將數據可視化活動融入學習、生活、創新等實際應用場景;了解數據可視化倫理規范,樹立正確的價值觀,能夠合理合法獲取數據并進行數據可視化傳播與交流;掌握數據可視化基礎知識,熟悉數據可視化工具的操作技能,能夠創造、分享、應用數據可視化成果;善于挖掘和利用不同來源的可視化資源與服務,能夠基于社會生活環境不斷提升自身的數據可視化素養水平。
2信息生態視角下大學生數據可視化素養評價指標選取
數據可視化素養信息生態系統由信息人、信息、信息技術和信息環境構成,這些要素相互依存、相互影響。信息人作為生態系統的核心要素和行動主體,一方面能動地適應和改造其他要素,另一方面也受到其他要素的規范和約束。具體來說,信息既是數據可視化實踐的客體,也是影響數據可視化活動質量的基礎性要素:信息技術可為數據可視化活動提供技術支撐和實踐平臺,但缺乏信息技術能力則會影響數據可視化實踐的成效;信息環境在為數據可視化活動提供外在保障的同時,也會引發內部因素變化,進而影響數據可視化實踐的效率。本文借鑒信息生態視角,從信息人與信息、信息技術、信息環境和諧發展的角度,以信息人即大學生作為評價主體,基于信息人—信息要素、信息人—信息技術、信息人—信息環境間的關聯,通過測量大學生在信息、信息技術、信息環境3個維度上的認知水平和實踐能力形成數據可視化素養評價維度,如圖1所示。基于三大維度,立足我國高校實際情況,遵循“目的性、系統性、可操作性”原則,通過梳理數據可視化素養的相關文獻,構建大學生數據可視化素養評價指標,如表1所示。其中,一級指標是對數據可視化素養在信息、信息技術和信息環境維度上的具體劃分和闡釋,二級指標是對一級指標的縱向延伸和細化。
2.1信息維度
信息是由信息內容和信息載體構成的實體,數據可視化作為信息的表達形態和內容來源,對應生態系統中的信息要素,因此,信息維度主要評價大學生對數據可視化的感知和認知程度,具體可從數據可視化意識、數據可視化知識、數據可視化倫理道德3個方面衡量。其中,數據可視化意識隸屬于認知范疇,它是驅動個體進行數據可視化實踐的先決條件,直接影響到需求判定和數據獲取的自覺程度,以及將數據映射成可視化呈現的豐富程度。不同層次的群體(如:新手和專家)對數據可視化的認知程度存在差異。按照意識內容不同,可將數據可視化意識劃分為數據可視化價值意識、應用意識、評價意識和安全意識。它要求大學生具備良好的數據敏感度,能夠洞察和判斷數據價值,并認識到數據可視化的重要性、適用性及局限性;具備較強的實際應用意識,能夠實現具體問題與數據可視化任務之間的自由轉換;具備批判性閱讀、理解、評價及利用數據可視化的意識;具備良好的安全意識,能夠通過數據加密等多種方式確保數據呈現正確可靠。
數據可視化知識主要測量信息人對數據可視化的了解程度,只有具備扎實的知識積累,才能高效地閱讀和創作數據可視化作品。這不僅要求大學生應具備基本的數據知識,能夠辨析和處理不同類型及形式的數據,而且應掌握可視化方面的知識,可以根據任務場景恰當地選擇并運用圖形符號、圖形變量等。兩方面知識缺一不可,它們的融通聯動是進行數據可視化活動的基礎。
倫理道德是數據可視化素養培育的方向標,它貫穿數據可視化活動生命周期,要求大學生必須遵守數據可視化相關法律法規及倫理規范,尊重他人數據成果,不侵犯他人數據隱私,確保數據安全及數據可視化呈現真實可靠,努力營造一個健康文明的數據環境。
2.2信息技術維度
人類的數據可視化活動離不開信息技術的支撐,他們對信息技術的掌握程度會影響數據可視化實踐的效果。基于信息人與信息技術的依存關系,信息技術維度著重考察身為數字產品消費者或生產者的大學生掌握和運用數據可視化技術與工具的能力,這是數智時代大學生生存生活的基本素養要求。根據數據可視化的活動流程,可將信息技術維度劃分為數據獲取與分析、可視化呈現與交互、可視化理解及利用3個環節。數據獲取與分析環節強調大學生能夠在需求分析的基礎上,使用計算機、互聯網等數字平臺及工具檢索、獲取、處理、分析數據,它是數據可視化素養的先導性、基礎性能力要求。具體而言,數據獲取與分析能力包括3個層次的內容:①需求表達與轉換能力是數據可視化活動的出發點,它要求大學生善于運用數字化手段解決學習和生活中的實際問題,并將其轉換為數據可視化任務;②數據獲取環節要求具備數據檢索能力和數據獲取能力。良好的數據可視化素養要求大學生熟悉搜索引擎、數據庫等不同數據源的收錄范圍及檢索方法,可運用檢索技巧快速準確地從海量資源中獲取所需數據。當二手數據無法滿足需求時,能夠借助問卷調查等方式獲取一手數據;③數據處理與分析能力,強調個體對數據的過程化操作及洞察分析能力,對后續實踐活動有重要影響。這要求大學生要熟悉常用的數據分析工具及方法,能夠針對不同類型的數據進行規范化處理、多角度分析、全面解讀,并適時調整分析策略。
可視化呈現與交互是將“復雜”數據映射為“簡潔”可視化展示的關鍵步驟,體現出數據可視化素養的社會交流特性。該環節要求大學生能夠基于數據分析結果,選擇合適的圖形符號、交互方式進行數據可視化的表達和交流分享,不僅要保證數據的準確傳達,還要注重可視化呈現的直觀與美觀。大數據時代,數字技術重塑了青年人的學習和生活方式,大學生應善于利用數字工具表達自己的想法與成果,因此,可視化呈現與交互應納入大學生數據可視化素養指標體系。
可視化閱讀及利用旨在從消費者視角衡量大學生能否準確、完整、有效地獲取數據,洞察數據動態變化及因果關系,實現對數據的活學活用和創新發展。按照參與程度不同,可視化閱讀及利用可分為以下3個層次:能夠閱讀、理解并提煉簡要數據等;基于可視化呈現分析數據變化趨勢,挖掘數據關系等;通過批判性思考和辨識將數據轉化為信息、知識,并用于解決實際問題或支持決策的高層次能力。
2.3信息環境維度
數據可視化是復雜的社會活動,大學生在利用、改善信息環境的同時,信息環境也會制約大學生數據可視化活動的范圍,影響數據可視化實踐的效率和效益。鑒于此,信息環境維度主要測量大學生借助內外部環境(如學校、互聯網等)理解和創造數據可視化的能力和效率,可從數據可視化基礎設施、數據可視化服務兩方面進行評價。數據可視化活動離不開計算機、工具軟件、數據源等基礎設施,因此,基礎設施的可及性會影響大學生的數據可視化實踐,進而影響大學生的數據可視化素養水平。此外,數據可視化服務作為提升大學生數據可視化素養水平的有效途徑,他們能否根據專業學習需要明晰自身需求,并針對性地尋求幫助開展數據可視化學習,也會直接影響該群體的數據可視化素養水平。針對已有服務內容,大學生能否進行正確、客觀的評價和反饋,不斷提升高校及其他平臺的數據可視化服務水平,在一定程度上也體現了他們的數據可視化素養。
3基于BP神經網絡的大學生數據可視化素養評價模型構建
基于上述指標體系,本文借助BP神經網絡構建了大學生數據可視化素養評價模型。BP(Back Propagation)神經網絡是目前使用最廣泛的神經網絡模型之一,它是一種模擬人腦信息處理方式的非線性系統,具有結構簡單、網絡訓練快、容錯性高等特點,可減少傳統評價中人為主觀因素影響,從而為綜合、動態及模糊評價工作提供科學依據。由于大學生數據可視化素養受到自身能力和外部環境等諸多要素影響,其評價工作也無法借助簡單的線性運算完成,屬于典型的非線性復雜問題。而BP神經網絡僅需少量訓練樣本就能有效擬合非線性函數,可準確、客觀地反映實際情況,因此,本文將采用BP神經網絡來構建大學生數據可視化素養評價模型。
3.1 BP神經網絡原理
20世紀80年代.Rumelhart D E和McClelland兩位科學家首次提出BP神經網絡算法。BP神經網絡采用多層前饋神經網絡結構,典型的BP神經網絡結構由輸入層、中間隱含層和輸出層組成,拓撲結構如圖2所示。它的學習過程包括信號的正向傳播和誤差的反向傳播兩部分。正向傳播時,輸入信號經隱含層處理向前傳輸至輸出層,輸出層收到刺激后返回最終結果。當最終結果和期望結果間的誤差值未達到預期設定精度時,則轉入誤差的反向傳播過程,誤差沿著原路返回逐層修正神經網絡中的權值和閾值,直至誤差信號最小,從而完成學習過程。
3.2 BP神經網絡模型訓練步驟
構建BP神經網絡需經過數據預處理、確定網絡結構、設置參數等一系列操作,而MATLAB集成了人工神經網絡工具箱,為BP神經網絡應用提供了便利,因此,本文將借助MATLAB2022a構建BP神經網絡,具體操作流程如下:
1)樣本數據獲取與處理。由于樣本數據介于1~5之間,為提高BP神經網絡的學習效率,加快收斂速度,本研究采用MATLAB自帶函數Mapmin-max對樣本數據進行歸一化處理,將數據轉換至[0,1]之間。
2)確定輸入層、輸出層、隱含層神經元數量。輸入層和輸出層神經元數量由輸入值和輸出值的特征數決定。隱含層神經元數量的確定尚未有統一規定,通常可采用經驗公式、試湊法等選取均方誤差精度最小時的隱含層節點數作為BP神經網絡隱含層神經元個數。
3)設定訓練函數和訓練參數。在設置初始化權值和閾值的基礎上,通過不斷迭代調試設置合適的訓練函數及訓練參數。
4)訓練BP神經網絡。輸入大學生數據可視化素養的訓練數據,經過隱含層處理得到實際輸出值。對比實際輸出值和期望輸出值,當兩者間的誤差滿足設定誤差要求時,訓練結束;否則重復3)步驟,通過反復調整訓練參數,直至實際輸出值逐漸逼近期望輸出值,誤差達到設定要求,然后停止訓練。
5)仿真模擬。將檢驗樣本輸入訓練好的BP神經網絡模型,檢測該模型的準確性及有效性。
3.3 BP神經網絡模型訓練
1)數據獲取。為了解大學生數據可視化素養水平,根據表1構建的評價指標體系設計調研問卷進行實證調研。調研問卷包括兩部分,第一部分為大學生基本信息,包括性別、學歷、專業,第二部分采用李克特5級量表考察大學生針對23個數據可視化素養指標的自評分數,指標下設“非常同意”“同意”“不確定”“不同意”“非常不同意”5個選項,依次對應1~5分。最后,調研對象需要對自身的數據可視化素養進行等級評估(差、中、好),對應賦分1、2、3,如表3所示。問卷調查于2022年7月—9月開展,排除作答時間過短、選項重復率過高等不合格問卷,剩余有效問卷共計91份。對問卷統計分析發現,如表2所示,調研對象對數據可視化有一定了解,且性別、學歷、專業分布較為平衡,樣本具有一定的代表性。
3) BP神經網絡訓練。將樣本指標數據作為輸入值,數據可視化素養自評結果作為輸出值。借助MATLAB2022a讀取并使用Mapminmax函數對數據進行歸一化處理,然后按照8:2的比例將樣本數據隨機分為兩組,系統取整后選取72份樣本數據為訓練集,18份樣本數據為測試集。其中,訓練集數據用于訓練BP神經網絡模型,通過不斷調整訓練參數,尋找輸入值與輸出值之間的非線性關系,從而確定最佳的網絡模型;測試集旨在驗證訓練好的BP神經網絡模型的泛化能力。依次代入隱含層神經元個數,并選用訓練函數trainlm、traingdm和traingbr進行模型調試,對比后發現,選用trainbr函數時的訓練誤差最小。據此,本文設置隱含層傳遞函數為tansig函數,輸出層傳遞函數為purelin函數,學習函數為默認的learngdm函數,訓練函數采用貝葉斯歸一化trainbr函數,初始閾值和權值為系統默認值,其余設置為缺省值。主要訓練參數設置如下:
net.trainParam.epochs= 1000;%允許最大的迭代訓練次數
net.trainParam.lr=0.01;%學習速率
net.trainParam.mc=0.9:%附加動量因子,避免局部最優和過擬合
net.trainParam. goal=0.001;%訓練目標最小誤差
4)仿真模擬。調用上述訓練參數對72份樣本數據訓練神經網絡模型,訓練結果如圖3所示(橫坐標為訓練次數,縱坐標為均方誤差)。由于數據量較少,本文所構建的BP神經網絡在運行迭代38次后即達到目標誤差0. 001的要求停止訓練,可用于仿真模擬。使用Sim函數對18份測試數據進行模擬仿真,將預測結果進行反歸一化處理并據此劃分分類等級,且與期望值對比計算誤差率,以此檢驗所構建的BP神經網絡模型的準確性。如圖4所示,根據檢驗樣本期望值與實際輸出值對比圖可知,檢驗樣本的實際輸出值與期望輸出值誤差較小,誤差率小于6%,達到了理想預測精度。從圖5可知,訓練樣本的期望輸出值與實際輸出值之間的相關系數為0. 98272,擬合度較高。數據說明,本文所構建的BP神經網絡模型仿真效果較優,權值和閾值恰當,能夠較好擬合數據可視化素養指標和數據可視化素養水平之間的復雜非線性關聯,可用來準確預測大學生的數據可視化素養水平。
綜上所述,利用BP神經網絡構建大學生數據可視化素養評價模型具有較強的可行性和實用性,而且通過自主學習獲得的權重和閾值可有效避免人為賦予指標權重時的主觀性,提高了評價的客觀性及準確性。
4大學生數據可視化素養評價模型應用
將91份數據可視化素養指標數據輸入BP神經網絡評價模型,得到大學生數據可視化素養等級,結果發現,超過一半(58%)的大學生數據可視化素養僅為中等水平,24%的處于較低水平,只有18%的大學生數據可視化素養水平較高。數據說明,大學生數據可視化素養仍有較大提升空間,亟需開展素養培育工作。
數據可視化素養并不是孤立存在的,從信息生態視角來看,大學生的數據可視化素養水平是信息人即大學生、信息、信息技術、信息環境等多要素綜合作用形成的內在個性品質,體現了大學生對數據可視化資源及工具的駕馭能力,受其信息素質、信息技術能力以及信息環境利用程度等因素的影響。本文通過分析調研對象在信息、信息技術和信息環境維度上的指標得分,如表4所示,探討影響大學生數據可視化素養水平的內外部因素。從表4可知,大學生作為數據可視化的生產者、消費者和傳遞者,他們的信息素質、信息技術能力和信息環境利用程度均有待提高.特別是信息技術及信息環境維度,其指標得分遠低于信息維度指標。多維度能力的欠缺或不足一定程度上制約了大學生在數據可視化信息生態系統中的生態位寬度,降低了他們在數智時代的生存競爭能力。
信息技術能力是數據可視化素養的核心要素,大學生的信息技術能力越強,對數據可視化的應用創新和吸收利用效率就越高,反之則越低。對應數據可視化生命周期,信息技術能力主要包括數據獲取與分析能力、可視化呈現與交互能力和可視化理解及利用能力。根據表4數據可知,大學生的信息技術能力最為薄弱,其中可視化生產與消費的核心技能即可視化呈現與交互能力(2.79)、可視化理解及利用能力(2.73)尤為不足,二級指標可視化交流能力得分僅為2.91。可視化呈現與交互是將數據映射為可視化呈現的必經環節,可視化理解及利用是數據可視化實踐的終點,上述能力不足影響了大學生的數據傳播效率和消化吸收效果,應引起高度重視。數據可視化是基于數據分析的可視化活動,數據收集與處理是數字化活動的前提和關鍵。研究發現,大學生的數據獲取與分析能力并不強,得分僅為2.60,而二級指標數據分析能力、數據處理能力則低至2.75、2.71。大數據時代,數據成為新的引擎與動力,缺乏扎實的數據獲取與分析技能會大大削弱大學生的數字創新能力。
信息環境要素是信息生態系統的外在支撐,數據可視化實踐離不開時間、空間、資源、人員等條件保障。調研發現,大學生對時空資源等要素的占有情況與利用能力并不好,表現在數據可視化基礎設施特別是硬件基礎設施薄弱導致必備條件缺乏,以及因數據可視化服務體系不健全而引起的服務需求及評價意識淡薄。上述環境因素以不同強度綜合作用于大學生,一定程度上削弱了他們進行數據可視化活動的意愿以及實踐效果。
信息維度指標主要衡量大學生對數據可視化的敏感程度、知識儲備水平以及倫理道德修養,它們會影響信息生態系統的穩定性及持續性。大學生的信息素質越高,數據可視化意識越敏銳,知識和經驗積累越豐富,數據可視化判斷及選擇就會越容易,整個生態系統的流轉效率也越高。分析調研數據發現,雖然大學生的數據可視化素養信息維度指標得分相對較高,但整體素質特別是數據可視化倫理道德(2.37)方面仍有較大提升空間。數據可視化倫理道德作為數據可視化活動的準則,大學生雖然具備了模糊的倫理道德觀念,知曉合理獲取和使用數據、確保數據可視化可靠的重要性,卻缺乏一定的倫理知識儲備(數據可視化倫理知識平均得分僅有2. 62),不利于大學生形成科學、系統的倫理道德觀。數據可視化知識主要考核大學生對數據可視化原理、方法及原則等內容的掌握情況,它關乎大學生能否理解和認識數據流轉的本質,是維持信息生態系統正常運轉的基礎要素,因此,大學生仍需加強數據及可視化知識的系統學習。相較信息維度的其他一級指標,大學生的數據可視化意識得分最高(2.26),但二級指標數據可視化應用意識、評價意識及安全意識得分卻顯著低于價值意識,這說明大學生已經意識到數據可視化的重要性,具備了一定的數據可視化素養基礎,但在具體應用、評價及安全方面卻有待加強。
5分析與討論
數據可視化素養信息生態系統并非靜止不動,而是處于持續演進狀態,只有不斷優化內部要素,才能增強信息生態系統功效,提升大學生數據可視化素養。本文立足于高校圖書館,基于信息生態視角下大學生與信息、信息技術以及信息環境因素的關系探討,以功效導向為原則,通過構建信息生態系統的內部提升體制和外在保障機制提出大學生數據可視化素養培育重點。
5.1提升大學生信息素質
信息是聯結信息生態系統各組成要素的紐帶,信息的流轉形成了信息生態系統的信息通道,保障了信息生態系統的穩定運行。為保障數據可視化素養信息生態系統的良性循環,大學生必須具備良好的信息素質,這不僅是理解數據科學的必備條件,也是衡量大學生數據可視化素養的首要方面,決定著行動實踐的視野和高度。本文從信息維度考察了大學生的數據可視化意識、數據可視化知識、數據可視化倫理道德水平,結果發現,大學生的信息素質有待提高,特別是在數據可視化倫理道德方面。作為數據可視化活動的準繩,倫理道德是維護信息生態系統平衡的內在力量。隨著數據時代信息自由程度越來越高,數據可視化行為自律顯得尤為重要,而自律機制的建立離不開數據可視化倫理道德體系構建,以及信息人的倫理道德自律養成。為此,圖書館應注重數據可視化倫理道德教育,積極創設倫理道德意識的養成環境,幫助大學生補齊倫理知識短板,使他們在數據可視化實踐中能夠自我約束、自我保護、自我監督,從而維護整個系統的生態平衡。數據可視化知識是可視化實踐創新的基礎,大學生只有掌握數據可視化方面的基礎知識,才能更好地進行數據可視化實踐,推動生態系統進化,因此圖書館應注重專業知識教育,不斷完善大學生知識結構,提升大學生在數智時代的適應能力。數據可視化意識作為先導性要素,圖書館應注重數據可視化應用意識、評價意識及安全意識方面的培養。大學生只有從思想層面認可數據可視化的價值,采用批判性眼光看待數據,理解數據安全、準確的重要性,才可以更好地運用可視化解決實際問題,提升數據可視化素養水平。簡言之,圖書館應著重培養大學生的價值敏感性、道德想象力,幫助大學生完善專業知識體系,這是數據可視化素養培育的首要要求,也是保障信息生態系統穩定的根基。
5.2增強大學生信息技術能力
信息流轉是信息生態系統正常運轉的必備條件,它通過數據可視化的生產發布、傳遞流動及消化吸收環節實現,而這些都離不開信息技術的支持。作為信息生態系統的重要生態因子,大學生生產和消費數據可視化的技術應用能力不僅關系到他們對信息的整合及利用效率,甚至會影響整個生態系統的價值實現。數據調研發現,目前大學生的數據可視化信息技術能力最為欠缺,其中可視化呈現與交互能力最低,其次為可視化理解及利用能力、數據獲取與分析能力。可視化呈現與交互作為將數據轉化為可視化呈現的關鍵環節,該環節能力不足直接影響大學生對數據可視化成果的展示及擴散交流。此外,隨著可視化技術的廣泛應用,大學生在實際學習生活場景中經常充當“讀者”角色,因此數據可視化理解及應用能力決定了大學生能否批判性地獲取、利用數據,反映出他們的知識創新能力。然而研究發現,目前大學生的數據可視化理解及利用能力尚有較大提升空間,這在一定程度上影響了大學生對數據的有效利用。數據獲取與分析作為數據運用的基礎環節,大學生的數據獲取與分析能力仍相對較弱,這不僅影響了后續的數據可視化實踐活動,還制約了他們在數字環境下處理實際問題的能力。
圖書館作為數據可視化素養培育的主導機構,如何促使大學生成為優秀的數據采集者、生產者、傳遞者、利用者,是圖書館面臨的核心問題。為此,圖書館應在摸清大學生需求及環境現狀的基礎上,制定系統性實施方案,通過開展內容豐富、形式多樣的培育服務,增強與大學生的服務鏈接,改善數據可視化信息生態鏈結構及質量,以提升大學生數據可視化流轉能力。在內容方面,圖書館要構建分層次分類別的數據可視化素養培育體系,既要圍繞可視化全生命周期教授普適技能,也要面向不同專業、年級、層次的學生群體提供個性化培育內容;既要注重培養數據可視化意識,夯實專業知識積累,也要著力提升大學生對數字工具的使用水平,以及對數字技術的運用能力。在服務方式上,圖書館應開展線上線下一體化的數據可視化服務模式,除保留參考咨詢等傳統服務方式外,還應結合講座、培訓、工作坊以及專業課程等多種服務形式。
5.3營造良好的培育環境
在信息生態系統中,信息人與信息環境相互依存,相互作用。信息環境在為數據可視化活動提供信息資源及環境空間等要素的同時,大學生也通過學習等方式不斷適應和改造周圍環境,從而鍛造了數據可視化素養。良好的信息環境是數據可視化素養實踐的外在驅動力,而信息環境失衡則會制約大學生數據可視化素養發展。研究發現,數據可視化素養服務、數據可視化基礎設施特別是硬件基礎設施是影響大學生數據可視化素養的主要環境因素。數據可視化素養培育需要與實踐緊密結合,因此,圖書館要不斷完善數字化環境,加強數字化基礎設施建設,積極引入虛擬現實與增強現實、大數據、云計算、人工智能等先進數字技術,建設多樣化實踐空間,配備可視化軟硬件設施(如高端圖形處理器等),為大學生實踐探索與科技創新提供良好的環境保障,防止“木桶效應”引發的生態系統失衡。數據可視化服務作為提升數據可視化素養的有效手段,可增強大學生對信息生態環境的適應能力。為此,圖書館應努力打造一支高素質的服務隊伍,以提升數據可視化服務水平。一方面要積極引入數據可視化館員,加強對館員專業技能、知識結構、服務能力等方面的培養和提升;另一方面應充分發揮自身優勢,協同企業、院系等不同機構組建開放共享的服務共同體,以彌補高端專業人才短缺的困境。圖書館只有創造人人皆學、處處能學、時時可學的數字化學習環境,確保每個人能夠及時找到適合自己的資源及服務,才能保障大學生能夠從容應對數字社會變革。
大學生作為數據可視化生態系統的關鍵節點,其信息素質越高、信息技術能力越強、環境利用程度越高,就越善于整合及運用內外部資源進行數據可視化實踐創新,從而提高整個信息生態系統的運轉效率,提升自身的數據可視化素養水平。圖書館作為信息生態系統中的重要服務主體,應以提升信息生態系統功效為目標,密切關注信息人、信息、信息技術、信息環境的發展變化,通過不斷優化信息生態系統結構要素,調動多元主體的參與積極性,保障數據可視化素養信息生態系統的正常運行。
6結語
大學生是數字經濟的主要利用者和積極創造者,其數據可視化素養不僅關乎我國高端數字人才培養,甚至會影響數字經濟的發展現狀和未來前景,因此,數據可視化素養培育逐漸成為數智時代圖書館的新擔當和新職能。數據可視化素養評價作為數據可視化素養培育的首要工作,可以量化大學生數據可視化素養培育的成效與不足,便于針對性、系統性制定實施方案,因此,高校特別是圖書情報機構應重視大學生數據可視化素養評價工作。
本文以信息生態理論為視角,以“大學生”作為評價主體,從信息、信息技術和信息環境和諧發展、動態平衡的視角,通過梳理已有研究形成了基于信息生態理論的大學生數據可視化素養評價指標體系(包括8項一級指標和23項二級指標),并借助BP神經網絡進行實證研究,構建了數據可視化素養評價模型,形成了從理論研究到實踐探索的閉環。在理論層面,本研究將數據可視化素養評價納入數智時代背景,基于信息生態系統內外部要素的關聯互動,構建了大學生數據可視化素養評價指標。這不僅推動了數據可視化素養的評價研究,而且為數據可視化素養理論探索提供了新的思路。在實踐應用層面,利用BP神經網絡構建大學生數據可視化素養評價模型,不僅為圖書館等培育主體評測大學生數據可視化素養水平提供了可操作性的評價體系與評價方法,也為上級機構制定相關標準提供了政策依據,還為設計師等供應端主體開展效用分析、完善數據可視化設計指明了方向。
然而,本文主要借助社交媒體滾雪球方式向大學生發放問卷,研究對象的數量及覆蓋范圍有限,造成研究樣本存在一定的局限性。在未來研究中,將進一步擴充研究樣本,并針對不同類型群體開展分類評價研究,以進一步優化評價指標體系,增加評價方法的普適性。此外,還將嘗試應用和對比不同的評價方式,以尋找更加科學和實用的數據可視化素養評價方法。