曹 金,劉 悅,李翊萌
(1.中國科普研究所,北京 100081;2.深圳市南山外國語學校(集團)大沖學校,廣東 深圳 518057;3.中國紡織出版社,北京 100027)
數據洪流下大數據將成為各行各業(yè)競爭與發(fā)展的關鍵基礎,從經驗科學、理論科學和計算模擬科學3種科研范式,跨越到如今大數據時代下數據密集型的科研范式,大數據作為新的科學研究范式,已經逐步被運用到教育、媒體、醫(yī)療、科研等多個領域,并運用廣泛。國務院印發(fā)的《全民科學素質行動規(guī)劃綱要(2021—2035 年)》提出要建設即時、泛在、精準的信息化全媒體傳播網絡,服務數字社會建設,指出通過實施智庫科普建設工程,推進科普與大數據等技術深度融合。如何將大數據技術應用于科普工作中,提升科普工作的全體性、效率、相關研究廣度、探索性,引導從事科普的科技工作者更好開展科普活動和科普工作,具有重要的理論與實踐意義。本文旨在研究在科普中以及與科普有關的領域中運用大數據技術的典型案例,從而探索運用大數據技術深化科普工作的路徑與方向,加速構建數字經濟形態(tài)下智慧科普工作新模式。
隨著互聯網技術的發(fā)展,大數據時代已經到來,大數據具有多樣化(Variety)、大量化(Volume)、速度化(Velocity)、價值高(Value)的“4V”特征,科普網絡輿情分析、實時更新城市交通信息、刷臉支付、基于數據的危情預警機制等都依賴于大數據技術。大數據科普是科普中的大數據,是大數據技術的重要使用范圍,對科普的變革發(fā)展有著巨大的潛在價值。大數據技術在生產、管理、研究和使用方面主要有數據挖掘、數據管理、可視化分析、預測性分析4 種研究方法。
在互聯網廣泛普及背景下,數字鴻溝逐漸縮小,各領域也開始廣泛使用大數據技術開展工作與研究,但科普的大數據應用研究少于其余領域。在知網上搜索主題關鍵詞,如“大數據 科普”“大數據 教育”“大數據 媒體”“大數據 醫(yī)療”“大數據 科研”,出現的論文數量如圖1 所示。從一定程度可看出,國內目前對大數據科普的研究相較于教育、媒體、醫(yī)療、科研4 個領域,在發(fā)表中文論文數量上,要少很多。再搜索北大核心及Cssci 的有關論文,發(fā)現在科普、教育、媒體、醫(yī)療、科研5 個領域中已發(fā)表的論文數量分別為 37 篇、5 607 篇、3 923 篇、1 234 篇、1 191 篇。可見國內對大數據科普的研究基礎較為薄弱,且閱讀相關論文發(fā)現其理論研究不深入,僅是浮于表面的分析與介紹,缺乏相關的系統(tǒng)研究與理論支撐。

圖1 相關主題詞搜索分布情況
研究如何在科普領域中運用大數據技術,是科普發(fā)展的必經之路,未來的科普發(fā)展在數字化背景下必將逐步引入大數據技術。分析如何正確運用大數據技術到科普中,具有重要意義,能夠為引領科普信息化發(fā)展提供路徑。
教育大數據分析是當前學界關注的熱點問題,科大訊飛的“智慧課堂”的提出開拓了教育大數據分析新的研究視角,為教與學的優(yōu)化提供數據支撐,實現了基于數據的教育?!爸腔壅n堂”已經形成了完整的體系,曾在某重點中學學生群體中使用2 年有余,積累了大量的過程行為數據與學業(yè)結果數據,為研究數據分析提供了大數據的支撐。智慧課堂數據挖掘分析是一項十分復雜的系統(tǒng)工程,以師生互動指數分析為例,闡述數據挖掘分析的過程。師生互動指數分析的基本框架為:通過針對教師和學生在智慧課堂平臺產生的行為數據進行分析,遵循實用性、發(fā)展性、全面性、可行性等原則選取指標,建立師生互動的評價指標體系,全面客觀地展現教師與學生的互動情況。智慧課堂利用教育數據進行挖掘分析,可為受教育者量身定制學習目標、計劃、方案、資源,有助于實現“因材施教”,為個性化智慧發(fā)展提供技術支持。
美國各州學區(qū)都安裝了有利于進行數據收集分析研究的管理系統(tǒng)。學校管理者可以通過數據驅動決策系統(tǒng)查看年級、全校乃至整個學區(qū)學生的學習情況。如果發(fā)現低效的課堂和學習表現不佳的學生群體,管理者會依據學習分析結果決定是否給予特定的干預。對于更大范圍的異常表現,管理者會依據學習分析數據調整管理策略,以適應教師更好教和學生更好學習,數據驅動決策系統(tǒng)有助于幫助學校領導建立持續(xù)的改進方案。
大數據正深刻地影響社會經濟發(fā)展和人們的日常生活,也已經成為新聞采編中的“熱詞”,抓住大數據發(fā)展的契機,可以提升新聞采編的速度。信息冗余、信息過量是當前社會存在的突出問題,大量無用、無效和不準確信息會影響新聞采編的效率,影響新聞的時效性。因此在大數據環(huán)境下,新聞采編人員應以大數據為支撐,提前做好基礎性工作,根據大數據揭示的規(guī)律特點,主動挖掘新聞,制造新聞價值,提升新聞采編效率。
由央視財經聯合國內權威政府部門、智庫,頂級互聯網公司和大數據研究院共同成立了中國經濟生活大調查數據聯盟,重磅打造“美好生活指數”系列數據產品。數據聯盟成員將通過線上線下渠道,向全網推送“美好生活指數”調查問卷,以調查的大數據為支撐展開新聞采編工作,就會大大提升新聞采編的速度。該大數據應用的創(chuàng)新點在于大數據具有對數據進行自動校正與預測功能,能在概率與數理統(tǒng)計方面進行觀測,不僅能抵消錯誤數據造成的影響,減少不確定性,還可發(fā)現相關性關系,生產出具有前瞻性與預測性的新聞產品。
醫(yī)患矛盾一直以來都是全社會高度關注的問題。目前諸多醫(yī)學院校的醫(yī)學人文素質教育教學資源有限,內容陳舊,缺乏時效性,難以呈現當前社會現實問題。因此構建具有針對性與時效性的醫(yī)學人文素質教育對于提升醫(yī)學生人文素養(yǎng),減少醫(yī)患矛盾沖突的發(fā)生,構建和諧醫(yī)患關系有著積極的作用。此想法的提出迎合了當下新冠疫情的時事熱點,對醫(yī)患事件分析和教育體系進行分析,依據大數據的分析來優(yōu)化人文素質教育體系。
構建基于醫(yī)患糾紛案例大數據的醫(yī)學人文素質教育體系的深化改革模式,并通過全面系統(tǒng)客觀的評價,可以為醫(yī)學人文素質教育改革提供更有價值的參考與依據?;卺t(yī)患糾紛案例大數據的醫(yī)學人文素質教育優(yōu)化體系的實施模式如圖2 所示。首先,采集“醫(yī)患糾紛案例”與“醫(yī)學人文素質教育”相關數據,構建醫(yī)患矛盾與人文教育大數據,形成動態(tài)、可視化平臺,其中包括對“醫(yī)患糾紛案例”觀點的挖掘以及構建醫(yī)患糾紛案例與醫(yī)學人文素質教育知識圖譜;其次,結合大數據結果進行深層次、全方位地剖析兩者之間的關系,揭示二者之間的因果關聯,探索從基礎醫(yī)學教育的體系上化解醫(yī)患矛盾的產生機制;最后,以醫(yī)患糾紛案例與醫(yī)學人文素質教育的大數據挖掘和分析為支撐,開展醫(yī)學人文素質教育體系優(yōu)化研究。

圖2 基于醫(yī)患糾紛案例大數據的醫(yī)學人文素質教育優(yōu)化體系的實施模式
傳統(tǒng)的社會科學研究機構目前尚未具備“功能完備的信息采集分析系統(tǒng)”,要在大數據環(huán)境下進行科研作業(yè),需要建立全景式大數據的信息采集儲存分析系統(tǒng)和科研協同智能推薦操作平臺。廣東智庫信息化平臺能夠在短時間內實現跨學科領域專家的協同合作和資源共享。平臺致力于實現“互聯網+大數據”環(huán)境下各研究機構或決策部門的資源共享,是廣東智庫各科研機構資源的整合者。平臺設有智庫視野、專家?guī)?、數據中心、知識定制、知識社區(qū)等多個板塊,并通過智庫鏈接,與全球智庫建立“大連接”關系。智庫信息平臺利用大數據智庫信息化平臺為載體,通過建立基于大數據的智能采集加工分析系統(tǒng),為跨時空科研協同創(chuàng)新提供了情報大數據支持。智庫平臺的優(yōu)勢在于創(chuàng)建了線上與線下結合的科研協同工作流,從而能夠實現多個虛擬課題組同時并發(fā),在云空間多系統(tǒng)支撐的網上研討寫作,進而實現專家利用最大化效應。
美國智庫戰(zhàn)略預算與評估中心(CSBA)收集戰(zhàn)爭數據,運用戰(zhàn)爭推演方法,通過建設仿真作戰(zhàn)模型,能夠預測未來的戰(zhàn)爭場景,該中心具有聯合一體化應急模型評估工具,收集了眾多國家和地區(qū)的戰(zhàn)場環(huán)境和作戰(zhàn)計劃等數據,在此基礎上進行系統(tǒng)建模,為美國制定軍事對策提供數據參考。
隨著大數據技術不斷成熟,將大數據技術應用在科教評價領域能夠使科教評價的多樣性、方法的可行性以及評價體系的完整性等方面得以體現。
杭州電子科技大學中國科教評價研究院提出利用Cite Space 軟件對科教評價領域進行可視化分析,通過可視化能夠較為直觀地觀測科教評價的發(fā)展過往、當前研究熱點及潛在發(fā)展趨勢,進而找出科教評價目前存在的問題和發(fā)展方向。具體實施模式如圖3 所示,首先通過整理文獻梳理出科教評價概念的演進以及科教評價的應用實踐,使用Cite Space 可視化軟件對檢索收集到的數據進行數據來源分析和文獻時間分布分析,通過可視化可以較為直觀地觀測科教領域的發(fā)展過往、當前研究熱點及潛在發(fā)展趨勢,最后進行研究熱點分析和研究趨勢分析。大數據在科教評價領域的應用突破了傳統(tǒng)科教評價在范式和方法上的不足,可以深入挖掘出更多可量化的評價指標,也為科教評價的指標體系建立提供正確的向導,科教文本的數據搜索更加精準,多維度、多層面的角度使科教評價更加具有借鑒意義。

圖3 大數據應用科教評價實施模式
重慶市規(guī)劃和自然資源調查檢測院建設了大數據平臺,大數據平臺定制了空間計算、屬性統(tǒng)計、機器學習、數據輸出等多個類型的模型,搭建了征地、供地和儲備技術審查等多個業(yè)務應用系統(tǒng)。該平臺利用集中連片度分析模型,快速統(tǒng)計了細碎龐大的耕地集中連片度分析,并轉移到全市級別統(tǒng)一的大數據環(huán)境計算模式中,解決了之前單機匯總耗時長難以完成任務的困難。平臺在土地技術審查、永久基本農田管理、大屏展示系統(tǒng)等方面也進行了有效擴展,充分踐行以業(yè)務需求為導向,開展大體量數據運算的實踐應用。
隨著社會科技的不斷發(fā)展,人們能夠獲得信息的途徑也隨之增多,能夠滿足人們多樣化需求的智慧化科普成為科普創(chuàng)新的必然趨勢。在信息技術不斷發(fā)展的背景下,大數據在數據挖掘、數據管理、可視化分析、預測性分析方面的優(yōu)勢為科普工作的創(chuàng)新發(fā)展提供了可能。大數據觀念有助于實現科普資源信息化,促進社會共享,同時也有助于對受眾和熱點進行精確把握,對科普效果進行全面客觀的評價,從而為改進科普工作提供更加準確的思路。目前科普領域在科普平臺、科普場館、科普創(chuàng)新工作等方面,利用大數據技術方面進行了一些嘗試和探索,展現出較為廣闊的發(fā)展前景。
在科普平臺建設上,湖北省科協構建的科普知識大數據庫及共享平臺“科普游楚天”,展示了科普網站可形成一個導航門戶、三大服務環(huán)境、多種資源站點聚合的網絡化科學傳播平臺,通過此平臺整合多個科普場館的資源,構建知識集合數據庫。河南省科協開發(fā)的科普云平臺系統(tǒng)下包括2 個子系統(tǒng),分別為科普云計算系統(tǒng)和大數據科普應用系統(tǒng)??破赵朴嬎阆到y(tǒng)主要進行云計算管理和云安全管理,大數據科普應用系統(tǒng)主要有科普資源管理、科普動態(tài)管理和科技創(chuàng)新服務管理3 方面的功能。
在科普場館應用上,大數據時代下,科普場館嘗試利用現代技術進行科普效果的提升,積極發(fā)展創(chuàng)新數字媒體交互形式。無錫科技館對科普場館與大數據的接軌進行了研究,探索科普場館創(chuàng)新數字媒體交互形式。傳統(tǒng)科普場館展示常常會出現信息滯后,無法跟隨時代發(fā)展的問題,同時展項創(chuàng)新不足導致觀眾興趣降低的情況也時常出現。而建立在大數據基礎上的科普展館展示可以實現內容和系統(tǒng)的自我更新,并且在信息獲取方面可以依據參展個體的特點進行調整,智能調整交互展項的內容和參展進度,提升觀眾興趣,有效獲取知識。數字化科技館可采用大數據思維的信息采集手段,如通過數字科技館對監(jiān)控路線進行分析、了解科普受眾的行動路線、在展品前停留的時間、分析受眾的表情以檢測興趣度,以此類分析來構建更完善的數字化科技館。大數據支持下的學習可以整合更多形式的學習資源,有針對性地形成高效深度參展體驗模式。
在科普工作實踐上,除線下場館和傳統(tǒng)科普讀物外,互聯網時代的科普工作同樣需要拓展渠道滿足人們的知識需求??破誂PP 能夠幫助公眾更加方便獲取知識,降低了時間空間對知識獲取的限制,以多種形式提供科普內容。因此良好的內容的整合與呈現是科普APP 達到更好科普效果的關鍵。殷麗麗等研究了基于MVP 模式的醫(yī)療科普APP,通過文本、圖片、視頻三種媒體形式展示醫(yī)療大數據信息,在“互聯網+大數據”的背景下拓展科普知識覆蓋范圍,加強醫(yī)療知識的普及和宣傳力度,提高用戶體驗。孫玉玲表示依托數據挖掘技術,機器能夠洞察閱讀者需求并自動生成相關知識圖譜,形成選題策劃的初步方案,是科普出版業(yè)的創(chuàng)新性發(fā)展。楊思思等分析了科普網站的信息化建設,重點表明今后科普網站的建設也要應用Blog、RSS、SNS 等經典技術,以大數據技術為支撐,推動科普受眾參與互動,并能夠做到信息定制化。
現有的大數據科普形式較為單一,取得的工作成效不太顯著,尚處于初步展開的階段,結合其余領域的開展情況,提出大數據科普的遷移思考。
借鑒多領域應用大數據技術的模式,在科普領域中應用,是短期內提升科普信息化建設的重要參考方向。譬如借鑒教育領域的“智慧課堂”應用,可考慮打造“智慧科普”,應用智能信息技術創(chuàng)設高效科普環(huán)境,支持線上線下一體化、虛擬現實一體化的全場景科普應用;建設數據驅動決策系統(tǒng),掌握區(qū)域內科普活動的開展情況,幫助管理者依據數據調整管理策略。借鑒媒體領域的應用,應用大數據在科普領域普查和搜集資料,提前做好科普調查的基礎性工作,依據數據挖掘結果進行科普策劃及發(fā)展方向分析。借鑒醫(yī)療領域的應用,建設大數據平臺,對科普中出現的典型事件進行分析,有助于總結經驗,探索新機制。借鑒智庫領域的應用,聚集跨學科專家的科研力量,作為科普智庫的支撐力量,為跨時空科研協同提供支持,減少重復勞動,實現專家協同的最大化。借鑒科研領域的應用,利用大數據進行熱點關鍵詞和前沿領域的分析,使信息呈現更加精確,同時對科普現狀進行評價,把握研究方向的發(fā)展趨勢,對未來進行有效預測。諸如此類的可借鑒模式還有很多,在眾多優(yōu)勢領域聚集下,在科普領域中邊試邊用,終能形成大數據科普模式。
基于大數據能夠更快速準確地確定大眾科普需求,取得更為有效的科普傳播效果。大數據的應用過程主要分為數據挖掘、數據管理、可視化分析、預測性分析,數據挖掘和數據管理能夠顯著提升工作效率,幫助使用者精準快速地做好科普前的準備工作。大數據科普要保證能夠根據用戶的科普需求進行收集指定內容的數據,并且在挖掘數據的同時可以調整挖掘方向,打造高效科普。可視化分析和預測性分析是科普工作進階發(fā)展的重要工具,為應急科普、科普研究、知識科普提供了新形式。大數據科普要利用新技術條件,反饋給受眾前沿和更具數據依據的科普內容,通過可視化分析可以減輕人工科普的負擔。要建立大數據科普預測分析機制,如采取數據專業(yè)分析軟件得出圖表發(fā)展走向,采用三維建模的方式進行三維演示和動態(tài)推演,從而更好地為決策服務,為提升科普內容質量服務。還應利用大數據充分凝聚專家資源、科普資源,開創(chuàng)科普工作的新載體。
建設大數據科普平臺,利用大數據的智能化,實現科普智慧化發(fā)展,為實現高效科普打下了良好基礎。平臺化是指在大數據科普的每一步中都設有平臺支撐,搭建大數據科普收集平臺、大數據科普管理平臺、大數據科普分析平臺、大數據科普展現平臺、大數據科普評估平臺等,對國內外信息進行挖掘,對科普機構、科普社團、科研機構、教育結構等多個單位的信息進行挖掘,將挖掘到的數據都放入平臺數據庫中,實現平臺的共建共享功能,最大化利用資源。智能化即建設智能化的大數據科普管理系統(tǒng),通過智能化整理,將數據按機器學習識別的結果分配到各模塊中。引入機器學習和人工智能技術,以自動化數據管理為主,繼續(xù)采用云技術和數據分片技術完成數據的儲存,整個數據管理過程是可自動配置和調整的。還應緊扣科普評價,完善利用數據的科普評價體系,以評促升,打造循環(huán)科普生態(tài)體系,發(fā)揮科普高端智庫的支撐性作用。