蔣貴友
(華東師范大學高等教育研究所,上海 200062)
數字時代開啟以來,人工智能、機器學習正以不可逆轉之勢進入人類互動、輿論傳播與學習科學等領域,并憑借以數字算法為代表的信息技術變革文科知識生產的研究范式。[1]智能技術既可以跟蹤千萬級群體的實時互動,又能精準捕捉個體級別的行動軌跡。2009年,以大衛·拉澤(David Lazer)為首的15位科學家在《科學》雜志上以“計算社會科學”為題高度概括了大數據參與文科知識生產的可能路徑。[2]這代表了社交媒體、非結構化文本與視頻圖像正成為新的數據來源,而信息轉變為知識的方式在技術的驅動下不斷多樣化,文科知識生產在數字時代已被重新定義。相反,傳統的知識生產范式已經難以回應知識更新的時代需求,甚至過細的分科研究與科層化的學術管理成為學術研究迭代與創新的制度化障礙。面對智能社會,大學是否有能力應對文科知識生產數字化的挑戰,已經成為其推動知識創新與回應社會需求必須要面對的課題。
在智能時代,文科知識生產有兩個典型特征:一是就現實而言,它使用大規模的結構性數據與信息處理作為解釋人類社會及其內部結構的關鍵成分,清晰且立體地建構真實的社會系統網絡;[3]二是從方法來看,它既非以同一學科知識為藍本的知識更新,亦非社會科學與數據科學的跨域疊加,而是多學科研究者的協同合作以及企業、政府與公民社會的深度參與。[4]實踐證明,不同于知識生產模式Ⅰ與Ⅱ,這是典型的超學科研究與知識生產模式Ⅲ。該范式一定程度回應了現實問題,但從大數據所推動的經驗研究飛躍到社會科學的理論闡釋時,仍然面臨不小的創新困境。同時,跨越邊界的數據合作隱含著更大的隱私、倫理與知識產權問題,而回應這些問題既無法依靠傳統知識生產進路加以減緩,也不能通過數字技術革命予以祛除,其關鍵在于建構一個行之有效的運行保障機制。
在運行機制方面,西方大學通過創建更加靈活的數字空間和知識生產體系,與互聯網平臺、政府數據部門建立了知識創新網絡,從而實現數據—知識—決策之間的高效轉化。已有研究看到了知識創新的技術優越性與數據便捷性,但卻較少探究其背后的運行機制與各要素的互動關系。[5]因此,本研究旨在分析世界一流大學計算社會科學實驗室知識生產過程,并深刻剖析文科知識生產數字化背后的運行機制。
在案例選擇方面,本研究通過多渠道收集了78個世界一流大學計算社會科學實驗室素材,從而形成分析該問題的初步案例資料庫。為了更加精準地匹配適切案例進入分析,對備選案例庫進行了理論抽樣。抽樣原則體現在四個方面:一是所選實驗室在人文社會科學領域具有代表性,其所屬高校為全球排名前列的精英高校;二是所選機構與數據平臺、政府、社會建立了長期合作;三是機構類型盡可能地涵蓋人文社會科學諸領域;四是所選案例資料至少由網站信息、學術論文、媒體資料三種以上分析文本組成,且字數不低于0.8萬字。基于上述原則,最終遴選了26個案例作為研究樣本。
研究采用扎根理論方法并基于Nvivo 12.0軟件從26個實驗室案例樣本中隨機抽取18個案例,對所涉案例的相關資料采取開放式編碼、主軸編碼與選擇性編碼,并分類、提煉與概括數字時代計算社會科學實驗室知識生產的關鍵信息,據此建立與研究問題相契合的分析框架。然后,利用剩余的8個案例資料進行飽和度檢驗,從而確定得出最后的研究模型。
為了系統呈現26個計算社會科學實驗室的樣本信息,本研究列舉了所選案例概況(詳見表1)。為了最大限度地還原各實驗室的知識生產過程,本研究從實驗室官網、學術論文、研究報告與媒體宣傳四個方面收集了各案例的文字、視頻與圖片信息,并將其全部轉換為統一的文本信息,按照抽樣編碼原則進行歸類編號,以此作為后續分析的數據資料支撐。

表1 計算社會科學實驗室案例概況

表1 計算社會科學實驗室案例概況(續)
在組織社會學語境下,機制是指組織內部各要素之間的結構關系及其運作方式,而運行機制是指影響組織活動的因素、結構、功能及其相互關系,以及諸因素所產生影響的作用過程與運作方式。[6]因此,本研究基于扎根理論旨在挖掘計算社會科學實驗室知識生產過程的核心要素及其諸要素相互作用機制,以此刻畫數字時代文科知識生產的運行過程。
開放式編碼是基于研究的問題情境對原始素材進行提煉與概括,進而形成初始概念及其范疇化的過程。為此,本研究根據隨機原則抽取18個正式樣本,除A-05、A-09、A-12、A-14、A-18、A-19、A-21與A-24未入選外,其余案例進入分析階段。隨后,將入選案例材料導入Nvivo12軟件中進行編碼,經過反復比對、歸納與整合,最終提煉出43個初始概念,并進一步歸納為包含應用服務、項目治理、數字協作與外部問責在內的13個初始范疇。(詳見表2)

表2“數字時代文科知識生產運行機制”概念與范疇化過程

表2“數字時代文科知識生產運行機制”概念與范疇化過程(續)
主軸編碼立足于開放式編碼的基礎上,根據案例情境中的初始概念的內涵外延及其相互之間的邏輯聯系,確定概念間的類屬關系并進行范疇化,從而確立一個以知識生產運行為核心的框架雛形。為確保范疇劃分的科學性,本研究將初始概念與范疇置于案例情境中,根據彼此在知識生產案例中所處的位置,進一步明確概念之間的關系并提出更為上位的主范疇。最終,經過范疇合并生成了情境驅動、創新網絡、知識集群與評估問責4個主范疇。(詳見表3)

表3 “數字時代文科知識生產運行機制”主范疇及其內涵界定
選擇性編碼旨在尋找所涉初始概念的基本范疇,并通過范疇化將相關概念歸類并建立內在聯系,以此構建問題研究的分析脈絡與框架。具體而言,在研究問題的統攝下,參考編碼過程中的備忘錄,并將主范疇置于具體的案例情境中以便進一步明確各主范疇之間、主范疇與副范疇之間以及范疇與初始概念間的邏輯關系,并最終以知識生產流程體系將主范疇進行串聯。分析表明,以文科知識生產運行機制為研究的核心范疇可衍生出情境驅動、創新網絡、知識集群與評估問責四個主范疇。
理論飽和是指新增樣本并未能夠使研究概念與范疇更新,亦未能產生新的解釋,一旦達到此標準將停止研究的理論抽樣。為此,本研究將上階段隨機抽樣中未入選的8個計算機社會科學實驗室案例的相關資料導入質性分析軟件中再度進行三輪編碼,編碼與類屬分析中并未涌現新的概念與范疇,概念之間與范疇之間的邏輯關系也并未更改,代表此前建構的分析框架通過了理論飽和度檢驗,這對分析數字時代文科知識生產運行機制具有較強的解釋力。
本研究從宏觀抽象層面呈現了數字時代文科知識生產運行的體系輪廓與內部要素,但并未深入知識生產內部揭示生產要素與環節的關系與作用機制。為此,通過將主范疇與案例情境共置于文科知識生產過程中對運行機制進行解讀與驗證,從而揭示數字時代文科知識生產運行的過程機制。
數字時代的大學受其生存情境驅動開展文科知識生產創新,其知識生產目標大致可分為應用服務、工具開發與學術創新三個方面。其一,通過知識應用實現咨政決策輔助的智庫功能,通過數字模擬與風險預測分析公共政策的實施效力和發展態勢,從而優化政策進程與政策設計。換言之,當算法與機器學習愈加智能時,數字技術變革了知識創新方式,并使知識生產能夠通過數字模型優化決策與影響政府行動,從而賦予知識新的治理形式與專業權威。[7]其二,旨在推動大學、政府、產業與公民社會之間“產學研用”融合的知識轉化與工具開發進程。在新冠病毒疫情期間,馬里蘭大學計算社會科學跨學科實驗室(A-22)使用數字平臺模擬疫情輿論傳播路徑、檢測全球媒體的偏見和誤導以及優化疫情輿情治理技術,一定程度維護了社會的公共秩序。[8]在此過程中,大學通過數字平臺將不同領域的利益主體有效納入知識轉化中,構建知識創新網絡生態并實現工具革新。其三,突破學科分化與知識分割的桎梏并實現知識統一化的創新轉型。知識創新必然以理論創新為追求,賓夕法尼亞大學沃倫中心(A-17)通過數據集成與信息追蹤技術,分析人類互動規律、社會結構演變、公共健康動態追蹤與政治輿論傳播等復雜問題,以此檢測與修正社會動力與輿論傳播理論。[9]可見,數字時代的文科知識生產目標受其所處情境的驅動,通過數據技術對人類復雜問題的有效回應,進而尋求理論層面的創新突破。
三重向度的目標關系鏈可以理解為,以機器學習為核心的數據技術與人文社會科學交叉的創新研究為政策輔助與社會發展提供了事實依據與科學見解,有助于大學、政府、行業與公民社會聯結為“四重螺旋”創新結構。這賦予了數字時代知識生產系統所需的創新環境,能夠驅動大學、政府、行業以及公民社會在協同創新中形成良好的互動關系,從而生成基于數據智能的知識生產生態系統。譬如,大數據技術在建構機器學習模型時將單點與線性的知識進行智能化鏈接,形成包含學術層、行業層與社會層在內的網狀、多維知識體系。綜合而言,數字時代文科知識生產既解決應用性問題,亦回應原理性障礙,其多重目標的出現受到問題情境驅動,實質指向的是以公共利益為取向的人類與社會發展的基本命題。
知識生產中的創新網絡是創新目標轉化為知識成果的基礎平臺與技術聯盟,包括項目治理、團隊分工、研究支持與制度保障四個維度。第一,實驗室通過項目制統籌數字資產,并確定組織架構的基本形態。計算社會科學實驗室屬于交叉學科集群,是多個研究項目捆綁的去科層化結構。[10]如賓夕法尼亞大學計算社會科學實驗室(A-01)由媒體問責、高通量實驗與疫情人口流動調查項目組成,在以項目制為基礎的知識生產體制下能有效建立公私伙伴關系并有效配置資源。第二,實驗室建立的異質成員網絡與協同分工體系由研究問題的復雜性所決定,其學科交叉組合根據研究項目的不同而變化。為了保證學科之間的橫向協作,實驗室秉持小規模作業、跨域協作的開放理念展開項目式合作。在異質網絡與專業分工的運作法則下,不同系統、團隊與部門相聯系,構成基于問題情境的協調創新聯盟。第三,數據、資金、技術及其配套的研究支持體系攸關知識生產的有序運行。除了自建集成平臺獲取數據外,實驗室與產業界、政府部門在公共議題領域開展數據共享合作。同時,由于項目、人員與平臺的開放性與多元性,技術與資金支持也較為多元。以牛津大學互聯網研究所(A-16)為例,它建立了由行業專家、商業精英與政府領袖組成的咨詢委員會,更好整合了多元化的資金來源與技術支持,提供了專屬開源技術和數據基礎設施支持。[11]第四,全方位的組織制度保障有效規避了知識生產中的數字風險。針對數據獲取中的倫理隱私問題,蘇黎世聯邦理工學院社會科學實驗室(A15)建立了全域隱私計算與數據安全中心,在保障隱私倫理前提下實現了數據可查找、可訪問、可操作與可重用的目標。
顯然,創新網絡賦予了數字時代知識生產更大的算力支持。譬如,當面對機器學習模型所存在的建模假設偏誤與模型偏差的技術限制問題時,“四重螺旋”系統通過數字協調機制克服技術障礙、跨越部門限制與穿越知識譜系,有效回應大數據技術在建構機器學習模型以及評估、比較和使用這些模型時無法回答的方法論和理論問題。[12]正是由于更加扁平化、開放化與異質化的知識創新網絡,以及橫向協同與縱向聯動的立體化知識生產體系,為數字時代的知識生產賦予了更強的組織基礎與制度支持。
復雜混亂的數據信息有效整合為知識成果有賴于知識集群相互協作,這涉及議題設計、數字協作、知識建構與成果輸出四個方面。議題設計作為項目的具象化路徑,旨在評估與論證研究的創新和可行性。譬如,賓夕法尼亞大學沃頓商學院分析中心(A-12)主導的高通量實驗涉及自動化與信息科學的精心設計,可使數千名受試者同時參與社會試驗,從而減少研究成本與時間周期。[13]盡管議題極為龐雜,但其本質仍是以數字技術解決社會重大議題為切口,開展面向未來的創新設計。當項目議題確定后,大規模與靈活化的數字協作使實驗室、私營部門與政府協同完成數據獲取、清洗、分類與儲存任務。目前,人文社會科學領域的數據是非結構化的,多呈現為符號、事實與信號的雜亂集合,且不能直接被用于研究分析。為此,康奈爾大學社會科學中心(A-06)構建的云計算虛擬平臺與數據庫鏈接,[14]將高度異質性的數據集進行清洗加工后變為可分類、儲存與檢索的結構化信息,實現了不同知識域的數據融合與去中心化的超學科協作。
在知識建構方面,自動信息提取、社交網絡分析、社會地理空間分析、復雜系統建模與社會仿真模型方法使數據信息得以結構化、空間化與系統化,從而完成數字向知識的創新轉化。但社會改進方案的成型是多個知識綜合的結果,需要經由建模、融合與導航的知識建構才能完成。目前,數據科學領域廣泛采用大數據知識工程模型(BigKE)。[15]這一過程將多源異構的碎片化知識整合為局部知識,經過知識融合與知識導航后成為具有全局性與系統性的知識集群,才能為咨政輔助、行業預測與社會創新提供服務。在成果輸出方面,由于議題目標差異化,成果類型既涉及出版物、數字課程與技術工具,亦包含數字治理產品、數字經濟項目與人機交互機器人。以賓夕法尼亞大學計算社會科學實驗室(A-01)開發的行為科學創新工具(Empirica)為例,它是進行人類參與者實驗的可定制虛擬平臺,既可運行數千個實驗條件與系統覆蓋給定的參數空間,又能通過數字孿生技術仿真實體組織進行整體分析。[16]可見,以區塊鏈、5G與腦機接口為主的智能技術正在賦予文科知識生產更大的靈活性、便捷性與科學性。
綜合而言,數字化知識合作網絡可以動員大規模異質化的學科人員、數據專家與行業代表參與知識生產,推動單一的知識成果走向知識集群。在知識生產數字化背景下,議題評估、數字協作、知識建構與成果輸出是在以虛擬實驗室為集成的多個數字平臺上協作完成的,既涉及學科、行業與政府多個層面,又包含資源、人力與數據多個要素,還囊括知識、工具與技術多個形態,呈現了知識集群的動態適應、系統開放與自組織特征。
由于數字時代知識生產具有多主體、多形態與多層次的多維聚合性,知識成果的效用評價既包含內部評價,又囊括了外部問責。在內部評價中,同儕人員基于學術創新視角評估數據建模解釋研究假設的科學性,學生從人才培養角度評價數字化知識生產過程中的內容與知識體驗,而組織評價的任務在于分析數字模型的有效性。由于建構的機器學習數據模型屬于“黑匣子”,無法清晰地掌握內在生產過程,因此內部評價通過數據算法模型對因果關系、機制生成與趨勢預測進行檢驗,從而保證知識生產的整體質量。[17]其實,從確立目標之初,計算社會科學實驗室(A-02,A-07和A-20)建立了全時段與全過程的數據評價機制,將歷史數據與質量評測納入知識生產模型中,以便進行動態追蹤與監控。
數字時代的文科知識生產是由公共議題、異質知識與數字協作所驅動的,關于知識“成功”的定義愈來愈取決于產業、政府與公民社會對知識成果的反饋,由此也決定了外部評價標準愈來愈成為知識合法性的重要向度。在哥倫比亞大學計算社會科學中心(A-11)建立的外部反饋機制中,側重關注知識成果對商業模式與資源配置的再生影響,著眼于數字技術評測政策效果與推動政府數字轉型進程。此外,他們還從公共利益與道德福祉層面反思知識創新所帶來的社會影響。[18]這體現為文科知識生產在通過數字技術更加靈活便捷嵌入“大學—行業—政府—公民社會”的創新生態系統時,亦通過公共尺度強化了知識成果在數字正義與算法規范層面的審查問責,確保了知識創新與公共利益的達成。
為了使內部評價與外部問責有效結合,計算社會科學實驗室構建了數字化知識評價體系。以倫敦大學學院知識實驗室(A-08)為例,它將數據評測、計算仿真與外部問責相統一,形成了“全過程數字跟蹤—機器學習評價模型—知識全景歸納分析—可視化反饋調節”的知識評價路徑。不過,數字化評價存在廣泛共識,即評價模型、指標與內容需要滿足公共利益的統一標準,符合算法正義與數字倫理的共享價值。換言之,當前文科實驗室構建了基于技術與數據的知識評價體系,其內核仍是從人的發展向度與社會公益尺度審思數據、計算與技術共同締造的知識價值。因此,數字時代的知識評價不僅要兼顧一般意義上的多重標準,還須在知識創新的公共價值方面做出更多的制度建設。
數字時代文科知識生產過程中的關鍵要素及其相互作用方式,共同構建了從情境驅動邁向知識創新的運行機制(見圖1)。本研究秉持整體主義原則將主范疇納入案例情境中進行邏輯串聯發現,各要素之間之所以能形成較為緊密的互動關系,關鍵在于數字時代“四螺旋”創新結構具有較大的資源整合與動員能力,善于從社會議題中形成具有前瞻性的知識創新目標,構建縱橫交錯的創新網絡與高度協同的知識集群,從而實現知識生產的公共利益。

圖1 數字時代文科知識生產創新的運行機制
計算社會科學實驗室的高效運作很大程度上歸因于多元參與、扁平松散與開放韌性的數字化知識創新生態系統。在智能時代,文科知識生產創新目標并不是私益性的,其必須通過數字技術與多元主體參與實現研究的公益性目標。[19]知識生產在社會情境驅動形成公共目標時,也促進了知識創新實現社會公共利益的進程。融入公共目標的知識生產在評估問責時不僅會遵循學術創新與應用效率的評價邏輯,同時會受到社會公共利益邏輯的問責影響。同樣,知識創新目標中公共目標的融入,使大學具備了對政府、行業與公民社會更強的知識動員能力。因此,公共目標是文科知識創新的隱性目標,并滲透到其他目標中隨其他目標的達成而實現,而后續的知識生產活動圍繞創新目標而展開的過程,更是公共目標融入后組織協同作用的連鎖反應。
為了打破數字協作壁壘并提高知識生產創新效率,在使用機器學習與算法治理的大數據計算對社會復雜問題尋求新穎且可復制見解的過程中,學術組織其實構建了包括數據基礎設施平臺、行業伙伴關系與學術合作網絡在內的縱橫交錯的創新網絡。這體現了整合思維、大規模協作與開放科學的組織特征,打破了學科邊界與組織層級,使大學在應對數字化挑戰與社會危機時能夠快速動員知識共同體中的學科專家與公共機構開展數字協作,從而提升知識創新效率。[20]這種適應實踐需要而形成的縱橫交錯的智能平臺以云計算為工具,通過數據云、服務云的云層服務實現知識生產協作的無縫銜接,增強了知識治理的靈活性與韌性。創新目標中,公共目標的融入為數字化知識評價模型與體系構建確定了基調,從而有效維護了知識生產過程中的數字倫理、算法正義與計算創新。實質上,這是一種對知識生產創新效果的反饋,并與最初的知識創新目標構成了評估問責的閉環。這一閉路的循環機制與評估問責的激勵機制促進了知識生產創新的整體效能,并對文科知識生產目標的實現扮演著過程監督功能。
知識集群作為銜接創新目標、創新網絡和評估問責并將諸要素轉化為知識創新的中間環節,這一機制關系到數字化知識成果的科學性與有效性。實質上,數字化知識生產運行依托于區塊鏈、人工智能與云計算等技術集合,如通過人機交互機器人、腦機接口與物聯網等技術進行數據聯通與交互(A-10),通過區塊鏈、智能端口監管與維護數字化知識協作體系運行(A-18),通過云計算、5G技術支撐大規模即時的開放科學實踐與數字化合作(A-21)。在文科知識創新過程中,議程設計、數字協作與知識建構共同構成數字化知識生產集群機制,并與縱橫交錯的創新網絡機制、可視化的知識評價機制一道,實現數據生產要素向知識智慧的創新轉化。這其實是將社會議題轉化為研究任務實現知識輸出并完成公共目標的數字化過程,亦有助于各生產要素相互作用所形成的知識聯合體實現資源、創新與傳播的協同放大效應。概言之,與知識生產模式Ⅲ一致,數字時代文科知識生產運行依賴創新網絡與知識集群所促成的創新生態系統開展數字協作與有機聯動,加速了知識生產進程并實現知識生產的創新目標。
知識生產模式Ⅲ以知識集群、創新網絡及其所建構的生態系統作為核心要件,并以“四重螺旋”創新生態系統作為其存在的適應性情境。分析發現,數字時代文科知識生產受問題情境驅動,并在創新網絡、知識集群與評估問責運行框架下產生類型多元的知識成果。四者間的互動共同構建了數字化的文科知識生產運行機制,也促成了文科知識生產創新生態系統,使“大學—政府—行業—公民社會”有機聯結并具備更大的創新協調能力。為此,全球大學應科學制訂文科實驗室的規劃方案與建設辦法,通過公私合作模式建立橫縱交錯與開放共享的數字協作系統,完善文科知識生產的智能設施與技術結構,從而健全知識生產的智能技術體系。與此同時,由于成果類型較為多元,數字時代的大學應當建立由多領域、多學科與多層次專家與行業領導者組成的學術委員會,對知識成果建立具有發展性、激勵性與指導性相兼容的評價體系,并聯合政府、行業組織與社會確定更為嚴格的數據隱私與倫理風險評估體系,預防與治理知識生產中的數據安全問題。但須注意的是,文科知識生產不必對數字算法產生效率崇拜,不必倒置問題與技術的主客關系,而是堅持以人為本的價值立場并與人類命運的公共利益相聯系,直面社會問題的復雜與紛亂,才能彰顯技術進步的革命性意義。