【關鍵詞】 數據;數據治理;數據密集型大學;數據密集型科學【中圖分類號】 G647 【文章編號】 1003—8418(2025)06—0011—09【文獻標識碼】 A 【DOI】 10.13236/j.cnki.jshe.2025.06.002【作者簡介】(1980—),男,河北承德人,教授、副院長;(1994—),女,山西臨汾人,博士生。
黨的十九屆四中全會通過的《中共中央關于堅持和完善中國特色社會主義制度推進國家治理體系和治理能力現代化若干重大問題的決定》將數據作為與勞動、資本、土地、知識、技術、管理并列的生產要素[1]。對于高校而言,隨著大數據時代的快速發展,數據已然成為高校的戰略資產[2],高質量的數據治理也成了大學發展的關鍵因素。數據治理(DataGovernance)是對數據資產管理行使權利和控制的活動集合[3][4]。傳統大學知識治理關注的兩個核心問題是:數據是基礎知識還是應用知識?數據應該“開放”還是“封閉”?這兩個問題背后反映的是大學數據治理的兩個主要框架,即開放科學規范和知識產權制度。開放科學規范鼓勵研究人員、管理員、資助者、出版商和監管機構建立制度框架促進數據共享;知識產權制度則旨在推動建立大學研究數據封閉性和專有性的框架和實踐。而在大數據時代,數據在大學研究實踐及管理中變得越來越重要,大學已然成為數據密集型學術機構,數據的“開放性”“專有性”與“流動性\"等屬性挑戰了大學原有的數據治理框架,試圖將數據置于開放或封閉的二分法框架中可能弊大于利。因此,數據本身為大學提供了新的中心組織原則,需要構建全新的治理準則。
一、數據密集型科學范式與數據密集型大學的出場
數據密集型科學作為科學方法革命歷程的第四種范式[5],由圖靈獎得主吉姆·格雷于2007 年提出,它標志著科學研究從傳統實驗科學、理論科學、計算機科學向以數據為中心的范式轉變,強調數據的收集、存儲、分析和解釋。事實上,數據密集型科學起源于20世紀80 年代,在一些專門探索超大型數據集的專業學科中開始興起,尤其是在粒子物理學、天文學、天體物理學和基因科學等學科領域,定制化的信息技術被開發出來,以處理超大或超小規模的異常大量的世界觀測數據集合。進入21世紀后,從這些領域逐漸抽象出來的計算資源及其衍生技術(感知和觀測技術、信息處理和存儲能力、網絡通信設施及相關解釋技術)已逐漸被其他研究領域引入和接受,如數字人文學科[7]。收集、處理和應用超大數據集逐漸成為許多領域的常態。換言之,數據在科學研究中的地位和角色發生了轉變,這種轉變導致數據密集型研究日益主導大學研究實踐的許多領域,以至于傳統上以追求知識為基礎的大學現在可以更準確地被理解為“數據密集型大學”。曼迪森(Madi-son)對該概念做了一定的闡釋,他認為數據密集型大學是對傳統科研范式的進化適應,他認為數據本身就是這種新興大學的基本表征,包括藝術和文化、科技、社會科學等學科領域數據的收集、記錄、理解、使用和證據[8]??梢姡瑪祿芗痛髮W的出現,表明大學數據本身屬性在發生轉變(具體見表1),不僅改變了人們對于數據的認識,提高了大學科研基礎設施的要求,也重塑了大學的角色和治理框架[9][10]
(一)數據密集型科學范式促使大學轉變為數據密集型大學
數據密集型科學范式對“數據”的內涵進行了重構?!皵祿"最初可廣義地定義為證據,或一般地定義為與研究和學術有關的自然、物理、物質和文化的“世界現象的表征”[11]。因此,數據往往被看作基礎資源,被視為各種證據原料或是一種多用途的研究工具[12]。數據也被研究人員收集、創建和使用,將其作為信息輸入解釋過程、實踐和技術中,這些信息本身幫助研究者產生和共享研究結果。恰如伯格曼(Borgman)所言,數據是人類構造的。同樣,萊昂內利(Leonelli)認為數據是“相關的”,數據的意義依賴于它們的歷史(數據如何產生和演變)、它們的特征以及分析時對數據的解釋[13]。但是,隨著數字化的到來,數據中所蘊含的信息、知識已然超越了其自然屬性。如果將數據視作基礎資源,然后將解釋后的結果稱為“信息\"或“知識”,則強調了“生成一收集一加工一存儲一管理一分析一解釋”線性的數據生命周期[14],這是一種典型的線性或層次關系,強調事實歸納的思想[15]。從古希臘時期開始,觀察、調查和研究的成果就被認為是支配世界的基本、一般或永恒的原則,并被認為是知識,隸屬于哲學家的領域;而應用的或有用的知識則被認為是工程師或者技術專家的領域。在科學史家和信息學家看來,與其將數據視為通向知識的線性路徑的一部分,不如將數據理解為證據收集和解釋重疊過程的一部分更為合適[16],強調數據之間的相關關系而非因果關系[7」。在一些學術領域,數據和數據集越來越多地被視為具有價值的研究和學術活動。特別是“數據流\"(DataStream)思想的出現,暗示了數據既是輸入,又是工具,還是廣義知識的命題,而不是把數據僅僅看作“原材料”“物”或固定的“對象”。一些學者認為,復雜數據集的生產和出版應該被視為一種有價值的知識生產活動,可以運用于研究生招生和學術人員晉升的決策之中[18]??傊?,數據可能具有很多實體和數字化的存在形式,數據和數據集可以人工制作,也可以由算法生成,導致不同學科對數據定義的邏輯各不相同。它們本身就是基礎知識或廣義知識的模式,也就是說,數據構成了不同領域研究者或數據科學領域的專業研究者所產生的研究結果和產品?;诖耍髮W的使命與角色被重塑,定位為“數據密集型大學”,體現以“知識\"為中心敘事向“數據\"中心敘事的轉變,其治理框架理應置于數據密集型科學背景下,對其進行探索。
(二)以數據為核心要素已成為數據密集型大學治理的共識
在當代大學中擁有大量的數據和數據集,其中大部分是大學的教職工和學生收集、生成的,并在本地進行存儲,也有一些數據由大學研究人員訪問,但在其他地方存儲和維護。這些數據構成了跨多個領域的研究資源,而非僅為特定利益或專門的工具。在美國及一些歐洲國家,大學已經在準備制訂數據管理政策和指南,以幫助研究人員和其他人存儲、管理、保護、共享和開發研究數據,并及時跟蹤良好研究實踐的發展[19]。如牛津大學、密歇根大學等研究型大學通過制訂并推行數據治理策略,優化對數據的使用,幫助學校做出明智決策、提升學術水平和管理效率[20]。美國院校研究會(The Association for Institutional Re-search)、高等教育信息化協會(EDUCAUSE)和大學商務官員協會(TheNationalAssociationofCollege and University Business Officers)三個機構更是聯合聲稱,數據分析可以解救美國高等教育[21]。由此可見,在全球范圍內,以數據為核心要素已然成為大學科學治理的共識。在我國,多數大學已經認識到數據作為治理核心要素對高校信息化建設的重要性,并進行了數據治理實踐,通過管理數據、運營數據、智填數據、應用數據、治理數據等路徑構建高校數據治理體系。
以數據為核心要素,開展治理工作成為大學治理體系現代化的重要內容。一方面,數據治理有利于數據密集型大學的科學決策、高效管理。數據治理以客觀事實為依據,通過建立科學的數據分析模型和智能決策系統,為大學的決策提供智力支持,從而提升決策的科學性、精準性和前瞻性[22]。例如,大學通過整合數據資源和數據分析工具,分析和處理大學大規模集成的師生數據資源,對招生趨勢、教學效果、人才培養效果等方面進行預測和評估,為大學提供科學的決策依據。另一方面,良好的數據治理能夠將數據轉化為數據資產,轉化為價值[23]。數字化時代,基于大量數據,通過數據分析技術能夠創造出一定的社會、經濟或文化價值。在數據密集型大學,隨著數據“量”的積累,不同數據之間相互關聯,數據既作為解釋的資源,也作為解釋的結果資源,形成了價值性的數據集。特別是,大學里的版權、專利等數據能夠產生一定預期的經濟價值,為我國經濟發展貢獻重要力量。然而,這些數據集本身并不是大學某個研究人員單獨操作的領域,而是需要不同利益相關者復雜的合作關系[24]。因此,數據密集型大學的治理不僅涉及利用數據技術為大學管理與決策提供便利,而且涉及數據的采集、分析、應用及數據產權認定、保護、權益分配等方面,這就需要全面考量數據特征及大學現有架構,構建系統化的數據治理體系。
二、傳統知識治理模式對數據密集型大學效用不足
大學自誕生起就是以知識保存、傳播、生產及應用為主要活動的場所,特別以知識生產為主要特征。正如克拉克所言,大學作為知識中心,是控制高深知識和方法的社會機構[25]?;诨A知識和應用知識的分類,形成了以開放與封閉為框架的知識治理模式。但隨著數字密集型大學出現,原有的治理框架并不能很好地規范考慮數據治理問題,數據和數據集不一定是基本知識,也不一定是應用或有用的知識,不能單純用“開放”或“封閉\"的數據治理框架進行規范,并產生關于專有系統和開放系統的實質性沖突,使得這兩種知識治理模式的效用達到極限。
(一)二元知識分類框架的形成
早在對數據和數據集的關注之前,大學的主要職能是知識的傳播、生產和應用,其核心依然是知識的生產。隨著知識生產模式的轉變,大學的知識生產具有兩重性,既有學術研究,也有發明和技術轉讓的實踐。傳統的知識生產模式1是基于牛頓模式的科學研究,以單學科研究為主;而知識生產模式2是指在應用環境中,利用交叉學科研究的方法,強調研究結果的績效和社會作用的知識生產模式。根據知識性質,可以將知識分為基礎知識和應用知識。其中,基礎知識以公共性為基本屬性,受到好奇心、創造力和實驗精神驅動產生,結果是開放和廣泛共享的,以便其他研究人員在此基礎上進一步發展;應用知識以私有性為基本屬性,以解決特定技術或社會問題的興趣而產生,其成果通過商業化從大學轉移到其他機構來分配,結果是專有和封閉的?;谶@兩種知識,大學通過平行的知識治理實踐使這種二元性制度化。這種二元性的治理制度可以從大學的制度發展歷程中看到,一是在大學環境中存在著根深蒂固的知識概念框架一一基本知識或純知識和應用知識或有用知識。二是大學知識治理方式的特點和發展呈現二元論。
從認識論維度審視,啟蒙運動實際上構建了知識構成的二元框架一一將基礎性知識的本質屬性錨定于經驗主義的實證根基,而非理性主義的先驗思辨。這種知識分野在洛克與休謨的哲學體系中得到充分印證,強調將感官經驗作為知識生成的必要條件,與笛卡爾式純粹理性反思形成鮮明的方法論對照。受到經驗主義思想的影響,德國大學是第一個在制度上實施這一轉變的大學,它們圍繞著以觀察世界為基礎的科學研究,圍繞著研究成果的開放共享進行組織和重組,由洪堡發起建立了柏林大學,對基礎知識進行了系統的調查和生產,將基礎研究和知識(大學)與應用研究和知識(技術學院)區分開來。
在美國,基礎知識和應用知識的界線較為明顯,但基礎研究和開放知識與應用研究和專有知識可以共存。之所以在美國出現依賴于兩個關鍵事件的發展。一是二戰后布什政府發布的《科學:無盡的前沿》報告,提高了聯邦政府對大學基礎研究的贊助,強調了基礎研究的線性轉移及基礎研究在技術創新發展中的作用。該報告深刻影響了大學的知識治理框架。二是1980 年《拜杜法案》的出臺允許大學和大學研究人員保留其發明的專利權,即使研究是在聯邦政府的支持下進行?!栋荻欧ò浮芳捌浜罄m立法幾乎是直接催生了現代以大學為基礎的技術轉讓實踐,促使大學在應用研究實踐與商業市場的產品開發和融資實踐之間實現思想上和實踐上的“轉換\"[26]。相關的技術轉讓法和現代技術轉讓實踐使基礎知識和應用或有用知識之間長期存在的鴻溝縮小,形成了巴斯德象限,即對應用背景引發的基礎研究在政策上、科研項目組織和成果評價上予以重視,建立科學與社會之間新的聯系。由此,在實踐中形成了規范性的治理制度,一方面支持研究人員繼承長期以來存在的開放共享傳統,另一方面則在應用知識生產方面不斷與外部專利制度相互作用。
(二)二元知識治理框架及其局限性
在這種二元知識分類框架下,形成了基礎知識應該是開放性知識、應用知識是封閉知識的認識,并形成了兩種知識治理框架。
首先是基于“基礎知識一開放\"的知識治理框架,旨在鼓勵研究人員、管理人員、資助者、出版商和監管機構建立促進數據共享的制度框架,其基本假設是數據作為基本知識,應該是開放的,將數據視為無主、開放和自由共享的知識。在該框架下,對數據的本體論應傾向于“基本的”“發現的”,而不應該是“應用的”“制造的”,否則對數據所有權的主張無法得到證明。大學的研究者被期望盡可能廣泛地傳播他們的研究成果,繼承長期以來“科學共同體\"開放共享的傳統。正如默頓強調的那樣,科學是客觀的、非個人的共有財產,其成果不應該被私人擁有,應該是無私的[27]。在國家層面,各國紛紛采取了一系列治理措施推進開放治理框架的運行。如美國開放科學中心發布“開放科學框架\"(OpenScienceFramework),歐盟委員會發布《歐洲開放科學云實施路線圖》,中國頒布《科學數據管理辦法》《關于加快公共數據資源開發利用的意見》等,推動開放科學發展[28]
其次是基于“應用知識一封閉\"的知識治理框架,旨在強調有用的知識是受到專利保護的,將數據視為私有化的具有商業價值的知識產品,其基本假設是數據作為應用知識,具有一定的經濟價值和社會價值,受到法律保護。目前,無論是在國家政策層面還是大學制度層面,都有技術轉讓實踐和正式的政策工具,以解決在大學的研究產品和學術作品中分配知識產權利益的問題。知識產權法通過將知識成果“物化”(即賦予其法律客體形態),構建起激勵知識創新的制度框架,以促進更多元、更優質的知識生產,并通過確立法律保護邊界來實現其應用價值。如果數據是“物化\"的知識成果,就意味著數據具有促進知識創新和應用價值的社會功能,應該被納入知識產權保護的范圍。但是,在法律上,數據通常被視為關于世界的事實,包括世界上的自然現象?;谶@種認識,數據就不受知識產權保護。在知識產權環境下,將數據定義為開放且不受保護的,在很大程度上依賴于將事實視為基本“原材料”的傳統觀念,這是解釋知識產品的基礎。傳統意義上對數據的理解是不可靠的“原始材料”,這與現代學術中普遍存在的事實可能是相悖的。根據工業部門的直覺,數據集可能構成有商業價值的、可擁有的產品。例如歐盟于1996年通過了一項關于保護數據庫的指令,目的是防止“挪用\"投資產生的專門知識數據集[29]。所以,數據不是無主的、開放的、原始的東西,而是一種資產 一種制造出來的東西,一種可能具有經濟、社會或文化價值的物品,以及一種成熟的可以圈地的東西。目前,《中華人民共和國著作權法》《中華人民共和國專利法》《高等學校知識產權保護管理規定》保護的均是最終成果,并沒有對創作過程中的數據給予相應的法律保護[30]。2021年,《“十四五\"國家知識產權保護和運用規劃》提出,將探索建立分級分類的數據知識產權保護模式,推動建立行業規范,加強數據生產、流通、利用、共享過程中的知識產權保護。
傳統知識治理框架下將數據看作知識產品,一方面,數據和數據集可能被壓縮到這些政策和實踐中,忽視了數據或數據集本身具有的技術實用性或商業價值。另一方面,將用于治理目的的數據資源視為固定的形式,與數據在“流通\"或“生命周期\"實踐過程中生成和使用的方式相沖突,使得傳統知識治理模式對數據密集型大學出現效用不足的問題。
三、沿用傳統知識治理模式對數據密集型大學產生的風險
(一)數據多元性認識不足,引發數據安全隱患
隨著大學中數據來源多樣,包含了結構化數據、半結構化數據和非結構化數據等不同類型的數據,導致數據治理變得更加復雜。如果繼續沿用傳統的知識治理模式,會導致數據開放共享與隱私保護之間的矛盾沖突,進而引發數據安全隱患。如數據共享違規、數據泄露、數據濫用等問題。一方面,數據的公共屬性要求數據進行公開共享,可以被多主體同時使用、處理等,但并非所有的數據都具有開放性和共享性,其專有性應該受到產權保護,這就導致在數據規則不明確、使用目的不清晰的情況下,出現數據被用于非授權用途的情況。另一方面,數據的專有屬性要求對數據進行法律保護,在數據生成和使用過程中可能會涉及創造性的勞動,體現了數據的獨創性和非流通性,是需要進行知識產權保護的,這又與數據的可復制性、非排他性等產生沖突。目前,許多高校在數據治理方面缺乏健全的治理制度和標準,導致數據質量參差不齊,難以有效對數據進行管理和應用,這種能力的不足進一步加劇了傳統知識治理模式在數據密集型大學中的失效[31]。因此,在大數據環境下,大學需要構建統一的數據治理制度,處理好數據開放與隱私保護的關系,避免安全隱患的產生,使數據安全風險得以有效控制。
(二)弱化數據間的關聯性,不利于跨學科合作與研究
數據密集型大學通常涉及多個學科的知識共享與合作,從而提升了研究效率和創新能力。數據驅動下,學科之間開展集群、多視角的學術合作成為科學研究的一種新范式。一方面,數據作為學科間同質化的基礎和媒介將弱化學科邊界;另一方面,隨著科研方法從傳統的假說驅動型向探索型轉變,開展跨學科領域的交叉研究將有利于對獲得的海量數據進行更全面的關聯性分析,形成學科間優勢互補,解決更多復雜的科研問題[32]。與此同時,對于數據共享的需求也更加強烈,進一步促進了不同學科間的合作與交流。在傳統知識治理模式下,不同學科數據的獲取與使用的規則不明確,學科之間數據融合的思路不一致等問題進一步阻礙了數據價值最大化,如何將不同學科的數據組合在一起形成新的數據集及如何管理新的數據集,成為大學治理的難題。
(三)忽視數據的主體協同,導致協調共享困難
數據密集型大學涉及多方利益相關者,不僅僅局限于校內的學生、教師群體及各類部門,更涉及產業、政府等其他組織,校內外的利益相關者對數據的需求和期望各不相同,而傳統的知識治理模式難以平衡這些群體間的多元利益,從而導致治理效果不佳,也產生校內不同數據部門間的隔閡及在不同組織間數據協調困難等現象。特別是,在數據密集型大學中,數據本身并不是大學研究人員單獨操作的,而是跨越不同組織、學科。但由于數據系統的孤立、協調機制的缺乏、學科實際需求不同等,數據的協調共享難成為大學數據治理中的重要挑戰[33]。隨著知識邊界的模糊與開放,科研活動不斷出現交叉性和跨學科性,在數據密集型范式下,數據治理體系發生了深刻變革。在行政有邊界、數據無邊界背景下,各部門的數據治理體系和功能雖然相似,但由于管理職能劃分、建設進度不一等情況,難以協同建立數據關聯,導致數據一致性差[34]。當這些數據抽取到數據倉之后會發現,數據雜亂無章,難以直接利用。此外,不同學科在數據治理方面的實際需求迥異,生物醫學研究、公共衛生、天文學和天體物理學很大程度上是基于收集和分析大型數據集,其實施管理涉及安全性和隱私問題可能是社會科學研究領域的若干倍;一些研究人員可能要處理的數據集又大又復雜,需要商業存儲服務,并通過超級計算機進行處理,一些研究人員可能使用存儲在筆記本電腦上的簡單電子表格中的數據集就可以滿足需求。因此,數據治理不僅對部門之間的數據協調機制提出了要求,也同樣對數據標準規范提出了要求。
四、數據密集型大學的治理模式與實現機制
數字時代下,大學的知識生產模式產生了深刻的、系統的、顛覆性的變化,可以稱之為“數據中心化知識生產范式\"[35]。這種知識生產范式下,“用數據改變世界狀況”將取代“普遍而有用的知識”,成為數據密集型大學治理實踐的主導范式。當前形成的技術治理、要素治理、全局治理等模式雖具突破性,仍存在制度供給不足問題。需通過制度創新、流程再造和關系重組,構建全生命周期治理體系,實現從知識生產到治理范式的系統性變革。
(一)數據密集型大學的三種治理模式
在數據密集型大學中,隨著不同數據類型的增長、跨學科的合作交流以及多方利益相關者的參與,不斷對傳統知識治理框架提出各種各樣的挑戰,并在不斷地探索過程中形成了“技術治理\"[36]“要素治理”“全局治理\"[37]等多種治理模式(見表2)。
“技術治理\"模式側重從技術方法層面對大學所產生的數據進行收集、存儲與分析,旨在技術架構升級。它突破了原有垂直管理、靜態歸檔的科層制管理模式,利用技術作為治理工具來簡化治理過程,提升治理效率,將復雜的治理問題轉化為可視化、可量化的數據,以實現對數據的科學管理及數據驅動決策。在治理過程中,注重發揮大數據技術的功用價值,不斷通過技術迭代優化治理模式,但由于數據本身在現有法律框架中存在的矛盾,導致在治理過程中欠缺對如何平衡開放科學與數據主權之間的關系的探討。
“要素治理”模式著力于在技術手段的基礎上,通過數據要素化重構將大學數據納人經濟發展框架,其核心在于構建基于權屬明晰、價值評估和市場配置的數據資產管理體系。在該模式下,以技術賦能為底層支撐,重點是在建立數據資產目錄和價值評估的基礎上實現數據產品的開發與交易。但在現有知識產權體系下,數據的法律屬性、產權保護制度還不明晰、不健全,導致數據在實踐中數據歸屬、利用產生糾紛,進而阻礙了數據確權、定價、交易秩序的生成,進而不利于數據匯集、數據處理、數據流通、數據應用、數據運營等一系列數字經濟活動的展開[38]。目前,多數大學出臺了數據管理辦法,對數據權屬的數據所有權、使用權作出規定,但從出臺的數據治理文件中可以看出,大多數大學對使用數據交易所產生的利益分配規定不明確,未能形成數據的價值循環機制。
“全局治理”模式屬于關系型治理,聚焦于組織層面對數據的整個生命周期及參與主體進行全面考量,旨在構建多元利益相關者的共治機制,建立數據治理引力場,使離散的數據活動在制度約束下形成有效軌道,最終實現數據的全方位全要素治理。特別是數據的價值創造于利益相關者的共同協作的生態之中,具有共創性和共享性,如何為不同主體提供場景化對話和協商通道的利益相關者機制,是實現數據價值共生與增值的關鍵[39]。國內高校已經對該模式進行了探索,如哈爾濱工業大學成立的哈工大(深圳)—傲天數據治理聯合實驗室。但已有研究表明,我國大學在組織結構與職責方面,缺乏與多元治理主體相適應的統籌管理體系[40]
總體來看,要達成對數據密集型大學數據的全方位治理需要重塑大學現有的治理框架,加強頂層設計,明確數據權屬與流通規則,協調不同利益相關者的數據治理訴求,實現技術、要素、關系等層面的有效鏈接,綜合構建數據治理機制。
(二)數據密集型大學治理的實現機制
1.以制度建設為保障,推動數據治理結構機制制度化。數據治理結構性機制是通過建立系統化、規范化的制度框架設計,將數據治理中的組織結構、權責分工、流程規則等以明確的規則形式進行確立,以形成“用數有據,治數有規”的治理秩序。目前,數據密集型大學治理的結構性機制受到兩種知識產權制度的規制,即版權和專利。大學通常通過正式的政策工具,解決研究產品和學術作品中知識產權決策權及利益的分配問題。在專利法框架下,大學研究人員創造的發明通常歸屬于大學,由大學決定是否申請專利,并最終將具有商業價值的技術轉移至相關企業。然而,數據在專利法中的歸屬并不明確,因為數據缺乏知識產權法所要求的創造力,因此數據本身不受知識產權法保護。數據和數據集既非完全私有,也非無主之物,甚至在許多方面根本不屬于傳統意義上的“物”,因此單純的所有權和控制權模式可能并不適用。在數據密集型大學,隨著新的內部數據需求和不斷變化的外部需求,數據治理結構機制理應適應變化與需求,突破傳統的基于“基礎知識\"或“應用知識”的數據治理結構,改變結構機制以往的非此即彼觀念,重塑一種體現互通、互享、互聯、互信的數據治理結構機制。一是組建專門的數據治理組織架構,將數據密集型大學的數據管理、保護、應用等相關職能納入現有的組織架構內,明確治理主體的職能邊界,明確決策、執行及監督的職能分工,為數據資源的開發和利用提供組織保障。二是建立相關職能部門間的統籌協調機制與制度,制定數據治理的總體方案,充分調動、發揮各職能部門的積極性,并協調各方關系,形成數據治理發展的長效機制。三是構建鏈接政府、企業及社會等不同主體的合作與交流制度,探索大學數據與其他組織數據融合聯動機制,明確數據權屬,以更有效地發揮數據的作用與價值。
2.以數據要素為核心,推動數據治理程序機制標準化。數據治理程序機制是通過統一的操作規范和操作流程,將數據治理的關鍵環節優化為可執行的標準體系,旨在確保數據的準確記錄、安全保存、有效使用和適當共享,具體包括流程、技術、管理、監管等方面的標準化。從當前的政策實踐來看,大學在頂層設計中規范了數據的共享性、準確性、完整性和安全性,并在此基礎上制定了一系列二級目標,要求各學院和部門在財政和技術上落實學校的數據戰略目標。但卻存在兩個矛盾的問題。一是廣泛而公開地共享數據,以促進科學研究的透明性和協作性;二是適當保護數據,防止隱私泄露、數據來源和分析的錯誤歸因,以及非研究人員的盜用。國家層面的信息公開法要求大學向公眾披露數據,同時確保數據在校內的安全性,以保障學術自由和研究流動,同時不妨礙研究成果的有效商業化。在這一背景下,大學的歷史框架正在根據數據的多重角色被重新塑造。從矛盾點出發,數據密集型大學的數據治理需要一套合理可行的程序機制作為數據治理的依據,從而避免數據公地悲劇、數據孤島、數據質量參差不齊等問題。一是數據治理流程標準化,明確數據全生命周期的管理原則和規范,保障數據的準確性、可靠性及可追溯性,對于特殊領域的數據需要采取加密、權限控制、備份等措施保護數據的安全性。二是數據治理技術標準化,統一數據存儲與交換格式,對數據進行分級分類管理,根據數據的敏感性和重要性,采用數據安全技術確保數據安全和合法合規使用[41]。三是數據管理標準化,建立數據共享和應用的合作原則和機制,遵循共享范圍限制、需求導向、權限控制、有序有度等原則,明確數據共享的合法性和規范性,確保數據的合理使用。
3.以合作共享為理念,推動數據治理關系機制生態化。數據治理關系機制是指通過多主體協調、動態適配的方式,將數據治理中的利益相關者納入一個開放、互信、可持續的生態系統中,通過促進利益相關者之間的溝通與協作,協調決策過程,推動數據治理的有效實施。其核心目標是在利益相關者中形成對數據治理的共識,確保利益相關者的積極參與。在數據密集型大學中,數據被視為跨社區和組織共享的資源,而非特定大學的知識資產。在數據生產、存儲和使用過程中常常會觀察到“溢出效應\"或外部性,這些效應往往涉及跨機構、跨學科甚至跨行業的合作與價值創造。例如,大學之間、大學與研究機構之間,甚至大學與私營企業之間的協作,都可能產生重要的學術和社會價值。但目前對學者攜帶數據并生成新知識成果的政策規范尚不完善,哪些利益相關者的實踐、需求和目標對定義數據至關重要尚不明確。因此,需要統籌不同部門及大學與利益相關者之間的利益沖突,不斷完善數據治理關系機制,構建多方主體協同、各司其職、規則兼容、共享共治的綜合治理結構。一是統籌建立跨部門合作機制,大學內部普遍設置信息中心或大數據中心負責本部門職能范圍內的數據治理,要實現數據的一體化管理,需要各部門間的緊密合作,建立跨部門的數據共享和協作機制。二是建立跨域治理框架,不僅要建立不同主體所擁有數據的接口標準,也要創新數據應用模式,推動數據資源的共享交換和開放應用,在保障數據安全與隱私的前提下,探索定向開放、專區開放等方式[42」,為數據高效流轉提供支撐。三是探索建立數據治理價值分配規則,健全數據要素生產、流通、應用、收益分配機制,促進數據的流通交易與應用,實現數據要素在生態內的經濟和社會價值增值。
數據密集型大學治理需通過結構機制的制度化、程序機制的標準化、關系機制的生態化,構建“數據驅動一流程再造一協同共治\"的新型治理模式。未來應重點關注數據確權、算法治理等問題,推動大學治理體系向智能化和生態化方向演進。
[1]中共中央關于堅持和完善中國特色社會主義制度 推進國家治理體系和治理能力現代化若干重大問題的決定[EB/OL].(2019—11-07)[2024—12—23].http://www.qstheory.cn/yaowen/2019—11/07/c_1125202003.htm.
[2]Alhassan,I.,Sammon,D.,Daly,M. Data Governance Ac-tivities:An Analysis of the Literature[J]. Journal of DecisionSystems,2016,25(supl):64-75.
[3]許曉東,王錦華,卞良,等.高等教育的數據治理研究[J].高等工程教育研究,2015(05):25-30.
[4]Yebenes, J., Zorilla,M. Towards a Data GovernanceFramework for Third Generation Platforms [J].ProcediaComputer Science,2019,151:614—621.
[5]張婧婧,封晨.多學科視域下教育密集型研究的機遇與挑戰——基于美國《數據密集型教育研究》的解讀[J].復旦教育論壇,2017,15(05):99—105.
[6][9]黃鑫,鄧仲華.數據密集型科學研究的需求分析與保障[J].情報理論與實踐,2017,40(02):66-70+79.
[7][8][16][24]Rooksby,J. H. Research Handbook on Intellec-tual Property and Technology Transfer[M]. Cheltenham:Edward Elgar Publishing,2020:364-390.
[10]Hey,T. Tansley,S. ,Tolle,K.Hey,T. The Fourth Para-digm:Data- Intensive Scientific Discovery[M]. RedmondWA:Microsoft research,2009:31.
[11][13]Leoneli, S. Data Governance is Key to Interpretation :Reconceptualizing Data in Data Science[EB/OL].[2025-01- 10]. https://hdsr. mitpress. mit. edu/pub/4ovhpe3v/release/7? readingCollection 72befc2a.
[12][18]Christine,L.B. Big Data,Litte Data,No Data:Schol-arship in the Networked World[M].Cambridge:MIT Press,2015:17-29,47-53.
[14]Borgman,C. L. The Lives and After Lives Of Data[EB/OL].[2025-01-10].https://hdsr.mitpress.mit.edu/pub/4giycvvj/release/8? readingCollection °eq 72befc2a.
[15]Ibekwe-SanJuan,F.,Geoffrey,B. Implications of Big Datafor Knowledge Organization[J]. Knowledge Organization,2017,44(03):187—198.
[17](英)維克托·邁爾一舍恩伯格,肯尼斯·庫克耶.大數據時代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:人民出版社,2013:29.
[19]方曉娟,陳媛媛.歐盟數據治理政策法規體系研究[J].數字圖書館論壇, 2024,20(06):1-11.
[20]陳茜.國外大學數據治理政策框架一覽[EB/OL].(2024-0920)[2024-12-29].https://www.edu.cn/xxh/focus/zctp/202409/t20240920_2634046.shtml.
[21]汪瓊.高校數據治理應用于哪些領域?[EB/OL].(2020-11-03)[2024-12-29].https://www.edu.cn/xxh/xy/xytp/202011/t20201103_2029641.shtml.
[22]31]高丹丹,郭健.數智時代的高等教育外部治理:政策導向、現實困境與數據治理賦能[J].中國高教研究,2024(12):20—28.
[23]袁振國.重塑未來——教育數字化之于教育強國建設的突破性意義[J].教育研究,2024,45(12):4-12.
[25](美)伯頓·R.克拉克.高等教育系統——學術組織的跨國研究M].王承緒,等譯.杭州:杭州大學出版社,1999:11.
[26]Winickoff,D.E.PrivateAssets,Public Mission:ThePolitics of Technology Transfer and the New American University[J].Jurimetrics,2013,54(01):1-42.
[27](美)R.K.默頓.科學社會學(上冊)[M].魯旭東,林聚任,譯北京:商務印書館,2017:8.
[28]袁亞湘,魏鑫,汪洋,等.我國開放科學治理框架研究[J].中國科學院院刊,2023,38(06):818-828.
[29]European Commission. Staff Working Document and ExecutiveSummary on the Evaluation of theDirective 96/9/EC on theLegal Protection of Databases[EB/OL].[2025-01- 15].https://digital- strategy.ec.europa.eu/en/library/staff -working-document-and-executive-summary-evaluation—directive-969ec-legal-protection—databases.
[30]尚趁.大數據時代高校數據權的屬性、類型及其保護[J」.蘇州大學學報(教育科學版),2024,12(03):79-85.
[32孫吉勝.以學科交叉融合推動研究創新[EB/OL].(2024-08 -01)[2025-01-15].https://www.cssn.cn/skgz/bwyc/ 202408/t20240801_5767917.shtml.
[33]胡水星,包飛宇,荊洲,等.我國高校大數據治理能力成熟度
模型的構建與實踐——基于CMM與ISM融合研究的視角[J].遠程教育雜志, 2024,42(04):22-30.
[34]喻姣,袁新輝,王鷹.高校數據一體化建設思路[EB/OL].(2023—09—18)[2024—12—24].https://www.edu.cn/
[35]杜巖巖,牛軍明.數據中心化知識生產:數字時代大學知識生產的新范式[J].復旦教育論壇, 2024,22(05):13-20.
[36吳立保,吳暉.數字時代的大學治理:理論邏輯、現實挑戰及其實施策略[J].江蘇高教,2024(04):42-47.
[37孟小峰.破解數據壟斷的幾種治理模式研究J」.人民論壇,2020(27):58—61.
[38]馬一德.構建數據保護的知識產權規則[EB/OL].(2024—12-18)[2025-04-19] .https://theory.gmw.cn/2024-12/18/content_37744747.htm.
[39]黃尹旭,楊東.“利益一權利\"雙元共生:“數據要素 x ”的價值創造[J].中國社會科學, 2024(02):47-64+205
[40]王楠,杜月.數字時代我國一流高校數據治理政策的文本研究[J].中國教育信息化, 2024,30(05):45-54.
[41]陳永杰.眾議:高校數據共享的挑戰與應對[EB/OL].(2024-12—13)[2024-12-25].https://www.edu.cn/xxh/xy/xytp/202412/t20241213_2646226.shtml.
[42]謝輝.北京數字經濟發展報告 2022~2023 [M].北京:社會科學文獻出版社, 2023:60-78
基金項目:2024年度國家社會科學基金一般項目“基于‘三鏈融合導向的高校學術成果多元價值評價指標體系構建研究”(BIA240112)。
Abstract: In the digital age,universities have become more data-intensive,and high-quality data govemance has become a key factor in their development. At present,the institutional characteristics of universities are largely defined by two paradigms: \" basic knowledge一open\" and \"applied knowledge一 closed.\" but the traditional open govemance framework based on basic knowledge and the closed govemance framework based on applied knowledge have become less effctive,and the use of the traditional knowledge govermance model will bring potential risks to university governance. As a result,based on the data-centered knowledge production model,many data-intensive universities have made initial explorations in data governance models,but there is stilla lack of institutional provision.The new govermance model of \"data- driven,process re-engineering and co- governance\" needs to be constructed from the institutionalization of structural mechanisms,the standardization of procedural mechanisms and the ecological optimization of relational mechanisms.
Key words: data; data governance; data-intensive universities; data-intensive science
(責任編輯 劉夢青)