
[摘要]科研數據是科研活動產生的重要資源,其共享與重用的重要性不言而喻。科研數據的產生既同科研工作者密切相關,又離不開科研單位等主體,但各主體訴求利益復雜,而這些復雜的利益則極易被忽略,導致科研數據共享效率低下、重用糾紛等問題。現存研究偏向于將科研數據進行財產化處理,但缺乏對科研數據公益性與自益性沖突的考慮,在加強數據產權、強化數據安全環境下,類型化思維能為科研數據的共享和重用提供指導,類型化思維不刻意強調分類,而是聚焦不同類別科研數據的核心特性,對癥下藥,針對事實數據追求共享的特性,采取強制性開放,針對觀點數據追求重用的特性,采取版權保護。
[關鍵詞]科研數據;共享與重用;類型化思維;版權保護;觀點數據
一、問題的提出
數據是科研過程的基本要素,為提升科研的透明性、可證實性和可重復性,數據成為學術交流的“一等公民”[1]。隨著數據密集型科研的興起,科研數據的重要性不言而喻,作為一種知識資產,其既是科學發展的“原料”,又代表著一個階段的“成品”,是推動科學發展的重要資源。
早在1993年我國便開始施行《中華人民共和國科學技術進步法》,以促進科研數據的共享,2018年出臺的《科學數據管理辦法》對科研數據的管理體制、采集、保存及共享和利用等進行規定。然而,實踐中相當長的一段時間內,科研數據常被視為論文、專利等成果的附屬品,科研工作者對數據權益認識不足,導致數據共享與重用率低等問題。并且從理論上而言,目前科研數據依托于公共資源且多數須政府、社會資金予以投入才可產生,故學界更多默認不探討其法律屬性、利益所屬,抑或直接在肯定科研工作者擁有版權的基礎上展開研究,不利于科研數據的共享和重用。
二、以共享與重用為關鍵的科研數據
(一)科研數據的種類和劃分依據
根據數據內容,可將科研數據劃分為事實數據和觀點數據,其中,事實數據指描述事實、具有客觀性的數據;觀點數據則指非描述事實的數據,既可能是在事實數據基礎上的觀點描述,也可能是經實驗、模擬后融入了科研工作者主觀判斷所產生的數據。
根據數據加工程度,可將科研數據劃分為原始數據和衍生數據,原始數據指通過觀測監測、考察調查、檢驗檢測等方式取得的尚未進行任何實質性加工的數據;衍生數據則是經一定程度加工形成的數據,包括匯編數據、算法和模型、可視化數據等。相較于原始數據,衍生數據可能是科研工作者通過應用研究、開發研究等產生的,蘊含科研工作者主觀因素的數據。
根據數據來源,科研數據可被劃分為由國家出資、社會機構出資、合作研發、獨立研發以及數次重用衍生的科研數據,其區別在于科研投入的承擔主體和應用方式不同,如國家出資所取得的數據往往直接用于政府機構或開放共享等;社會機構出資取得的數據大多為自用;合作研發取得的數據由各研發方共用;獨立研發取得的數據則由研發人員自行決定;重用衍生的科研數據的科研投入由加工者承擔,成果則加工者自用。
(二)科研數據共享與重用的關鍵價值
基于數據生命周期管理理論(Data Lifecycle Management),科研數據從產生到再利用須經歷采集、處理、存儲、共享、重用、銷毀等階段,其中數據的共享和重用,對實現科學數據的增值效應具有決定性作用(如圖1所示)。
以科研項目所產生的數據為例,其需要依托整個項目,主要在試驗監測、搜集、處理階段產生,并作為成果予以利用和保存,項目結束后通過網絡平臺或其他途徑實現共享或直接進入下一個科研項目的重用環節。但科研數據的生產耗資巨大,若僅應用于生產該數據的項目則明顯不能發揮其最大化價值。而共享與重用作為實現科研數據價值最大化的主要途徑,不僅能夠為后續科研工作提供堅實的數據支撐,助力科研工作的高效開展,還能激發新的數據需求,推動科研數據的持續創新與發展[2]。
(三)科研數據的階段特性
1.生產階段:涉及多方利益的系統性
科研數據的創建與生產是一個系統過程[3]。就主體而言,數據創建主體主要指科研工作者,數據通過科研工作者的研究工作而產生,整個過程離不開科研工作者的付出,但其中所耗費的資金往往不由科研工作者承擔,而由科研單位資助。故我國長期存在著科研成果權益歸屬于資助方的觀念,但隨著市場經濟的發展,這種觀念會淡化法治中的權利意識,影響科研工作者的積極性和創造性。
就對象而言,科研工作必須基于我國的自然資源開展,且依托此類資源產生的科研成果往往涉及國家主權與公共安全,如地質勘測數據、生物遺傳資源等,其權屬理所當然須體現國家所有權益的法定保留。但隨著國家創新驅動戰略的深化,《中華人民共和國科學技術進步法》和《中華人民共和國專利法》中均明確規定除涉及國家安全、國家利益和重大社會公共利益的外,授權項目承擔者依法取得利用財政性資金形成科研成果的知識產權。
2.共享階段:滿足社會需求的共益性
“共益性”指自身利益獲得滿足的同時,也通過公共品的生產和提供促進產業行業的整體發展[4]。科研數據的開發利用既需要強調社會公共利益,滿足社會需求,也應當在此基礎上肯定科研工作者滿足自身利益的目的。以礦業為例,目前我國已建立較完善的礦業相關的互聯網數據庫平臺,其中由中國地質調查局構建的“地質云”平臺不僅擁有我國礦產資源分布等信息,還擁有項目成果報告、地質調查文獻、館藏資料等,相較其他具有公益性特征的數據平臺,其已經具備面向大眾進行網絡傳播的基礎,數據的共享和重用也更為便利。
3.重用階段:表達信息的高價值性
科研數據重用是未收集數據的人員使用數據的行為[5],其關注的是科研數據的再利用[6]。科研數據作為一種信息表達則具有更高的價值,這應是數據重用的關鍵。有學者認為數據等同于信息,數據是信息的載體,信息是數據的表現內容[7];也有學者認為數據不等同于信息,二者具有實質區別[8]。數據的定義目前未有統一標準,實際上,數據應當由信息加工而成,是信息經數字化運作轉換為電子符號的外在形式。科研數據表達信息的高價值性體現在:大部分科研數據為反映事實的數據,具有客觀性,經長期的數據積累所形成的科研成果代表著某領域科技的進步和發展。
三、科研數據版權保護的關鍵問題剖析
作為保護信息表達的版權,不僅有助于提高創作者的積極性,而且不與公共利益相悖,因此我們需要剖析科研數據版權保護的關鍵因素,把握自益和公益的平衡,才能解決對立、實現統一,明確最優的保護方式。
(一)科研數據表達高價值性與版權保護創新性的統一
就保護對象而言,版權保護具有創新性的成果,這也是科研數據的特性。科研數據表達本身就是一種創新,既是形式創新也是內容創新,前者在于其以電子符號的形式表達信息,并存儲于互聯網,從而實現共享和重用;后者則在于科研數據所表達的內容雖基于公共資源產生但并非對公共資源的復制,其添加了主觀因素。就保護目的而言,二者的根本目的一致,版權設立的最終目的在于激勵創新以實現社會進步,同理,生產科研數據也是為更好地利用社會資源而實現社會進步,二者區別僅在于版權通過私權保護方式,而科研數據目前則通過制度管理。
(二)科研數據公益性與版權自益性的沖突
“沒有合法的壟斷就沒有足夠的信息生產出來,有了合法的壟斷又不會有太多的信息被使用。”[9]這一論述深刻表達了版權保護與科研數據共享的沖突,版權具有壟斷性,其考慮如何保護創作者利益,即自益性,而科研數據依托于我國的公共資源產生,社會公眾有權享用信息化成果,具有公益性,因此便產生了利益之爭。
但這種對立并非絕對的對立。就科研數據而言,公益性的特征考慮到了科研工作者的利益,這便契合版權保護,能夠激發科研工作者的科研熱情。就版權而言,雖然其以保護私權的方式將私人領域同公共領域劃分開來,但二者在一定條件下可以轉化。一方面,版權保護期限意味著當作品版權超期將回歸公共領域;另一方面,我國版權保護的根本目標是促進社會進步,尤其是文化和科學的發展,但該目標的實現首先須保護作品版權以維護創作者的個人利益,進而才能促進更大范圍的共享。
四、類型化思維主導的科研數據版權保護路徑
整體思維固然重要,但類型化思維提供的思路仍具有較高的應用價值,應用于科研數據版權保護這一問題中,需要相關主體以數據內容分類為標準,基于科研數據共享和重用的核心特性,對癥下藥,采取不同路徑的區分保護。
(一)面向共享的事實數據開發開放
1.事實數據“共享”的核心特性
“共享”是事實數據的核心特性。事實數據指描述客觀事實的數據,其研究主體和對象較為固定,通常由科研工作者生產并整理、分析和保存,而其中耗費的成本大部分由國家或其他科研單位承擔,盡管生產一手數據的科研工作者及資助單位以外的主體對科研數據重用的需求并不相同,但能夠獲得科學、準確、完整的數據進行再利用是開展下一步科研活動的必要前提。科研活動的研究對象決定了其產出的數據必然涉及社會公共利益,且其承擔著促進產業行業發展的任務。
對國家而言,科學研究是所有科學技術的理論和知識源頭[10],事實數據支撐著科學研究的進行,不斷修改的事實數據高度客觀地反映了相關領域科學研究的不足,促進科學研究的進一步開展。對社會和公眾而言,科研產出的事實數據是對客觀事實的表達,既是“全民所有”的應有之義,又是公眾知情權的內在要求,應當避免將公有信息變為私有信息,以保護公眾利益。因此,事實數據應以“共享”為核心特性,為實現事實數據的最大價值,必須開放共享。
2.事實數據開放的制度保障
1991年美國明確建立起以“完全與開放”為基本國策的數據共享法規體系[11]。事實數據的開放首先需要立法和制度作為基礎保障,然后則依賴政府的強制性推動。但同時需要注意,在事實數據開放的過程中,相關主體應處理好數據與安全的關系,涉及國家機密、軍事機密、科學機密等可能導致產生國家安全和社會穩定風險的事實數據更關注其安全而非開放,不得損害國家、社會及他人隱私利益。
(二)面向重用的觀點數據賦予版權
1.觀點數據“重用”的核心特性
“重用”是觀點數據的核心特性。觀點數據指非描述客觀事實的數據,其是在事實數據的基礎上衍生的數據。而數據重用的權益相關者包括科研資助機構、科研機構、科研工作者等[12],既有可能是公益性質的再利用,也有可能是自益性質的再利用,并且科研工作者的個人意愿、利益獲取等因素是影響數據重用的主要因素。由此可見,數據重用一般涉及私人利益,不必要求按公益之標準予以開放共享,而更應關注主體的權益問題,這一權益則是觀點數據之版權。在實踐中,一手科研數據的利用往往不會產生糾紛,因其在生產過程中已然達成了數據歸屬的約定,并且在項目中具有較高的保密性,而科研數據的重用則常產生問題,存在科研單位或科研工作者不愿意使其進入重用階段或被非法重用等情況。
2.觀點數據的可版權要件
版權保護觀點數據,首先即面臨觀點數據是否可滿足作品的可版權要件的挑戰。傳統劃定作品范圍的標準包括“思想與表達二分法”和獨創性標準,其中,“思想與表達二分法”解決“版權保護什么對象”,獨創性標準則回答了“保護對象達到何種標準才能受到版權保護”[13]。依據“思想與表達二分法”,版權雖堅持只保護表達而非思想,但實際上,其相關規則也附帶性地保護了思想[14]。
觀點數據是信息經加工產生的表達形式,并且科研工作者為其賦予了不同于事實數據的思想,這種思想往往表現為科研工作者對客觀事實的主觀認知抑或創新觀點。理論探討過程中因數據往往不具有規模性、是否作為表達有爭議且表達的思想不明確而被版權保護所忽視,然而科研觀點數據本身即具有較高的價值,并且作為信息的表達,其能夠明確表達出科研工作者對客觀事實的認知和觀點,故基于“思想與表達二分法”,觀點數據可以成為版權保護對象。
依據“思想與表達二分法”肯定觀點數據成為版權保護對象后,相關主體需要明確對象達到何種標準才能受版權保護。科研數據與作品具有高度的相似性,但依據獨創性標準,科研數據受到版權保護仍舊存在一定的障礙,尤其是關于創造性的認定。創造性意味著“作者應通過符號、文字等要素的排列組合表達特定思想”[15],在我國版權傳統理論中,對創造性“有無”和“高低”標準的討論一直在持續[16]。新型創作物中依然存在創造性標準認定的問題,同時也引發了“創造性應體現于創作過程中還是創作結果上”這一新討論。創作過程中因表達尚未產出,創造性僅表現于思想之上,而創作結果的創造性則既表現為“思想的創造性”,也表現為“表達的創造性”。既然版權法保護“思想的表達”而非思想,便意指創造性的認定應體現于具有“表達創造性”的創作成果中。
誠然,觀點數據生產的過程更依賴某些技術、器械等,但因科研數據的生產過程不具備創造性而否定其版權保護可能的結論則明顯缺乏一定的證明力。且從創作結果來看,觀點數據是科研工作者經過科學研究并添加主觀因素產出的智力成果,內容上可以體現思想的創造性,形式上又可以體現表達的創造性,故觀點數據應具有創造性。除此之外,事實與作品的邊界還可體現為表達是否可具有不同的形式,若表達唯一則應當認定為事實而非作品。觀點數據的表達形式并不唯一,其可作為連續的值從而表達為聲音、圖像等,也可作為離散的值從而表達為文字、等同于文字的數字符號等,科研工作者在此擁有一定的創作空間。因此,為了表彰這一勞動,相關主體可以賦予觀點數據版權保護,以實現激勵創造、促進科技進步。
五、結語
科研數據共享與重用的重要性不言自明。在加強數據產權、強化數據安全的環境下,依據類型化思維,推進事實數據開放的同時,給予科研工作者觀點數據版權保護,既能在考慮國家安全、社會公益的基礎上滿足社會公眾的信息需求,促進信息開放、透明;又能激發科研工作者參與科研工作的熱情,鼓勵其為社會創造出大量的精神財富,促進社會主義文化和科學事業的繁榮發展。
[參考文獻]
[1]BOLIKOWSKI L,HOUSSOS N,MANGHI P,et al.Data as“first-class citizens”[J/OL]. D-LibMagazine,2015[2025-01-12].http://www.dlib.Org/dlib/january15/01guest_editorial.html.
[2]張晉朝.我國高校科研人員科學數據共享意愿研究[J].情報理論與實踐,2013(10):25-30.
[3]孟祥保,錢鵬.數據生命周期視角下人文社會科學數據特征研究[J].圖書情報知識,2017(01): 76-88.
[4]羅文恩.后脫鉤時代行業協會功能再定位:共益組織研究視角[J].治理研究,2018(05):104-112.
[5]KARASTI H,BAKER K S. Digital data practices and the long term ecological research program growing global[J].International Journal of Digital Curation,2008(02):42-58.
[6]ZIMMERMAN AS. New knowledge from old data The role of standards in the sharing and reuse of ecological data[J].Science Technology amp; Human Values,2008(05):631-652.
[7]蔣坡.個人信息數據的法律保護[M].北京:中國政法大學出版社,2008.
[8]王玉林,高富平,曾詠梅.信息服務與信息交易視野下的信息分類研究[J].情報理論與實踐,2015(12):25-30.
[9]羅伯特,托馬斯.法和經濟學[M].張軍,譯.上海:上海三聯書店,1994.
[10]陶誠,張志強,陳云偉.關于我國建設基礎科學研究強國的若干思考[J].世界科技研究與發展,2019(01): 1-15.
[11]劉闖,王正行.數據開放帶來國家振興:美國國有科學數據“完全與開放”共享國策剖析[EB/OL]. (2022-06-12)[2025-01-12].http://www.digitalearth.net.cn/docs/docs/gen/gen0043.doc/2005.
[12]張閃閃,劉晶晶,顧立平,等.科研數據內容重用中的權益問題研究[J].圖書情報知識,2018(01):105-113.
[13]馮曉青,刁佳星.從價值取向到涵攝目的:“思想/表達二分法”的概念澄清[J].上海交通大學學報(哲學社會科學版),2021(02):27-39.
[14]趙銳.版權法中思想/表達二分法的反思與認知[J].東岳論叢,2017(09):47-53.
[15]司馬航.用戶數據的知識產權屬性之辯[J].科技與法律,2019(06):32-40.
[16]盧純昕.法定作品類型外新型創作物的著作權認定研究[J].政治與法律,2021(05):150-160.