宋秀芬 周茜 李立睿等



DOI:10.3969/j.issn.1008-0821.2021.10.010
[中圖分類號]G250.76 [文獻標識碼]A [文章編號]1008-0821(2021)10-0083-10
協同科學環境下的數據量和數據豐富度呈爆炸式增長,數據再利用量顯著落后于快速增長的數據存儲量,產生這種現象的原因之一是數據再利用性(Data Reusability)不高。數據共享性(Shareability)、可用性(Availability)與再利用性(Reusability)共同影響數據再利用(Data Reuse)活動。數據再利用性已成為開放科學實踐的顯著特征,是數據再利用活動產生的必要條件。因此,如何實現數據再利用性最大化已成為當前數據再利用實踐領域亟待解決的問題。
近幾年,國內學者已著手研究數據再利用相關主題,但涉及數據再利用性的科研成果較少。國外學者關于數據再利用性研究成果主要集中出現在近幾年,研究主題主要體現在3個方面:①數據再利用性影響因素與評估要素,其中影響因素如相關性、可理解性、可信度等;評估要素如元數據完整性、溯源質量、數據質量、數據文檔、數據原則FAIR等;②數據再利用性技術維度:語法與語義異質性表示、工具與應用軟件開發、機器自動化識別技術等;③數據再利用性提升策略與措施:元數據質量、數據用戶需求與期望識別、透明化科研過程、數據原則FAIR遵循、服務流程優化、開放數據文化、數據監護人員協同工作等。
基于現有國內外文獻,目前數據再利用性研究僅從單一維度(如技術、數據監護人員等)展開,鮮有從多維度研究數據再利用性。鑒于此,相較于已有研究成果,本文研究的特點體現在以下3方面:①闡述了數據再利用性的理論基礎;②剖析了數據再利用性的五大維度,構建了數據再利用性的五維度模型;③從數據再利用性的五維度模型中提煉出數據再利用性的提升策略與措施。另外,值得注意的是,本文數據再利用性中的“數據”(Re-search Data或Scientific Data)專指科研數據。
1數據再利用性相關概念
1.1數據再利用
數據再利用(Data Reuse)又稱為數據復用或數據重用,是基于不同研究背景對現有數據二次使用的過程,數據再利用概念包含兩層含義:一是利用現有數據解決新問題的研究過程;二是通過新的數據分析方法(二次分析或再分析)解決原始問題。數據再利用就是在原始研究數據基礎上解決新問題的研究過程,或采用新數據分析方法解決原始問題的過程。再利用的數據包括原始數據、算法、工具、工作流等。
1.2數據再利用性
學術界對數據再利用性(Data Reusabilicy或Research Data Reusability)定義還未達成統一共識,典型數據再利用性定義如表1所示。
從以上數據再利用性定義分析得出,其定義體現了5個方面的關鍵詞:數據監護人員、政策、法律、經濟、技術,具體如下:
①數據監護人員方面:維護數據再利用性涉及的數據監護人員之間的數據可用性關系;②政策方面:創建數據再利用文化環境,第三方(數據用戶、領域專家、期刊編輯、項目資助者等)根據數據屬性與再利用意愿等來評估數據再利用性;③法律方面:解決數據再利用性涉及的版權、隱私問題、訪問許可、敏感數據等法律問題;④經濟方面:解決數據再利用性涉及的成本與效益(如科研過程透明與再現、科研成果驗證、科研效率提升、開放數據文化營造等)平衡問題;⑤技術方面:豐富數據再利用性的數據屬性(如數據文檔、數據適用性、數據作者可信性與可靠性、數據質量、研究嚴謹性)與特征來滿足數據再利用者特定數據需求與期望。
1.3數據再利用、數據再利用性、數據可用性三者關系
數據可用性(Data Availability)是指數據具有便利使用的狀態或屬性,即通過必要管理程序、基礎設施、技術、策略等向數據用戶提供及時、便利數據訪問的保障程度,數據作者或提供者很大程度上影響數據可用性。
數據再利用影響因素:數據共享性、數據可用性與數據再利用性。換句話說,數據再利用的基本特征為數據共享性、數據可用性、數據再利用性,三者缺一不可,共同作用于數據再利用。因此,數據共享性、數據可用性、數據再利用性是數據再利用的必要條件。
2數據再利用性理論基礎
2.1數據原則FAIR
數據原則FAIR(Findable,Accessible,Interop-erable,Reusable)為開放數據可發現性、可訪問性、互操作性和再利用性提供數據監護指南,強調通過自動化技術處理復雜數據及元數據解決共享數據的質量問題,提升數據再利用性與數據可用性。
數據原則FAIR與數據再利用性關系表現為:一方面,數據原則FAIR是數據再利用性的測量指標(FAIR原則遵循、數據溯源質量與元數據完整性)之一,是保障發布數據具有再利用性的規范指南;另一方面,數據再利用性是數據原則FAIR的組成部分,數據知識庫(Scientific Data Re-positories,SDRs)需遵循數據原則FAIR來滿足數據用戶對數據和元數據的個性化需求。
2.2數據可用性關系
一方面,數據集自身無法單獨被理解和使用,需要元數據增強數據理解性,實現不同科研環境下的數據遷移,因此,元數據質量是數據再利用性的重要影響因素;另一方面,關系思維方法有助于選擇和組織元數據信息(來源、環境、質量、不確定性信息),消除研究社區之間的語義和語用障礙,增強數據理解性和再利用性。采用關系思維方法建立數據作者與數據用戶之間的數據關系以支持數據應用于不同科研環境。
數據再利用性涉及數據作者(Data Author)與數據用戶(Data User),后二者之間的數據可用性關系(Usability Relationships)表現為認可關系、驗證關系、發現關系,其中認可關系表現為數據用戶從數據作者創建的數據中找到符合需求或期望的數據;驗證關系表現為數據用戶收集數據作者創建的數據來驗證科研成果;發現關系表現為數據用戶根據數據作者創建的數據提出新見解。
3種數據可用性關系的特征表現為關系差異、關系依存、關系變遷。其中關系差異表現為數據作者與數據用戶的年齡、地理區域、研究文化、學科規范等差異影響數據再利用性;關系依存表現為數據作者與數據用戶相互依賴,數據作者的數據共享意愿與接受程度影響數據用戶對數據的理解性與再利用性;關系變遷表現為隨著時間變化,數據作者與數據用戶之間的關系差異與關系依存不斷變化與交互,需實時更新維護二者之間的關系。
2.3數據監護活動
根據對數據監護生命周期模型(Curation Life-cycle Model)與數據再利用性理論基礎的分析,數據再利用性的監護活動表現為:數據創建、數據處理與分析、數據發布、數據維護與評估、數據再利用,如圖1所示。數據再利用性的數據監護流程是具有高效、漸進、自適應特征的科學生態系統,系統不斷維護數據價值。
①數據創建。數據作者在科學研究過程中創建數據,其類型包括觀測數據、計算數據、實驗數據、派生數據。平臺數據監護人員(包含數據經理、數據科學家、數據館員)從研究早期就協助數據作者及時記錄數據來源、生成方法、實驗環境等描述信息以免數據丟失;②數據處理與分析。一方面,平臺數據監護人員指導數據作者規范化處理與分析數據,生成原始數據集、元數據、數據文件以及支撐材料等;另一方面,人員、技術、環境以及其他因素影響數據質量(原始數據集、元數據、數據文件以及支撐材料等質量)與數據知識庫質量(FAIR遵循、認證標準支持等);③數據發布。數據發布的3種途徑分別為:數據作為獨立文件通過數據知識庫發布、數據作為數據論文通過數據期刊發布、數據作為文獻支撐材料通過出版物(期刊、報告、著作等)發布。數據知識庫是數據期刊與出版物的基石,數據知識庫中數據關聯了數據期刊的數據論文、出版物的文獻,數據期刊的數據論文是對出版物中文獻成果的驗證。因此,3種數據發布途徑互為補充、互為關聯,共同支持數據可見性與再利用性;④數據維護與評估。數據作者更新數據、數據經理提供技術支持、數據科學家優化資源配置、數據用戶再現研究與反饋問題,不同崗位的數據監護人員協同更新與維護數據,增強數據再利用的共享性、可用性、再利用性,這3種數據再利用特征由第三方(數據用戶、領域專家、期刊編輯、項目資助者等)根據數據屬性、標準化、實踐要求、個性化需求等要素來綜合評估;⑤數據再利用。一方面,數據監護人員在數據監護生態系統中起主導作用,通過建立數據作者與數據用戶之間的數據可用性關系進一步提升數據再利用性,為數據再利用活動產生奠定基礎;另一方面,數據再利用活動建立數據與衍生出版物的關聯,進一步提升數據再利用性。
3數據再利用性的五維度模型構建
3.1數據再利用性的五維度分析
3.1.1數據監護人員維度
數據再利用性涉及的數據監護人員(Data Cu-rator)包括數據作者、數據科學家、數據經理、數據館員、數據用戶,數據作者主要負責數據創建與更新,數據科學家主要負責財物管理,數據經理主要負責技術支持,數據館員主要負責數據服務定制,數據用戶主要負責及時反饋問題、合法引用與使用數據等。
數據監護人員在數據再利用性方面發揮主導作用,其影響數據再利用性的個體主客觀因素為:協同能力、知識技能、態度信仰、感知風險、學科規范、領悟能力、年齡資歷等。其中協同能力尤為重要,不同崗位的數據監護人員承擔著不同職責與任務,這就要求不同崗位的數據監護人員加強溝通、協同工作。因此,在數據監護實踐中需不斷增強數據監護人員參與度和協同創新能力。數據作者與平臺數據監護人員的協同能力直接或間接影響數據用戶對數據的可信度,可信度又是影響數據再利用性的重要因素,原因是數據再利用性的構成要素包括相關性(Relevance)、可理解性(Understand-ability)、可信度(Trustworthiness),例如:
1)協同能力在知識技能整合方面增強數據可信度。實踐中數據作者缺乏數據監護技能,平臺數據監護人員缺乏專業領域知識,平臺數據監護人員或數據作者如單獨從事數據監護活動會導致數據監護不到位或不完整,數據再利用性差,數據用戶無法有效再利用數據。因此,需要平臺數據監護人員充當數據作者與數據用戶之間的交流媒介以提升用
2)協同能力在數據描述方面增強數據可信度。數據作者獨立從事數據描述時存在數據環境(Data Context)信息或數據文件不足等問題,造成數據用戶不能完整理解數據,需要平臺數據監護人員從研究早期參與到科研過程中,協助數據作者及時記錄數據環境信息與補充數據生命周期各個階段的數據文件以適應不同科研環境下的數據遷移。
3)協同能力在數據增值方面增強數據可信度。數據記錄、存儲、發布等過程是數據監護人員共同職責,平臺數據監護人員參與數據作者科研過程中的增值活動,包括清理、驗證、組織與記錄已接收的數據,增強數據長期再利用性,維護數據價值性。
3.1.2政策維度
數據再利用性涉及的政策包括數據共享政策、數據使用政策、數據治理政策、經費資助政策、隱私政策等,清晰的、標準化的政策內容有助于增強數據影響力和可見性。鑒于目前數據共享范圍小且程度較低,因此在數據共享政策方面,政府機構、基金組織、出版發行機構與科研機構已制定并實施數據共享政策,對數據再利用性產生積極影響,共同推動開放科學發展:
1)政府機構的數據共享政策。國務院辦公廳于2018年3月印發了《科學數據管理辦法》,該辦法界定了數據利益相關者的權利與義務,創建開放數據文化環境,增強科研人員對數據再利用價值的認識,促進數據再利用。政府機構制定的數據共享政策為數據再利用性提升奠定了堅實基礎。
2)基金組織的數據共享政策。自2011年開始,美國國家科學基金會NSF(National Science Foundation)規定申請人須提交項目申報書與數據管理計劃(Data Management Plans,DMP)。數據管理計劃是一種支持數據再利用性的工具,其內容包括創建數據內容、創建數據方式、共享和保存計劃、數據訪問權限設置、研究項目名稱、數據創建組織、數據可用性方案等。其中數據可用性方案尤為重要,其內容包括:①識別數據作者與潛在數據用戶之間的數據可用性關系;②將數據生成過程中積累的顯性與隱性知識轉換為遷移知識;③定義適
3)出版發行機構的數據共享政策。《Nature》《Cognition》等期刊強制要求數據作者提交期刊論文的支撐材料、數據集等,同時要求發布數據具有長期有效性。《Nature》《Cognition》等出版發行機構的數據共享政策實踐表明,強制型開放數據政策在一定程度上增強了數據可用性與再利用性。針對目前數據再利用性面臨的問題,如:數據共享效用低、錯誤報告阻礙研究再現、數據共享質量低等,出版發行機構的數據共享政策需從兩方面改進:一方面,出版發行機構需完善出版物數據共享政策指南;另一方面,出版發行機構的數據共享政策需明確要求科研人員的科研過程透明化,同時要求科研人員具有完整清晰記錄數據結構的技能。
4)科研機構的數據共享政策。國內外科研機構(含高校)數據監護平臺的數據共享政策大多采用自愿共享原則來提升數據可見度,如明尼蘇達大學數據知識庫(The Data Repository for University of Minnesota)。、復旦大學社會科學數據共享平臺(Fudan University Dataverse Network)、北京大學開放研究數據平臺(Peking University Open Research Data)等的“數據資源共享合作協議”鼓勵科研機構或科研人員開放共享有價值的數據。科研機構數據共享政策對數據再利用性產生的影響表現為:第一,平臺數據監護人員協助數據作者描述數據,通過提升數據集質量、元數據質量、數據文件質量來增強數據再利用性;第二,數據共享政策鼓勵數據作者與數據用戶加強溝通,通過再現研究增強數據理解性,降低數據二次使用難度;第三,數據共享政策提升機構數據資產的可見性、學術影響力及機構聲譽,從而提升數據可信度。
科研機構數據知識庫的數據共享政策制定工具通過規范化、個性化政策內容明確了數據利益相關者的權利與義務,增強數據再利用性。例如:全球開放存取知識庫目錄(The Directory of Open Access Repositories,OpenDOAR)網站提供數據知識庫平臺政策制定工具(Policy Tools),以網頁形式或純文本形式生成限制型(禁止商業再利用)與非限制型兩套數據共享政策方案,其政策詳細內容包括元數據政策、數據政策、內容政策、提交政策、保存政策,同時政策制定工具滿足不同數據知識庫平臺政策個性化制定需求(如專門術語使用)。
3.1.3法律維度
數據再利用性的法律維度包括:數據許可(使用許可、訪問許可等)、知識產權、保密規定、隱私權等,其中數據知識庫的數據許可按數據權限從高到低依次分為:寬松許可、公共版權、限制許可、專用許可、版權、未知許可。第三方通過數據許可評估標準(許可條款類型與可發現性、許可范圍與完整性、數據訪問能力、數據再利用類型、數據再利用限制)來衡量數據再利用性。
數據許可(Data Licensing)相對于其他法律因素具有靈活性與擴展性。一方面,清晰的數據訪問許可協議明確了數據利益相關者的權利與義務,促進數據可用性、開放性、再利用性等,鼓勵數據再利用;另一方面,缺乏許可、非標準化許可、限制性或非兼容許可條款等阻礙數據互操作性與再利用性。
3.1.4經濟維度
數據再利用性經濟維度的影響因素表現為:數據共享成本、數據再利用成本、風險管理、財務可持續性等,其中共享成本如清理數據、創建文件與元數據、檢查數據完整性與一致性等工作耗費時間與精力;財務可持續性包括:①收益、投資與支出等分析;②財務透明性、經費監控;③運營計劃、經營計劃、審計計劃、財務預測、技術基礎設施投資計劃等。
從經濟維度具體要素來看,需從人員與工具兩個角度合理配置資源,降低成本,提高科研效率。數據再利用性經濟維度的工具重點關注成本效益平衡問題,例如:數據審計框架(Data Audit Frame-work,DAF)是審計機構數據資產工具,有利于優化利用機構資源,實現數據訪問與再利用價值;此外,基于區塊鏈的數據驅動流程重組工具增強數據靈活性、降低科研成本,增強數據利益相關者之間的信任。
3.1.5技術維度
數據再利用性的技術維度包括元數據建模技術、領域本體技術、數據發現技術、數據互換技術、數據與出版物關聯技術、數據標準化技術。
1)元數據建模技術。元數據是關于數據的描述性信息,用于解釋所測量的數據屬性,不受版權保護。面向目標的元數據模型使用對數據再利用性至關重要,需要在數據收集過程與派生過程中對其詳細清晰地描述以提升數據理解性。元數據信息包括數據溯源信息、數據環境信息、數據不確定性信息、數據質量信息。元數據建模技術包括數據溯源建模技術、數據環境建模技術、數據不確定性建模技術、數據質量建模技術:
①數據溯源建模技術。溯源元數據記錄數據獲取來源與數據更新頻率,數據溯源是關于數據對象來源、數據訪問方式、數據作者等信息,用于解釋、驗證、再計算、再現研究;②數據環境建模技術。數據環境元數據記錄數據與環境的關系,環境信息包括數據集屬性(數據來源、數據收集方法、數據創建與發布過程)、實驗過程與特性、數據來源、物理組織、項目組織、科學組織、任務、用戶社區等,數據環境信息實現跨學科數據遷移,將數據作者創建的數據遷移到數據用戶的研究環境中,數據環境的描述增強數據理解性與再利用性;③數據不確定性建模(Data Uncertainty Model-ing)技術。數據不確性建模技術是定量評估由系統誤差或隨機誤差產生的不確定性。數據不確定性是科學研究調查報告的重要組成部分,被稱為不明確、概率、模糊、近似、不完整、不精確等。目前,數據庫軟件不支持數據不確性管理,這是數據經理亟待解決的技術難題;④數據質量建模技術。數據質量包括數據集質量、元數據質量、數據文件質量等,其中元數據與數據具有同等價值,元數據質量是實現數據再利用性的重要因素。數據質量維度包括準確性、完整性、可訪問性、一致性、及時性、互操作性等,利用全球通用元數據標準規范化描述與解釋數據以增強其互操作性和再利用性。
2)領域本體技術。領域本體是由一組概念、公理、關系構成,是關于跨領域數據再利用活動內容的協議,如知識表示術語等。領域本體是為了提高數據理解性與可用性,促進數據再利用。領域本體的特征為:一致性、動態性、模塊性和環境性等,其中一致性對于數據再利用性至關重要,跨領域本體的一致性是通過一組映射規則指定各種實體(如對象、概念、關系和實例)之間的對應關系來實現。
3)數據發現技術。數據發現性是指根據研究需求精準識別與查找數據的能力。數據發現技術包括:數據配準(Data Registration)、數據引用、數據分類、數據字典、元數據注冊表(Metadata Reg-istry)。其中數據配準為數據分配唯一數據對象標識符,提供一種永久且可操作數據識別系統;數據引用提供數據引用指南與引用參考格式,數據引用6要素:創建者、標題、年份、標識符、版本號、數據集內部格式;數據分類是為了有效使用數據,對數據進行分類。
4)數據互換技術。數據互換性是指數據作者與數據用戶互相交換有意義數據的能力,是數據再利用的必要條件。當數據作者與數據用戶分屬于不同學科時,數據交換存在3種類型的異質性:查詢語言異質性(語法互換)、數據模型異質性(結構互換)、領域術語異質性(語義互換),數據互換技術通過解決語法、語義、結構互換問題支持不同學科數據遷移。
5)數據與出版物關聯技術。數據與出版物關聯包括數據與出版物、數據與數據、出版物與出版物、數據與數據文件等鏈接,數據關聯內容包括:統一數據模型、標準訪問機制、基于超鏈接的數據發現。數據與出版物建立關聯的益處有:促進數據發現、增強數據理解性、提升數據作者學術聲譽、提高數據的可用性。數據與出版物關聯工具如:文獻數據集推薦工具支持研究再現,提升數據再利用性。
6)數據標準化技術。數據標準化技術提高數據再利用性與理解性,數據標準分為:元數據模型標準、查詢語言標準、元數據標準、數據標識標準、傳輸協議標準等。標準化(Standardization)是指跨障礙(如空間、時間、文化障礙等)數據再利用時將局部知識轉化為公共知識的能力,避免因原始數據收集與數據再利用的障礙對同一數據造成認知差異與理解差異。
3.2數據再利用性的五維度模型分析
本文通過對數據再利用性的5個維度分析,構建了數據再利用性的五維度模型,如圖2所示。模型中數據監護人員維度側重于人員的數據素養提升問題,法律與政策維度側重于數據開放存取問題,經濟維度側重于數據再利用性的成本效益平衡問題,技術維度側重于數據互操作問題(如物理與語義障礙)。數據監護人員維度、政策維度、法律維度、經濟維度與技術維度共同構成數據再利用性的五大支柱,五大支柱缺一不可,五維一體共同發展提升數據再利用性。從數據再利用性的五維度模型分析得出以下結論:
1)數據監護人員在數據再利用性的五維度模型中起主導作用。數據監護人員的主觀因素(如態度信仰、感知風險等)與客觀因素(如知識技能、學科規范等)影響數據再利用性;此外,數據監護人員通過在政策維度、經濟維度、技術維度、法律維度的相關活動影響數據再利用性。
2)數據再利用性的五維度模型中5個維度融為一體,共同發展。數據監護人員維度、政策維度、法律維度、經濟維度、技術維度相互作用、相互依存。模型中每個維度都不是獨立的,當其中某一個或幾個維度提升時會影響其他維度并共同作用于數據再利用性。例如:政策維度中良好的政策環境促進技術維度中的技術(發現技術、互換技術等)進步,降低經濟維度中科研人員的數據共享成本,提升數據監護人員維度中協同能力等;此外,數據監護人員維度中協同能力的提升促進技術維度中的技術進步,降低經濟維度中的數據共享成本等。
3)數據再利用性的五維度模型構成要素之間相互交叉、互為補充。例如:①技術維度的數據標準化要素也體現在政策維度與數據監護人員維度中,如:從政策維度制定數據標準政策促進數據標準化,從數據監護人員維度要求數據利益相關者遵守數據標準政策,開發數據標準化技術來提升數據再利用性;②政策維度與法律維度中隱私問題(如敏感數據、私有數據保護)側重點不同,二者均涉及數據監護人員維度。其中,政策維度的隱私要素側重于對數據用戶自覺約束,法律維度隱私要素側重于對數據用戶的強制約束,數據監護人員維度在隱私要素中發揮主導作用,三者共同解決數據再利用性的隱私問題。從以上分析得出,數據再利用性的五維度模型中各構成要素不是孤立的,要素之間相互交叉,共同影響數據再利用性。
4)科研機構與數據監護人員以模型的技術維度為突破口提升數據再利用性。一方面,數據監護人員維度、政策維度、法律維度、經濟維度在數據再利用性實踐中面臨的問題主要體現在數據技術維度的技術障礙上;另一方面,數據監護人員維度、政策維度、法律維度、經濟維度支撐并促進技術維度的技術進步,技術進步提升數據質量,直接或間接影響數據再利用性提升。因此,將技術維度實踐作為突破點,解決數據再利用性的五維度模型中其他維度的相關問題,提升數據再利用性。
5)模型中數據再利用性是數據再利用活動產生的必要條件。數據具有再利用性,數據再利用活動不一定產生;反之,數據再利用活動產生的前提條件是數據具有再利用性,開放科學的最終目標是促進數據再利用。總之,數據再利用性是數據再利用活動的基礎。
4結論與展望
4.1研究結論
本文在數據監護人員維度、政策維度、法律維度、經濟維度、技術維度基礎上,構建了數據再利用性的五維度模型,分析得出以下結論:
1)模型中數據監護人員維度側重于數據再利用性中數據監護人員的數據素養提升。數據監護人員在數據再利用性模型中起主導作用,其個體主觀因素(如態度信仰、領悟能力等)是影響再利用性的不可控因素,數據監護人員的協同能力在數據再利用性方面尤為重要。
2)模型中法律與政策維度側重于數據再利用性的數據開放存取。例如:①政策維度中數據共享政策創建數據開放存取環境,目前政策機構、出版發行機構、基金組織、科研機構已制定并實施數據治理、使用、隱私保護、經費資助、數據共享方面的政策,提升科研人員對數據價值認識,對數據再利用性產生積極影響;②法律維度中數據許可界定了數據開放存取相關權利,開放清晰的數據許可明確了數據利益相關者的職責與義務,促進數據再利用性提升。
3)模型中經濟維度側重于數據再利用性的成本效益平衡。從人與工具兩個角度解決成本效益平衡問題,其中人占主導地位,因此需開發成本效益類工具,有效管理短期(數據共享成本、數據再利用成本等)、長期(財物可持續性)成本效益平衡問題。
4)模型中技術維度側重于數據再利用性的數據互操作。數據再利用性技術維度涉及元數據建模技術、領域本體技術、數據發現技術、數據互換技術、數據與出版物關聯技術、標準化技術,這些技術解決跨領域、跨學科科研環境的數據遷移難題,實現科研人員跨系統、跨平臺再利用數據。
4.2研究展望
本文構建了數據再利用性的五維度模型,但還存在一定局限性:未采用定量方法研究數據再利用性的五維度模型中影響因素的相互關系及其作用效果。筆者下一步將采用系統動力學工具,通過量化方法研究數據再利用性系統五大要素模塊(數據監護人員、政策、經濟、法律、技術)中具體影響因素的因果關系,對數據再利用性系統動力學模型的敏感因素作用效果與變化趨勢進行擬合。
(責任編輯:郭沫含)