賈娟娣 潘玲玲



關鍵詞:科研原始數據;流程化管理;監管模型;仿真實驗
在經濟發展由高速度發展向高質量發展過程中,推動企業轉型、實現創新發展成為各行業“制勝法寶”,科研領域也是如此。在越來越多先進智能化技術支持下,科研深度不斷推進,復雜性和難度與日俱增。與此同時,科研原始記錄數據數量也在日益攀升,且原始記錄數據的完整性、真實性和精確性對科研活動最終結果影響遠大,一旦劣質數據混入其中,很容易導致科研結論存在誤差,甚至導致研究活動之前的努力毀于一旦。因此,保證科研原始記錄數據如實記錄、科學管理、精確篩選劣質數據極為重要,尤其是在當前“創新就是生產力”背景下,科研活動數量持續化增加,關于科研原始記錄數據監管的重要性進一步凸顯。基于此,本文結合現代化技術,構建科研原始記錄數據監管模型并分析其應用可行性具有極其重要的實際意義。
一、科研領域中的原始數據具體內涵闡述
(一)原始數據內涵
結合現有資料和文獻分析,對數據內涵總結如下:在科學研究活動或者技術涉及活動中,計算、分析、統計等所依仗的數值信息。數據形式沒有統一標準,在不同應用場景下表現形式存在差異,例如實驗室中獲取,收錄在數據記錄本中的手寫、打印的測量數據、觀察數據及計算解釋、結論記錄信息及報告等“無形數據”,也被稱為“文本數據”。還存在實驗過程中直接測量的數據經過分析從而編寫出來的圖形及圖表信息等,這些數據可以相較文本數據可以更為全面、直觀地展示描述具體內容,其被稱為“有形數據”。
科學研究領域中提到的原始數據主要是指未經過技術手段處理、分析、整合等操作,直接是通過實驗觀察、實驗測量或者調研等獲取的紙質記錄數據或者是依托計算機信息技術形成的文字、圖像及聲音等數據。
(二)原始數據的記錄和保存
當前科研領域中原始數據記錄方式多樣,一般情況下,紙質數據記錄本、電子記錄和數據庫保存三種形式是最常見方法。三種數據記錄保存形式各有優缺點,在實際應用時,需要結合實際場景,科學進行選擇。接下來對三種記錄保存方式進行全面闡述:
第一,數據記錄本。此種方式在科學研究實驗活動中應用最為常見,數據記錄本是科學編制、連續編碼專門用來記錄科研過程、數據信息的裝訂本,其形式不存在統一標準,可以基于實際需求進行調整。該記錄本在應用時,可以對研究人員實驗獲得數據、觀察獲得數據、解釋、思考思路及行動計劃等進行記錄,通過紙質版信息保存方式,可以實現原始數據真實、全面記錄保存目標。同時該方式具備操作簡便、及時高效等優點,盡管在數據處理及分析時面臨更大挑戰,但整體來看,仍是利大于弊,是實驗室中最常用的記錄方法。
第二,電子記錄方法。隨著現代化技術發展,計算機、互聯網得到普及,依托現代技術形成的電子數據記錄本面世,充分發揮軟件系統優勢,實現數據智能化記錄,其較紙質數據記錄本在文字處理、信息處理及數據整合等方面具有高效、便捷的優勢,電子數據記錄本可以通過與其他智能程序耦合實現,數據精確篩選、智能化分析及圖表自動生成、圖像自動轉化等優勢。基于此,該種記錄方式得到大面積推廣,且逐漸取代傳統的紙質數據記錄表信息保存方式[1]。
第三,數據庫保存。隨著信息技術、大數據技術、云平臺等先進技術發展,科研領域逐漸構建起專業信息共享數據庫,將相關信息數據存儲其中,從而便于其他研究人員查閱,例如GENBANK、DDBJ 等,具備收錄期刊文章信息數據及保存數據的功能,此種方式對于科研發展有推動作用,通過實現數據共享可以為科研水平提升夯實基礎,但由于多種因素限制,數據庫可以保存的數據類型有限,此方面有待進一步研發。
二、用戶需求分析
本文旨在構建科研原始記錄數據監管模型,通過發揮智能化、現代化技術優勢,實現科研數據全方位管理及系統性監控,從而有效提升數據來源可靠性和真實性,為我國乃至世界科研發展提供支持。從用戶需求角度來看,需要滿足如下需求:
(一)提升工作效率
打造智能化數據監管模型,可以有效提升數據記錄、保存效率,降低數據出錯的可能性,再加上設置定人定崗管理機制,可以有效避免出現數據重復記錄、混亂記錄等,且智能化模型可以發揮技術優勢,實現數據錄入保存全過程監督及智能提醒,這不僅可以提升數據安全性還能有效保證工作效率。
(二)提升數據質量
智能化數據監管模型的構建,可以有效對數據來源、記錄等進行管控,且為數據營造高等級防護體系,可有效避免人工失誤或者信息泄密等問題出現。因此構建數據監管模型時保證科學管控數據質量是一項重點關注內容。
(三)提高分析數據可靠性
數據監管模型的構建科研通過日志審核及審計體系構建完整的數據溯源機制,有效保證數據信息的可靠度和真實性。對于后續利用原始數據進行的分析、圖表制作及結論總結等真實可信夯實基礎。
(四)降低人員工作壓力
數據監管模型構建之后,可以實現原始數據智能化記錄,進而將人從煩瑣、復雜的數據整理、記錄工作中解放出來,降低人員工作量,也可以有效避免數據混雜、數據重復記錄等問題,只需按照提示,自動化錄入信息內容即可,可節省更多的時間做更有價值的工作[2]。
三、科研原始記錄數據監管模型構建
結合上文的用戶需求分析,本文參考博弈論理論、數據監管生命周期模型及改進病毒傳播SIR 模型等為基礎,總結科研原始數據的特點以及當前現有技術,提出如圖1 所示的實現全覆蓋、無縫式監管的科研原始數據收集、整理、分析及保存流程思路。
(一)監管模型構建過程中的重點任務
結合上文的數據監管思路分析,科研原始數據監管模型在構建之前,需要先明確理清監管流程。基于現有研究資料分析,本文構建的原始數據監管模型只要從前期準備、中期建設及后期完善三部分進行思考。
第一,前期監管。此過程中相關人員需要明確科研原始數據的內涵及數據常見類型,然后咨詢相關領域專家,針對設計思路提出建議,指出其中不足,然后組織模型構建隊伍,通過科研原始數據系統性分析,總結監管模型的要點,形成模型框架。在此過程中,對數據進行粗糙式整理,為后續監管提供助力。
第二,中期監管。此過程中,完整的數據庫、數據庫管理模型構建完成,此時依托智能化技術可以實現數據全方位管控,且依托模型對數據進行上傳、修改及搜索等操作,且在構建模型時或基于不同數據類型針對性進行架構。
第三,后期監管。此過程是從數據傳播、數據利用、數據融合及評估等角度完成數據監管任務的。以數據傳播為例,在對外傳播數據過程中,更多的科研人員可以了解科研數據,在利用參考數據過程中,可以多次驗證數據可靠性,且保持數據持續更新增補。因此,通過不斷更新優化模型,總結模型實際應用經驗,對模型存在的不足進行更新優化,這對于提升數據監管目標有積極作用[3]。
(二)數據監管模型構建時應用的方法和技術
基于上文提出的數據監管模型流程和需求,在構建模型時,采用如表1 所示的方法和技術,支持模型發揮效用,真正實現數據監管目標。
(三)科研原始記錄數據監管的要素分析
科研原始記錄數據在進行監管過程中,設計要素曝光,其中監管環境、數據資源、數據監管服務、監管工具等是重點內容。具體來看,監管環境包括數據基礎來源、國家監管環境、科技發展環境等;數據資源包括現有的科研數據類型,幾乎所有科研活動中獲得或者由計算機獲取的信息數據均包含在內;監管服務隨著技術發展,基礎服務日益優化,在進行模型架構時大數據技術、云平臺及信息技術等均可以發揮效用;監管工具是實現功能的重要支撐,監管模型的數據收集、數據存儲、數據組織及數據共享等均需要監管工具發揮作用[4]。
(四)科研原始記錄數據監管模型分析
結合上文分析,本文基于前人已有研究成果,構建如下管控模型。該管控模型遵循科研數據生命周期為主,結合博弈理論等進行架構[5]。主要分為三階段進行思考,第一階段以數據源頭博弈為基礎,從數據生產者方向和科研數據監管者方向為主,旨在生產優質數據,避免劣質數據出現。在進行模型架構著重思考實用價值和利益價值。第二階段,從劣質數據傳播阻斷方向入手進行思考,通過現代化技術在科研數據傳播途徑中設置柵欄,實現阻隔劣質數據傳播的目的。第三階段實現科研數據修復與淘汰,大量的科研數據中,勢必會存在數據缺少及不完整信息數據,同時在數據整合過程中,高校、科研機構等場所會對數據進行驗證,此時數據會得到進一步修復,但部分數據由于缺失嚴重難以修復則需要被淘汰,無法再將其留存,不然會對后續的科研活動產生阻礙作用[6]。結合上述三階段工作重點,構建如下模型如圖2 所示。
四、科研原始記錄數據監控模型應用分析
經過系統性分析,最終對構建的控制模型進行仿真實驗。按照上述三階段劃分系統性進行驗證,確保模型具有實際應用價值。從靈敏度方向進行分析,該模型的構建可以有效降低數據失誤的可能性,依托博弈模型等優勢,有效平衡數據生產者和數據服務人員之間的關系,通過提升劣質科研數據生產成本、降低監管難度方面進行思考,且從提升科研數據造假懲處力度等方面完成監管機制[7]。
例如設立科研補助、科研獎勵、科研懲罰等,這對于進一步提升監管效果極為有利。從此方面來看,構建的模型從實際出發,構建框架基于現實角度進行設置,具有較高的靈敏度。從傳播角度來看,構建的模型在數據傳播途中設置甄別機制,可以對數據進行篩選,對于其中的劣質數據,可以通過構建隔離空間單元,縮短數據修復時間,在短時間內實現數據修復阻隔其傳播路徑。雖然劣質數據具有一定的潛伏期,但通過延長隔離觀察時間、降低該數據的應用次數,不僅可以降低數據造成的負面影響,也可以在先進技術支持下縮短劣質數據確認時間降低數據感染可能。在修復與淘汰階段,模型發揮優勢,從科學角度對劣質數據進行區分并修復,然后發揮優選機制作用,將修復后的數據與初始數據進行比較,從而確定修復的價值[8]。本次模型的構建,充分發揮科研數據生命周期理論價值和博弈模型等理論優勢,結合現今智能化技術,實現科研數據智能篩選和優劣數據區分,并組建數據修復模型實現數據再修復。綜上,本文構建的科研數據監管模型具有實用價值,可以實現對劣質數據科學管控的目的。
五、結束語
綜上所述,本文結合現有理論,在前人研究成果支持下,嘗試提出一種符合實際的科研原始數據記錄監管模型構建思路。通過系統性梳理數據監管要素及各要素之間的關系,在生命周期理論和博弈理論等支持下,按照三個階段進行討論,在保證涵蓋原始數據來源、服務對象等基礎上,完成監管模型架構。希望通過本文的研究,可以為誠信科研目標實現、提升科研數據的可信度和實用價值提供更多借鑒。