史 江 黃天麒/四川大學公共管理學院
重大科技基礎設施是為探索未知世界、發(fā)現(xiàn)自然規(guī)律、實現(xiàn)技術變革提供極限研究手段的大型復雜科學研究系統(tǒng)[1],又稱“大科學工程”“大科學裝置”。重大科技基礎設施項目檔案是重大科技基礎設施在規(guī)劃、立項、設計、研發(fā)、施工直至竣工交付等過程中直接形成的,具有保存價值的文字、聲像、數(shù)碼、圖表等不同形式的信息記錄。
截至2019年,國家已批準立項、在建、運行的國家重大科技基礎設施共計50余項,其中依托中國科學院(以下簡稱“中科院”)組織立項、建設和運行的設施約占總數(shù)的2/3[2]。筆者在中科院重大科技基礎設施共享服務平臺上選擇了500米口徑球面射電望遠鏡(以下簡稱“天眼”)、“上海光源”、中國散裂中子源(以下簡稱“散裂中子源”)、“科學號”海洋科學綜合考察船(以下簡稱“科學號”)等4個已建成的重大科技基礎設施作為案例進行剖析,探討重大科技基礎設施項目檔案管理工作中的特點及問題,并提出改善建議。
重大科技基礎設施建設過程中參建單位眾多,檔案內(nèi)容豐富多樣,檔案管理工作具有復雜性。一是檔案形成者的復雜性。如,“天眼”項目參建單位數(shù)以百計,不同單位移交檔案的形式各不相同[3];“散裂中子源”項目建設中作出重大和重要貢獻的參建單位就有69家[4];“科學號”項目參建單位近300家[5]。重大科技基礎設施參建單位眾多,導致檔案管理工作標準不一,協(xié)調的復雜度和難度較高。
二是檔案內(nèi)容的復雜性。首先是檔案數(shù)量龐大,如,“上海光源”立項和建設期間形成共計5000多卷工程檔案;“散裂中子源”建設期間共形成4366卷紙質檔案。其次是檔案種類豐富,重大科技基礎設施項目檔案涵蓋文書、科技、聲像、會計以及電子檔案等多種類型,如,“天眼”項目僅聲像檔案就包括9大項、39小項[6];“上海光源”這個單一項目形成的檔案就涵蓋了眾多門類,幾乎相當于一個全宗[7]。龐大的檔案數(shù)量和豐富的檔案種類也加大了重大科技基礎設施項目檔案管理工作的復雜性。
各重大科技基礎設施建設單位在重大科技基礎設施項目檔案管理工作中堅持制度、標準先行,以規(guī)范的制度、標準指導檔案管理工作科學、有序進行。如,中科院檔案館基于國家、行業(yè)標準制定了《中科院大科學工程項目檔案建檔規(guī)范》《中科院基本建設項目檔案建檔規(guī)范》《中科院科研課題檔案建檔規(guī)范》《中科院科研儀器設備建檔規(guī)范》《中科院聲像檔案建檔規(guī)范》等標準,指導重大科技基礎設施項目檔案管理工作規(guī)范開展。
此外,各重大科技基礎設施建設過程中,也形成了更加細致的檔案管理工作制度。如,“天眼”制定了《FAST工程檔案管理辦法》《500米口徑球面射電望遠鏡(FAST)檔案立卷作業(yè)指導書》等管理制度[8];“散裂中子源”制定了《散裂中子源國家重大科技基礎設施項目檔案管理辦法》《CSNS自研設備歸檔材料歸檔示意圖》等規(guī)范性文件[9];“上海光源”制定了《上海光源檔案歸檔范圍及保管期限表》《上海光源檔案歸檔流程》等文件[10]。
重大科技基礎設施項目具有極強的專業(yè)性,在研制過程中會產(chǎn)生各種測試實驗數(shù)據(jù)、檢驗報告、觀測記錄等科技文件,蘊含了該領域前沿的科學技術知識。一般檔案人員會因不懂這類科技文件的內(nèi)容,無法理解科技文件間的關系,導致開展后續(xù)檔案管理工作時出現(xiàn)偏差。為解決這一問題,目前重大科技基礎設施項目檔案管理工作要求建設單位、參建單位的檔案人員與科研、技術人員共同參與,由這三類專業(yè)人員共同組成的檔案工作隊伍可揚長避短、保證檔案管理工作的專業(yè)性。如,“天眼”要求工程技術人員全員參與檔案管理工作;“上海光源”檔案分類方案由檔案人員與工程技術人員、專家多次討論后最終確定[11];“散裂中子源”要求檔案人員與科研人員共同參與制定“散裂中子源”研制檔案分類方案[12];“科學號”由項目監(jiān)理和項目各系統(tǒng)負責人對檔案質量進行技術把關和技術審查[13]。
同時,檔案管理隊伍也會接受專業(yè)的檔案業(yè)務指導。如,由中科院各研究院所組織立項和建設的重大科技基礎設施,其項目檔案管理工作通常會受中科院檔案館指導。中科院檔案館具有豐富的重大科技基礎設施項目檔案管理經(jīng)驗,可為中科院各重大科技基礎設施項目檔案管理隊伍提供檔案方面的專業(yè)指導與技術支持。
重大科技基礎設施建設周期長、檔案管理情況復雜,為確保檔案管理工作質量,各項目建設單位基本上都采取了全程控制的管理方式。
在合同訂立階段,建設單位即將檔案管理工作納入合同。如,“天眼”“科學號”在合同中都約定了檔案管理的條款,對歸檔范圍、質量、時間及違約責任等都提出了明確要求[14][15]。在施工建設階段,建設單位全程跟蹤檔案形成質量。一是要求參建單位做好預立卷工作,如“上海光源”由專職檔案人員檢查預立卷情況,收集并解決課題組的歸檔問題[16]。二是依據(jù)建設進度檢查預立卷質量,如“散裂中子源”基于項目進度,及時開展歸檔的布置、檢查和推進工作,使歸檔材料的質量與完整度全程受控[17]。在竣工驗收階段,通常會由中科院檔案館或國家檔案局組織檔案驗收小組對項目檔案管理情況進行專業(yè)檢查與驗收,驗收合格后,整個項目方能提請國家發(fā)改委組織國家驗收。
在重大科技基礎設施項目檔案管理工作中,因科技文件專業(yè)性強、參建單位管理水平參差不齊等,會出現(xiàn)項目檔案質量參差不齊的情況。
部分檔案分類方案存在瑕疵。一是分類方案無法涵蓋所有檔案,如,“天眼”項目檔案分類表的一級類目“綜合管理類”包括“項目研制階段文件”“自查及預驗收階段”“竣工驗收階段”等二級類目,但是沒有“立項審批階段文件”類目;二是同級類目之間有交叉重疊情況,如,“科學號”項目檔案分類表的一級類目“聲像檔案”包括“照片”“視頻”“光盤”三大類,事實上“光盤”可作為“照片”類和“視頻”類檔案的存儲載體。
部分案卷裝訂與裝具存在質量問題。如,“科學號”的部分案卷,其裝訂方式不符合《紙質歸檔文件裝訂規(guī)范》的要求;“天眼”“散裂中子源”的部分案卷存在使用材質、規(guī)格、樣式不一的文件盒、檔案盒,或者未裝盒等情況。
在重大科技基礎設施項目檔案管理工作普遍實行雙套制的背景之下,電子檔案通常被視作紙質檔案的“電子版本”,其特性常被忽視。
一是電子檔案的原始記錄性被忽視。“天眼”強調“所有歸檔材料均需原件,不能用簽名章、電子簽名代替手簽字”[18]。該做法否認了電子檔案的原始記錄性,與新修訂《檔案法》中的相關要求不符。
二是電子檔案自身的成套性被忽視。如,“科學號”認為電子檔案的歸檔范圍要與紙質檔案相同[19]。事實上,雖然確定電子檔案歸檔范圍應參照紙質檔案歸檔范圍,但二者并不一定需要保持完全一致。此外,在重大科技基礎設施建設過程中,必然會形成很多僅以電子形式存在的電子文件,這類電子文件之間存在固有聯(lián)系與成套性,不僅無法以紙質形式呈現(xiàn),而且其讀寫還依賴于特定的軟件環(huán)境。若使用與紙質檔案相同的歸檔范圍,必然會遺漏許多有保存價值的電子文件,影響重大科技基礎設施項目檔案的成套性和完整性。
三是電子檔案的可讀可用性被忽視。“科學號”強調“要確保歸檔電子文件為原始‘版本’和最終‘版本’”[20],即確保歸檔電子文件歸檔前不被篡改,歸檔后不可修改。這一做法雖然在一定程度上確保了電子檔案的真實性,但若嚴格按此執(zhí)行,可能導致部分電子檔案的可讀可用性面臨威脅。部分科技電子檔案格式復雜,專用軟件更新?lián)Q代頻繁,若不對這類電子檔案開展格式轉換工作、不對歸檔的專用軟件進行升級,可能會導致這類電子檔案未來面臨不可讀、不可用的風險。
重大科技基礎設施項目檔案蘊含最新的科學技術知識,其檔案管理工作保密性要求較高,存在重收集和保管、輕開發(fā)利用的現(xiàn)象。
在檔案提供利用方面,以中科院近代物理研究所的重大科技基礎設施項目檔案利用工作為例[21],一是利用率較低,2015—2019年,所藏重大科技基礎設施項目檔案年均利用僅有32人次、126卷次。二是利用者和利用目的單一,利用者多為檔案的形成者,利用檔案主要為重大科技基礎設施建設服務。三是利用方式單一,基本停留在傳統(tǒng)的原件查詢借閱或復制件獲取上,沒有采用信息技術深度挖掘檔案價值,也沒有為開展相關工作提供主動的檔案服務。
在檔案開發(fā)成果方面,分析“上海光源”“散裂中子源”“科學號”三個項目的檔案開發(fā)成果,可以發(fā)現(xiàn)這些項目檔案開發(fā)的方式主要是利用聲像檔案制作檔案微視頻,如《大科學裝置的故事——上海光源發(fā)展歷程》《陳和生:大國重器背后的筑夢者》《“科學”密碼——海洋科學綜合考察船建造檔案》等,這些開發(fā)成果多是為了完成檔案宣傳任務,開發(fā)層次低、內(nèi)容簡單、宣傳力度不大、受眾面窄。
首先,應結合《質量管理體系基礎和術語》和《質量管理體系要求》,構建重大科技基礎設施歸檔質量管理體系。基于PDCA循環(huán)理論,重大科技基礎設施項目檔案歸檔質量管理體系包括歸檔質量計劃、歸檔質量計劃實施、歸檔質量檢查、歸檔結果處理等四個螺旋式上升的階段,每完成一次循環(huán),歸檔質量都得到一次提高。
其次,隨著檔案信息化建設的推進,在檔案收集整理過程中采取新技術,能極大提高重大科技基礎設施項目檔案管理工作質效。一是可采用新技術收集某些僅以電子形式存在的檔案,如口述檔案、聲像檔案等。以訊飛檔案機為例,該設備能通過機器學習掌握檔案專業(yè)詞匯和檔案工作標準規(guī)范,借助語音識別技術和檔案行業(yè)專用AI引擎,實現(xiàn)重大活動全程記錄收集、建檔與管理。訊飛檔案機上相關技術在重大科技基礎設施項目中的應用,可便捷實現(xiàn)對建設重大節(jié)點的記錄與收集,更準確地呈現(xiàn)建設歷史。二是可采用自然語言處理、神經(jīng)網(wǎng)絡、深度學習等技術,根據(jù)檔案內(nèi)容實現(xiàn)檔案自動分類。如澳大利亞新南威爾士州檔案館2017年將機器學習軟件應用于非結構化數(shù)據(jù)集分類,結果表明該技術能夠協(xié)助分類和處理未分類的非結構化數(shù)據(jù)[22]。此類技術尤其適合重大科技基礎設施項目檔案按專業(yè)、按子項、按建設階段分類的特點。
在建設過程中,電子檔案不同于紙質檔案,科技電子檔案不同于管理類電子檔案,生成的軟件環(huán)境各不相同,格式復雜多樣,不能基于對雙套制的簡單理解來保存科技電子檔案,而應著重考慮滿足電子檔案的真實性、完整性、安全性和可用性要求。
一是保存原始格式文件,確保電子檔案的真實性和完整性。《產(chǎn)品數(shù)據(jù)管理(PDM)系統(tǒng)電子文件歸檔與電子檔案管理規(guī)范》已于2021年10月實施,該規(guī)范對此作了詳細的規(guī)定,要求“產(chǎn)品的二維圖樣、三維模型文件在以符合規(guī)定的格式歸檔的同時歸檔原始格式文件”[23]。后續(xù)的重大科技基礎設施項目檔案工作中,應參照執(zhí)行該規(guī)范。
二是科技電子檔案的專用軟件更新?lián)Q代頻繁,應將格式復雜的電子檔案轉化為版式文件格式或中性格式保存,確保電子檔案的安全性與可用性。如“LOTAR(長期保存和檢索國際項目組)”項目旨在滿足產(chǎn)品及技術數(shù)據(jù)的長期保存和利用要求。該項目已創(chuàng)建和部署EN/NAS 9300系列標準,用于數(shù)字數(shù)據(jù)的長期保存和檢索,規(guī)定了具體的格式轉化要求。空客公司在A350項目產(chǎn)品設計數(shù)據(jù)歸檔時,就應用了EN/NAS 9300系列標準,將產(chǎn)品設計數(shù)據(jù)轉化為STEP AP 242 ed2格式保存[24]。同時,也應確認格式轉換前后內(nèi)容的一致性。
重大科技基礎設施項目檔案的價值主要體現(xiàn)為對科研人員與科研單位的科研價值,以及對社會公眾的科普價值。
以知識管理為目標推動檔案利用。一是在重大科技基礎設施研制、建設過程中,應加強科研、技術人員的個人知識管理,將個人知識以檔案形式固化為可用的知識資源。二是應推動建設單位內(nèi)部知識共享,將重大科技基礎設施項目檔案納入單位內(nèi)部知識管理體系,挖掘重大科技基礎設施項目檔案內(nèi)含知識,實現(xiàn)重大科技基礎設施項目檔案知識資源在單位內(nèi)部共享。三是將重大科技基礎設施項目檔案納入機構知識庫聯(lián)盟(如中科院機構知識庫)共享范疇,實現(xiàn)其內(nèi)含的可開放知識在科研單位間的廣泛共享與利用。
以科普功能為導向推動檔案開發(fā)。一是挖掘重大科技基礎設施項目檔案中可開發(fā)的科普信息,如規(guī)格參數(shù)、名人事跡、音視頻、關鍵節(jié)點記錄等。中科院國家天文臺挖掘重大科技基礎設施項目檔案中的名人事跡,制作了檔案微視頻《南仁東:一眼萬年》。二是重大科技基礎設施項目檔案開發(fā)要反映真實的研制和建設歷史,如臺灣大學物理文物廳除了展示過去核物理實驗室使用過的各類硬件、儀器之外,還展示了相關科學家的人事任命文件、手稿等,再現(xiàn)了亞洲首臺粒子加速器建設及重建的歷史[25]。三是創(chuàng)新重大科技基礎設施項目檔案開發(fā)形式,如以虛擬現(xiàn)實(VR)技術和全息投影技術呈現(xiàn)重大科技基礎設施項目檔案開發(fā)成果,同時結合人工智能技術,使開發(fā)成果更具表現(xiàn)力和感染力。