趙雪芹 李天娥
(湖北大學歷史文化學院 武漢 430062)
數據科學起源于20世紀60年代對數據分析未來的預測和計算機科學“數據處理的科學”根本理念與原則的研究。1966年,計算機科學家P.Naur提出了“datalogy”的概念,強調計算機科學的本質是利用數據來解決問題,系統討論了數據、數據表示和數據處理構成的數據科學基本概念和技術,并積極推動數據科學在計算機教育中的地位,形成了計算機科學的哥本哈根傳統。20世紀90年代以后,數據科學獲得較大發展,數據科學的術語和過程被正式提出,并強調用“數據”分析和理解實際現象[1]。2012年以后,隨著大數據的崛起,數據科學也迎來了爆發式的發展,并推動了在各個領域的應用。
2015年8月31日,國務院印發《促進大數據發展行動綱要》,2016年3月國家將大數據戰略納入十三五規劃,隨后各地推出了相關政策支持大數據產業發展。與此同時,高校開始開展相關研究并嘗試培養專業的數據人才。2016年,教育部批準首批高校開設“數據科學與大數據技術”專業,2017年,第二批申請“數據科學與大數據技術”本科的大學擴增至32所,包括中國人民大學、北京郵電大學、復旦大學等高校。全國高校大數據教育聯盟的統計數據顯示,2017年申請該專業的院校多達263所,其中工學190所,理學73所[2]。2018年3月,教育部發布《2017年度普通高等學校本科專業備案和審批結果》顯示,開設“數據科學與大數據技術專業”課程的高校增至248所[3]。2019年,開設“數據科學與大數據技術”課程的高校已達482所。由上述數據可看出,國內數據科學的本科教育已成為一種普遍的趨勢,數據科學專業已成為我國現階段熱門專業之一。
與數據科學的熱門相比,檔案學專業是傳統的冷門專業,數據科學與檔案學的交叉點在于檔案領域具有豐富的數據資源,隨著檔案由數字化向數據化轉變,數字檔案資源從底層來看也是一種特殊的數據。檔案數據是國家經濟和社會發展的戰略性信息資源,在國家治理現代化、政府治理重塑、社會政策優化、公共服務提升等各項工作中發揮著基礎信息支撐作用[4]。數據科學的方法可以應用于檔案數據管理的全過程,形成新型管理模式,比如利用數據科學的方法采集業務系統中的數據,進行數據組織與知識挖掘分析,與已有的數字檔案結合,形成新型決策分析模型,為相關企業的發展與決策提供參考。數據科學可促進檔案數據結構的轉變,用戶可利用數據可視化、建模、算法洞察等數據方法來剖析檔案信息資源,以創新檔案知識的生產方式[5]。檔案學領域對數據科學與檔案數據的融合研究表明了一個趨勢,即社會對檔案人才的要求會更加關注其數據能力,數據科學成為促進檔案領域發展新的增長點。因此在新一代信息技術與學科融合發展的大環境中,檔案學專業的人才培養要注重數據科學理論教育與技能培養相結合,培養支撐數字社會發展的專門人才,進而提升檔案學科的影響力與輻射力。
數據科學是關于數據的科學,是一門以數據獲取、數據存儲與管理、數據安全、數據分析、可視化方法與技術作為基礎的新興學科,專注于從大量原始和結構化數據中找到切實可行的見解,通過發掘數據與其代表事物的關系,為其他領域與科學提供幫助[6]。作為一門新興的科學,數據科學對檔案學的影響是全方面的。首先,數據科學為深入研究海量的檔案數據資源提供了規模化數據處理的方法和技術,降低了檔案管理者和利用者的研究成本,提高了管理效率和水平;其次,數據科學為檔案學中檔案數據資源的獲取、組織、開發、利用和保存等問題提供新視角,如檔案領域很多數字人文項目的開展就是利用了數據科學技術來進行的。
在數字化環境下,社會的人才需求逐漸向數據型人才轉變,不同學科應根據數據產業的發展需要,創新人才培養模式,思考制定與學科發展緊密關聯的數據人才培養計劃,培養面向領域的專業數據人才或綜合性數據人才[7]。檔案學也應當在數據科學驅動下進行課程體系的改革,以建立符合時代需求的人才培養體系。
圖情檔教育的本質和核心價值是培養“信息人”,為人類社會提供專長于數據、信息和知識的記錄、保存、組織、檢索、獲取、分析與開發利用思想、方法及技術的人才[8]。檔案學教育的產生源自社會中對專門人才的需要,這種專門人才的專業性體現在為特定崗位培養了相適應的人才,并逐漸向其他機構擴展。在大數據時代下,信息和數據是具有重要價值的資源,而檔案學教育培養的專門人才就是對資源進行收集、整理、管理、開發與利用。因此,在具體的職業情境中,檔案學教育更加具有針對性,如面向檔案館等機構輸送專業人才。總之,在綜合、復雜的信息社會中,檔案學教育應對課程體系進行改革,以培養出能夠對信息進行識別、篩選、重組并創造新知識的復合型信息人才。
筆者通過對開設檔案專業本科教育的高校進行調研,總結出檔案學專業本科課程體系現狀。2020年3月,杭州電子科技大學中國科教評價研究院和浙江高等教育研究院、武漢大學中國科學評價研究中心和中國科教評價網聯合推出了《中國大學及學科專業評價報告(2020-2021)》[9]。其中,2020-2021年檔案學本科教育專業排名共顯示了17所高校(見表1),本文以17所高校為調查對象,調查了其檔案學專業本科課程體系現狀。

表1 檔案學專業本科課程體系現狀

13 天津師范大學數據庫系統原理、管理信息系統、網絡基礎、應用軟件、檔案學概論、檔案管理學、電子文件管理、文檔一體化管理軟件、行政管理學、文書學、文件運動規律研究、檔案經典文獻導讀、秘書實務和辦公室管理等。14 鄭州大學 檔案學概論、檔案管理學、檔案保護技術、檔案文獻編纂學、公文寫作與管理、電子文件管理、中國檔案史、外國檔案管理、科技檔案管理、數字檔案館概論。15 山東大學管理學、文書學、秘書學、檔案管理學、信息資源管理、電子文件管理、檔案文獻編纂學、檔案保護技術學、中國檔案事業史、外國檔案管理學、科技文件與檔案管理、計算機與網絡技術、數字檔案館、電子政務等課程。16 廣西民族大學大學英語、計算機應用基礎、檔案學概論、檔案管理學、科技檔案管理、電子檔案管理、檔案文獻編纂學、檔案保護技術學、中國檔案史、信息學、行政管理學、現代漢語、數據庫管理系統、檔案計算機管理、計算機網絡技術、辦公自動化等。17 湖北大學檔案學基礎、中國檔案事業史、管理學原理、信息管理學基礎、管理信息系統、人力資源管理、統計學原理、文書學與應用寫作、秘書學、檔案文獻編纂學、科技檔案管理、圖書館學基礎、圖書檔案分類、電子文件管理、聲像檔案管理、攝影與縮微復制技術、辦公自動化、多媒體檔案處理技術、檔案信息安全、檔案網站建設與網頁制作、檔案保護技術、信息資源數據庫、外國檔案工作、科技文獻檢索、社科文獻檢索、企業檔案管理等。
通過對表1中17所學校的檔案學本科課程體系現狀分析,可以得出檔案學專業本科課程的特點是,課程內容設置兼具傳承性與前沿性。縱觀17所學校的檔案學專業本科必修課程情況,既包含檔案學概論、明清史與明清檔案、檔案編纂、科技檔案管理學、中外檔案事業、檔案文獻遺產保護等傳承了檔案學理論與管理經驗的傳統課程,又包含程序設計、數字檔案館、計算機網絡基礎、數據結構等具備學科前沿性的必修課程內容。
教育的主要功能是促進學生個體的發展,檔案學專業課程體系需在現有課程體系的基礎上,借助數據科學進行改革,就改革的內容而言,可從以下四個方面展開:以培養數字時代高素質人才為目標、學科融合發展的同時凸顯專業特色、跨學科培養同時注重實踐性、實現多樣化的教學方法。
數字時代是檔案學課程體系改革的背景,隨著技術的不斷更新換代,未來社會需要大量的技術專才。美國檔案學教育協會(Association for Library and Information Science Education)院長暨系主任聯席會議合作主席、加拿大多倫多大學信息學院院長Seamus Ross教授曾指出[10],檔案學專業人員的生存環境正在劇烈變化,而檔案學的教育幾乎沒有發生變化,傳統的就業領域的職位需求日益向新興的與大數據有關的職業如數據分析、數據監護等方面傾斜。隨著網絡的快速發展,網絡催生的數據量在日益增加,大數據在實際應用中為很多行業和產業帶來了實際效益,為順應大數據發展形勢,檔案學與數據科學的深度融合成為學科發展的必由之路。
數據科學驅動的檔案學專業課程體系改革,整體上應呈現出必修課與選修相輔相成的特點,必修課程為學生掌握數據科學基礎理論提供條件,同時通過設立不同類型數據科學方向的選修課程,使得學生可根據個人興趣愛好擁有充分的選擇范圍,學生能自主選擇最為契合自身職業發展的課程來學習。這些課程絕大多數應圍繞數據處理、分析展開,數據分析、數據挖掘、數據可視化出現的概率最高。此外,基于數據科學的檔案學專業課程設置要符合大數據時代的教育特點,即呈現跨學科多元化的特點。總體來說,數字時代檔案學的高素質人才不僅要掌握檔案學、計算機科學、統計學、管理學等理論課程內容,而且也要具備數據分析、數據可視化等實際操作能力。
檔案學科的發展應以開放包容的姿態去吸收其他學科的成果,以促進自身的發展和壯大,但是在借鑒相關知識與技能的同時也要保持檔案學科的專業特色。因此,檔案學的課程體系改革,要著重建設與數據科學融合的課程,例如數據科學導論等課程。此外,需要明確學科融合建設是在掌握了檔案學的專業特色課程的基礎之上實現的,如電子文件管理、檔案學概論以及檔案文獻編纂學等專業課程。在檔案學本科教育課程中,可將數據科學融入其中,如檔案文獻編纂課程,數字時代檔案文獻編纂工作的最大特點是與互聯網融合較深,線上線下連通緊密,對人員素質要求不斷提高,檔案文獻編纂工作不能夠僅局限于檔案機構內部,而需要更多具有廣泛、專業知識或豐富資源的人員共同參與[11]。結合大數據來探析檔案文獻編纂工作的主要環節,可開設關于如何構建檔案文獻目錄數據庫以及檔案文獻全文數據庫的課程,教學生將數字化的圖像內容轉化為數據,不僅方便閱讀和檢索,也可以用來做數據分析。
通過對檔案學專業優勢和課程目標的分析,可看出多元化、跨學科的教育理念日漸凸顯,這與檔案數據自身屬性有直接關系。與檔案學有關的數據多種多樣,因此圍繞這些數據的數據科學呈現廣泛性和多樣性的特點,導致檔案學專業的本科人才培養方向呈現多元、跨學科形態。然而,在跨學科特性的基礎上要更加注重開展具有實踐性的聯合培養式教育,培養具有實踐精神的人才,這種培養模式是指雙方或者多方一起培養的教育模式。檔案學專業的聯合培養主要是指構建“校檔結合”“校企結合”“校政結合”“校校結合”的聯合培養方式,學校可以通過和檔案局、企業、政府機關、事業單位及其他高校進行合作,建立實習基地等措施共同培養檔案專業人才。在此培養方式下,學生可在不同的單位進行實踐,進而全面掌握不同機構環境下的檔案管理實際情況,可以全面學習、接收各種檔案學理論與實踐知識,夯實檔案理論,提升業務技能,滿足數字時代對復合型檔案人才的要求。[12]
在課程體系建設方面,需要增加實踐課程的比重,實踐課程的形式也可以分為多種,有個人獨立實踐,可在以設計和建設數據管理和分析為核心的在線實驗平臺完成;也有集體合作實踐,一般是學生利用所學知識參加競賽、撰寫科研論文或解決現實問題。實踐課程可以加強學生的實踐能力和動手能力,給學生提供了解技術、學習技術、掌握技術、運用技術的機會與渠道。
檔案學專業課程體系改革應實現教學方法的多種多樣,不僅限于教師授課,要更注重多元教學方法和形式的融合。比如授課方式以專業老師授課和數據科學相關從業人員授課相結合,有利于及時掌握前沿研究;課后討論通過研討會、講座、小組討論等方式展開,有利于學生拓寬思路,激發靈感。傳統授課方式中學生只是知識的接收者,而教學方式的多樣化促使學生轉變為輸出者,對于檔案學專業發展也有一定的促進作用。
具體而言,檔案學專業教學可增加以下幾種授課方式:一是交互教學方式,采用在線教學、網上課堂、案例教學、慕課等立體化、多樣化的教學方式,使教學方式更加多元高效;還可以利用彈幕與課程教學結合的方式來增強學生的學習興趣,以電子文件管理課程教學為例[13],將彈幕運用到課堂教學中,可以在理論教學、互動討論、小組匯報等方面使用彈幕,通過統計分析學生發送的彈幕內容,評估學生對課堂知識的掌握與理解情況,及時調整教學方式,如此既可以提高教學質量,也可以使學生充分參與到課程中。二是項目教學方式,即老師將課程內容劃分為若干個項目并提出所要完成的任務,而學生通過小組合作等方式進行分工與合作,在老師的指導下完成項目任務,并形成項目成果報告。三是輔助教學方式,個別課程如數據科學相關課程可利用一些輔助工具來提升學生的學習驅動力,如開設一個在線的課程學習系統,老師可上傳科研論文、講座視頻、閱讀材料等學習資料,學生可提前下載進行學習,以便在課上及時反饋學習中的困惑。另外,還可利用微博、微信等社交媒體軟件來及時解答學生所遇到的知識難點和學習疑問,實現教師與學生、學生與學生之間的實時互動。同時,也能夠充實專業教學素材,有利于及時獲取社會有價值的檔案信息,豐富專業教學內容。
數據科學驅動的檔案學專業課程體系框架的構建,首先要遵循一定的原則進行,其次要涵蓋必需的組成要素,最后在前文的基礎上,根據要素之間的邏輯聯系可構建課程體系的框架。
(1)統籌性原則
統籌性原則要求在構建數據科學驅動的檔案學專業課程體系時,不僅要關注學科內部的課程關系,而且也要重視學科之間的課程聯系,要具備統籌兼顧的體系化的思維和方法。具體而言表現為兩個方面:全面化和系統化。全面化指的是整個課程體系要涉及所有與課程相關的因素,如制約因素、課時分配、學分設計、考核標準等,但是也要注重邏輯性,力求嚴謹。比如在設計活動性的實踐課程體系時,要仔細考察完整有序的課程模型,選擇一種最能反映出學生實踐能力的課程體系。系統化是指檔案學的課程體系是一個有機聯系的整體,各個學科之間具備一定的聯系機制,因此,在設計課程體系時要考慮學科之間的聯系。
(2)可行性原則
可行性原則要求最終所形成的的課程體系方案要具備實際操作的可行性。在數據科學的驅動下,檔案學專業應加強自身課程的實踐性,為此,課程體系設計中要充分體現出實踐的可行性。然而,要想將數據科學所有的實踐課程形式全部融入課程體系中,對于目前的教學環境和師資力量而言是不現實的。所以,要想增強課程體系的可行性,需要依靠教育主管部門所制定的指導性規范,考慮實際的資金與設備情況,特別是對于一些技術含量較高的課程,往往需要更多的資金投入,這些課程的開設更加需要考慮現實的可行性。
(3)多樣性原則
教育是一個復雜多樣且專業性很強的領域,多樣性原則體現在課程體系的教學形式、教學內容與教學方法上。教學形式的多樣化指的是要盡量避免以老師為中心、書本為中心、課堂為中心的傳統形式,并非單純一味地摒棄傳統,而是提倡老師與學生進行對話、書本理論用實踐來檢驗、實驗實踐相結合的多樣化教學形式。
在課程體系改革內容、框架構建原則的基礎上,構建了如圖1所示的數據科學驅動的檔案學專業課程體系框架。基礎性的理論課程與開放性的實踐課程屬于相互對應的關系,融合性的應用課程是數據科學與檔案學學科在實際應用中的結合,這部分課程是全部課程融匯貫通的重要體現,在檔案學專業課程體系中比例應大于等于40%。

圖1 數據科學驅動的檔案學專業課程體系框架
(1)基礎性的理論課程
基礎性的理論課程主要是培養學生對數據科學中模型的理解和運用。其中,可將課程分為四個類別:公共課、專業必修課、專業選修課以及任意選修課。比如,將數據科學概論或數據科學導論作為專業必修課,使得學生了解基本的數據科學理論,繼而,再學習相關的具體技術。其次,改革后的課程體系應呈現出選修課的豐富內容,給予學生充分的自主選擇的空間,選修課可依據數據處理、數據分析、數據挖掘、數據可視化等方面開設。
(2)融合性的應用課程
融合性的應用課程主要是培養學生運用數據科學的研究方法、技術與平臺處理檔案數據的能力,可分為四個類別:公共課、專業必修課、專業選修課以及任意選修課。隨著數字時代的來臨,市場對于檔案學專業人才的要求越來越高,不僅僅要求掌握基礎的知識理論,而且也要掌握企業生產實踐的技術。所以融合性的應用課程,能夠培養出優秀的檔案學專業應用型人才。數據科學所涉及到的內容包括了機器學習、數據的分類、信息可視化、平臺工具和大數據等。因此,在應用型課程中,應該培養學生利用數據科學的方法或理論解決具體專業應用問題的能力,一般體現在實例教學、畢業設計等應用教學。
(3)開放性的實踐課程
開放性的實踐課程主要是在開放的環境下培養學生實際操作的能力,實踐課程是理論課程在具體項目、研究、工作中的具體體現,同時也是培養學生綜合能力的重要途徑。所開設的途徑有以下幾個:專業實習、實訓課、項目學習等。在數據科學的驅動下,實踐課程內容可以按照相關的數據生命周期對數據進行相關的采集、數據的清洗、數據的變換、數據的集成等內容[14]。實踐課程是理論付諸于行動的重要過程,若沒有具體的實踐操作,那么再好的理論也只是紙上談兵而已。檔案學專業傳統的許多理論課程在數據科學的驅動下,可以借助相關的技術實現成果轉化,針對于特定課程使用專門的數據分析工具,能夠最大程度上解決數據分析過程中的各種問題。
在數據時代和多學科交叉綜合的背景下,檔案學專業應在強化學科建設的同時把握住新技術帶來的便利,將數字技術合理地應用到檔案學理論與實踐中,為檔案學科發展增添活力。本文所提倡數據科學驅動的檔案學課程體系改革的目標是:在現有課程體系上,實現基于數據科學的檔案學課程體系的構建;在教學理念上,實現數據科學的廣泛應用與接納 ;在學科關系上,實現檔案學學科與其他學科的融合發展;在教學內容上,實現檔案學與數據科學的交融,并突出檔案學科的特性。這些目標的“落地”需要檔案學及各界人士的支持與推動,未來的課程體系培養出的人才是全方位、多功能的復合型人才。