茅曉薇,楊靜麗,楊雨慧
(南京工業職業技術大學,江蘇 南京 210023)
我國近現代教育家黃炎培先生是職業教育的集大成者,其職業教育思想對我國職業教育改革有著重大的現實意義。南京工業職業技術大學作為黃炎培先生親自創辦的學校和中國現代職業教育事業的繼承者,在職業教育進入提質培優、增值賦能的新階段,學校依托現有特色資源,構建一個集學術研究、社會服務、專業資源服務于一體的黃炎培研究專題數據庫,不僅能服務于學校教學科研,而且能實現資源共享,推動黃炎培研究多元化、系統化格局的形成,使黃炎培職業教育思想煥發新的時代價值。
黃炎培先生是我國職業教育的先驅,他于1917年在上海發起成立了中華職業教育社,以倡導、研究和推行職業教育,隨后又創辦了《教育與職業》雜志,次年創辦中華職業學校(即南京工業職業技術大學前身)[1]。他在長期的職業教育理論探索和職業教育實踐中,形成了比較完整的中國現代職業教育思想理論體系,并對當時及以后的職業教育產生了巨大的推動作用[2]。
國內學者對黃炎培的研究由來已久,但是有關文獻分布廣泛且分散,尚沒有專門的文獻信息中心,在此背景下,南京工業職業技術大學建立一個完備的黃炎培研究專題數據庫,可以妥善保存黃炎培文化遺產,更好地弘揚、傳承和發展黃炎培職業教育思想。通過建設具有學科特色的“黃炎培研究專題數據庫”,利用現代信息技術手段對分散的、零亂的、多種類的有關黃炎培研究的文獻資源進行全方位、深層次的挖掘、采集、整理、加工、整合和展示,使黃炎培研究文獻資源完整化、數字化和網絡化,實現對黃炎培研究文獻資源的存儲、檢索和傳播,形成黃炎培研究文獻資源的服務平臺,面向國內外用戶、學者和研究人員,提供特色服務,實現資源共享。
學校于2004 年成立了黃炎培職業教育思想展覽館和黃炎培職業教育思想研究中心,在黃炎培職業教育思想的研究、宣傳、傳承與創新方面做出了諸多探索與實踐,收集了珍貴的史料圖片、文字及實物,編印出版了系列研究資料,建成了黃炎培職業教育思想文庫專題網站等,為數據庫的建設奠定了前期基礎,提供了大量數據資料。
學校黃炎培職業教育思想研究中心2018 年獲批江蘇高校哲學社會科學重點研究基地,得到了多方經費支持并建成了一支具有深厚理論功底、學科互補、研究與教學融通的職教文化研究與創新隊伍,為數據庫的建設提供了充足的經費及人員保障。
2020年,中華職業教育社黃炎培職業教育思想研究院成立并在學校設立秘書處開展工作,研究院所組建的專兼職研究團隊以及相關專家學者,為數據庫的建設提供了內容收集、框架設計、專題欄目分類等多方面的理論指導。
2018 年底,學校學報更名為《江蘇高職教育》,從服務一方院校轉變為服務江蘇乃至全國職業教育,期刊設有“黃炎培職教思想研究”專欄,刊登了眾多研究黃炎培及職業教育的專家和學者的優質文章,為數據庫培育了穩定的讀者用戶群。
學校購買了清華同方TPI專業數據庫制作管理系統作為數據庫創建、發布和管理的平臺,它是基于非結構化文檔管理開發的智能內容管理系統,以KBASE全文檢索數據庫為核心,采用B/S 形式進行網站的發布,C/S形式進行數據加工,能夠同時管理文字、圖片、音頻等不同格式的多媒體信息,實現資源整合,為數據庫建設提供了完備的技術保障。
黃炎培研究專題數據庫需要將分散無序、形式各異的文獻信息資源進行采集、整理、加工、集成、整合,形成統一的信息服務體系后通過門戶系統展現,供用戶使用。建庫平臺TPI 系統的核心是KBASE 檢索服務器,它能實現信息的組織、存儲與檢索,內容管理器(CMC)實現數據倉庫創建與內容管理,元數據加工工具(TCMM)實現元數據在線標引對原始文獻資料的數字化結構化,內容發布(TPIWeb)實現內容的發布與資源展示利用服務。數據庫主要的建設過程如下所述。
建設團隊依托先進的數字化技術、網絡化信息手段和檢索方法等,全面、廣泛地收集了各類黃炎培研究資料(包括文字、聲音、圖像等信息),從時間上收集了包括自晚清以來各歷史階段有關黃炎培的所有資料;從介質上收集了包括紙質的和電子的有關黃炎培的所有文獻;從內容上收集了包括黃炎培著作、日記等資料,有關黃炎培研究、黃炎培職業教育思想影響等所有文獻;從文獻類型上收集了包括圖書、期刊論文、學位論文、報紙論文、會議論文、視頻、圖片、相關網頁等所有文獻[3],具體資源內容可見表1。

表1 資源內容一覽表
對于收集到的所有資源,經過遴選后,團隊在建庫前期進行了大量的數字化處理工作,把各種類型的數字對象加工成規范、有序的資源,具體流程見圖1。一是對現有的電子資源進行加工、標引后上傳到資源中心;二是對所收集到的紙質資源進行數字化處理,利用建庫平臺TPI 的電子圖書制作專用工具,通過書頁掃描、掃描圖像處理、OCR識別處理、校對、標引、編輯目錄等工序后上傳到資源中心;三是對收集到的網絡資源通過信息采集、資源轉換后上傳至資源中心。所有資源將通過建庫平臺TPI進行發布。

圖1 數字化流程圖
根據收集到的資源數據類型,在遵循CALIS特色數據庫建設技術規范的前提下,團隊結合數據庫的實際使用需求,利用建庫平臺TPI 的內容管理與發布工具(CMC)實現了圖書、報紙、期刊論文、博士論文、碩士論文、國際會議論文、國內會議論文、視頻、圖片等子數據庫的搭建,設置了子庫的名稱、字段信息、位置、權限等,子庫的數據結構表為:XXX_CLS 數據分類導航目錄表、XXX_CLS_NODE 分類導航樹結構表、XXX_DATABASE_DESCRIPT 數據庫的描述表、XXX_FIELD數據庫的字段表、XXX_METADATA數據庫中表數據表、XXX_METADATA_ FILE 文件存儲路徑表、XXX_METADATA_FILE_IMAGE 數據庫中縮略圖表、XXX_METADATA_RELATION 數據庫相關表。這些子庫是構成黃炎培研究專題數據庫的核心。
數據轉換主要包括數據導入、數據導出和數據庫間的數據導入,建庫平臺TPI 的數據轉換工具(Data-Tran)支持多種類型的轉換模板,如:CNMARK、ODBC、Excel、DC、ACCESS、XML、TPI、CALIS、自定義文本等多種格式。在數據庫設計并創建完成后,團隊利用該工具進行元數據與目標子庫的字段映射,將數據導入各子庫中;還可利用該工具可以把數據庫中每個子庫中的數據導出到本地,同時平臺支持數據庫間的數據導入,包括導出文本文件、Microsoft Excel 文件、Microsoft Access數據庫、MARC文件等。
數據導入之后,團隊利用建庫平臺TPI 的后臺管理功能來實現數據庫的發布,首先配置子庫的檢索、概覽、細覽、排序、分組字段等內容,實現子庫的頁面初始化;然后再進行提交字段、修改字段的配置,實現子庫數據的初始化;最后對跨庫進行配置,實現統一檢索全文的功能。同時平臺支持Internet內容信息發布的流程化管理,采用動態頁面生成技術,無須編程即可自動發布,提供了多種發布風格[4],支持多導航和多個數據庫的無縫鏈接。
數據庫最終是以網頁的方式呈現,并為用戶提供瀏覽、檢索和下載服務,因此黃炎培研究專題數據庫在前期構建時即采用了個性化頁面設計,網站的設計上內容豐富、布局合理、美觀且具特色。為了全面展示黃炎培相關研究成果、打造具有特色的研究平臺,團隊設計建立了分類導航體系,以生平簡介、個人著作、珍貴圖片、影像資料、研究動態、傳承發展、熱詞分析等為主要導航架構,方便快速定位到所需查找的內容模塊,具體設計可見數據庫首頁導航展示圖(如圖2所示)。

圖2 黃炎培研究專題數據庫首頁導航展示圖
1)生平簡介模塊。該模塊重點展示了黃炎培的生平及其職業教育思想概述,從1878年至1965年,以時間為主線,詳細介紹了黃炎培先生的職業教育生平。
2)個人著作模塊。該模塊展示了黃炎培個人所著《中國教育史要》《學校教育采用實用主義之商榷》《內外時報中華職業教育社宣言書》等作品,以及許漢三編寫的《黃炎培年譜》等。
3)珍貴圖片模塊。該模塊重點展示了黃炎培工作、生活中的珍貴照片,包括其與家人朋友的合影、多次考察教育、進行職業教育辦學、重要場合主持工作等場景圖片。
4)影像資料模塊。該模塊展示了黃炎培相關影像資料,包括《大師》中國教育家(黃炎培)、電視劇《黃炎培》等視頻。
5)研究動態模塊。該模塊不僅詳細展示了與黃炎培職業教育思想相關的最新研究成果,同時圍繞黃炎培教育思想體系的教育救國思想、實用主義教育觀、大職業教育主義、職業道德教育觀、職業指導等五個方面展示了與之相關的研究成果,主要選取了CNKI 中國知網總庫收錄的中外文期刊、博碩學位論文、會議、報紙等相關成果[5]。
6)傳承發展模塊。該模塊展示了黃炎培職業教育思想傳承發展的最新動態,利用互聯網資源抓取工具進行相關數據的抓取,并實現數據的智能標引,主要包括國家、省市、中華職業教育社與各省社以及學校的相關新聞動態。
7)熱詞分析功能。主要為用戶呈現具體的可視化分析結果,熱詞分析為與黃炎培研究相關的、反映當下職業教育研究熱點的關鍵詞展示,例如黃炎培、教育、職業、職教、職業道德、周期率等,可為用戶進行關鍵文獻及相關文獻推送,并提供延伸閱讀。
團隊充分考慮了各層次用戶的使用習慣及需求,建立了簡潔方便的檢索界面,數據庫的檢索工具不僅提供單庫檢索、跨庫檢索和分布式檢索等多種檢索方式,還提供二次檢索、高級檢索等,并能按照更新日期和相關度等方式進行排序。
黃炎培研究專題數據庫已初步建成并投入使用,目前運行良好,總數據近四千條,以時代為線索,將著作、論文、圖片、視頻等,借助于數字化平臺,有組織地分類、編排在一起。具有獨立的域名(http://hypresearch.niit.edu.cn/),提供Web 形式的開放式檢索,可基于題名、作者、關鍵詞、全文等多種檢索途徑及多個字段的組合檢索方式,檢索功能強大。對于信息資源提供概覽顯示、全文顯示、打印等輸出方式,供廣大職業教育者、學者和研究團隊學習使用。
專題數據庫的建設是一項長期且艱巨的工作,需要持之以恒地對數據庫不斷進行充實、調整、更新、維護和完善,使其真正成為為廣大用戶和研究學者提供全面、方便、快捷、高效的文獻信息資源檢索的平臺。
在黃炎培研究專題數據庫的后續建設過程中,要始終堅持特色,突出特色,高度重視知識產權問題并嚴格遵循相關法律法規,加強對數據庫的宣傳,注重數據備份與數據安全,及時收集用戶使用的反饋信息,對平臺不斷加以改進和完善,同時可建立面向黃炎培研究團隊的知識管理和協同平臺,提供云服務,以用于團隊成員之間的網絡協同、知識共享、知識沉淀和知識創新,努力將數據庫建設得更加實用與專業。