
摘要:借助榆林學院綏德師范校區(qū)獨特的紅色文化優(yōu)勢,收集整理在革命戰(zhàn)爭年代留存的許多珍貴的紅色文獻,建設綏德師范校區(qū)紅色資源館藏庫和數字研究平臺,不僅是保護紅色文獻資源的需要,也是大數據時代科學研究的需要。該文闡述了綏德師范校區(qū)紅色文獻的收集整理方法,研究了國內紅色文獻數字化加工技術,提出了綏德師范校區(qū)紅色文獻的數字化方案和實施流程,以期為高校圖書館進行紅色文獻保護提供參考。
關鍵詞:綏德師范;紅色文獻;數字化;OCR文字識別
中圖分類號:G255" " " " " " " " " " "文獻標識碼:A" " " " " " " " "文章編號:2096-4110(2023)01(b)-0154-04
Research on the Construction and Digitization of Red Literature in Local Universities
—Taking Suide Normal Campus of Yulin University as an Example
Abstract: With the unique red cultural advantages of Suide Normal Campus of Yulin University, collected and sorted out many precious red documents preserved during the revolutionary war. It is not only the need to protect red literature resources, but also the need of scientific research in the era of big data to construct red resources collection library and digital research platform in Suide Normal Campus. The article expounds the collection and sorting method of red literature in Suide Normal Campus, studies the digital processing technology of domestic red literature, puts forward the digitization scheme and implementation process of red literature in Suide Normal Campus, which provides a reference for the protection of red documents in university libraries.
Key words: Suide Normal Campus; Red Literature; Digitization; OCR Character Recognition
陜西省綏德縣,地處榆林市東南部,在抗日戰(zhàn)爭時期和解放戰(zhàn)爭時期是抗日軍政大學、綏德警備區(qū)司令部和359旅司令部駐地。地處綏德革命老區(qū)的綏德師范學校,早在1924年就建立了陜北地區(qū)最早的黨團組織,在革命戰(zhàn)爭年代留下了許多珍貴的紅色文獻,這些紅色文獻具有極高的史料價值、文化價值和教育價值,搶救、收集、整理、保護這些珍貴的紅色文獻資料十分必要。2017年,綏德師范學校并入榆林學院后,更名為榆林學院綏德師范校區(qū),榆林學院圖書館作為榆林學院文獻資源信息中心,應承擔起建設綏師紅色文獻資源庫的重任。
1 榆林學院綏德師范校區(qū)紅色文獻數字化建設的背景
1.1 榆林學院綏德師范校區(qū)紅色文獻資源豐富
紅色文獻資料主要指從1921年7月中國共產黨成立起至1949年10月新中國建立前,由中國共產黨機關或各根據地所出版、發(fā)行、制作的各種文獻資料[1]。紅色文獻記載著中國共產黨領導中國革命的光輝歷程,是彌足珍貴的黨史資料,在目前大力開展的黨史學習教育中具有重大現(xiàn)實意義和理論價值[2]。榆林學院綏德師范校區(qū),原陜西省綏德師范學校,是一所紅色歷史底蘊深厚的學校。在近百年的歷史發(fā)展中,榆林學院綏德師范校區(qū)作為“革命搖籃育才基地”“西北革命策源地”和“革命英才的搖籃”留下了許多珍貴的紅色文獻,這些紅色文獻是在艱苦的戰(zhàn)爭年代中出版和發(fā)行的,面對敵人的嚴密封鎖,當時的印制條件非常簡陋,后又經歷了戰(zhàn)火的洗禮、校址整體搬遷、綏德縣“7·26”特大洪災,留存下來品相較好的文獻資料十分有限,甚至有些紅色文獻到今天已成為孤本、善本,具有重要的史料價值、文化價值和教育價值。收集整理紅色文獻這一專題信息并使之形成滿足讀者需要的文獻資源是信息服務部門的一項光榮任務[3]。高校圖書館工作者在注重服務教學、科研的同時,要本著“立足老區(qū)、強化特色、服務地方”的研究宗旨,注重老區(qū)文化建設工作[4]。榆林學院圖書館作為陜北革命老區(qū)重要的文獻資源收藏地,在紅色文獻收集、整理和建設方面具有天然的地理優(yōu)勢、豐富的資源優(yōu)勢和優(yōu)秀的人才隊伍優(yōu)勢。
1.2 榆林學院綏德師范校區(qū)紅色文獻收集整理的意義
榆林學院綏德師范校區(qū)的前身是創(chuàng)立于1923年的陜西省立第四師范學校。建校初期,在共產黨人的領導下,成為西北革命的活動中心,是最早的西北地區(qū)黨團組織的發(fā)源地,為西北紅軍、西北革命根據地的創(chuàng)建與發(fā)展立下了汗馬功勞。通過對檔案原件、文獻資料、回憶資料考辨,相互印證,綜合考察,可以得出如下結論:學校黨小組創(chuàng)建于1924年11月;1925年初,校內成立陜北第一個中共黨支部;1925年夏,校內成立中共綏德特別支部;1926年6月,中國綏德地方執(zhí)行委員會成立[5]。
2017 年7月,經陜西省委、省政府批準,陜西省綏德師范學校并入榆林學院后,更名為榆林學院綏德師范校區(qū)(以下簡稱綏師)。保護好綏德師范校區(qū)現(xiàn)存的紅色文獻,收集整理各種紅色資源,把這些資源保護好、建設好、傳承好,使其成為紅色教育的珍貴教材,對弘揚和傳承紅色歷史文化、強化黨史學習教育具有重要意義。
2 綏師紅色文獻收集整理的方法及數字化的必要性
2.1 綏師紅色報紙收集整理的方法及存放環(huán)境
綏師辦學歷史悠久,留下了很多特色鮮明的紅色報紙。課題小組對綏師的這些報紙進行了細致的分類整理,按照報紙出版的年代順序,依次進行了排序、登記、造冊、電子錄入、上架、標記。存放紅色報紙的房間做到避光、防潮、防火、防塵,安裝布置了專用的紅色報紙柜,并對專柜中的每一層報紙按照名字和年代范圍貼標簽標記,便于后期對原始文獻的查找。在分類整理的過程中,發(fā)現(xiàn)了很多份具有綏師元素的紅色報紙,例如解放戰(zhàn)爭時期,綏德縣當地發(fā)行出版的《大眾日報》和《大眾報》。這些報紙中詳細記載了綏師在解放戰(zhàn)爭年代發(fā)生的一些事跡,對研究陜北革命史和綏師校史具有重要的史料價值。課題組還對缺失的紅色報紙通過購買、復印等途徑進一步完善,逐步建成綏師紅色資源館藏庫。
2.2 綏師紅色文獻數字化的必要性和緊迫性
綏師現(xiàn)存的紅色文獻因為年代久遠,無專人管理,保存條件簡陋,隨著歲月的流逝,都已發(fā)黃變脆,不能經受頻繁的人工翻閱。歷史上又經歷過綏師校址搬遷、綏德縣“7·26”特大洪災,珍貴的紅色文獻難以得到有效保護。如果再不進行搶救性保護、整理,若干年后,這些紅色文獻將不能再被翻閱,無法再被使用。為了將現(xiàn)存的綏師紅色文獻保護好和利用好,紅色文獻數字化十分必要,而且刻不容緩。另外,人工翻閱大量的紅色文獻,不僅不能快速地查找到所需的文獻史料,而且耗時費力,非常不利于紅色文化研究工作的開展,使得研究人員查找資料的積極性減弱。由于缺乏對原始文獻的挖掘,造成研究的深度和寬度不夠,科研成果的數量和質量都受到影響[6]。此外,館藏紅色文獻資源的數字化,不僅能夠讓紅色文獻資源實現(xiàn)永久保存,而且能夠通過新媒體融合傳播活起來,有助于擴大紅色文化資源內容的影響規(guī)模[7]。因此,將紅色文獻進行數字化是保存好和利用好紅色文獻的重要方法和有效途徑。
3 國內紅色文獻數字化發(fā)展現(xiàn)狀
課題組通過查閱資料和調查研究發(fā)現(xiàn),目前國內各種機構紅色文獻數字化主要有兩種形式。
3.1 掃描成電子圖像
這種數字化的方法是把文獻內容掃描成電子圖像,之后不進行深加工,那么讀者只能一張張地查看圖像,無法進行檢索,如由中國社會科學院、國家圖書館、國家檔案局和中國社會科學院共同建設完成的“抗日戰(zhàn)爭與近代中日關系文獻數據平臺”,收錄了《紅色中華》《解放日報》《晉綏日報》等紅色報刊,該數據平臺可以實現(xiàn)根據報紙的名稱和出版時間進行電子圖像瀏覽,不足之處是讀者不能對數字化后的報紙內容使用關鍵詞進行檢索。
3.2 OCR 數字化
OCR是Optical Character Recognition的縮寫,意為“光學字符識別”。這種數字化的方法是在文獻內容掃描成電子圖像的基礎上進行OCR文字識別,識別完成后,可以提供關鍵詞檢索服務。從唐月娥[8]的研究中得知,OCR文字識別分為3個層次:第一層次只是對正文標題進行文字識別,這樣識別的效果可以提供標題的檢索,可以定位到標題所在的版面,但篇目的位置還要讀者自行查找;第二層次是對OCR文字識別后的篇目進行標引,可以實現(xiàn)標題、作者、出版者、出版時間等關鍵詞的檢索,如上海圖書館開發(fā)的《中國近代報紙資源全庫》,該資源庫是依托上海圖書館豐富的近代文獻館藏資源制作的大型報紙全文數據庫,可以實現(xiàn)對題名、作者、文獻來源和出版時間等字段的檢索功能;第三層次是對紅色文獻進行全文OCR文字識別后,再加以字段標引,就可以實現(xiàn)對紅色文獻的全文檢索,功能比較強大,檢索出來的信息較為全面,如北京愛如生數字化技術研究中心研發(fā)的全文檢索版大型數據庫《愛如生紅色歷史文獻庫》,是國內外第一款紅色主題、全文檢索、圖文對照的大型數據庫,該庫的“三窗點選式”全圖頁面可以瞬間切換,強大的檢索系統(tǒng)可以實現(xiàn)毫秒級全文檢索。
通過對3個層次的OCR文字識別技術比較可以看出,實現(xiàn)全文檢索的全文OCR文字識別數字化技術的優(yōu)點是顯而易見的,缺點是成本較高,對合作公司技術實力的要求也較高。
4 綏師紅色文獻數字化的建設思路
4.1 綏師紅色文獻數字化建設目標
為了將綏師的紅色資源進行系統(tǒng)科學的收集、整理和利用,弘揚和宣傳綏師紅色文化,傳承紅色精神,賡續(xù)紅色血脈,滿足專家學者對西北革命策源地中共黨史、政治、經濟、文化等課題研究的需要,榆林學院圖書館專門成立了紅色資源建設課題組,并邀請了西安交通大學、西北大學和延安大學的紅色資源專家為課題組指導,對紅色資源的收集范圍、建設方向、制度建設和來源途徑等進行了論證指導,課題組將負責完整系統(tǒng)地收集、整理綏師現(xiàn)存紅色資源,并同時聯(lián)合綏德革命紀念館、榆林革命紀念館、中共榆林市委黨史研究室、榆林市紅色文化研究會、榆林學院馬克思主義學院等研究機構,實現(xiàn)紅色資源共建共享,并與專業(yè)的數字化公司進行合作,對收集到的紅色資源進行數字化加工。一方面,建成西北革命策源地紅色資源館藏庫,為研究西北革命史奠定史料基礎;另一方面,建成涵蓋電子圖書、電子報刊、圖片、音視頻等媒體類型的西北革命策源地紅色資源數字研究平臺,成為研究陜北早期黨史和綏師校史方面最為全面豐富的紅色資源數字平臺。平臺建成后,將能夠實現(xiàn)對紅色文獻的原版原貌展示,除了可以逐層點擊瀏覽網頁信息以外,還能夠按照篇名、作者、出版社、出版時間等關鍵詞進行檢索,將具有文獻檢索、成果展示、學術交流等主要功能。
4.2 綏師紅色文獻數字化的建設原則
在紅色特色圖書館館藏資源數字化工作方面,應確立館藏文獻資源中價值與實用性高的,且具特色性的文獻資源品種范圍,有重點分步驟地實施,做好館藏資源數字化工作。結合孫烈濤提出的紅色文獻數字化建設原則,課題組認為,綏師紅色文獻數字化、建設紅色文獻數字研究平臺應當充分展現(xiàn)綏師自身的紅色血脈,應當將突出綏師作為“西北革命策源地”“革命英才的搖籃”“陜北地區(qū)最早的黨團組織”等紅色元素的文獻作為首批紅色文獻數字化的建設內容,體現(xiàn)綏師在早期陜北革命史中的重要地位。基于以上建設原則,課題組經過反復的論證,在與指導專家交流討論后,最終篩選出《大眾日報》等報紙,作為第一批數字化加工的對象。
4.3 綏師紅色文獻數字化方案
為迎接榆林學院百年校慶,作為百年校慶的一份獻禮,課題組決定對綏師紅色文獻資源進行全文OCR文字識別的數字化方案。在數字化過程中,將嚴格按照國家圖書館制定的《特色館藏專題資源建設項目加工及著錄規(guī)則(2019)》進行數據加工,依據《中國分類主題詞表》對主題詞或關鍵詞進行標引,根據國標《信息資源的內容形成和媒體類型表示》進行著錄,元數據的設置遵循都柏林核心元素集的標準,在選擇元數據時要考慮到各種類型資源的特征,在尊重差異和使用習慣的基礎上統(tǒng)一,在保證通用性的前提下,滿足不同類型資源的個性化需求[9]。數字化工作將緊密依托榆林學院圖書館資源數字化方面人才、技術的支撐,發(fā)揮本館的專業(yè)隊伍優(yōu)勢,對綏師紅色文獻資源循序漸進地開展數字化掃描、OCR文字識別、標引、入庫、索引工作。
4.4 綏師紅色文獻數字化實施流程
按照制定好的綏師紅色文獻數字化方案,遵循項目實施流程,進行綏師紅色文獻數字化工作。綏師紅色文獻的數字化實施流程如圖1所示。
4.4.1 收集整理
全面完整地收集整理綏師紅色資源,包括圖書、報紙、期刊、圖片、音視頻等多類型的紅色資源,再通過購買、復印、共享等多種途徑,補足綏師缺失的紅色資源,建立西北革命策源地紅色資源館藏庫。
4.4.2 登記造冊
對收集整理的紅色資源進行分類整合并且登記造冊,制作為電子表格文件,同時將紙質版留存。
4.4.3 數字化
選擇技術實力雄厚的數字化公司作為項目合作方,使用技術成熟的數字加工平臺,要求合作的數字化公司出具合理可行的項目執(zhí)行方案,要求文獻資源掃描數字化的速度較快,掃描工作的工期要在可接受范圍內。
4.4.4 搭建平臺
搭建西北革命策源地數字研究平臺,平臺搭建工作可外包給專業(yè)公司進行,平臺建成后,用戶可以通過互聯(lián)網在電腦、手機等多種終端訪問平臺資源。
4.4.5 錄入數據
按照資源分類將數字化后的紅色資源錄入到數字研究平臺中。在錄入工作前期,可依托數字化公司批量錄入數據,在錄入工作后期,指定專人進行數據錄入工作。
4.4.6 校驗勘誤
數據錄入后,課題組必須進行多次校驗勘誤工作,以保證數據的準確性和完整性,對錄入到數據庫中的內容進行全面校驗,有必要時,將待校驗內容提交給相關專家進行考證,對出現(xiàn)錯誤的內容及時進行勘誤。
4.4.7 驗收發(fā)布
驗收階段必須嚴格把關,可分為預驗收環(huán)節(jié)和專家驗收環(huán)節(jié)。預驗收環(huán)節(jié)由課題組負責,驗收過程必須嚴格對照項目計劃書和項目需求報告。預驗收合格后,邀請課題組指導專家和文獻資源數字化專家進行聯(lián)合測試并驗收發(fā)布。
5 結語
紅色文獻記錄了老一輩無產階級革命先烈奮斗的歷程,為我們后人留下了珍貴的精神財富,是進行黨史教育的優(yōu)質教材,有助于廣大黨員干部深入學習貫徹習近平新時代中國特色社會主義思想,繼承和發(fā)揚黨的光榮傳統(tǒng)。整理好、保護好、傳承好地方高校紅色文獻資源,是高校圖書館義不容辭的重任。在紅色文獻資源數字化的基礎上,應當進一步整合資源,構建紅色文獻資源平臺,逐步形成紅色文獻資源體系,充分發(fā)揮高校圖書館服務于教學科研、服務于文化傳承、服務于社會主義建設、服務于地方經濟發(fā)展的重要職能。
參考文獻
[1] 趙莉.紅色文獻資料綜述[J].絲綢之路,2009(18):31-36.
[2] 任靜,林衛(wèi)東,李洪梅.紅色文獻數字化建設現(xiàn)狀研究[J].圖書館界,2021(5):11-15.
[3] 孔輝,王宗枝.高校紅色文獻資源建設與服務——以遵義師范學院為例[J].圖書館學刊,2015,37(7):21-24.
[4] 袁子英.紅色資源數據庫建設研究——以籌建賀龍圖書館為例[J].圖書館學研究,2012(14):46-48.
[5] 王天強,王守文.中共陜西省綏德師范學校黨組織建立時間考證[J].榆林學院學報,2021,31(3):45-51.
[6] 賈翠玲.延安時期紅色文獻收集整理與數字化建設[J].延安大學學報(社會科學版),2016,38(4):122-125.
[7] 孫烈濤.紅色文獻資源數字化建設實踐探索——以梅園新村紀念館周恩來圖書館數字化建設為例[J].新世紀圖書館,2021(4):48-52.
[8] 唐月娥,李敏.紅色報紙文獻數字化探索與實踐——以《晉綏日報》為例[J].圖書館雜志,2021,40(11):4-8.
[9] 吳茗,龍偉,肖紅.自建數字資源的元數據管理實踐及啟示——以國家圖書館中文圖書數字化資源庫為例[J].數字圖書館論壇,2014(3):44-48.