○ 馬英珺
《中國音樂大典》編纂工程是“中國樂派高精尖創新中心”①“中國樂派高精尖創新中心”成立于2016年10月9日,是依托中國音樂學院建設的音樂人才特區,其建設目標是以中國音樂資源為依托、中國藝術風格為基調、中國音樂家為載體、中國音樂作品為體現,為最終實現中國樂派的確立與發展構筑強有力的支撐。的建設方向之一,是“中國樂派”研究與建設的重要理論支撐,其要旨是通過梳理中國音樂的歷史文化發展脈絡,研究中國音樂傳世之精品,全方位展示中國音樂的思想理論、音樂作品、音樂人物、音樂表演、音樂器物、音樂組織等各方面的發展成就,努力打造成為中國音樂歷史上的“四庫全書”②王黎光:《院長致辭》,《中國音樂》,2017年,第1期,第5-7、11頁。。
中國音樂大典數據庫是一套專門為《中國音樂大典》編纂工程而建設的典籍資源平臺,內容與《中國音樂大典》收錄的資源相匹配。平臺的根本任務是通過對《中國音樂大典》文論編、樂譜編、音像編、圖像編等不同類型的音樂資源進行采集、存儲、分析、管理,實現海量資源的動態展示和各編之間的信息關聯,為用戶提供瀏覽、檢索、資源推送等個性化服務,為中國音樂理論、創作、表演研究提供便捷有效的知識獲取渠道。
數據庫首先需要將《中國音樂大典》先期收錄的圖、文、譜、音、像等數據資料進行整理、分類、編目、修復和存檔等,在保證原文件無損的前提下進行數字化處理、轉換、加工、入庫,然后根據不同類型資源的元數據規范建立索引和關聯,通過資源發布平臺對外發布,用戶便可以通過終端進行檢索、瀏覽、下載、視聽,隨時隨地獲取中國音樂信息資源。
系統采用經典B/S架構,基于MVC設計模式,以Mysql數據庫、Solr搜索引擎、SpringCloud服務端框架等先進的開源技術作為支持。技術架構支持分布式集群,采用模塊化設計,每個模塊之間互不影響,分合自如,是有機聯系的一體,確保在高并發下的訪問速度和穩定性,同時保證系統后期升級迭代開發的延續性。
系統通過梳理實際業務流、數據流和工作流,細化軟件開發方案,設計了數據庫管理、數據庫采集轉換與加工處理、數據庫發布檢索、用戶權限認證、系統管理等模塊,并且支持門戶布局、框架的自定制,功能模塊、服務的擴充和調整等個性化定制,實現資源的導航瀏覽、發布檢索、資源推送以及數據庫管理和統計分析等功能。
在遵守國家相關標準的前提下,系統圍繞統一數據管理、統一身份認證、統一數據共享的設計原則,規范地進行業務數據的采集、存儲和應用,確保技術的先進性和穩定性、平臺的開放性和可擴展性、數據的規范性和安全性以及服務的可靠性、操作的易用性,并充分尊重知識產權問題。
中國音樂大典數據庫的內容與紙本大典文獻資源內容一致,分為文論編、樂譜編、音像編和圖像編。四編的收錄內容大致如下:文論編主要收錄古代與近現當代有關中國音樂的經典著作、論文、文集等,其作品收錄標準定位為經典、典范、典型,以便于研究和了解中國音樂研究的現狀;樂譜編收錄中國古代與近現當代已出版的、民間收藏的,以及流傳于海外的各類型樂譜及譜本提要,其中古代樂譜包括存見于古籍中的古代樂譜和傳世于今的琴譜、工尺譜等,現當代樂譜包括中國傳統音樂曲譜及經典中國音樂作品曲譜;音像編主要收集整理中國傳統音樂各類藝術形式的音樂作品,著重于收錄現當代有學者采錄的、來自田野的音像資料和傳統音樂作品;圖像編主要收錄中國古今一切記錄、描繪社會樂音生活各個領域的音樂器物、場景、人物,以及音樂實踐的、以平面視覺形象為表現形式的、具有經典意義的圖像資料。四編收錄的各類資源共同為“中國樂派”的建設提供理論體系的支撐。
中國音樂大典數據庫確立了基于音樂研究領域的科學的、合理的分類。文論編、樂譜編、音像編和圖像編是四個并列的子庫,也是數據庫的四個一級分類。二級分類建立在時間維度之上,文論編分古代文論、近現代文論;圖像編亦分古代卷和近現當代卷;樂譜編和音像編分傳統藝術形式與現代藝術形式等。從三級分類開始,各編內容各有側重:如近現代文論按照資源的出版形式和來源分為圖書、期刊和學位論文;傳統藝術形式的樂譜和音像資源則是根據音樂藝術形式的門類劃分為民歌、戲曲、曲藝、器樂等。第四級、五級、六級分類是數據庫最為核心的內容,分別體現了各類資源所屬的學科、專業、樂種等,七級則是具體的曲目名稱。以漢族民間器樂曲譜的分類層級為例。(見表1)

表1 漢族民間器樂曲分類結構示例
數據庫在上述分類基礎上確立了層次性與多元性結合的樹形分類體系,并搭建了數據庫分類導航架構,使得各編的分類一目了然,用戶可以根據檢索需求任意點擊分類樹前面的“+”“-”符號,擴展或縮小層級。(見圖1)

圖1 樂譜編和文論編樹形分類架構
對于以資源為主的學術類數據庫來說,檢索功能之重要性不言而喻,檢索結果的精確度和敏感度直接影響到數據庫使用效果。中國音樂大典數據庫采用實時分布式搜索和分析引擎,實現了一站式檢索、分類檢索、高級檢索、關聯檢索等功能,并且對不同信息載體之間既各自獨立,又相互關聯的中國音樂資源進行優化和整合。
在中國音樂大典數據庫主頁面上,即設計了一站式檢索框,可以同時在四個子數據庫中進行檢索式表達,并支持主題檢索和全文檢索。
主題檢索即選擇相應主題字段進行檢索。數據庫在檢索框左側設置了主題字段的下拉框,用戶可以根據需求選取下拉框中的標題、關鍵詞、摘要、責任者等字段,然后在檢索框中輸入對應的關鍵詞進行檢索。在這些主題字段中(除責任者之外),系統采用了搜索引擎的分詞檢索功能,即把檢索詞拆分成多個詞語,如“中國音樂學院”進行分詞后就會生成“中國”“音樂”“學院”“音樂學院”“中國音樂”等,使得檢索結果更加豐富。
全文檢索則是根據關鍵詞在全文中進行匹配③蘇石、翟中會、劉華:《一站式檢索工具在系統評價中的應用及效果評價》,《中國循證醫學雜志》,2018年,第5期,第506-510頁。,在中國音樂大典數據庫中,如果沒有選擇下拉框中的指定主題字段,則默認為全文檢索。全文檢索支持空格操作符,多個關鍵詞使用空格連接可實現“與”檢索。以查詢“程硯秋”演唱的《鎖麟囊》為例,直接在檢索框中輸入“程硯秋 鎖麟囊”(使用空格連接關鍵詞,實現“與”檢索),即可在四個子庫中進行全文檢索,如果檢索結果數量較多,可以直接點擊左上角資源類型,有目的地瀏覽某一編的數據內容。
中國音樂大典數據庫首頁下方設計了文論編、樂譜編、圖像編、音像編的分類導航功能。鼠標移動到某一編目標區域的時候,會自動展開其二級分類和三級分類,用戶可以根據需求點擊某個分類,即可進入到相應的檢索結果頁面。快速分類檢索功能能夠幫助用戶快速了解數據庫各編的資源內容。
高級檢索是利用布爾邏輯運算符實現多個字段的檢索組合,是一種靈活、精確的檢索方式。中國音樂大典數據庫在高級檢索頁面設計了可視化的表單式檢索界面,用戶可以通過資源類型、檢索字段、時間范圍、查找方式、檢索式等多個條件,任意新增或刪除檢索字段,并在多個字段間進行“與”或“非”等邏輯關系的組配,滿足多元的檢索需求,有效縮減檢索范圍,直接定位目標數據。在高級檢索中,數據庫還提供了精確查找、模糊查找以及“檢索字段+時間范圍”的檢索方式。其中,精確查找不進行字段分詞檢索,檢索結果比較精確;模糊查找對檢索字段進行分詞檢索,可以得到更全面的檢索數據;“檢索字段+時間范圍”的檢索方式,方便用戶根據關鍵詞來定位某一個時間范圍內的文獻,提高數據訪問的效率。
關聯檢索是在檢索結果頁面中根據數據庫提供的檢索字段進行二次檢索,以縮小數據范圍。由于中國音樂大典各編內容的側重點不同,因此每一編設計了不同的二次檢索字段:文論編可以通過標題、關鍵詞、責任者、摘要、文獻來源進行二次檢索;樂譜編可通過標題、責任者、民族、類別、流傳地區進行二次檢索;圖像編通過標題、民族、類別、時間等字段進行二次檢索;音像編可以通過標題等字段進行二次檢索。關聯檢索可以找到更多目標之外而又非常重要的數據。
中國音樂大典數據庫的檢索結果以列表形式呈現,檢索結果可以按相關度或者時間進行排序。為了醒目表現,每一條數據都將其中的檢索詞(包括分詞之后的詞語)做了高亮展示。頁面左側提供檢索分類樹和聚類檢索功能,右側上方還可以選擇標題、責任者等主題字段繼續“在結果中檢索”,或者重新進行全局檢索。在檢索結果數據中,每一條數據都可能對應不同的附件類型,點擊標題后的附件標志(不同的附件類型有不同的標志),即可瀏覽PDF、音視頻等附件內容。每次使用的檢索策略都會存放在檢索記錄模塊中,用戶可對自己的檢索歷史進行修改、保存和刪除,如果直接復用這些檢索條件可以再次進行檢索。④陸敏、劉穎、洪正國:《CALIS專題特色數據庫中心門戶系統建設分析》,《圖書情報工作》,2007年,第5期,第126-129頁。
中國音樂大典數據庫以資源的目錄體系為紐帶,整合不同類型資源,實現海量數據的存儲、維護、管理、發布、全文檢索以及統計、分析、應用等功能;數據庫的每個子系統既可單獨運行,又是有機聯系的一體,分合自如,有效地梳理解決數據資源整合及數據共享的復雜應用需求。
中國音樂大典數據庫目前已擁有20余萬條數據,所包含的中國音樂信息全面豐富,體量巨大。數據庫內容與大典收錄的文獻資源內容一致,涵蓋了現有分布式網絡中所有數字媒體類型。目前,樂譜編收錄了中國古代與近現當代已出版的、民間收藏的各類型樂譜數據近4萬條;音像編收錄了中國傳統音樂門類的音視頻資源3萬余條;圖像編收錄中國古今音樂器物、音樂場景、音樂人物等圖像資料13萬條;文論編收錄有關中國音樂理論、創作等相關書籍、學位論文、期刊文獻等5萬余條。這些海量數據為音樂學者進行中國音樂研究提供了重要線索,為音樂藝術院校及音樂研究機構提供全面而翔實的音樂史料。
針對不同文獻類型和資源內容而設計的元數據著錄體例和規范,對于在不同元數據元素之間建立準確可用的映射起到非常重要的作用。為滿足不同類型的文獻對于元數據的不同需求,中國音樂大典數據庫在遵循國際標準、國家標準和行業標準的前提下,以都柏林核心元數據為基礎,制定出十幾套元數據描述類型和對應的著錄體例,如著作類元數據、學位論文元數據、期刊文獻元數據、古代樂譜元數據、近現代樂譜元數據、民間樂譜元數據、音像編元數據、圖像編元數據等,涉及曲名、作詞、作曲、演唱、傳譜、演奏、伴奏、劇目、角色、聲腔、民族、打譜、譜本名稱、版本信息、年代、編者、提要等上百條元素,從而可以對各種不同格式、不同來源、不同類型的文獻進行有效組織,合理類聚,形成互聯互通的中國音樂知識網絡。
中國音樂大典數據庫在四個子庫的基礎上,設計了科學、合理、專業的分類導航瀏覽體系,并根據資源類型、年代、藝術門類、民族、樂種、作品等,將相同字段、相近主題特征的數據聚合在一起,提供基于文獻內容和外部特征的知識鏈接,有助于厘清四編內容之間的內在聯系,有效解決各編資源松散孤立的問題。與此同時,數據庫利用語義化共詞分析方法實現基于主題的多維度聚合⑤劉偉:《基于內容特征元數據的多源異構科技資源關聯聚合研究》,《中國科技資源導刊》,2020年,第5期,第28-34頁。,形成類目體系之外的聚類層次:比如文論編提供時間、期刊、院系機構、出版社等聚類;樂譜編提供譜式、譜本、體裁聚類;音像編提供時間、采錄地點聚類等;圖像編提供表演照、事件照、人物照、樂器照聚類。如此這般,不同的資源類型聯動不同的聚類,使得數據庫的層級更鮮明,為用戶提供更多的關聯內容,數據檢索結果也更加理想,便于知識的分享與推薦。
中國音樂大典數據庫秉持“一切面向服務”和“簡化用戶體驗”的設計原則,系統頁面清晰簡潔,配色輕松淡雅,欄目主次分明,結構合理清晰,數據顯示集中,操作簡便靈活。登錄用戶可以對檢索結果進行收藏、分享、推薦、下載、保存、打印等豐富的個性化服務。數據庫將PDF文件都添加了目錄,并可進行放大、縮小、旋轉、全屏閱覽、快速跳轉等功能。另外,數據庫支持門戶布局、框架的自定義以及功能模塊的擴充和調整等個性化定制。
數據庫后臺管理系統采用 VUE+Elementui的集成方案,內置了i18國際化解決方案,提煉了典型的業務模型,設計了圖表化數據分析和統計功能。業務人員可按照四編聚類特點進行學科、專業、體裁、民族、樂種、譜式等方面的數據統計和數據分析功能,分析結果以柱狀圖、餅狀圖、地圖等形式展現出來,滿足各編信息資源的統計和數據共享過程中的應用和管理需求,為《中國音樂大典》的進一步研究提供便利的條件。
中國音樂大典數據庫是《中國音樂大典》編纂項目不可或缺的一部分,同時也是學院信息化建設頂層設計的項目之一。數據庫整合了《中國音樂大典》的海量數據資源,實現了對文論、音視頻、樂譜、圖片等多種數據資源的發布、存儲及管理,為保存、傳承和利用中國音樂資源、弘揚中國音樂文化發揮了應有的作用。