邢明旭
中文在線將與CBDB項目組共同打造中國古籍數據的數字人文資源平臺,重構古文獻研究服務新脈絡。
不少重要時刻的誕生都緣自不經意的邂逅。正如2017年的深秋,大洋彼岸的美國哈佛大學校園內,一位中國訪學者與美國教授的一次偶然相遇,不僅讓兩人成為志同道合的好友,更讓CBDB(中國歷代人物傳記資料庫)走進了中文在線董事長兼總裁童之磊的視野,并幫助這一由海外學者牽頭、歷時30余年打造的中國歷史人文寶庫得以漂洋過海,普惠更廣泛的用戶。
剛剛過去的3月,這一愿景在初春的上海迎來了它抽枝發芽的一刻。中文在線數字出版集團股份有限公司董事長兼總裁童之磊、哈佛大學費正清中國研究中心包弼德教授、北京大學中國古代史研究中心史睿博士齊聚滬上,共同簽署了CBDB(中國歷代人物傳記資料庫)項目合作協議。在不久的將來,中文在線將與CBDB項目組共同打造中國古籍數據的數字人文資源平臺,重構古文獻研究服務新脈絡,并運用人工智能技術,提高處理歷史資料的效率和準確度,聚合更多主題并不斷優化用戶體驗。
“CBDB是現今數字人文(Digital Humanities)技術發展過程中的前沿成果,這與從誕生之初便以數字傳承文明為使命的中文在線的愿景不謀而合。過去,中文在線主要在大眾出版、教育出版兩個領域謀篇布局。與CBDB的合作,則象征著中文在線在專業出版邁出的第一步。”童之磊指出,“中文在線有使命去推動CBDB的發展和傳播,與更多有志于傳承中華文明的同伴共建數字人文的新未來。”
緣起哈佛
在童之磊看來,人類文明和文化產品的發展經歷過三個階段。在經歷了上世紀90年代從傳統紙媒向數字化內容的轉換后,如今人類文明的存續已經進入了全新的階段——數字人文時代。
相較于單純的紙本數字化,數字人文時代有何獨特之處?“數字人文是用數字化的方式將人文資料進行重構,利用大數據、神經網絡分析等數字技術,構建新的人文體系,這是未來非常重要的趨勢。”童之磊告訴《出版人》。“其次,數字人文時代充分發揮信息技術的優點,跨越時空,對過去的人文資料進行高效的處理。這樣的重構還創造了很多新的可能性,比如過去鮮有人考慮到的人文資料和地理信息的結合。所有這些,都讓我們得以看到全新的人文浪潮席卷而來。”
從2000年創辦以來,中文在線在過去的18年間成為了大量中國經典作品的傳播平臺,這其中包括巴金、莫言等文學巨匠的作品,也包括季羨林、啟功等人文社科領域的大家之作。而在童之磊看來,未來中文在線很重要的一步便是在數字人文方面持續推進。
“在這個過程中,我特別榮幸地在過去一年的哈佛大學訪學期間認識了包弼德教授,并深深地為他和CBDB項目組多年來的努力所折服。”童之磊告訴《出版人》。
在包弼德教授的介紹下,童之磊對于CBDB有了深入的了解。據悉,CBDB是由哈佛大學費正清中國研究中心、北京大學中國古代史研究中心、中研院歷史語言研究所共同主持的學術數據庫,該項目旨在將計算機技術與人文社會科學相結合,系統性地對中國歷史上所有重要的傳記資料進行數字化處理,以便采用社會科學方法研究中國歷史。研究人員可以通過檢索人物ID或人名(漢字或拼音),返回豐富的結構化人物傳記資料(生卒、別名、地理信息,任官、親屬關系、社會關系等),即在以傳統感性為主的人文學科研究基礎上引入理性技術手段,將定量分析與定性分析融為一體,輸出可視化的成果。截至目前,該數據庫共收錄超過41萬人的傳記資料。
“CBDB體量之龐大、內容之深入讓我印象深刻,客觀來講,之前在國內鮮有類似的以人物傳記構建的中國歷史文化數據庫。”童之磊告訴《出版人》,而更加令他感到震撼的則是包弼德接手CBDB背后的原因。“包弼德教授告訴我,在他學習世界歷史時,中國是19世紀才出現的,該過程似乎就像人們發現了一個世界文明的旁支。這令包弼德教授非常震動,中國這樣一個幾千年沒有中斷的文明,卻在西方的世界史研究架構當中出現如此之晚,且份量如此之輕。正是基于此,包弼德教授決定接受并延續CBDB的生命,讓更多的人了解中國的歷史和文化。”
“中文在線誕生以來的愿景,就是數字傳承文明。很快我便認定,中文在線有使命來推動CBDB這項對中華文明意義重大的工程的發展和傳播。”
助推CBDB普惠大眾
牽手后,中文在線將為CBDB注入怎樣全新的活力?在采訪中,童之磊和中文在線研發中心常務副總經理朱厚權向記者做了詳細的介紹。
“首先很重要的一點,便是CBDB的大眾化。”童之磊說。“當前CBDB項目成果的使用對象主要是非常專業的科研人員,在易用性、合理化、友好性等方面還存在相當大的升級空間,這也是中文在線承接這個項目后首先要改進和升級的地方。”
“很重要的一個工作,便是增加簡體版和拼音版。”朱厚權補充道。“另外,去年清華附小四年級學生利用大數據研究蘇軾并寫出一系列論文的事件受到社會的關注,中文在線也和該校老師進行了交流,設想如果在當時有CBDB這樣的數據庫可以提供給學生,類似的研究便會非常方便。”朱厚權說。“另一方面,數字人文研究人員需要大量基于B/S的定量和定性分析工具,以解決網絡資源和本地資源的組合利用困境,因此為研究人員提供豐富、多樣、易操作的分析工具、接口和方法也是重點。”
其次,便是多方關注的商業化。“CBDB過去更多地以非商業化的方式發展。這有其優點,卻也使其面臨如何持續、穩定發展的挑戰。”童之磊指出,今天人類文明的發展很大程度上是和商業文明的發展并行的,沒有商業文明的發展,不可能出現像蘋果手機這樣集合高科技和人性化于一體的優秀產品,正是因為商業的推動,很多科學技術才得以廣泛地被使用,并產生巨大和持久的生命力。“中文在線要做的,就是把CBDB進行增值開發,為用戶帶來更大的價值,相信用戶也愿意因此付費。”包弼德教授也對此次CBDB牽手中文在線提出了自己的想法。“學者沒有能力進行商業運作,但‘中文在線可以。他們把學者打造的數據庫,變成所有人都可以利用的工具,這點非常重要。這樣學者就可以專注于學術,讓商業和學術各自去完成擅長的部分。”
最后的落腳點則是創新。童之磊指出,中文在線希望在CBDB數據庫中,重構古文獻研究服務新脈絡,創造研究歷史人文的全新坐標體系。“通過時間、地點、人物三個維度,打造史學的三維研究空間,當我們確定三個坐標,便可以聚焦到每個事件,這是非常有意義的新型研究模式。”
而在具體落地方面,“我們一方面將努力擴大CBDB在國內的應用范圍,并引入更多圖書館領域的合作方,充實CBDB數據庫內容資源;二是提供一定的科研支持,吸引更多高端學術人才加入CBDB項目組;三是將CBDB的成果分用戶層級地展示給不同的用戶,如可以單獨制作中小學傳統文化教育中涉及的重要歷史人物庫,以方便中小學生用好、學好相關知識。”朱厚權告訴《出版人》。
對于CBDB的商業化引入,同時身為共建方和使用者的北京大學相關負責人也在接受《出版人》采訪時談及了自身的理解。“在傳統的史學研究領域中,‘數字人文還沒有得到廣泛應用;而與中文在線合作后,除了希望把以前的工作做得更深入之外,也期待CBDB加入更標準化、更通用的工具,建成完善的‘網絡基礎設施,使數據庫除了在學術上應用以外,也能推向公眾,讓普通人也更方便地了解中國歷史人物的事跡、著作、生平等。”北京大學中國古代史研究中心副所長史睿如是說。
北大圖書館副館長聶華表示,CBDB數據庫在圖書館界久負盛名,是中國歷史資料數據庫的鼻祖,從各個方面來講本次引入都很有意義,國內高校圖書館及公共圖書館對其的需求也毋庸置疑。而作為用戶代表,面對數據庫的商業化,聶華認為“從理智的角度看,商業化是正確的選擇。多年來,各方專家學者團隊,包括中文在線接手以來,都在該項目上投入了大量的人力和財力資源。商業化能夠更好地維持CBDB繼續健康地發展下去”。但聶華同時也指出,就最終的目的而言,希望能夠讓CBDB開發者、企業、使用者三方共贏,“只有共贏才是真正可持續的模式。”
在童之磊未來的愿景中,未來重新構建后的CBDB不僅面向國人,更要面向世界。“讓全球無數有尋根訴求的華人以及對中華歷史文明感興趣的人們受惠,一起擁抱數字人文的新未來。”童之磊說。