□姚樂野 王阿陶 蔡娜
“5·12”汶川地震文獻專題數據庫建設相關問題探討*
□姚樂野 王阿陶 蔡娜
建設“5·12”汶川地震文獻專題數據庫旨在保存人類歷史記憶、傳承民族精神,供學術參考和行政決策以及為其他專題文獻數據庫建設提供借鑒。數據庫建設平臺的規劃與設計圍繞系統管理、數據管理、用戶共享、門戶基本服務、文獻檢索與服務展開,其中文獻量的增加、文獻質量控制與及時更新,以及提供利用的開放性與公益性是該數據庫建設的關鍵與難點。項目的創新之處在于新的數據庫定位思路、文件數據庫及開放資料收集平臺的引入以及一批標準規范的制定,而該項目的最終研究成果表現為研究報告及數據庫兩大部分。
地震信息 專題文獻 數據庫 汶川地震
* 本文系四川省哲學社會科學“十一五”規劃項目【2008】“‘5·12'汶川地震文獻專題數據庫建設研究”課題成果之一(項目批準號:SC08B06)。
“5.12”汶川地震是新中國成立以來最大的一次地震,其影響之深遠前所未有。地震發生后,國內各級政府、企事業單位、社會組織、外國政府及國際公益組織紛紛通過各種方式支持抗震救災及災后重建,由此產生了大量文獻。但是這些文獻資料的分散性、格式的多樣性和存儲介質的不穩定性等因素,都使得這些文獻的保存岌岌可危。因此對這些文獻進行收集、整理、長久保存并提供利用不僅成為災后重建精神家園的一部分,而且從保存人類重大歷史事件的角度來看,也是當務之急。鑒于此種緊急之狀況,“5.12”汶川地震文獻專題數據庫建設研究項目因此設立。
建設“5.12”汶川地震文獻專題數據庫的目的在于,通過現代化技術手段實現對分散、無序的有關“5.12”汶川地震的各類文獻信息資源進行系統的收集、整理、輸出,建立一個集全文、書目、圖像、音視頻等為一體的綜合專題文獻數據庫,為用戶提供有關汶川地震這一專題的全方位的、立體式的文獻資料,并通過以后與其他相關數據庫的信息共建促進本地區乃至全國的地震文獻信息資源共享。
基于此種建庫目的,項目組對“5.12”汶川地震文獻專題數據庫建設的各方面需求進行了分析:
“5.12”汶川地震是建國后震級最大的一次地震,使人民的生命財產遭受到極大損失,并且這種破壞力的影響還將在未來持續很久。作為人類社會發展進程中的一次重要歷史事件,今人有義務將這一段歷史保存并流傳下去。但在今天的網絡環境下,信息資源呈爆炸性增長,且信息的分布呈分散、無序的狀態,給利用造成極大困難。要想讓汶川地震相關文獻有效地為用戶所用,必須對它們進行有效的收集、組織、整合,使這一專題文獻更為集中、條理、有序,使其可獲得性得以保證和提高[1],從而使用戶可以方便、快捷地查詢。“5.12”汶川地震文獻專題文獻數據庫建設的開展,可以使各種類型、格式、內容的汶川地震文獻被加以甄選、著錄、保存入庫,使汶川地震這段人類集體記憶被翔實的數據保存和記錄下來,并全面、真實和完整地揭示此次地震及其對人類產生的各方面影響,這既是對歷史文獻的保存,又是人類歷史記憶的延續。
在此次汶川地震中,中國人民表現出了團結果敢、自強不息、勇往直前、前赴后繼、舍生忘死的偉大民族精神。這些民族精神是我們中華民族五千年生生不息、發展壯大的強大精神動力,也是在未來歲月里薪火相傳、繼往開來的強大精神動力。而這些精神力量通過有關此次地震的各種文字、圖片和音視頻資料等展現無疑。通過這些文獻,全國各族人民不僅可以體會到中華民族在災難面前的偉大精神,感受到民族精神對于家園重建的支持力量,年輕一輩還可以從中汲取到中華民族在災難面前眾志成城、頑強拼搏、自強不息的偉大民族精神,可以從中感悟到自己作為未來民族脊梁的責任,并且激勵他們樹立團結、奉獻、愛國、自強的民族氣節。因此,“5.12”汶川地震文獻專題文獻數據庫的建成對民族精神的傳承和傳播也有著非常積極的促進作用,同時又對年輕一代起到了愛國主義教育的作用。
“5.12”汶川地震文獻專題文獻數據庫將全面收錄關于此次地震的文件、圖書、期刊、報紙和學位論文等各類文獻,而且本數據庫定位于及時更新、持續生長,一旦新的政府決策及研究成果出現就會在第一時間被收羅入庫。因此,該數據庫保存文獻的權威性和價值毋容置疑,這些文獻不但能反映國家對于地震災區的政策趨向,反映學術研究等方面的動態和水平,還可以普及防震知識,適應不同科研機構對于文獻在針對性、適用性上的需求,對于支持災區重建并盡快恢復生產,為政府部門抗震救災的決策提供信息支持,為地震監測、預防和科學研究機構提供最新的研究成果等各方面也都具有十分重要的意義。
“5.12”汶川地震文獻專題數據庫建設項目圍繞數據庫建設的總體需求特別制定了九個子數據庫建設標準規范——《文件數據庫建設標準規范》、《網絡文獻數據庫建設標準規范》、《報紙文章數據庫建設標準規范》、《期刊論文數據庫建設標準規范》、《圖書數據庫建設標準規范》、《學位論文數據庫建設標準規范》、《圖片數據庫建設標準規范》、《音視頻數據庫建設標準規范》、《導航數據庫建設標準規范》。這些標準規范站在圖書館普通用戶,更多的是社會用戶的角度對著錄對象進行選擇,以用戶方便快捷的利用文獻為目標確定著錄項目,并在此基礎上規定了元數據元素描述方法和著錄細則。這些標準規范既具有理論上的科學性、規范性,又具有實際操作的合理性、可行性,值得其他專題文獻數據庫參考借鑒。
“5.12”地震文獻專題數據庫平臺規劃與設計是指為完成系統目標而對系統功能做出規劃和定義,并通過軟件開發和集成的方式形成統一的系統平臺。
“5.12”地震文獻專題數據庫平臺的功能模塊包括:系統管理、數據管理、用戶共享、文獻檢索與服務、門戶基本服務。“5.12”地震文獻專題數據庫建設平臺的功能模塊結構如圖1所示:

圖1 功能模塊結構圖
系統管理功能模塊為“5.12”地震文獻專題數據庫系統管理人員提供系統管理設置功能,是其他模塊正常運行的基本保障。該模塊由用戶管理、日志和統計模塊、系統數據維護組成。
數據管理模塊是提供“5.12”地震文獻專題數據庫數據的采集加工、著錄入庫、質量檢查等業務流程的網絡操作平臺,是內容管理的重要模塊。該模塊由數據錄入、數據審核、數據導入、數字對象數據加工、數據發布、數據操作日志、數據備份組成。
“5.12”地震文獻專題數據庫平臺為用戶提供了開放式內容建設平臺,接收任何讀者符合法律規范的和“5.12”地震相關,滿足系統數據質量檢查基本要求的文獻。用戶共享模塊由共享數據接收、共享數據審核、共享數據入檔組成。
患者主要在床上完成康復治療,需要輕度活動、定時變換體位并且合理擺放肢體,這樣可以讓肢體處于功能位置,避免出現關節變形或者攣縮的問題,進而保證患肢的正常血液循環,奠定下一步康復治療的基礎。
“5.12”地震文獻專題數據庫平臺門戶的基本服務是對各類用戶提供認證管理及服務功能。門戶基本服務主要包括項目相關信息發布、項目社區服務、訪問認證、網站導航。
文獻檢索與服務是“5.12”汶川地震文獻專題數據庫平臺提供給用戶的核心功能,用戶需要通過文獻檢索與服務方便快捷準確地獲取所需的“5.12”地震文獻。文獻檢索與服務由文獻瀏覽、文獻導航、文獻檢索與文獻整合服務四部分組成。
“5.12”汶川地震文獻專題數據庫建設中的關鍵問題在于文獻量的增加、文獻質量控制與及時更新。
由于時間、人員等方面的限制,目前本數據庫收錄的文獻數量還較少,但項目組成員的增加及穩定性的保障可以使該數據庫文獻保持持續性增長的態勢。另外,有關汶川地震的新文獻也在不斷產生,這也決定了本數據庫的建設也是一項集長期性、持續性為一體的工作。此外,作為民間文獻資料收集渠道的開放資料收集平臺也是增加文獻量的一個重要途徑。該如何擴大宣傳,吸引更多的民眾將自己收集的有關汶川地震的文獻資料上傳到平臺不僅是廣泛收集文獻的重要推動力,更是提高數據庫的影響力、影響范圍,實現其社會效益的確實舉措。為此,項目組決定積極借助新聞媒體的力量開展各種形式的宣傳、推廣活動,實現文獻收集與社會效益的雙贏。
在文獻量穩步增長的情況下,對文獻質量進行控制是數據庫整體質量得以保證的關鍵。因此,項目組在原有著錄人員數量不變的基礎上,增加若干碩士以上學歷的具有一定標引實踐經驗的數據質量控制人員,首先以文獻的全面性、準確性、實用性和針對性為原則[2],對文獻的收集渠道、著錄對象界定等源頭方面進行把關,對文獻的質量進行首次控制;其次對著錄方法進行嚴格限制,對文獻標引的詞表選用、標引范圍、標引類型、標引深度等都進行了明確規定,努力使各著錄項目達到科學、準確;最后對已著錄完成的文獻進行抽查。三個環節的嚴格把關和控制極大地提高了數據庫的文獻質量,保證了文獻的科學性、權威性。
由于有關汶川地震的文獻在不斷產生,因此文獻的及時更新成了衡量數據庫整體效能的標準之一。在對已有文獻進行高效收集、著錄的同時對新產生的文獻進行及時的采集和挖掘,是實現數據庫文獻及時更新的保證。項目組最初采用人力采集網絡文獻的方法已顯露出其速度慢、準確性低以及無法避免重復采集的弊端,因此項目組及時調整網絡文獻的收集方法,轉而利用新的技術手段——RSS、WEB信息挖掘等方法解決了網絡文獻及時更新的問題。
“5.12”汶川地震文獻專題數據庫在建設之初就以開放性、公益性為其未來的發展方向。開放性是指該數據庫系統正式投入使用后將采取向社會全面開放、不設置任何權限地提供文獻資料,并且通過開放資料收集平臺,任何人都可以將其符合要求的文獻資料上傳到數據庫內,并以同樣的方式為社會所用。公益性是指任何人利用數據庫中的文獻都不收取任何費用,數據庫提供的所有服務也都是免費的。但提供利用的開放性面臨的窘境是如何避免版權糾紛,公益性的困境是如何在公益性的前提下保證數據庫的正常運行,畢竟該數據庫的持續發展需要大量人力、物力、財力的投入。而這也是本數據庫建設項目組下一階段需進行深入研究、解決的問題。
“5.12”汶川地震文獻專題數據庫較之于一般的專題文獻數據庫,其主要的創新之處有如下方面:
一般高校圖書館的專題文獻數據庫大都服務于本校的教學、科研,因此其服務對象也以本校教師、學生為主,因此,在收集文獻的種類方面具有一定的標準,以學術論文為主,輔以其他的科研成果[3]。而“5.12”汶川地震文獻專題數據庫突破了僅僅為一定范圍內用戶服務的局限,以保存人類集體記憶,傳承民族精神為目標,將所有民眾作為自己的用戶。因此,該數據庫在收集文獻的種類方面,不再局限于科研成果,而是將所有有關此次地震的各類文獻都納入到收集范圍,涉及文件、圖書、報紙、期刊、學位論文、圖片、音視頻、網絡文獻、網站,涵蓋了有關此次地震的所有文獻種類。從某種意義上說,該數據庫的建成為專題文獻數據庫的建設打開了一條新的思路,提供了一種視野更為寬廣、服務對象更為龐大、記錄更為全面的重大歷史事件的記錄、保存方法。
基于不同于一般專題文獻數據庫的定位,“5.12”汶川地震文獻專題數據庫中引入了文件數據庫,這在國內尚屬首次。而圍繞專題文獻數據庫建設對文件數據庫制定的《文件數據庫建設標準規范》也是前所未有的。目前國內文件著錄元數據是從電子文件管理人員的角度出發,以電子文件的產生、流轉、保存為設計目標,以實現不同機構、不同系統之間文件及信息的互操作,為電子文件在不同時間、不同空間、不同應用軟件中的再利用提供統一的元數據。而《文件數據庫建設標準規范》是從普通民眾的視角出發,以文件的信息內容提供為設計目標,因此,在著錄對象的界定、著錄項、著錄對象元數據元素描述方法和著錄細則等方面都與現有電子文件元數據標準規范有很大不同,例如,著錄項主要圍繞文件的快速檢索、方便利用,而減少了對文件原始性方面的要求。因此,該文件數據庫及其標準規范可以說是專題文獻數據庫建設中的一個創新,也可為其他同類型的專題文獻數據庫中文件數據庫的建設提供參考借鑒。
形成的10余萬字的《“5.12”汶川地震文獻專題數據庫建設研究報告》包括了《文件數據庫建設標準規范》、《網絡文獻數據庫建設標準規范》、《報紙文章數據庫建設標準規范》、《期刊論文數據庫建設標準規范》、《圖書數據庫建設標準規范》、《學位論文數據庫建設標準規范》、《圖片數據庫建設標準規范》、《音視頻數據庫建設標準規范》、《導航數據庫建設標準規范》共9個子數據庫的標準規范。這些標準規范是基于對“5.12”汶川地震文獻的特點、基于本數據庫建設目標而制定的,具有極強的針對性和應用性。另外,這九個標準規范涉及文件、網絡文獻、報紙文章、期刊論文、圖書、學位論文、圖片、音視頻、網站共9種文獻類型,是對這9種文獻的著錄項、元數據元素及著錄細則等方面進行深入研究的基礎上做出的,既具有理論上的科學性、規范性,又具有實際操作的合理性、可行性,本身就具有一定的學術研究價值,不僅能補充和完善目前國內專題文獻數據庫標準化建設中多種類型文獻數據庫標準規范的缺失,還可供同類數據庫的建設者參考、借鑒,可以說,這些標準規范是融學術價值和應用價值為一體的。
將開放資料收集平臺引入圖書館專題文獻數據庫尚屬首次。目前開放資料收集平臺作為文獻資料的收集方式之一,多在網站論壇出現,而將其引入“5.12”汶川地震文獻專題數據庫建設中,作為一種民間文獻資料收集的有效方式可以使那些保存于個人手中的珍貴文獻有了提交集中保存的途徑,而各種載體、類型的文獻經過收集、加工、整合后進入數據庫,不僅其可獲得性得以提高,而且也能進一步補充和完善數據庫文獻。另外,開放資料收集平臺的開放性、互動性在一定程度上提高了人們對于汶川地震文獻的關注度,是整個數據庫建設中的亮點之一。
“5.12”汶川地震文獻專題文獻數據庫建設研究項目的最終成果由兩大部分組成:
首先對汶川地震文獻的來源、類型、格式、主題等各方面進行充分調研,在此基礎上確定將9個子數據庫和一個開放資料收集平臺作為該專題數據庫建設的主要內容,并對數據庫建設的可行性等進行論證,以確保項目的順利進行;在確定了數據庫的組織框架后,項目組共同制定了9個子數據庫建設的標準規范,以確保所有類型的有價值的文獻均能科學、規范地收羅入庫。另外,為保證數據交互能力合乎相關技術規范要求,保障系統的穩定性、兼容性和持續維護能力,最終確定采用微軟公司WEB開發工具軟件組合WINDOWS 2003+SQL Server+Asp.net 2.0,以此為基礎,對系統平臺進行規劃與設計,制定了平臺功能模塊結構圖,對系統管理、數據管理、用戶共享、文獻檢索與服務、門戶基本服務5個模塊的具體功能進行了劃分與明確,為數據庫建成后的開放、利用指明了方向。在權衡了資源、成本、管理三方面的因素后,項目組提出通過技術、標準、管理、安全4個總體策略以解決數據庫文獻的長期保存問題。最終,項目組將各方面的研究結果匯總為十余萬字的《“5.12”汶川地震文獻專題數據庫建設研究報告》。
基于“5.12”汶川地震文獻專題數據庫建設的研究成果,圍繞9個數據庫建設標準規范中的各項規定,構建“5.12”汶川地震文獻專題數據庫系統平臺是本項目的另一成果。通過對WEB服務器平臺建設、SAN存儲環境平臺建設,“5.12”汶川地震文獻采集加工平臺、“5.12”汶川地震文獻著錄平臺、“5.12”汶川地震文獻發布平臺的研發與集成,該數據庫系統平臺構建完成。在經過數次試運行、試著錄的檢測最終確定了的著錄平臺上,一批由碩士、博士組成的著錄人員對分散保存在各類組織、個人、網絡中的有關“5.12”汶川地震的具有代表性的、對國家和社會具有長久保存價值的文獻資料進行收集、整理和著錄標引。
“5.12”汶川地震文獻專題數據庫系統平臺的構建為有關“5.12”汶川地震的具有典型性、代表性的各類文獻提供了長期保存的平臺,同時在針對重大歷史事件建設專題數據庫方面做出了重要的實踐。
已建成的“5.12”汶川地震文獻專題數據庫是目前國內收集汶川地震文獻種類最多、范圍最廣、數據量最大的數據庫。該數據庫收錄了文件、網絡文獻、報紙、期刊、圖書、學位論文、圖片、音視頻、網站共 9類文獻。9個子庫收錄的文獻內容涵蓋了地震實況、抗震救災、災后重建、捐贈援助等各個方面。可以說,所提供的汶川地震文獻的類型之多、內容之全面是前所未有的。到目前為止,該數據庫共著錄數據2萬余條,其中全文文獻占 30%。由于國內相關文獻不斷產生,因此數據庫中的數據也將隨之繼續增加,從而形成一個動態的、可持續生長的有關汶川地震文獻的大本營,并成為永久保存汶川地震這一重大歷史事件記憶和向所有用戶開放的公益性門戶網站。
1 張久珍.論圖書館信息資源整合機制的建立.圖書館雜志,2005(1):10-14
2 金甦文,許征尼等.巖土工程專題數據庫的規劃與建設.圖書館工作與研究,2007(5):66-67
3 黃桂鳳.高校圖書館特色數據庫建設的若干對策.圖書館雜志,2005(12):45-47
Discussion on the Construction of“5.12” Wenchuan Earthquake Database
Yao Leye Wang Atao Cai Na
The purposes of the“5.12” Wenchuan earthquake database project are preserving the history,inheriting the national spirit,as so as providing reference to academic study and administrative decision.The construction of the database tackles with the system management,data management,user sharing,basic service of portal and literature retrieval.The major issues in the database construction include data collecting and quality control,real time update,and assurance of the openness and nonprofit.Innovations of this project lies in its new design of the database,implementation of the file database and open platform,and the adoption of a group of standard specifications.
Earthquake Information;Thematic Document;Database;Wenchuan Earthquake
姚樂野,四川大學公共管理學院;王阿陶,四川大學歷史文化學院;蔡娜,四川大學圖書館;成都,610064
2009年6月18日