999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文獻計量學的中文古籍數字化研究分析

2011-12-31 00:00:00韋楠華
現代情報 2011年10期

〔摘要〕以《中文科技期刊數據庫》、《中國知網》、《萬方數據資源系統》為數據統計源,采用文獻計量學方法、內容分析法對1995-2010年間發表的464篇有關古籍數字化研究的論文進行梳理,從論文發表年份分布、期刊分布、著者分布、研究主題內容等方面進行多角度的統計分析,揭示古籍數字化領域的研究現狀、存在問題以及未來的研究發展方向。

〔關鍵詞〕古籍;數字化;文獻研究;文獻分析

收稿日期:2011-07-23

作者簡介:韋楠華(1980-),女,館員,研究方向:信息咨詢,發表論文6篇。

DOI:10.3969/j.issn.1008-0821.2011.10.025

〔中圖分類號〕G255.1 〔文獻標識碼〕A 〔文章編號〕1008-0821(2011)10-0107-05

An Analysis of Digitization of Chinese Ancient BooksResearch Domain Based on Bibliographical Metrology

Wei Nanhua(Library,Guilin University of Electronic Technology,Guilin 541004,China)

〔Abstract〕Use of bibliometric methods and content analysis,based on the database resources system of“Databases of Chinese Scientific and Technical Periodicals”,CNKI,“Resource system of wanfang data”,this paper investigated the research articales on Digitization of Chinese ancient books from 1995 to 2010,and made an all-round quantitative analysis from such aspects as chronological distribution,journals distribution,primary authors,contents,and subjects,etc.,which gave us general pictures of this research topic,its on-going research situation and its developing trends.

〔Key words〕chinese ancient books;digitalization;literature research;quantitative analysis

古籍數字化是古籍信息資源開發利用的重要環節,對其相關理論的研究則為這一重要環節提供有力的理論支持和重要的方向指引。伴隨著古籍數字化實踐工作的不斷進展,國內諸多領域學者對古籍數字化的理論研究也不斷深入與拓展,取得了一定的成果。本文選取1995-2010年這一時段,對這一時期的研究成果文獻進行了較為全面的收集與調研,以期在科學量化指標的基礎上,揭示該領域的研究現狀及發展趨勢,提出進一步研究的建議和設想。

本文以《中文科技期刊數據庫》、《中國知網》、《萬方數據資源系統》為數據統計來源,采用粗檢與精檢相結合的文獻調查方法。檢索詞分別為:古籍、古籍整理、古典文獻、古代文獻、善本、律詩、古詩、古文,在檢索結果中再以數字化、電子化、計算機等詞進行二次篩選,排除新聞報道類文獻(如消息、通知等),共檢索到相關研究論文464篇。利用Excel軟件從作者、題名、主題/關鍵詞、刊名、出版年、作者單位等進行數據梳理和分析,進而對上述研究文獻發表的年代數量分布、期刊分布、作者構成、主題內容等方面進行了文獻計量分析。

1 文獻數量分析

文獻的數量反映了該學科領域的研究水平和發展程度。1995年1月至2010年12月有關古籍數字化的研究,檢索到相關的研究論文有464篇,其中包括博士論文7篇,碩士論文28篇,其年份曲線分布見圖1。

從圖1中可以看出,1995年以前論文數量較為稀少,1996年以后論文數量開始呈現迅速增長,這與古籍數字化的研發實踐是密切相關的。古籍數字化的實踐工作緣起于上世紀80年代初期,但直到1996年左右,伴隨著計算機、

網絡技術的迅速發展,其研發才真正開始規模化的發展。特別是1998年以后,一些古籍數字化建設重大成果相繼誕生,如比較具有代表性的成果《文淵閣四庫全書》電子版、《中國基本古籍庫》等,逐漸引起了人們的關注與重視,圖書情報界、文史界、計算機技術界都積極參與了這一領域的研究工作。

總體來看,文獻數量呈波浪形向上增長的趨勢。可以看到,每當數據有較大的跳躍時,其后的數據會有一些回落,而其余年份,數據的增長較平緩。可推測,大幅度的增長可能與當時出現的某個專題相關,而這種專題知識是瞬時性的,不會給以后的文獻量帶來很明顯的變化。如2001-2003年論文增量迅速,大部分論文涉及到古籍書目數據庫建設,顯現了這一時段學術界比較關注的焦點。2005-2007年又出現一次小高峰,該時段的論文主要集中在對古籍數字基礎理論問題的研究,不再局限于單純的實踐研究,說明這一時段人們認識到古籍數字化基礎理論問題的重要性。

而博碩士論文的出現最早則在2000年,此后每年與古籍數字化相關的論文均有出現,說明這一領域的研究是比較活躍的,對古籍數字化的研究還有待我們進一步深入的探索與研究。

需要說明的是,目前發表于網絡上的文獻中,也有不少文獻論及古籍數字化研究,具有一定的學術參考價值,但是限于篇幅、網頁的穩定性等多種原因,它們不作為本文的統計研究對象。

2 期刊來源分析

2.1 期刊類型分布

對研究論文的來源期刊分析,一方面可以了解該領域涉及的學科范疇,另一方面可以確定該領域的主要期刊。表1顯示,除去博碩士論文35篇外,429篇期刊論文分布于159種期刊中,平均每種期刊發表有關古籍數字化的論文2.71篇。其中,56種圖書情報類期刊刊登了275篇論文,占論文總數的64.1%,而其余近35.9%的論文則分布在文史類、新聞出版類、計算機技術類、大學學報類等其它類期刊中。這種分布說明當前古籍數字化研究主要集中在圖書情報學領域界,同時文史、出版、計算機等其它領域的科研人員也參與了這方面的研究。

表1 古籍數字化研究論文的期刊類別分布

2.2 期刊載文量分析

對載文量的分析,一方面可以確定該研究領域的核心期刊,另一方面可以了解該學科研究的成熟程度。如果將期刊按發表論文數量的多少來排列(見表2),則可以按照文獻發表數量大體相當的原則把排序的期刊分為3個區:①載文8篇及以上的期刊有14種,其載文量139篇,占論文總數的32.4%;②載文4~7篇的期刊有24種,其載文量為129篇,占論文總數的30.07%;③載文1~3篇的期刊為122種,其載文量為161篇,占論文總數的37.53%。每個區的期刊載文量約為全部期刊載文量的1/3。第一區n1為核心區,第二區n2為相關區,第三區n3為離散區。則這3個區域的期刊數比例為:n1∶n2∶n3

1∶1.7∶8.7(14∶24∶122),這與布拉德福定律n1∶n2∶n3

1∶a∶a2(a為大于1的常數)存在一定的差距,離散區的期刊數量比例較大,這說明古籍數字化研究領域的核心期刊雖然具備了一定的雛形,但是目前該學科領域的研究處于成長期,仍需廣大學者繼續努力探索。

表2 古籍數字化研究論文期刊載文量分布

3.67。所以,凡是發表4篇及以上論文的作者都可以被稱為1995-2010年間古籍數字化的核心作者,由此計算古籍數字化研究領域的核心作者人數為9位。又根據普賴斯定律,只有“核心作者發文量占總發文量的50%”時,學科的高產作者群才可以形成。由表4數據計算可知古籍數字化研究領域的9位核心作者發表了59篇論文,僅占論文總數的12.72%,遠低于普賴斯定律的要求。因此,可以說古籍數字化研究領域穩定的核心作者群尚未形成。

從單個作者來看,毛建軍的研究成果最為突出,從2006年開始發文,到2009年的博士論文公開出書發表,一共發表了24篇論文。其論文比較全面的介紹了我國東北地區、江蘇地區、西南地區、臺灣,以及國外如日本、歐美等地古籍數字化資源的建設情況,進而對古籍數字化相關理論進行了較為系統的研究與梳理。他在2008年完成的博士論文《古籍數字化理論研究》中從古典文獻學和古籍整理學角度系統提出了古籍數字化的基本理論框架,提出了古籍電子索引、古籍書目數據庫以及古籍全文數據庫的概念,對古籍數據庫的規范提出了評價標準。另外從發表論文時間的跨度上看,王立清、鄭永曉兩位作者的研究也較長,分別為2003-2009年、2004-2009年,說明了他們對此領域的持續關注和連續性研究。其中,王立清在2006年完成的博士論文《中文古籍數字化研究》中,對古籍數字化相關概念、古籍數字化現狀、古籍數字化發展模式、古籍數字化的選題與成本效益評估、古籍數字化支撐體系中的標準、技術、人才的方案,以及古籍數字化的深遠影響進行了深入的研究與探討。鄭永曉在其發表的5篇論文中主要探討了古籍數字化在古典文學研究中的影響與應用。

表3 第一作者發文情況

表4 核心作者發文情況

3.2 作者所屬機構分析

對作者所屬機構進行分析不僅可以揭示國內古籍數字化研究領域的重要研究機構,還可以從側面幫助我們了解國內古籍數字化研究人員的分布情況。464篇文獻(除了4篇未署名作者單位的文獻外)以第一作者所屬機構統計,共涉及198個機構,其中發表論文2篇以上的機構有86個,占全部機構數量的43.43%;發文量較高的科研機構,如北京大學、南京大學、國家圖書館、河北師范大學、武漢大學等16個單位共計發表181篇論文,占論文總數的39.00%(見表5)。結合表4、表5來看,古籍數字化的研究除了與作者本人的研究興趣密切相關外,與所處機構古籍藏有量和開展古籍數字化實踐也有很大的關系。

表5 古籍數字化研究核心機構統計

4 主題分析

對古籍數字化的研究主題進行分析不僅可以了解目前國內的研究現狀,而且還可以預測發展趨勢和未來研究方向。全部464篇古籍數字化研究文獻所涉及的研究主題非常廣泛,本文將其歸納為7大類(為了便于統計,對于涉及多主題的論文,僅依照其研究重點和一個主題歸類):古籍數字化理論研究,書目數據庫研究,數字化成果分析與評價,技術標準與規范研究,應用研究,項目評估研究及研究綜述,各主題論文數量分布參見表6。雖然這樣的分類帶有一定的主觀因素,但是卻可以由此探知目前的研究熱點、重點以及難點等問題。因而,本節選用的詞語是“主題范疇”,而非嚴格意義上的“主題”。

表6 古籍數字化研究主題范疇分布

4.1 數字化理論研究

主要探討了古籍數字化的國家政策導向、數字化選題、發展歷史、可行性與必要性、建設目標與流程、功能設想、概念與定位、與古籍整理的關系、與傳統古籍的區別、與數字圖書館的關系以及古籍數字化本身的理論構建等問題。這些方面理論的研究對古籍數字化的實踐工作具有重要的指導性意義。其中,古籍數字化的學科歸屬于古籍整理范疇達成了共識。從技術轉化的角度上,彭江岸認為古籍數字化就是利用數字技術將古籍的有關信息轉換成數字信息,存貯在計算機上,從而達到使用和保護古籍的目的[1]。李國新則強調數字化古籍必須對古籍原典做出具有計算機瀏覽、檢索、利用特點的深度開發。他認為“古籍數字化”應具備4個基本特征:實現文本字符的數字化,具有基于超鏈接設計的瀏覽閱讀環境,具有強大的檢索功能,具有研究支持功能[2]。李明杰進一步指出:古籍數字化是以保存和普及傳統文化為基本目的,以知識發現的功能服務學術研究為最高目標,在對傳統紙質古籍進行校勘整理的基礎上,利用計算機將其轉換成可讀、可檢索及實現了語義關聯和知識重組的數字化信息的過程[3]。同時,史睿認為古籍數字化是一項重要的人文學術研究工程,是中文文獻數字化事業的一個復雜的特例,是數字化圖書館事業的一部分,是國家知識基礎設施的一部分,具有十分廣闊的應用前景[4]。總體上,人們對古籍數字化的定位賦予了更鮮明的學術特性和文化色彩[5]。毛建軍在廣泛分析當前古籍數字化實踐的基礎上,首次探討了古籍數字化的理論體系構建問題,他認為古籍數字化的理論包括4個方面的內容:數字化古籍生產學、數字化古籍流通學、數字化古籍整序學、數字化古籍利用學[6]。

4.2 書目數據庫研究

中文古籍書目數據庫建設始于20世紀80年代末,從自發的各自為政、各自摸索行為,逐步向規范化、合作化發展歷程。徐清著有《近十年古籍書目數據庫建設研究概述》,從古籍的收錄范圍、分類與主題標引、數據格式、著錄標準、漢字平臺與通用編目軟件等技術工具,對近十年我國古籍數據庫建設研究進行了綜述總結,指出近10年的古籍書目數據庫建設研究,以建庫的標準化、規范化為重點,取得了值得關注的成果。周迪等在《中文古籍數字化開發研究綜述》中對古籍書目數據庫建設中的業務技術問題,從著錄問題、分類、主題與名稱規范問題、聯合目錄中數據重復與質量控制問題、專題書目庫的建設問題及過程研究等方面進行了歸納總結。

4.3 數字化成果分析與評價

主要對20世紀90年代以來中國臺灣、香港、大陸以及日本、歐美等的中文古籍數字化成果進行了統計調查,包括建設情況、成果特色、經驗得失等方面研究。對具有代表性的數據庫如電子版《四庫全書》、《四部叢刊》、“中國基本古籍庫”光盤工程等進行了專門的研究評介。另比較有代表性的論文有吳家駒的《中文古籍數字化的進展與主要成果述評》、陳陽的《中文古籍數字化的成果與存在問題》、楊朝霞的《古籍數字資源述略》、郁默的《臺灣中央研究院漢籍全文資料庫》、李明杰的《古籍網絡資源述略》及《中國古籍數字化資源調查與分析》、楊虎的《港臺地區古籍數字化資源述略》、王立清的《港臺地區古籍數字化現狀分析及啟示》等。毛建軍則分別對我國東北地區、江蘇地區、西南地區、臺灣,以及國外如日本、歐美等地古籍數字化資源建設情況進行了較全面的調查和整理統計。這些作者研究認為,相較而言,臺灣、香港的古籍數字化工程啟動較早,在成果的共建共享方面取得較好的成績;大陸由于經費、技術等原因,起步較晚,但有豐富的文獻資源和人才優勢,近年來也取得了豐碩的成果。

4.4 技術標準與規范

古籍數字化離不開信息技術和系統的支撐,這方面的研究主要包括漢字編碼、開發平臺、文字輸入法、元數據、全文檢索技術、數據庫技術、語料庫、知識庫及聯機字典、古籍信息本體等。研究者普遍認為采用Unicode大字符集對古籍數字化具有重要的意義。因為,Unicode擁有充足的漢字編碼、可同時處理多國文字(包括繁簡體中文、日文、韓文、英文及少數民族語言等)、使用Unicode技術可以構造跨語境的應用和Internet應用,使古籍數字化的訪問與共享更加簡便。對于古籍文本的數字轉換和再現,其技術已經相當成熟[7]。而基于古籍數字化深層次的知識挖掘的研究,則取得了初步的成績。如肖懷志提出了構建基于本體的歷史年代知識元的設想,在利用該本體實現古籍數字化資源的重組和知識發現發面進行了有益的探索[8]。何琳、曹玲對農業古籍的語義檢索模型進行研究,提出構建基于領域本體的檢索框架,包括提問詞分析模塊、語義推理模塊、本體瀏覽模塊以及語義查詢模塊[9]。程佳羽、史睿對古籍數字化資源知識庫建設理念進行了研究,即認為其建庫基本理念是:增加知識維度而使知識的擴展性升級、規范知識標引而提高檢索效率、引入計量關系而強化知識關聯的科學性[10]。

4.5 應用研究

古籍數字化的目的和作用不僅是保存與普及傳統文化,同時還更應要為學術研究服務。尤其是古籍數字化從全文檢索到智能化分析功能的發展,逐漸引起了文史學術界的重視。李鐸、鄭永曉等認為古籍數字化對古典文學研究的未來有著極其重要的意義,但目前還處于起步階段[11-12]。李鐸認為計算機在古代文獻整理研究方面進入“分析時代”,計算機所能做的工作更廣泛,比如對詩歌風格、作家風格、作品時代分析等多角度的研究;而計算機中的數據不再是簡單的純文本格式,也不是為加快檢索速度而生成的數據庫文件,而是以研究為目的而做的“多屬性標記本文或多維度的數據倉庫(Databank)”,從而為研究者提供新的研究維度和多元的研究視角[13]。鄭永曉從古典文學研究的3個層面入手,探討了計算機輔助研究在其中的功能及應用,從而指出計算機的精確計算與人的心智和審美能力相結合,是未來學術研究的發展方向[14]。

5 結 論

綜上所述,近十多年來古籍數字化的研究,主要以發展原典古籍數字化研究為主,在古籍數字化基礎理論和技術應用研究方面取得了較大的突破。但在研究范圍、研究深度、研究創新等方面仍存在需要不斷改進的問題。

首先,對古籍數字化理論的研究多數停留在建設目標、歷程、概念定位等層面上,對古籍數字化的歷史使命的認識與研究還需加強。尤其是在網絡環境下,古籍數字化對中華民族文化在網絡上的傳播與共享,對抵御外來文化侵略具有長遠的戰略意義。如果沒有民族文化保護、弘揚使命以及憂患意識的思索,古籍數字化的實踐工作就難以實現更高層次的發展。其次,對古籍數字化項目的評估方面尚少有人研究。王立清提出政府在加大對古籍數字化項目的投資同時,應建立相應的成本效益評估制度,采用第三方評估方法,定期或分期地對國家投資的古籍數字化項目進行客觀的評價,認真分析其成本和效益,以提高古籍數字化的效率,提高數字化古籍的利用率[15]。但遺憾的是,目前為此還沒有專門的論文對古籍數字化項目的評估進行深入、全面的研究。再次,對古籍數字化應用研究、推廣普及研究還比較薄弱。雖然李鐸、鄭永曉等人對古籍數字化在古典文學研究中的應用做了比較有意義的探索,但參與這一領域的文史研究者還比較少,導致古籍數字化成果在文史界的實際應用研究相對還很薄弱。而對于古籍數字化的推廣、普及策劃,目前還未見有專門的論文研討。古籍數字化的研發是一項系統工程,應遵從系統論的觀點,那么今后的研究應加大對數字化成果的應用、推廣普及研究。

古籍數字化是一項實踐性很強的系統工程,其理論的構建與完善需要在實踐中探索,同時,其實踐工作更需要有高屋建瓴、統領全籌的理論作為指導方向。實際上,古籍數字化的理論問題比技術問題更為重要,因為一旦理論發生了偏差,技術越高明,則解決方案越是難以成功[16]。在這一點上,需要文史界、計算機界、圖書情報界等領域的專家學者們共同參與和努力。

參考文獻

[1]彭江岸.論古籍的數字化[J].河南圖書館學刊,2000,(2):63-65.

[2]李國新.中國古籍資源數字化的進展與任務[J].大學圖書館學報,2002,(1):21-26.

[3]李明杰.中文古籍數字化基本理論問題芻議[J].圖書館論壇,2005,(5):97-100.

[4]史睿.論中國古籍的數字化與人文學術研究[J].北京圖書館館刊,1999,(2):28-35.

[5]徐清.2001-2005年我國中文古籍數字化研究綜述[J].圖書情報工作,2006,(8):139-143.

[6]毛建軍.關于古籍數字化理論構建的思考[J].高校社科動態,2006,(4):40-43.

[7]陳力.中文古籍數字化的再思考[J].國家圖書館學刊,2006,(2):42-49.

[8]肖懷志,李明杰.基于本體的歷史年代知識元在古籍數字化中的應用[J].圖書情報知識,2005,(5).

[9]何琳,曹玲.農業古籍本體的構建及其檢索機制研究[J].現代圖書情報技術,2006,(12):37-53.

[10]程佳羽,史睿.古籍數字資源的知識庫建設解析[J].數字圖書館論壇,2006,(12):1-4.

[11]李鐸,王毅.關于古代文獻信息化工程與古典文學研究之間的互動關系的對話[J].文學遺產,2005,(1):127-137.

[12]鄭永曉.古籍數字化與古典文學研究的未來[J].文學遺產,2005,(5):130-137.

[13]李鐸,王毅.數據分析時代與古典文學研究的開放性空間[J].中國文化研究,2006,(夏):96-103.

[14]鄭永曉.技術與心智的互補——建立在計算機檢索基礎之上的古典文學研究[J].文學遺產,2009,(1):131-134.

[15]王立清.我國古籍數字化建設的國家控制與館里模式研究[J].情報資料工作,2009,(2):49-53.

[16]史睿.論中國古籍的數字化與人文學術研究[J].北京圖書館館刊,1999,(2):28-35.

主站蜘蛛池模板: 亚洲男人的天堂在线观看| 婷婷伊人久久| 狠狠ⅴ日韩v欧美v天堂| 国产精品污视频| 国产激爽大片在线播放| 国产精品自在线拍国产电影| 国产精品无码AⅤ在线观看播放| 亚洲福利片无码最新在线播放| 国产色婷婷视频在线观看| 欧美另类精品一区二区三区| 久久久久人妻一区精品色奶水| 一区二区三区四区在线| 中文字幕第4页| 美女被躁出白浆视频播放| 亚洲愉拍一区二区精品| 亚洲日产2021三区在线| 91网站国产| 97se亚洲综合在线天天| 国产精品黑色丝袜的老师| 全午夜免费一级毛片| 欧美久久网| 亚洲精品无码av中文字幕| 好吊妞欧美视频免费| 国产成人综合网在线观看| 国产最新无码专区在线| 91成人在线观看| 992Tv视频国产精品| 99国产精品国产高清一区二区| 欧美亚洲一二三区 | 久久久久国产一区二区| 99久久精品国产综合婷婷| 欧洲日本亚洲中文字幕| 婷婷在线网站| 欧美激情,国产精品| 操美女免费网站| 怡红院美国分院一区二区| 青青草a国产免费观看| 亚洲乱码视频| 久久精品只有这里有| 国产SUV精品一区二区6| 亚洲欧美一区二区三区图片| 九色视频在线免费观看| 久久久久夜色精品波多野结衣| 无码一区中文字幕| 色综合天天综合中文网| 国产国拍精品视频免费看 | 国产成人艳妇AA视频在线| av性天堂网| 国产精品漂亮美女在线观看| 色哟哟色院91精品网站 | 日韩大乳视频中文字幕| 丰满人妻一区二区三区视频| 亚洲一级毛片免费观看| 亚洲天堂高清| 国产综合精品一区二区| 狠狠色噜噜狠狠狠狠奇米777| 欧美成人a∨视频免费观看| 亚洲69视频| 在线综合亚洲欧美网站| 一区二区三区四区在线| 亚洲精品日产精品乱码不卡| 8090午夜无码专区| 高清视频一区| 国产亚洲精品自在久久不卡| 久久青青草原亚洲av无码| 国产精品成人AⅤ在线一二三四| 一级高清毛片免费a级高清毛片| a在线观看免费| 亚洲精品自拍区在线观看| 国产综合亚洲欧洲区精品无码| 亚洲AV成人一区二区三区AV| 中文字幕在线一区二区在线| 国产小视频免费观看| 国产精品永久免费嫩草研究院| 亚洲成人精品在线| 亚洲国产欧美自拍| 视频一区视频二区中文精品| 波多野结衣一区二区三区AV| 欧美全免费aaaaaa特黄在线| 国产成人久久综合一区| 日本人妻一区二区三区不卡影院| 无码一区18禁|