999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

G IS技術在古籍數字化資源建設中的應用

2016-02-13 19:43:25吳茗
圖書館學刊 2016年4期
關鍵詞:資源用戶信息

吳茗

(國家圖書館,北京 100081)

?

G IS技術在古籍數字化資源建設中的應用

吳茗

(國家圖書館,北京 100081)

[摘要]GIS技術有著強大的空間定義能力和空間關系查詢能力,將其應用于古籍數字化資源組織中,可以實現深度開發古籍資源,為用戶提供一種全新的、立體的資源展示方式。評述了GIS技術的理念和屬性特點,通過對GIS技術在國內古籍數字化建設的應用實例分析,總結了在古籍數字化建設過程中引入GIS的技術實現路徑,并提出了進一步開展GIS應用的建議。

[關鍵詞]GISGIS檢索古籍數字化統一時空框架

1 引言

中文古籍數字化歷經30余年的發展,在數據量方面取得了長足的進步。權威統計表明,2012年我國公藏機構已經擁有超過20億字的數字化文本格式的古籍,一些已成規模的大型古籍數據庫還在原有基礎上不斷拓展和完善[1]。然而隨著OCR光學識別技術、字處理技術、智能化處理技術和網絡技術的發展,數字化工作已從古籍文獻信息的簡單組織、檢索與利用的淺層次開發,深入到海量文獻資源的深度分析和挖掘深層次的開發。隨著開發層次的不斷加深、古籍數字化標準和體系結構的確立,為古籍中引入GIS技術構筑了非同尋常的新平臺。

GIS技術有著強大的空間實體定義能力和空間關系查詢能力,在組織與管理地理空間數據方面起著至關重要的作用。古籍數字化建設可以基于GIS的理念,把古籍中的各種信息與反映地理位置的空間信息結合在一起,得到時間和空間兩方面的直觀檢索集,為用戶提供一個更為有效和可視化的信息檢索與資源服務環境。

2 GIS技術的理念與實踐

2.1什么是GIS

地理信息系統(Geographic Information System,GIS)是20世紀60年代逐漸發展起來的一門新興學科,是一種集空間信息和其他數據信息為一體的計算機系統,其對空間信息進行采集、存儲、管理、組織、查詢和顯示并采用地理模型分析方法,適時提供多種空間和動態的地理信息,為研究和決策服務而建立起來的計算機系統[2]。地理信息系統使用和處理的數據分為兩類:第一類是反映事物的地理空間位置、幾何特征和拓撲關系等,稱之為空間信息數據;第二類是反映事物其他特征的信息,即屬性信息數據。將反映事物的空間信息數據與屬性數據結合在一起,用來存儲、組織、查詢和顯示空間實體及其相關信息,突破了傳統的文字表述模式,圖文并茂、多方面、多層次地展示在用戶面前。

基于GIS的古籍資源最大的改變在于可以幫助人們實現對海量復雜數據的有效管理,并輔助進行分析、解釋和數據挖掘。古籍文獻信息資源不再是靜態的、單一的,不再處于等待被使用的境地,它擁有了時間和空間的序列,這從某種意義上來說會改變古代文學史研究的視角、維度和書寫方式[3]。

2.2引入GIS技術的優勢

在數據層面,古籍信息文本型數據具有模糊性、不確定性和非線性等特征,不能給用戶帶來直觀的用戶體驗;將地理空間數據與文獻信息資源相關聯,就可以為讀者提供一個更為有效和可視化的信息檢索與資源服務環境。

在檢索層面,古籍資源一般通過題名、責任者、出版年代等文本特征加以索引,提供給用戶查找和使用。可將地圖數據信息與古籍文本相結合,構建基于GIS技術的數據庫,在數字化地圖上直觀地表現古籍內容及其地理分布,并提供地理檢索和分析功能,結合文本式檢索,幫助用戶深入閱讀和利用古代文獻。與傳統的文本式檢索相比,GIS檢索具有以下優勢。

2.2.1彌補文本式檢索不能準確檢索地名的不足

由于歷史的演變,經常出現一地多名、行政區劃改變、國土疆域改變等情況,這些都無法用文本式檢索準確定位,同時,窮舉其歷史地名也要頗費周折。而使用GIS檢索,則不需知道它叫什么名字,只需對所檢索的地點進行框選,利用此處空間的檢索值,檢索到所需的屬性和信息,檢索方式方便、直觀。

2.2.2減少因檢索詞的不準確匹配產生的誤檢

傳統的關鍵詞檢索主要還是詞形匹配而非詞義匹配,在漢字關聯技術上存在技術疏誤,在檢索詞中一般也未使用分詞技術,使用文本式檢索時,雖然能夠在海量信息集合中快速定位信息,但容易引起大量不準確匹配,產生誤檢,而使用GIS檢索就可以避免這樣的錯誤。

2.2.3可以實現輻射式檢索

可以以一個點或者一條線為基礎,設置檢索范圍,對周邊區域進行輻射性的檢索,而文本式檢索只能實現定點的檢索,因此GIS檢索相比文本式檢索擴大了檢索的方式。

將GIS檢索與文本式檢索結合,不僅可以獲取時間、空間的直觀檢索集,還能實現數據統計、地圖生成等功能,有利于用戶更好地理解海量數據。

2.3古籍數字化建設中的應用實例

目前國外及我國港臺地區圖書館的GIS服務已趨向成熟,朝著更專業的方向發展,并有較多的成功案例,例如中國臺灣“中央研究院”開發的中國歷史文化地圖系統,其針對歷代地圖資源進行數字化和可視化,以中國為空間范圍,并以原始社會到現代社會的整個中國歷史為時間縱深,以中國文明為內涵的整合性咨詢應用環境[4]。借助于該系統,用戶可以古代地圖為入口,了解到當時的地名設置、區域大小、重要道路以及其他重要文化信息。

國內數字資源領域應用GIS技術雖然剛剛起步,還不夠成熟,但也產生了一些具有代表性意義的項目,包括北京大學數字圖書館古文獻資源庫的時空檢索和復旦大學的中國歷史地理信息系統項目(CHGIS)等。

2.3.1北京大學數字圖書館古文獻資源庫的時空檢索

該系統結合GIS檢索技術,從時間和空間的角度對古文獻資源數據進行檢索,使歷史文化資源的時空特性得以充分展示。目前,該“時空檢索”僅在金石拓片這種資源類型上予以應用,用戶可以通過GIS檢索古籍拓片,形象直觀,其彌補了傳統檢索的不足,突破了傳統的文字檢索模式。

“時空檢索”具有兩種功能[5]:①可以在不同朝代的歷史地圖上按照用戶劃出的區域進行檢索;②可以在地圖上反映用戶檢索的結果集,定位出拓片所反映的原器物的出土或刻立地點,可以直觀分析數據分布,補充檢索式檢索的不足。

在“時空檢索”界面上顯示的地圖上,點選激活拓片圖層,就可以在地圖上顯示拓片所反映的原器物的出土或刻立地點,可以在不同朝代的歷史地圖上按照用戶劃出的區域進行檢索,檢索的結果集直接反映在地圖上。

目前已經可以分別提供墓志、墓碑、刻經、造像及全部拓片共5種類型的拓片圖標。

2.3.2復旦大學歷史地理研究中心的CHGIS

該項目試圖建立一套中國歷史時期連續變化的基礎地理信息庫,使其成為中國歷史GIS數據的基礎平臺。與傳統的紙質地圖不同,CHGIS系統地理要素之間的關系可以修改和更新,按不同歷史時期和不同數據集的方式,為用戶提供最簡潔的數據查詢、檢索、編繪數據地圖和連接用戶數據的功能,同時允許用戶按他們設定的時間和地區重新組合數據庫中的數據,可以將這個系統看作是以時間信息為縱軸,以空間信息為橫軸的立體數據空間,并將相關的政治、經濟、商業等信息附著其中[6]。

目前該系統的搜索引擎僅實現了提供簡體地名及簡繁體模糊兩種方式進行查詢,用戶可從授權發布數據的網站上下載并使用CHGIS數據。鑒于該系統只提供歷史地理的基礎數據以及地圖瀏覽和地名查詢等功能,用戶要想生成某個學科的專題地圖就必須利用GIS系統,對于完全不熟悉GIS的一般用戶,還存在一定的困難。

2.3.3構建全國范圍的古籍時空分布系統

我國古籍數量龐大,且往往分散各地,由于缺乏一個全國性的權威機構統一指導和協調,其數字化加工與存儲各自獨立,所生成的獨立古籍文獻數字資源專題數據庫很難形成有機整體。為了實現更大范圍的資源共享與揭示,有必要進一步推進我國古籍數字資源整合,若能在此基礎上將GIS技術應用到整合資源中,使其具有數據檢索、統計、地圖生成等功能,古籍資源將不再是相對獨立分散的知識點,而是形成了層次清晰的知識圖譜體系。

目前,隨著全國古籍普查登記工作基本完成,《中華古籍總目》的編制工作已陸續展開和全國古籍普查基本數據庫的建立,其為構建全國范圍的古籍時空分布系統奠定了堅實的基礎。上文提到的復旦大學歷史地理研究所開發的全球定位信息系統CHGIS,其目標是建立中國歷史時期基礎地理信息系統數據庫,可實現基于CHGIS構建動態的全國古籍等移動文物的地理信息系統。復旦大學校長楊玉良在《復旦大學中華古籍保護研究院”的創建》中提出,大數據時代,建設基于CHGIS的中華古籍書目數據研究中心”,也就是利用GIS技術存儲、管理我國古籍書目數據庫,構建可視化的古籍時空分布系統,為國家移動文物普查、古籍保護、傳統中華學術研究提供大數據平臺,為國家文化保護提供決策,為來自高校、社會的研究人員以及各類決策機構,提供書目信息咨詢服務。該系統的建設目標,是要完成古代書名、人名、地名以及相應機構名稱的規范化整理和翻譯,并將典籍出現時的經濟、文化等各種背景綜合輸入匹配,形成一個整合的數據庫[7]。

3 引入GIS技術的技術實現

從國內現狀看,在古籍建設過程中引入GIS技術已取得了一定成果,但相對于對文本文獻的數字處理技術的日臻成熟,基于文本挖掘的檢索和存取已經習以為常,以地圖或者圖像形式存儲的地理空間信息卻不像處理文本文獻那么容易,國內圖書館目前將GIS技術應用于古籍善本數字資源庫的技術還不夠成熟,而且這種應用在某種程度上仍屬于利用GIS檢索電子地圖和圖像信息等較淺的層面。結合這些系統建設的實踐經驗,對進一步推進我國基于GIS技術的古籍數字資源深度開發、更好地實現資源檢索和利用歸納出以下幾點提示和經驗。

3.1元數據

為了古籍的深層次開發和利用,利用GIS技術的可視化數據和空間關系分析能力,將文獻資源的屬性數據與具有結構特征的地理信息進行數據關聯聚合,充分重視和突顯古籍的時空信息,建構可視化的古籍時空網絡,在元數據中應增加突顯時空屬性的元數據項目,突出時間跨度、空間分布等表達時間特性和空間位置的信息。在時間維度上,記錄時間的紀年、紀時方式和時間的類型,兼容中國傳統歷法時間和公元時間;在空間維度上包括地名的空間位置、所屬時期和行政隸屬等。

3.2基本數據源

GIS技術的基礎和前提是擁有大量準確、翔實、覆蓋面廣闊的地理空間數據和屬性數據。

在地理空間數據方面,需要對時空信息進行采集,建立相關的時空數據庫,包括空間地理數據庫、時間數據庫等;對時間地點信息進行解析和映射,實現時空信息的規范化、結構化表達。其中時間數據由于歷史文獻的記錄與研究水平的關系,往往無法確定具體的時間,應將其相關描述信息予以保留,給用戶提供一個參考,以便在今后的研究中予以改正和確認;獲取空間地理數據,需要具備基礎地圖資源,要完成地圖圖像數據的矢量化工作。

在屬性數據方面,除了資源本身所帶有的信息外,可整合家譜和地方志的數字資源,將其作為重要的切入點和數據源,二者資源中都蘊含時空信息和相關屬性數據,并且具有全面、翔實、權威、系統等特點,利用其特有的資源豐富、古今縱覽和信息相關等優勢,以地理位置、時間為線索,運用空間信息技術進行顯式、動態的可視化表達,將歷史全面反映,可成為GIS的重要數據來源[8]。

3.3基礎支撐

為了實現古籍信息與地理空間以及時間的關聯并構成一個統一的整體,需要在古籍信息數據中抽取歷史地名信息和時間信息進行數字化建庫,然而在空間位置上,隨著地名的不斷變化、行政管理區域的改變而帶來的地名描述的變化,使得不同時期的地名沒有統一的參考基準,地名的空間位置和空間范圍難以確定;在時間信息上,因歷法差異和紀年方式的變化,計算機難以直接對其進行比較、分析。這就需要組織統一的時空描述參考框架,為所有的古籍提供一致的時間參考和空間參考。

將歷史演變過程中具有特定時間、位置、方位、范圍及形態特征的地名數據作為基本單元,以時間軸和空間軸為演變標尺構建時空框架。只有在這個時空框架下進行時空解析和定位,規范表達時空信息,解決時間與空間的對應關系和變化關系,才能使得不同歷史時期、不同地區的古籍資料整合到一個統一的時空背景下進行分析。

因此,可以說統一的時空參考框架,是在古籍資源建設中利用GIS技術進行共享和分析的基礎支撐。

3.4開發平臺

古籍資源的GIS應用主要是基于成熟的GIS平臺進行搭建實施,目前主要的GIS平臺有國外的ARCGIS,MAPINFO,GEOMEDIA,國內的超圖等,具有數據錄入、編輯、查詢、分析、制圖輸出等完善的功能和強大的二次開發能力。所有GIS數據庫的搭建與原有MIS(Management Information System,管理信息系統)類似,只要與地理信息或空間信息相關的數據,均需要以GIS平臺要求的數據格式進行規劃和存儲,然后在平臺搭建實施中按照相應GIS平臺要求的方式進行展現。同時,隨著用戶需求的扁平化,還可以基于GIS平臺開發更多的核心功能。

4 幾點思考

4.1標準化

標準化是資源整合共享和充分揭示的基礎,GIS技術的引用依賴于資源的整合共享。堅持數據的標準化、規范化具有突出的現實意義,也是進一步推進古籍數字資源深度開發的基礎保障。由于古籍類型眾多,包括善本印本、手寫本、輿圖、家譜、地方志、拓片等,情況各不相同,其數字化資源的格式往往也互不兼容,對數據共享的發展造成了障礙,因此,標準規范方面的工作相當復雜,應從數據、接口、應用、保存等多個層面進行統一和規范,制定統一的、行之有效的標準。

4.2專業人才的培養

目前,圖書館界對GIS技術的應用研究尚處于探索階段,尤其在古籍數字化方面,圖書館還缺乏這方面的專業人才,同時GIS技術發展迅速,軟件不斷更新,可獲得的空間數據的不斷擴大,不同格式、不同平臺、不同檢索機制的空間數據采集和轉換等,都對圖書館員的GIS素質提出了更高的要求[9]。結合我國的實際情況,可采用引進GIS相關專業人才、組織人員進行專業培訓、提供實習機會等途徑來保證、提高工作人員的素質。

4.3加強合作

在古籍資源開發中引入GIS技術,涉及的內容很多,既包括采集、編目等數據層面,也包括數據的存儲、發布、檢索等服務層面。因此開展多層次的資源共建和合作是必要的,其不僅包括加強與其他收藏機構和數字化機構的館際交流與溝通,也包括館內部門之間的協調溝通。合作內容是全方位立體式的,可以涉及資源、人才、技術、設備等多個方面,實現數據資源的整合共享,形成完整、翔實、準確的數據源,協同服務,優勢互補,共享人力技術資源,提供高效、全面的古籍資源服務。

參考文獻:

[1]高娟,劉家真.中國大陸地區古籍數字化問題及對策[J].中國圖書館學報,2013(4):111.

[2]韓新蕾,等.基于3DMAX和GIS的三維圖書館空間管理系統開發[J].圖書館學刊,2014(4):105.

[3]范佳.“數字人文”內涵與古籍數字化的深度開發[J].圖書館學研究,2013(3):31.

[4]中國臺灣中央研究院.中華文明之時空基礎架構[EB/OL]. [2015-09-15].http://ccts.sinica.edu.tw/intro.php?lang=zh-tw.

[5]中國高等教育文獻保障系統管理中心.時空檢索說明[EB/OL]. [2015-09-16].http://rbdl.calis.edu.cn/pages/GisSearch.htm.

[6] 復旦大學歷史地理研究中心.chgis數據說明[EB/OL]. [2015-09-16].http://yugong.fudan.edu.cn/views/chgis_data. php.

[7]楊玉良.復旦大學“中華古籍保護研究院”的創建.[EB/OL]. [2015-09-16].http://www.library.fudan.edu.cn/main/info/42 53.htm.

[8]龔強,胡運權.地方志:GIS的最佳數據源[J].學術交流,2001(01):155-157.

[9]黎明,但旺.國外圖書館GIS服務及其啟示[J].圖書館學研究,2008(10):79.

吳茗女,1975年生。碩士研究生,館員。研究方向:數字化平臺運維管理。

[分類號]G250.73

收稿日期:(2015-11-19;責編:楊新寬。)

猜你喜歡
資源用戶信息
基礎教育資源展示
一樣的資源,不一樣的收獲
資源回收
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 亚洲国产综合自在线另类| 青草精品视频| 亚洲成人一区在线| 日韩精品专区免费无码aⅴ| 亚洲成人一区在线| 在线欧美a| 国产午夜在线观看视频| 国产亚洲男人的天堂在线观看| 精品国产香蕉伊思人在线| 国产大片喷水在线在线视频| 专干老肥熟女视频网站| 国产成人久视频免费| 一级爆乳无码av| 天天做天天爱夜夜爽毛片毛片| 国产日韩AV高潮在线| 成人夜夜嗨| 九九久久精品免费观看| 国产人成在线视频| 日韩午夜伦| 欧美亚洲欧美区| 毛片基地美国正在播放亚洲 | 99精品国产自在现线观看| AV网站中文| 国内精品免费| 午夜老司机永久免费看片| 制服丝袜一区二区三区在线| 精品国产电影久久九九| 国产成人高清亚洲一区久久| 亚洲欧美在线综合一区二区三区| 97久久超碰极品视觉盛宴| 99r在线精品视频在线播放| 国产aⅴ无码专区亚洲av综合网| 国产成人精品一区二区不卡| 免费国产一级 片内射老| hezyo加勒比一区二区三区| 欧美国产日本高清不卡| 全部免费特黄特色大片视频| 久久中文字幕2021精品| 国产精品久久精品| 亚洲VA中文字幕| 精品人妻一区二区三区蜜桃AⅤ| 亚洲色图欧美| 免费人成视网站在线不卡 | a天堂视频在线| 青青久视频| 亚洲日本一本dvd高清| 国产成人综合网| 亚洲无码高清免费视频亚洲| 精品国产免费观看| 午夜日本永久乱码免费播放片| 国产男人的天堂| 免费毛片视频| 国产色偷丝袜婷婷无码麻豆制服| 国产亚洲欧美在线人成aaaa| 孕妇高潮太爽了在线观看免费| 一级一毛片a级毛片| AV不卡在线永久免费观看| 人人艹人人爽| 国产精品yjizz视频网一二区| 欧美精品在线免费| 成年女人a毛片免费视频| 在线高清亚洲精品二区| 四虎亚洲精品| 国产色图在线观看| 激情六月丁香婷婷| 中国国产A一级毛片| 亚洲中文字幕在线精品一区| 久久激情影院| 538精品在线观看| 成人午夜视频免费看欧美| 欧美高清日韩| 亚洲第一黄色网址| 亚洲黄色激情网站| 午夜国产不卡在线观看视频| 老司机久久99久久精品播放| 国产乱子伦视频在线播放| 在线一级毛片| 亚洲欧美日韩中文字幕一区二区三区| 精品久久高清| 国产男人天堂| 欧美日韩中文国产| 激情乱人伦|