金同玲
當前,大數據時代的到來推動了數字圖書館的建設。數字圖書館因其獨具的智能性與信息共享性,其發展勢頭越來越猛。而在大數據時代背景下的數字圖書館的重點建設內容為圖像信息資源的建設和圖像信息資源的檢索服務,本文將對大數據時代數字圖書館的圖像資源服務與信息建設進行分析探討,提出相應的對策。
圖像信息相比于文本信息來說,更加的鮮明生動形象,它能更直觀的把信息印入到人們的腦海中。社會發展迅速,傳統的文字閱讀方式已經滿足不了人們對于閱讀的需求,圖像閱讀悄然興起,它相比于傳統文字閱讀更能激發閱讀者的閱讀興趣,大量珍貴資料被以視頻圖像的方式收藏記錄,展現在閱讀者的面前,其潛在價值越來越高,圖像閱讀已經成為大眾普遍所能接受的一種閱讀方式了。而隨著圖像的采集技術和存儲技術提升,大數據時代數字圖書館的圖像資源存儲量正在飛快增長,如何有效地建設以及檢索信息存儲量巨大而又非結構化的圖像資源在目前相當重要。有效地建設以及檢索圖像資源能幫助圖像資源價值更大化,信息共享更全面,對此,下文將對數字圖書館的圖像資源服務以及服務中存在的問題進行分析講解,提出相應的對策,保證圖像資源服務的進步。
1.1 文本圖像服務檢索
數字圖書館圖像資源檢索方法有三種,文本圖像服務檢索作為其中的一種服務檢索方法,它由人工對所有的文本信息進行標注之后,再以文本關鍵詞作為檢索關鍵來對圖像資源信息進行檢索從而找到所需圖像信息。現今主流的文本圖像檢索引擎主要有百度谷歌等,文本圖像服務檢索相對來說準確率更高,但由于文本圖像服務檢索需要由人工對所有的文本信息進行一個個標注,投入的物力和人力巨大且耗費時間長,標注過程中稍不注意就會出差錯。
1.2 內容圖像服務檢索
內容圖像服務檢索作為數字圖書館資源檢索三種方法中的一種,它主要是通過對圖像庫里面所有圖像的顏色形狀等特征進行分析,建立圖像的特征檢索庫,將分析內容存入到特征檢索庫內,在檢索時,提取等待檢索圖像的顏色形狀等特征,輸入檢索庫進行檢索查詢。當前,內容圖像服務的檢索引擎主要就是百度谷歌這些,還有的就是IBM公司旗下的OBIC,Virage公司旗下的Virage圖像搜索引擎以及photobook和Visual SEEK等。內容圖像服務檢索相對于來說比較適合實際情況下的應用,它不需要使用者對需要檢索的對象精細描述就能進行檢索工作。但在圖像的特征提取分析過程中,其提取分析性能較差且在提取過程中對于圖像特征的區分能力不高,導致圖像特征提取與圖像高層語義之間存在著一定的差異,而僅僅以使用者所提供的圖像特征進行查詢所得到的結果經常不如人意。
1.3 語義圖像服務檢索
在使用內容圖像服務檢索時,會因為圖像特征提取與圖像高層語義之間的差異導致查詢所得結果不盡人意,語義圖像服務檢索就是解決這個問題的檢索方法,它可以通過圖像語義框架的補充來拉近圖像特征提取與圖像高層語義之間的差異。語義圖像服務檢索是先將一個基礎的圖像特征提取出來經過各種圖像預處理提取定量的信息內容之后,再通過機器學習的方式對圖像基礎特征進行分析集中訓練,之后再將經過分析集中訓練處理后的圖像特征與語義關鍵詞聯系起來,方便后續的圖像檢索工作更快速準確。語義圖像服務檢索能幫助圖像基礎特征提取和圖像高層語義間距離的拉近,經過語義標注后的圖像基礎特征,就能在只有文本的基礎上對圖像資源信息進行檢索。但語義圖像服務檢索方法還是有部分缺陷的,因為在對所選取的基礎圖像特征進行預處理時要用到圖像分割等方法,圖像分割對于現在的技術來說還不算十分容易,它在處理中只能將圖像簡單分割成幾個區域,圖像分割之后的結果缺乏語義,而基礎圖像特征提取與圖像高層語義之間本就存在著一定的差異,其不能直接推導進行檢索。大部分的語義圖像服務檢索在檢索過程中都是對單幅圖像進行檢索的,它不能將檢索建立在多幅圖像,這就使語義圖像服務檢索存在一定的局限性。
2.1 圖像資源服務中圖像資源建立不夠廣
大數據時代的到來使“數據”多方面的應用到人們的生活中,數字圖書館也因此加快了建設步伐,雖然數字圖書館的建設步伐快了,但它在圖像資源建立方面還不夠完善。現今數字圖書館中對于圖像資源的建立主要是針對專題性的圖像資源,它沒有對于所有的圖書資源信息進行收集,圖像資源建立不夠廣缺少全面性,在使用者對圖像資源服務的使用過程中不能對使用者提供全面的綜合性圖像資源。
2.2 圖像資源信息缺少資源協作共享性
不受時間空間的限制是大數據的特點和優勢,在大數據時代下建立圖像資源服務就是為了打破以各自為戰為目的建設的數字圖書館,從而實現所有圖書館之間的資源信息共享。但就目前來看,數字圖書館的建設還是以單個單位為建設范圍,依舊是各自為戰,并沒有實現圖書館之間的資源信息共享。圖像資源的信息缺少資源協作共享性就影響了大數據時代下真正的數字圖書館的建立,數字圖書館難以形成一個規范開放的資源信息共享平臺。
3.1 對數字圖書館的檢索知識加強學習,提升服務水平
當前,大數據時代的到來促進了數字圖書館的發展,數字圖書館成為大數據時代背景下的一種新型圖書閱讀模式。而數字圖書館的建立又需要多方面的對各種圖像信息資源進行收集和圖像信息資源服務平臺的建立,所以要想圖像資源服務做的更好,就需要擴大數字圖書館圖像檢索知識的學習人群,并對其學習深度進行加強,幫助人們學會如何使用數字圖書館的檢索系統。深度學習能對圖像基礎的中低層特征進行更好的挖掘,而學習人群的范圍不應該只包括數字圖書館的工作人員還要包括社會的普羅大眾。數字圖書館的圖像資源服務具有超強的智能性,它對使用者使用的圖像資源檢索功能具有超高的熟練度要求,使用者能熟練應用圖像資源檢索功能才能幫助使用者提供的檢索對象與數字圖書館內所儲存的圖像信息特征快速比對,提高信息檢索的準確率以及信息檢索的效率。而在加強提升數字圖書館的檢索知識水平時,數字圖書館的工作人員應該對檢索知識了解更熟透,這不僅能為其他應該加強學習數字圖書館檢索知識的人群提供榜樣,還能幫助在數字圖書館中進行功能使用的使用者解決使用過程中出現的問題,幫助使用者更好的使用。數字圖書館就是圖像基礎的信息提取和圖像高層語義的對接結合,它蘊含的信息資源極其豐富且使用價值極高,要想數字圖書館的使用價值最大化就要加強對于數字圖書館的檢索知識學習,掌握圖像資源服務信息才能幫助數字圖書館更好的使用。
3.2 對數字圖書館圖像資源服務進行遷移學習,提高效率
數字圖書館的建立能幫助圖像信息資源之間共享協作的進行,而在共享協作的過程中會出現信息資源遷移性的問題。對于這種問題,必須對數字圖書館的圖像資源服務進行遷移學習,遷移學習就是對當前已經大量被標記的有效的信息資源進行學習,而后將其加入到當前的數據集中去。遷移學習能幫助數字圖書館在進行圖像資源檢索服務時減少圖像資源的檢索時間,提高圖像資源檢索效率。古籍圖像資源就是一個典型的需要進行遷移學習的資源,因為古籍圖像資源相對于其他圖書圖像資源來說,圖像資源量少,而對古籍圖像資源進行遷移學習之后就可以將大數據區域內學習到的知識遷移到古籍圖像資源中去,豐富填充古籍圖像的資源存儲量。在進行有關古籍的檢索工作時,能快速準確的檢索到有關古籍的圖像資源信息,提高圖像資源檢索服務的效率。同樣的,對于數字圖書館的圖像資源服務的遷移學習,也應該由數字圖書館的工作人員身先力行,做好數字圖書館圖像資源信息的遷移學習工作,在使用者對數字圖書館圖像資源服務進行使用時才能對其進行指導,幫助使用者在使用過程中對于遷移學習的漸進進行,在提高數字圖書館圖像資源服務的檢索效率時將數字圖書館的圖像資源信息價值發揮到最大性。
3.3 推進大數據技術的應用,提高圖像資源服務的智能性
當前大數據時代發展的背景下,大數據將是推動數字圖書館發展的最強主力,要想數字圖書館的發展更好,就需要在數字圖書館的圖像資源服務中推進大數據技術的應用,打造獨特的圖書館服務平臺,使數字圖書館內的圖像資源信息做到最大化的信息共享協作,將數字圖書館內的圖像資源信息價值深度挖掘出來。在數字圖書館的發展規劃中,可以運用大數據技術對數字圖書館內的圖像資源信息使用情況進行分析,為未來發展規劃提供更可靠的依據,幫助數字圖書館未來的創新發展。數字圖書館可以加強閱讀者與圖書館的互動,使閱讀者感受到數字圖書館的智能性和人性化服務,讓越來越多的人喜歡上數字圖書館,推動數字圖書館的發展應用。
相對于傳統的文字閱讀方式來說,圖像閱讀方式更能滿足人們的需求以及更能深度的激發人們的閱讀興趣。大數據時代背景下建立的數字圖書館其所提供的圖像資源服務因其獨具的智能性,能更好的服務人們,滿足人們的閱讀需求。而數字圖書館的圖像資源服務質量好壞與數字圖書館的圖像資源信息收集有著很大的關系,所以數字圖書館要完善圖書館內的圖像資源收集,并對館內工作人員對于數字圖書館使用系統的熟練度進行一定培訓加強,保證數字圖書館的圖像資源服務的使用性和最大使用價值。
(作者單位:泰山學院圖出館)