李莉
(德州市圖書館,山東 德州 253000)
伴隨著技術的進步,越來越多的城市開始了智慧圖書館建設,當智慧圖書館建成以后,圖書館的管理方式都將發生巨大的變革。事實上,在當下的條件下,圖書館的自動化、數據化程度是評估圖書館實力的關鍵指標,各個圖書館都要注重管理工作中的數據分析和利用。數據挖掘被應用到了越來越多的領域,一個代表性的領域就是圖書館期刊管理中,雖然很多圖書館的期刊管理中都采用了數據挖掘,但其應用方面還存在著一定的不足,未來還要加大技術創新力度,以發揮數據挖掘的突出優勢。
大數據時代到來以后,在人們的各項生產生活活動的進行中,所產生的數據信息量日漸龐大,對這些數據信息的篩選、剔除和應用,可給后續的工作開展提供一定的參考。而數據挖掘作為大數據時代中的關鍵性技術,這一技術的應用就是要通過對數據的分析和統計,發現不同類型數據之間可能存在的緊密聯系,進而從中提煉出新的有參考價值的數據。因此,從本質上來看,數據挖掘可幫助人們從海量的數據中提取出潛在的信息,開展決策和預測。數據挖掘技術主要體現在以下方面:
傳統的數據挖掘工作中,因為存在著一定的技術限制,數據的分析和處理工作都是由人工來完成的,信息時代到來以后,傳統的數據挖掘技術逐步向新的方向發展,自動預測趨勢和行為技術,可從海量的數據中幫助人們找尋不同數據之間的內在聯系,獲取到關于預測性的信息,進而來輔助相應的預測或者決策工作。
統計分析技術同樣也是數據挖掘中的一種,在這一技術應用時,主要是要對特定的數據集合進行分部或者概率模型的構建,在該模型基礎上開展對應的統計和分析工作。
決策樹算法下的數據挖掘工作,首先要對海量的信息依據特定的分類標準來加以分類,在分類基礎上進行潛在信息的挖掘,在大規模數據的預測模型中,這一算法的應用相對較多。
聚類分析也是數據挖掘中十分常用的一種方法,當面臨海量數據時,聚類分析就是要對這些數據開展群組分類,但在群組分類的過程中主要是根據自身的特點來進行的,并沒有明確的分組規則和標準。
不同類型的數據之間可能存在著一定的內在聯系,而關聯分析利用的就是這一點,當在數據挖掘中利用的是關聯分析時,就是要判定在數據庫中的兩個或者兩個以上變量之間是否蘊含著一種內在的規律性關系。結合關聯特點,主要以簡單關聯、時序關聯和因果關聯為主。
在Internet 中有多個的服務器,這些不同的服務器之間存在著互聯互通的關系,在神經元網絡中就利用的是這種關系,可將神經網絡看成是很多神經元互聯互通所構成,在當下的數據挖掘中,神經元網絡的應用也相對較多。
數據挖掘是一種現代化的技術,在其中集成了多種的技術,技術專業性較強使得在將該技術應用在圖書館期刊管理時,應配備數據挖掘方面的專業化人才,使得這些人才能夠發揮其專業優勢,積極參與到圖書館期刊管理的數據挖掘中。但顯然,城市圖書館雖然日漸意識到了數據挖掘技術的優勢,也積極將數據挖掘應用到了圖書館期刊管理中,但卻未同步進行數據挖掘方面的人才引進,因為人才配置的不足,圖書館期刊管理方面的數據倉庫、數據庫建設等水平低下。
與發達國家相比,我國的數據挖掘水平還相對偏低,不論是技術發展還是軟件研發,都與發達國家存在著明顯的差距。因為數據挖掘的起步較晚,再加上應用經驗有限,我國國產數據挖掘軟件的技術含量偏低,國產軟件技術水平不足,使得圖書館期刊管理中的數據挖掘應用受到了很大的限制。近幾年來,我國在國產數據挖掘軟件的研發方面給予了巨大的資金和技術支持,但從整體的發展水平來看,尚處于初級階段,在直接利用國外先進數據挖掘軟件時,不僅存在著漢化方面的難題,還需考慮其是否能夠與我國圖書館的基本情況相符合,因此,國產數據挖掘軟件的研發是未來工作的重點。
隨著知識經濟時代的到來,人們越來越意識到了知識的重要性,對知識的渴求使得人們在學習的過程中,對圖書館的資源需求量逐年遞增,需求的這種變化使得各個城市的圖書館工作中,館藏資源也要隨著人們的基本需求而進行更新,以保障館藏的期刊種類能夠基本需求。圖書館的期刊管理中,采購是關鍵性的工作,一般可采用以下的采購方法:各個領域的專家列出符合人們閱讀的本專業期刊,以此為基礎采購;專業的采購人員根據自身的經驗來進行采購。不論在采購工作中采用的是哪種方式,都存在著過于主觀的問題,所采購的期刊往往無法與人們的期刊借閱需求完全一致,可能會在期刊采購以后發現無人訂閱的情況,存在資源的一定浪費。而數據挖掘可輔助圖書館的期刊采購,因為在通過對人們某一時間段中的訂閱與需求信息分析,就可以得出相對可靠的結果,將這些結果用于采購預測,使得采購人員可在這些基礎上進行采購計劃的制定。城市圖書館每年的期刊采購費用是有嚴格限制的,經由數據挖掘在期刊訂閱與采購方面的應用,就可以科學利用這些采購資金來平衡采購。
圖書館可使得人們能夠從各種類型的期刊中學到更多的知識,因此,圖書館的期刊管理工作是非常重要的,經由圖書館給用戶提供的期刊服務,可使得人們能夠在大量的期刊閱讀中開闊其視野和思維。隨著時代的變化,傳統的圖書館期刊服務模式已經難以滿足用戶的需求,而通過數據挖掘在期刊管理中的應用,可使得用戶能夠在最短的時間內就查閱到所需的期刊信息,給人們的知識拓展和研究工作提供指導。因此,數據挖掘可精準分析用戶的需求,進而使得圖書館優化和提升其服務,給用戶提供個性化期刊服務。比如,用戶不需提前申請就能夠獲得相應的資料,甚至在一些特殊的情況下,數據挖掘可經由個性化服務的提供,使得潛在用戶逐步向固有用戶所轉變。
不同的群體因為其知識需求、學習能力等的差別,在圖書館期刊訂閱方面,對資源的需求也存在著一定的不同,但在數據挖掘的期刊管理模式下,用戶在期刊借閱的過程中,也就同步在圖書館數據庫中產生了關于閱讀習慣等基本的個人信息,而后續通過數據挖掘,可實現對各個職業、不同層次的群體對圖書館的資源需求,準確了解到圖書館用戶的偏好、興趣愛好,從而從個性化角度給用戶提供服務。個性化服務可從以下方面來實施:(1)當利用數據挖掘發現了用戶可能存在閱讀興趣的期刊之時,能夠自動地為用戶發出對應信息的提示與推薦;(2)當面對不同用戶,考慮到每個人的取向、偏好都會難免存在一定差異,因此在其進行圖書館網頁信息的瀏覽、檢索時,所提供的界面也實行有針對性的設計;(3)發現用戶的實時需求,關注用戶興趣、需求等的動態化變化,經由數據挖掘來實現動態分析,給服務提供參考。當為用戶提供個性化服務之時,首先需要創建動態需求模型,對相應的需求信息開展搜索與挖掘,將特定主題作為核心標準,來對所采集、整理獲得的信息加以過濾、篩選與整合,構成有效、具有實用價值的信息集,然后利用在線或是離線的模式,對用戶提供針對性的信息反饋。
圖書館中的館藏量龐大,館藏布局也會影響到圖書館的服務水平,因此,在圖書館的期刊管理過程中,同樣也要加強對館藏布局的優化。圖書館期刊往往包含有現刊和過刊兩種,在一般情況下,過刊的數量要比現刊的數量大一些,在圖書館內的占有空間較大,用戶在進行這部分期刊的查閱時,往往相對困難。因為在圖書館的過刊數量龐大,使得用戶的借閱量也相對大一些,為了有效縮短借閱期刊時的時間,就需要圖書館進行館藏的科學設計與布局。數據挖掘條件下,圖書館要進行相應的數據庫建設,其數據庫中的信息應處于動態變化的過程中,不斷進行庫內數據的更新,隨后再通過數據挖掘來了解用戶對哪些期刊的興趣更高,在哪一階段的借閱量比較大,在這些數據挖掘條件下,圖書館的專業管理人員就可以及時根據用戶需求、借閱情況等的變化,來及時進行一些期刊的剔除或者布局調整,實現館內資源的更新。
就用戶的學習過程來看,圖書館給用戶的知識拓展和思維啟迪是非常大的,圖書館可作為用戶的第二課堂,在各種期刊的閱讀過程中,也就進行了知識的拓展,開闊用戶視野的同時也拓展了用戶的思維水平,使得用戶能夠逐步形成良好的學習習慣,鍛煉其專業能力。但為使得用戶能夠通過第二課堂掌握到更多的知識,圖書館就要在自身的工作過程中,給用戶提供最為專業且前沿的信息資料,而數據挖掘可使得圖書館的第二課堂服務水平得以大大提升。
為了使得圖書館的功能更加健全、更為多樣化,并且使其服務質量有效提高,則應當強化對期刊的管理工作,當下的很多城市,其圖書館內的殘破書相對較多,甚至圖書館存在著嚴重的丟書情況,給圖書館的運營帶來了極大的困難。在數據挖掘技術下,通過對圖書館期刊借閱數據的全面分析,能夠掌握一段時間內圖書館中增長幅度比較大的期刊種類,針對這種類型的期刊,在期刊上架的過程中,結合數據挖掘下所得到的預測結果,對于這些期刊預先留出充足的架位。通過對數據挖掘技術的應用,能夠實現對注銷信息的分類整理、計算分析,將其和樣本庫進行全面對比,如此便能確定丟失率過高的現象具體是由何種原因導致的,也就能夠讓圖書館在進行期刊管理時能夠從這些方向來制定優化措施,比如對制度加以完善、人員的合理安排、技術的更新迭代等。對圖書館中一些常常被連續借閱的期刊,可適當增大對這些期刊的采購量,制定科學且可行的采購計劃,數據挖掘下的量化管理,使得采購部門的采購工作更具科學性,采購人員可在采購過程中更有方向性和目的性,進而不斷提升其采購服務質量。
現階段的圖書館期刊管理工作模式發生了明顯的變化,各個城市都要加大圖書館期刊管理中的數據挖掘技術應用,以通過數據分析和處理來提取出有價值的信息,輔助圖書館的期刊管理工作,全面提升圖書館管理和服務水平。