陳江淮
(安溪縣沼濤圖書館 福建泉州 362400)
大數據時代背景中,公共圖書館不僅需要儲存大量的公共教育資源以保障社會群眾開展公共教育學習,同時還需要為群眾提供信息資源、公共教育以及社會文化等方面的服務,進而導致公共圖書館需要儲存、收集、管理的數據資源日漸增多,進而導致信息檢索需要面臨一定的工作難度。因此,對信息檢索進行智能化改革優化能夠為用戶開展信息檢索提供更加便捷的幫助。但是,大多數無序的信息檢索實際應用價值相對較小,難以滿足用戶開展信息查詢、高效快捷的需求,因此需要有關部門重點關注人工智能在實際生活中的具體應用。
人工智能技術是一項基于互聯網技術的新型技術,能夠廣泛應用在大多數行業領域中。人工智能技術的研究發展具有一定程度的挑戰性與創新性,需要相關研究人員對計算機技術、心理學、語言學、影像學以及哲學等領域知識具有一定認知理解,因此,人工智能技術是一項相對廣泛的科學,其中包括計算機視覺以及機器學習等不同種類的專業知識。一般情況下,人工智能的主要研究目的就是使機器系統能夠依據人類思維處理一系列比較復雜的任務。但是,在不同的研究發展階段,人們對于“復雜任務”的定義也不盡相同,但是其本質思想是一直不變的,即通過先進技術使得機器能夠依照人類正常思維與邏輯方法進行相關事務處理,計算機與互聯網技術是人工智能技術能夠實現的核心技術。人工智能技術的發展情況會直接受到計算機技術發展歷史的干擾與影響。同時,由于知識內容的表達方法具有多樣性與變化性,進而導致人工智能技術具有多種不同的推理方法,通常情況下,人們將邏輯推理過程分成兩種,即演繹推理和非演繹推理。
計算機技術能夠幫助人們從海量的數據資源中快速尋找到自身所需要的文檔信息,極大程度地提高了信息檢索的便捷性與效率。從實質角度來講,利用計算機等技術進行信息數據處理能夠為信息化技術進行更加復雜化、深入化的管理創新提供有效保障。在公共圖書館中,將書籍信息或相關文獻信息錄入信息檢索系統中能夠幫助讀者快速尋找到自身想要查閱的書籍,以此提高讀者查閱效率。隨著信息時代的到來,人們對于更加注重終身學習,利用公共圖書館開展相關知識學習以提高自身綜合能力與素養,因此,人們對于公共圖書館信息資源的儲存以及信息檢索問題越來越重視。
自然語言處理技術是人工智能技術中一項十分重要的基礎性系統,其主要研究內容是人類的通用語言特征,及人類常用的語言習慣、語法等內容,并將語言特征有效轉化成計算機語言,以此實現人類與計算機之間的有效溝通交互。自然語言處理技術的主要功能是對垃圾信息進行處理,通過對信息數據進行全面監測,判斷信息數據的內容是否為無用的垃圾資源。將特定的語言規則添加到信息數據過濾系統中,并將其鑲嵌到信息檢索系統中,當系統接收到可疑信息時會將其發送到特定的管理區域,在對信息內容進行全面檢索后分析其是否屬于垃圾信息,從而執行過濾操作。人們能夠對信息進行快速查看,以此判斷其是否符合自身預期需求。自然語言規則能夠阻止句子對其他句子進行含義理解,而在特定的復雜化處理優化后,能夠實現對單個詞語、多個關鍵詞或者長段落進行綜合分析,從而在讀音的語法規則下實現有效的分析判斷。
現階段,人工智能領域中存在一項新型視頻圖像檢索方法。該方法中,人工智能技術能夠有效應用在視頻圖像資源的整合收集、分類關系以及檢索查閱中。視頻圖像信息的特征選取主要包括紋理分析、影響顏色直方圖計算以及利用動態跟蹤算法對視頻局部信息進行動態跟蹤監測,特征選取信息最終形成特征向量。人工智能系統包括自適應匹配算法以及反饋式人工智能神經網絡,會依據特征向量對圖像視頻信息進行分類檢索。整個系統的工作區域是一個完整的二維平面區域,人工智能系統會依據不同視頻片段信息的特征向量進行分類,從而實現對視頻資源的有效整合與分類。當用戶查詢的過程中,只需要在特定區域進行規則細化,即可將視頻資源限制在較小范圍內,以此實現快速檢索視頻圖像資源的目的。其具體流程能夠分為5 個階段,分別是系統訓練、視頻圖像資源聚集、視頻圖像檢索、特征向量提取算法以及人工智能算法。
3.2.1 系統訓練階段
這一階段的系統會進行人工神經系統初始化操作,在系統與用戶之間進行交互的過程中進行重復訓練,以此使得系統能夠適應視頻圖像資源的特征向量,從而對相關影響資源進行更加精確化、細致化的整合分類。
3.2.2 視頻圖像資源聚集
在經過訓練階段的人工智能系統將會正式應用在視頻圖像資源整合分類中,特征向量相似的數據資源會被系統整合到相近區域,而不同類型的視頻影像資源則會依據彼此之間的關聯程度進行劃分[1]。
3.2.3 視頻圖像檢索
視頻圖像資源在經過整合分類后,用戶只需要在特定區域進行詳細檢索即可快速查詢到具體的視頻圖像資源。人工智能系統對于視頻圖像進行整合分類主要有兩項核心操作:第一,就是對視頻圖像資源進行特征向量提取,即確定視頻資源特征的具體表述方法;第二,就是利用對應的人工智能算法,確保用戶能夠依據算法快速查閱到視頻圖像資源。
3.2.4 特征向量提取算法
該技術中使用的特征向量提取算法主要包括顏色直方圖提取,即對視頻圖像資源的顏色信息進行有效分析,從而獲取到視頻圖像資源的全部顏色信息;紋理分析算法,對視頻圖像模式進行有效分析;對局部信息進行運動跟蹤算法,該算法能夠進一步提高視頻圖像資源的分類精確率。
3.2.5 人工智能算法
該視頻圖像檢索技術應用了兩種相對成熟完善的人工智能算法,即自適應匹配算法與反饋式人工神經網,自適應匹配算法在實際應用中具有高效化、精準化的特點,能夠通過分析輸入向量快速查找到特征最為接近的系統向量;反饋式人工神經網能夠通過分析分類結果的精準程度對系統內部參數進行反饋,同時依據實際情況進行修正調節。
人工智能技術應用在網絡信息檢索系統時,主要功能表現在:基于計算機技術對人類智能進行有效模仿、創新,以及擴展,以此豐富人工智能的技術、方法以及相關理論知識等。現階段,人工智能在網絡信息檢索系統中的具體應用主要表現在智能代理以及智能知識服務系統中。智能代理技術最早誕生于20 世紀80年代,是人工智能研究領域中十分重要的研究內容,能夠針對網絡信息檢索中存在的問題進行有效緩解與解決。
智能代理技術是一項軟件程序,使用戶能夠在代理通信協議的幫助下實現信息資源的交換,從而有效解決信息檢索問題。智能代理技術具有以下特征:自動化、智能化、動態化、協作化、代理化以及主動化[2]。智能代理技術在信息檢索中具體應用表現為智能搜索代理,其能夠以用戶的具體需求為核心導向內容,進行信息資源的整合收集以及分類加工,會依據用戶的特定需求以及近期偏好習慣等作為衡量標準進行信息篩選過濾。在用戶界面能夠為用戶提供良好的自然語言查詢功能。當用戶具體查詢需求缺乏足夠的明確性時,智能代理會啟動系統中的推理機制,依此判斷數據庫中符合用戶潛在需求的內容,同時依據用戶習慣進行近似檢索。
智能知識服務系統在實際應用中的主要目的在于幫助人們解決數據資源體量龐大,但是資源獲取具有一定難度的問題。智能知識服務系統主要包括數據資源采集系統、智能處理系統、智能服務系統以及資源數據庫系統。數據資源采集系統主要負責對整合收集到的數據資源進行加工處理,以此將其有效轉變成專業的知識信息。智能處理系統主要負責將采集到的知識信息與資源數據庫中現存的知識信息進行關聯分類,并將符合條件的知識信息精確上傳到資源數據庫中。智能服務系統以及資源數據庫系統又可以成為智能知識存儲系統,是整個智能知識服務系統中最為重要的組成部分,其直接影響到智能知識服務的整體質量與效果。
信息過濾技術主要包括兩方面,分別是信息過濾與安全過濾。信息過濾主要包括數據深入挖掘以及搜索引擎過濾等,是對信息資源內容的過濾;安全過濾主要是指對信息資源安全性的過濾。傳統的過濾方法主要包括文本過濾、包過濾以及應用過濾等,具有操作簡單便捷、靈活性低下、無法有效分析文章語義等缺點。而基于人工智能技術的新型信息過濾技術與傳統技術相比,能夠有效實現文本內容的智能化過濾,不僅提高信息的安全性,同時還能夠有效降低網絡管理系統需要進行的過濾負擔。
語音識別技術主要包括模式識別、信號處理、人工智能、發聲與聽覺機制以及概論理論與信息理論等,在人工智能技術中具有十分廣泛的應用,同時在信息檢索系統中能夠起到良好作用。其主要功能是將人類復雜多樣的自然語言進行有效識別,以此對語言信息進行適當過濾,提取其中的關鍵語音信息,以此為基礎進行信息識別[3]。在識別過程中會將難以有效識別的信息單獨處理,在對語音內容進行整體分析加工后,對關鍵內容進行重新組合,以此檢索有效信息。
異構信息技術在實際應用中能夠幫助用戶對不同格式化的文件信息進行有效檢索,包括XML、HTML、PDF、RTF、TBXT 等常見文件格式;異構信息檢索技術同時支持多種非中文語言信息的有效查詢檢索;支持結構化信息數據、非結構化信息數據以及半結構化信息數據的統籌管理;與關系數據庫之間無縫集成;與開放性檢索接口之間有效集成。全息檢索主要是指支持一切方法與格式的信息檢索,從現階段應用情況分析,異構信息檢索以及全系檢索等存在較大的發展進步空間,需要對自然語言理解、人機交互以及多媒體信息檢索等進行進一步深入研究。
在傳統的信息檢索模式中,雖然用戶因為年齡、職業、興趣愛好以及個人習慣等因素存在一定差異,導致其對于信息檢索的需求不盡相同,但是各領域專家能夠有效解決問題。對于計算機系統而言,對用戶類別進行精準定位同樣是一項相對復雜的工作。各行業領域的高度專業性導致計算機系統難以高效整合信息資源,同時計算機系統缺少專家具備的豐富經驗,對專業知識系統缺少正確的理解認知。在信息體量龐大的情況下,信息檢索技術通常會使用兩種常見的檢索技術,即分類技術與整體檢索技術。分類技術是指將檢索內容依據學科、概念等進行分類,將其規劃到對應的類別中。整體檢索技術就是指對整體文檔或內容進行搜索,但是為了搜索的精準化依舊需要將搜索內容簡單地劃分類別。但是,隨著大數據時代的到來,公共圖書館在日常運行的過程中需要處理海量的信息數據,進而導致傳統的信息檢索技術難以有效保障檢索質量與效率,對新進的信息概念理解不夠明確清晰,在數據分類過程中會出現分類錯誤的問題,進而導致數據信息檢索質量相對低下[4]。信息檢索相對比較淺顯,對信息的分析停留在文字表面,難以有效理解語句中的內在含義,在信息量龐大的情況下,會導致信息檢索的準確度出現一定下降問題。
個性化服務主要是指依據用戶的實際檢索需求、用戶行為習慣、瀏覽偏好以及用戶個體特征等進行相關的信息檢索服務,在個性化服務過程中始終堅持“以用戶需求為核心”的服務思想。公共圖書館具有一定的廣泛性,用戶群體結構十分復雜。在現階段網絡信息服務環境中,用戶信息必須進行深化、細致化以及個性化,這一要求直接決定了整個信息檢索服務的走向,即在實際生活中需要確保用戶能夠在檢索過程中快速、精確地尋找到自身所需要的有效信息。
由于用戶信息搜索行為和搜索內容以及信息服務環境的變化,公共圖書館應當提供良好的知識服務,并對現有知識體系與內容進行創新優化。在人工智能技術應用的過程中還需要為用戶提供非智能化與非專業化圖書館所提供相應的公共服務,包括傳統模式的信息檢索以及相關資源信息的傳遞等服務。隨著人工智能技術的深入推廣與應用,用戶對于現代化信息檢索服務的接受程度越來越高,同時社會群眾在開展公共知識學習的過程中更加傾向于專業知識學習。因信息檢索的過程中,應當將技術重點放在信息資源獲取方法以及知識問題解決方法中,而不是信息資源的獲取途徑[5]。在信息資源數字化、智能化發展的過程中,應當對信息檢索以及相關資源收集整合方法進行簡捷優化,以確保圖書館能夠高效整合公共教育資源,同時確保用戶能夠更加便捷、精準地檢索到想要的信息資源,從而實現信息檢索以及非信息檢索的目的。
公共圖書館與高校圖書館、研究類圖書館以及其他種類的圖書館相比具有較為明顯的特征,即公共圖書館的使用量相對較大,同時對于公共資源的需求種類與數量更加嚴格。在對用戶種類進行分割的過程中,主要結合用戶群體的具體結構對公共服務方法進行劃分,在結構劃分后,公共圖書館能夠以不同分類的用戶需求開展針對性公共服務,從而確保社會群眾能夠有效進行公共教育學習,享受到個性化、專業化的公共服務,從而有效發揮公共資源的社會價值與教育價值。
智能代理服務會隨著信息環境的變化而進行適當調整,依據提前制訂、完善的策略方案與用戶檢索需求進行相關信息查閱、篩選以及分類管理等,從而能夠有效彌補傳統模式中需要等待用戶輸入指令的缺點。智能代理服務能夠在自動化信息資源收集的同時建立索引,經過檢索器以及用戶查詢輸入索引庫,將最終的查詢結果呈現給用戶。同時,智能代理服務還能夠依據當前環境對用戶想要查詢的內容和目的等進行有效的預測推理,并結合運行環境的變化情況對預測結果進行調整變動,從而明確用戶的檢索結果。智能代理服務在運行過程中都會具有完整的智能體系,具有一定程度的問題處理能力以及目標分析能力。
服務器在引入智能代理思維邏輯后,會利用用戶反饋機制對信息檢索進行完善優化,從而確保信息檢索的工作質量與效果,同時能夠為用戶提供比較復雜的檢索服務[6]。用戶需要登錄特定的個人賬號,賬號需要對用戶的查詢檢索記錄進行記錄,當用戶再次登錄時,檢索系統能夠依據記錄信息為用戶提供智能化與人性化的檢索服務,提取用戶經常查詢檢索的信息資源,防止出現多次復查的現象。
除此之外,對用戶反饋意見進行追蹤分析能夠獲取到用戶對于檢索結構的滿意程度,進一步完善信息檢索的質量。由此可見,智能代理服務能夠有效保障計算機系統快速、準確地了解到用戶的具體需求,從而確保人機合一,實現智能化服務的最終目的。
自然語言屬于人工智能領域中的一項分支科目,其中包含了邏輯學、計算機、語言學等內容,其中主要以語言學為重點內容。利用計算機模擬人類語言,以此代替部分資料查閱、信息編寫以及文獻摘錄等工作。自然語言在實際應用中的工作流程主要為:在計算機系統中輸入一定的語法、詞語、推理規則以及語義規則等。在用戶輸入檢索內容后,計算機系統能夠對檢索內容進行逐句掃描分析,結合信息庫識別所有的詞語以及語法,并對詞語進行組合分析,推理檢索內容中的大體意義與內容,從而對知識庫進行相關信息查閱,將近似語義的結果依據關聯程度展示給用戶[7]。
自然語言處理技術能夠對語句段落進行有效分割與標注,對檢索內容進行語法和語義分析,將搜索庫中的涉及內容進行識別標注,同時提取其中的關鍵信息以及搜索特征等,隨后對語法含義進行有效識別與分析,并將其形成詞典以及知識數據庫。自然語言技術在實際應用中需要人工智能技術以及計算機技術進行輔助實施,不需要過多的用戶參與,因此在公共圖書館信息檢索中具有十分廣泛的應用。
公共圖書館是確保我國社會公民能夠有效進行社會學習的重要場所,在新時代發展中,公共圖書館為優化自身服務質量,提高用戶公共閱讀體驗,應當積極應用人工智能技術對信息檢索進行優化改革,以此提高信息檢索質量與效率,進而推動公共圖書館向著智能化、科學化方向健康發展。