文/廣東金融學院圖書館 張偉民
隨著圖書資源總數的快速提升,群眾生活和知識升級的加速,怎樣讓用戶在大量的圖書資源中迅速、精確地尋找有興趣的內容,已成為數字圖書館生存和發展必須要重視的問題,數字圖書的個性化推薦為處理這一問題給出了構思。個性化推薦是依據用戶閱讀需求的特點,向用戶給予有針對性的信息提議的一種信息服務方式;而協作推薦是個性化推薦的成功實現,它依據用戶(或項目)之間的相似度特點選擇目標用戶(或項目)的“近期鄰”,并依據“近期鄰”的評分必要性和可能目標對目標用戶的效應值展開分享。因為數字圖書館用戶總數巨大,圖書瀏覽紀錄數字經營規模巨大,在圖書個性化推薦過程中,推薦系統的運作效率十分關鍵。通過分析數字圖書館的服務特點,將概念格方式導入數字圖書的協作推薦中,依據用戶瀏覽的概念格中連接點間的承繼關系,能夠迅速明確“近期鄰”的范圍,得到用戶的閱讀喜好。隨后,通過測算目標對象與每一個可能的“近期鄰”之間的相似性來明確“近期鄰”,而且“近期鄰”和目標用戶的一同喜好也為高效的圖書協作推薦提供了大力支持。
概念格是由美國經濟專家于1982年明確提出的,它是依據二元關系創建的概念結構分析,也是數字分析和標準獲取的合理工具。概念格的每一個連接點稱之為概念,每一個概念都包括概念格的外延和內涵。外延性表示概念中包括的全部對象的結合,含義表示外延性中全部對象對應的特性集。在形式概念分析中,數字集以形式背景的形式展現,這是結構概念格的基礎。依據用戶使用數字圖書館的行為方式來敘述瀏覽感受稱之為使用細分化,一般來說,一個組織只有滿足一個或比較有限數目的用戶行為需求,被稱為“對焦于主體”。數字圖書館應當能夠在概念格理論的基礎上改善其設計和搭建,以滿足不同行為方式用戶的全部需要,考慮到朝向不同行為精彩片段的全部元素,隨后實現數字圖書館用戶的使用切分,以滿足大量用戶的個性化需求。
數字圖書館的均方誤差低,因此搜索引擎從本質上改進數字圖書館與用戶需求之間的分歧,信息查找是概念格運用的一個成功領域,數字圖書館的知識組織既要考慮到顯性基因知識,也需要考慮到潛在性知識。概念格能夠獲取關聯規則,蘊含標準和歸類標準,進而發現和獲取暗含知識,幫助進行知識的搭建。現階段,概念格在數字圖書館組織中的運用主要集中化在以下幾個層面:細分化用戶市場,細分化用戶使用,挖掘用戶查找行為及其運用概念格挖掘圖書關聯規則,大部分庫最少包括二種對映異構資源:同義詞庫和文字。在這種狀況下,即便有很多領域權威專家的手動式參與,也難以通過用單一的知識資源構造搭建領域本身來確保領域本身的科學性和一致性。融合搭建單構造知識資源領域本身的學術研究經驗,融合基于不同構造的知識資源領域本身的優點,探尋搭建對映異構資源領域本身的基本思路和辦法,將是未來時期數字圖書館領域本身搭建的必然方式。
依據作者明確提出的基于概念格的協作推薦方式,能夠迅速尋找目標用戶的“近期鄰”,進而節約系統在圖書協作推薦過程中的時間耗費。當數字圖書館用戶瀏覽數字庫文件的很多數字時,該優化算法能夠合理提升系統的推薦效率。
(一)基于概念格的關聯規則挖掘。基于概念格的數字圖書館用戶細分化是對基于概念格的數字圖書館用戶市場細分化研究的健全,盡管此類研究能體現用戶人群特點的細分化自變量,也能充分實現了用戶市場細分化,但依然無法處理利基市場的營銷的概念,很多用戶的個性化閱讀特點非常容易淹沒在數字深海中。這是由于基于概念格的一般關聯規則挖掘方式在格的結構過程中內嵌了閥值主要參數,為了更好地確保挖掘時間的可行性,預置的閥值通常很高,需要調節有關閥值以挖掘大量標則需要再一次實行該操作以搭建新的概念格構造。由此產生的概念格具備低器重性,用時少,在結構概念格的過程中,只考慮到對象與特性之間的偏序關系(基本格結構觀念),不考慮到閥值因素,概念格的構造不受閥值的影響。在沒有影響概念格構造的條件下,挖掘和獲取具備不同支持度和置信度閥值的關聯規則(尤其是低支持度標準),挖掘大量的潛在用戶的閱讀重要價值,常見的閱讀觀念是搭建網格圖,隨后獲取其他類似的資源。例如在“平穩階段”,只需挖掘的數字源不產生變化,搭建的概念格構造是比較穩定的,這一階段的關鍵是數字預備處理。因為最終獲取的標準一直受到支持度和置信度閥值的管束,因此需要開展較好的數字預備處理,以保證挖掘結果的實效性。“可變性階段”在基于概念格的數字圖書館用戶市場細分化研究中,在結構概念格后,能夠依據概念格的聚類算法實現用戶市場細分化,并在取得的概念格的基礎上挖掘用戶使用方式的關聯規則,假如得到的標準沒有具體意義(一般由領域權威專家明確),調節支持度和置信度閥值,并在原格構造的基礎上再次獲取,獲得的標準具備一定的意義,依據其是不是足夠體現潛在閱讀用戶的使用特點來辨別是不是滿足閱讀的需要,假如以上的平穩階段滿足閱讀要求,則將直接依據得到的標準進行切分。
(二)基于概念格的圖書協同推薦。圖書協同推薦步驟主要包含三個流程:第一,依據用戶訪問圖書的紀錄,結構體現用戶與圖書二元關系的形式背景,并從形式背景中獲取定義格;第二,依據定義格,找到“近期鄰”向目標用戶推薦圖書的可能范圍,明確可能的“近期鄰”和目標用戶的一同得分項目,依據常見得分項目測算可能的“近期鄰”與目標用戶的相似性,依據相似性明確目標用戶的“近期鄰”;第三,通過“近期鄰”與目標用戶的相似性,測算出代表目標用戶對某種圖書興趣愛好的協同推薦值,依據估算出的協同推薦值,明確向目標用戶推薦的圖書及其相應的推薦抗壓強度。在數字圖書館的服務過程中,每一個用戶的圖書訪問信息在日志數字庫文件組成一條紀錄,詳細說明了圖書訪問信息,用戶真實身份和訪問行為的各個領域。這些訪問紀錄能夠體現用戶的興趣愛好。通過對日志數字庫的解析xml和分析,能夠獲得每一個用戶的訪問歷史,并依據訪問歷史創建以用戶ID為行,訪問內容為列的訪問信息引流矩陣。引流矩陣中的用戶,書本及其二元關系組成了用戶訪問圖書館的正式背景。在圖書訪問過程中,同一用戶多次訪問很多圖書,訪問頻次表明了用戶對相應圖書的興趣愛好。因此,訪問頻次能夠作為正式背景下用戶與相應書本之間的二元關系的成績,數字閱讀背景的屬性(項)是初始圖書名字或歸類圖書種類名字。例如為了更好地實現對目標用戶的一些圖書的協同推薦,訪問過這些圖書的用戶需要選擇幾個臨近或者相似用戶興趣愛好點的用戶作為“近期隔壁鄰居”參與協同推薦。依據前一節獲得的簡單化定義格中每一個屬性項的傳遞性,明確提出了一種“近期鄰”的快速查詢方式,能夠為目標閱讀用戶給予精準的圖書推薦。要尋找目標用戶的“近期鄰”,首先明確“近期鄰”的可能范圍,隨后從該范圍中獲得每一個用戶與目標用戶的一同得分項目,最后通過一同得分項目獲得每一個用戶與目標用戶的相似性,并選擇“近期鄰”,依據相似性對目標用戶開展歸類。基于簡單化定義格的構造,通過解析xml目標屬性連接點的子連接點和“近期鄰”,迅速得到目標用戶可能的“近期鄰”范圍。再加上迅速追蹤目標用戶隔壁鄰居用戶的一同得分項目,便捷直接地選擇目標用戶的得分,提升了協同推薦的實行效率。基于定義格的用戶切分是將很多分散化但個性化的用戶需求引進到用戶切分的視覺系統中。并不是在發掘過程中得到的全部標準都具備具體意義,但要是必需,在支持度和置信度較低的情形下,可以得到很多在具體運用中有意義的標準。現如今,國內很多一線城市完全免費為群眾給予CNKI查找服務,定居在大學校園的老師或研究工作人員能夠訪問CNKI資源。對于CNKI而言,國內目前的適應面積和使用效率還很低,但這并不代表著這種閱讀行為方式應當被忽視,在未來,隨著數字化經濟的發展,類似的查詢模式會應用得越來越好。
(三)概念格的數字圖書館用戶行為分析。概念網格代表每個連接點之間的關系,概念網格的形式構造函數是分析中的關鍵數字結構,主要在每個連接點和屬性特征之間體現。關系規則優化算法恢復了庫用戶不同行為之間的關系,然后設置了一個正式概念背景模型,建立了一個正式的概念背景模型,探索不同用戶的需求,引發不同人群之間的行為關系,帶來基本理念,并參考了傳統圖書館對數字圖書館的服務需求,揭示數字圖書館用戶行為的最終目標是滿足用戶的需求,給予大量體驗,基于上述邏輯,在未來可建立數字圖書館用戶行為的概念模型,實現了用戶行為的深度離散,讓一部分根據不同的用戶行為需求對概念網絡進行了研究,根據移動庫場景的用戶設定數字、角色和用戶需求。第二部分是結構化形式的概念和背景標簽的概念,基于Hasse的概念,它被映射到用戶組聚類算法,分析不同組的用戶行為,找到它們的關系規則,準確掌握用戶行為的需要,并實現用戶行為的粗粒度,從而實現準確實施高校移動圖書館的用戶需求。例如通過分析用戶閱讀結構模式,以便用戶促進計算機語言的過程和應用,更好地減少用戶對用戶字符屬性的肖像,必須減去模糊的概念模型,然后創建一個用戶部門的投影,用戶標簽劃分用戶的自然屬性和用戶字符屬性,用戶的自然屬性包含用戶的性別、年齡、類型、專業等,用戶的特征屬性主要是預期用戶。符合級別,包括媒體網絡的用戶,網絡設計合理布局,互動質量、信息質量、搜索質量、服務態度、客戶服務溝通技能和與用戶的互動溝通技能對屬性有一定要求,需要對相應的標簽和屬性開展約簡和合拼,融合有關類別的標簽,以此解決用戶的需求和基本屬性標簽。超級星移動圖書館是專門為各種圖書館構建的專業移動閱讀文章平臺,用戶能夠通過手機、iPad等移動終端設備查看館藏品資源,還可以通過移動設備升級全新推薦書目,訪問更多的數字圖書館。超級星移動圖書館有著數百萬冊電子書,大量報刊資源和東西方參考文獻資源。通過獲得這些資源,能夠為用戶提供大量的選擇和服務,讓用戶能夠在家里閱讀文章經典好書。根據元數字的基本原則,該系統集成了內部和外部書籍、報紙、雜志,學術論文和專利,以及一站式搜索移動終端設備,導航欄和小說免費閱讀服務。同時,還實現了收付款查看、預定、報失、續訂、期滿提示、咨詢參照等一站式服務,并具備咨詢話題討論、新聞發布會、經典好書推薦、圖書個人收藏等信息溝通交流作用。因此,利用這種模式進行社交互聯網下移動圖書館的用戶行為,以充分了解用戶的行為需求,再定期運用conexp1.3軟件搭建用戶切分標簽的概念格,搭建了正式的數字閱讀概念背景。在產生形式概念的背景下,每一個屬性與其他屬性之間存在偏序關系。在這種狀況下,每一層概念以合理的形式組成這一層的概念格,用戶按段標識揭露了非常概念跟子概念之間的偏序關系。其中,超概念比子概念更具有外延性,子概念比超概念更具有時代含義。伴隨著等級的提升,等級所代表的數字也將提升,最終定位到指定的對象上。
概念格以其獨特的閱讀優點吸引愈來愈多的研究者關心,并在很多運用領域獲得了普遍的運用。數字圖書館的建設應充分參考概念格的研究成果,提升其在這一領域的運用。面對日益豐富的大量信息資源,數字圖書館建設的核心也將轉為數字信息的深層解決和運用,以提高其關鍵作用,進一步提高數字圖書館查找平臺的用戶滿意率。