999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶數據驅動的智能書目系統構建

2024-07-09 00:00:00彭賢哲石進李明
圖書館建設 2024年1期
關鍵詞:用戶需求

[摘 要] 信息資源時代下,作為知識載體的文獻資源與日俱增,對書目工作的效率和服務質量提出了新的時代需求。總結前人的研究工作,發現書目的最終導向在于服務用戶,但傳統書目在實踐工作中多以資源為導向,用戶的主體地位不夠顯著。為此,當代書目工作應納入用戶因素,重點在于處理書目資源庫、用戶需求、用戶能力三者之間的關系,由此衍生出智能書目的概念及內涵,據此設計構建的智能書目系統,通過動態建設深度標引組織的書目資源庫、針對性滿足用戶各類個性化需求、精準定位用戶各項能力,能夠擴展書目資源庫、用戶需求、用戶能力三者之間的交集,提供相宜的靈活智能性服務,推動書目的智能個性化發展進程,助力智慧圖書館知識服務平臺建設。

[關鍵詞] 智能書目 書目資源 用戶需求 用戶能力 智慧圖書館

[中圖分類號] G250.7 [文獻標志碼] A [ DOI ] 10.19764 / j.cnki.tsgjs.20222005

[本文引用格式] 彭賢哲,石進,李明.基于用戶數據驅動的智能書目系統構建[J].圖書館建設,2024(1):108-120.

*本文系國家社會科學基金項目“面向國家安全的科技情報態勢感知研究”的成果之一,項目編號:21BTQ012。

Construction of Multi-User Data Driven Intelligent Bibliographic System

Peng Xianzhe, Shi Jin, Li Ming

[Abstract] At the era of big data, an increasing number of literatures as knowledge carrier forces the improvement in bibliographic works. Previous research for bibliographic works usually tends to ignore users’ needs for potential knowledge. Thus, this study insists that bibliographic works should take users’ information into account and focus on the relationship among the bibliographic resources, the needs from users and the ability of users. This viewpoint results in the production of intelligent bibliography. Intelligent bibliography system oriented by users concentrates on the collection and organization for bibliographic resources marked by superficial and profound information, satisfaction for various needs from users, and assessment for users’ ability in all sorts of fields. It will provide intelligent services by expanding the intersection of bibliographic resources, needs from users and users’ ability. To some extent, it is feasible to improve the intelligent level of bibliographic work and construct the knowledge service platform of smart library.

[Keywords] Intelligent bibliography; Bibliographic resource; User’s demand; User’s ability; Smart library

0 引 言

書目旨在揭示文獻的內外部特征,通過有效提煉、組織書籍的核心知識內容,可以縮短書籍與用戶的知識距離,降低用戶獲取資源的成本。然而長久以來,書目工作多以書籍文獻資源的建設為核心,遵循“資源決定服務、服務決定需求”的模式,忽略了用戶在書目使用過程中的主體地位,由此構建的書目顯然不適宜當下以人為本的服務環境。知識經濟時代,書目的工作導向應轉向“以用戶為中心”[1],書目構建模式需過渡為“需求決定服務、服務決定資源”[2],人工智能、大數據分析等新興技術的出現為書目工作模式轉換提供了現實途徑,有利于書目工具在新時代背景下的轉型和變革,使其適應“十四五”發展規劃中全國智慧圖書館體系的構建,營造與用戶共創的開放式知識服務環境[3]。

為此,本項研究響應智慧圖書館“以人為本、綠色發展、方便讀者”的號召[4],提出了“以用戶為中心”的“智能書目”,通過將用戶因素納入書目建設的工作中,由收集的用戶數據驅動書目的組織與維護,促成文獻資源的智能化治理,推進書目工具的智能化進程,構建不同用戶的個性化書目工具,為大數據環境下需求多樣、但力有不逮的用戶獲取文獻資源,提供一個知其所缺、曉其所長、明其所需、予其所求的專屬智能助手工具,推動智慧圖書館中知識服務平臺個性化功能的構建與完善。

1 智能書目研究基礎

1.1 相關研究

書目作為文獻資源管理利用的工具,一直以來都是圖書館系統迭代優化工作的重心。自1950年起,圖書館特定業務獨立自動化系統的開發,既已涉及書目編制等諸多任務工作[5]。進入1980年,MARC作為書目元數據格式的出現與發展[6],促成了圖書館系統由鉆研單一任務自動化業務[7]向集成獨立功能模塊[8]的轉型。之后,元數據領域FRBR(Functional Requirements for Bibliographic Records,書目記錄的功能需求)、RDA(Resource Description and Access,資源描述與檢索)、BIBFRAME(Bibliographic Framework Initiative,書目框架)等基于關聯數據設計的書目本體方案,陸續應用于圖書館知識組織與融合。書目編制方案的多樣性雖然有利于文獻資源描述的全面性,但卻阻礙了資源的統一管理利用。因此,下一代圖書館管理系統的研究方向,在于利用云計算、Web技術和發現系統,支持各種開放元數據格式和數據交換協議,實現跨媒體的書目資源描述與組織[5, 9],如FOLIO(The Future of Library is Open,云瀚)平臺開發項目的元數據資源集成中心Codex[10-11]。

傳統意義上書目的功能主要是為用戶提供文獻信息、提高文獻查找速度和效率、最大限度地滿足用戶對文獻信息的特定需求[12]。參照圖書館系統演化先后經歷了以紙質館藏資源為中心、以業務管理為中心、以服務用戶為中心的轉移路徑[13-14],根據功能完善程度的不同,書目的功能實現分為三個層次[15],由低至高依次為固定化的人工被動式服務、自助學習式的查詢式服務、主動積極的精準個性化服務

早期書目工作服務以傳統的紙質書籍目錄為代表,預先制定固定的書目工具,用戶或工作人員再根據具體需求按圖索驥獲得文獻,重在發揮書目的索引服務功能,屬于初級層次的人工被動式服務。

進入20世紀90年代中后期,書目資源的主體從傳統館藏向網絡虛擬資源延伸和拓展,極大拓寬了書目服務的空間,數字書目由此而生,其功能由傳遞具體書籍逐漸轉移到滿足用戶的知識需求,以挖掘組織信息資源為主要內容,由文獻傳遞服務轉向知識導航服務[16],屬于第二層次的啟發式服務方式。

總結而論,傳統書目、數字書目多從信息資源角度出發(見表1),重視對書籍的組織加工、高效檢索、固定組織以及范式分析,呈現結果多為原始信息的篩選重組、二次信息的標準化生成,這雖然在一定程度降低了用戶獲取所需知識的付出成本,但忽略了用戶的知識背景與深層次知識需求,未考慮用戶使用書目工具的能力和對呈現信息的接受效果。

網絡環境下書目面向的用戶更為廣泛,其提供的功能急需擴展與延伸,這是信息時代發展的需要與必然[21]。隨著原始文獻信息的爆炸式增長,不以用戶需求及知識背景為導向的書目工具,常需要用戶擴充自身知識背景,付出較大的時間精力成本才可將書目提供信息內化為知識。于是,圖書館管理系統從以業務為中心的第二代系統向以服務為中心的第三代系統更迭[22],出現了諸如標引智能書目、智能書目推薦、智能檢索、智能閱讀等一系列提高書目工具使用效率、考慮用戶需求和知識背景的書目工具,但其大多僅就標引、推薦、閱讀等單一方面以用戶為導向,或以實現高效的自動化服務為目的,而未系統化地將“以用戶為中心”的服務理念作為貫穿書目編撰的核心內容。

本文在此基礎上,提出了“智能書目”的概念,推動書目服務邁向第三層次,將書目工作中心導向更多地轉變為用戶,從用戶知識需求角度和知識背景出發,力求服務對象的普及化與服務內容的個性化,可有效緩解日益繁雜的書目資源庫、漸趨多樣的用戶需求和有限的用戶知識背景三者之間的矛盾,實現三者交集的最大化。

1.2 智能書目概念

“智能書目”一詞在以往的書目工作中很少被單獨提及,常見于以“標引智能書目”“智能書目推薦”等組合詞形式出現,其主要是通過將人工智能技術引入書目工作中,實現書目工作的自動化,或就書目某一項功能展開智能化的實踐探究,未針對性地對“智能書目”界定概念。在此基礎上,本項研究提出了“智能書目”的概念,認為智能書目是指依托人工智能和大數據分析技術,根據不同類型用戶的知識背景和需求,對文獻進行標引、組織、關聯,為不同用戶提供相宜知識服務的信息集成平臺。

基于用戶視角、根據用戶學習能力組織資源信息[23]有利于改善用戶使用書目的體驗感,“以用戶為中心”作為智能書目的核心思想,蘊含在書目構建的每一步驟中,體現在書目的標引應納入用戶需求而多元分類,書目的組織應基于用戶目的而動態組編,書目的檢索應考慮用戶能力而人性服務,書目的推薦應依據用戶境況而精準推送,書目的閱讀應按照用戶視角而循序漸進,進而構建以服務用戶為目的的書目。

1.3 智能書目構成

書目的構建在于服務用戶,了解用戶有利于書目構建的完備性,通過收集用戶需求、用戶知識背景、用戶學習能力、用戶知識獲取障礙、用戶檢索習慣、用戶興趣愛好等用戶信息[24],為書目的服務方向、服務程度導航。鑒于用戶知識背景一定程度上體現著用戶學習能力、用戶知識獲取障礙等信息,而用戶興趣愛好、用戶檢索記錄作為用戶知識背景外延與用戶需求的交集,故可將書目對用戶的研究聚焦于用戶需求和用戶知識背景,有利于精簡用戶信息,提高智能書目的凝練度和針對性。

傳統書目主要以書目資源庫為研究對象,智能書目將研究對象擴展為書目資源庫、用戶需求和用戶知識背景,根據三者之間的交集關系可將書目資源分為四類(見圖1),包括用戶不需要的一般書目、用戶需要但不具備相關知識背景的書目、用戶需要且具備相關知識背景的書目以及用戶需要的書目資源庫之外的書目。用戶使用紙質書目、數字書目工具得到的主要為部分不需要的一般書目、需要但不具備相關知識背景的書目、需要且具備相關知識背景的書目,這需要用戶進一步的篩選或背景知識學習方能將其內化為知識,但忽視了用戶的交互體驗,且不能確保滿足用戶的特定書目需求。

基于此,智能書目擬通過書目資源庫的擴展和組織、用戶需求的精準劃分、用戶能力定位三個步驟,將用戶需求進一步融入用戶知識背景與書目資源庫的交集之中,使三者實現最大化的重疊,保證提供給不同用戶的是易于內化為自身知識且屬于用戶需要的書目資源。為此,智能書目的實現主要包括書目資源庫建設、用戶需求分類和用戶能力定位三個部分。

2 書目資源庫建設的組織與更新

2.1 書目資源庫組織

傳統書目在于著錄文獻內外部特征,按照一定格式編排組織,揭示和報導文獻信息[18],本質上即是通過各種技術手段篩選、壓縮、整序、揭示分散的原始文獻信息,形成便于傳遞的二次描述信息。

當代的書目實踐工作相比以往有所改變,一方面是研究對象發生了泛化,由規范的紙質文獻信息擴展至非規范的虛擬數字化信息;另一方面,書目工作實踐領域已由傳統學術科研領域席卷至大眾化知識服務環境,面向的用戶更為多元化,不同用戶知識背景參差、需求千差萬別。為調和不同用戶的個性化需求,智能書目將不同用戶的需求、知識背景等主觀性因素融入信息收集、信息揭示、信息組織和書目編撰過程。

智能書目的書目資源庫建設主要在精準性、系統性和動態性三個方面體現了智能化的特點:一是將文獻的語用信息納入文獻揭示的工作中,可據此形成不同用途的書目提供給相應的用戶,助力個性化、精準化的服務;二是以更為系統化的方式組織文獻,由此歸納分析得出的知識內容凝練精簡,可實現智能導覽和新聞播報的快速、高效化服務;三是以一種動態化的方式編纂書目,由用戶根據自己的需求編排書目,以一種靈活化的方式提高用戶的體驗感和滿足感。

為賦予書目智能化的特點,首先,智能書目在傳統書目工作基礎上,將用戶需求納入信息揭示、信息組織、書目編纂的考慮工作之中。例如,通過挖掘文獻的內外部特征獲得語用信息,捕捉文獻中出現的“導讀”“入門”“精通”等帶有明顯用途導向的詞匯,分析提取文獻的引用信息中蘊含的語用內容等,將某一領域的文獻資源按照用戶用途分為引讀書目、入門書目、進階書目、精通書目等,滿足不同用戶的個性化需求。

其次,智能書目組織文獻資源時注重系統性,可針對某一特定領域的學科脈絡演化進行分析,在歸納總結基礎上提供更為凝練、快捷、高效的知識服務。具體過程如圖2,選定某一特定領域,按照時間脈絡形成包含知識演化進程、學術傳承關系、當下研究熱點以及活躍學者等內容的知識圖譜。通過分析歸納式服務,快速引導用戶瀏覽某一領域的知識演化信息及最新進展,構建智能書目的智能導覽和新聞播報功能。

最后,智能書目在書目編纂過程中可提供寬松的變動空間,首先是書目組織對象可以多元化(見圖3),包括文獻、知識點、作者、機構等粒度大小不一、角度多樣的組編單元。另外,書目組編的層級可指定,可指定2個層級,如指定作者、文獻為書目編纂的2個層級,則需羅列每個作者發表的文獻;亦可指定3個層級,羅列隸屬每個機構的每個作者的文獻。

此外,智能書目通過動態組編功能增大書目資源庫與用戶需求的交集,提供用戶更為廣泛的選擇空間。層級的關系可調整更改(見圖3),用戶如需了解不同機構在某個知識點的學術貢獻,可指定一級目錄為知識點,二級目錄為機構,找尋對應知識點下轄的機構分布狀況;而如需獲得不同機構的研究重點,則可將一級目錄更改為機構,二級目錄更改為知識點,通過更改編目依據的順序即可實現。

2.2 書目資源庫更新

文獻資源、用戶需求、用戶能力呈現動態變化,這使得書目資源庫的建設并不能一蹴而就,而是一個動態發展的過程。首先,書目資源庫中的文獻資源應根據用戶直觀需求(用戶檢索記錄)、潛在需求(用戶閱覽記錄),通過擴充范圍方式增大書目資源庫與用戶需求的交集。另外,文獻資源擴充之后需對相關的書目資源信息進一步揭示、組織和編目,按照智能書目的書目資源庫建設方法,及時動態更新書目結構,確保書目資源庫的前瞻性和時效性。

書目資源庫的建設作為智能書目的基礎環節,是提供服務的關鍵所在。 為滿足不同用戶的個性化需求,智能書目需要一個完備、智能、高效、精簡、動態更新的書目資源庫。

3 智能書目系統用戶分析

2012年,Marshall提出的“圖書館服務平臺”[25]迅速贏得了業界的共識與認可。“服務因你而變”“互聯網+”等用戶驅動型變革的大時代背景,催生出大量利用大數據和人工智能技術等實現的“智慧服務”形式[13]。為此,智慧圖書館服務的升級和轉型,應由以“書”為核心的管理體系,轉向以“人”為核心的服務體系[26]。書目系統作為圖書館系統構建的中心環節,亦應貫徹“以人為本”的服務理念,將用戶分析納入智能書目系統建設的核心工作。

用戶畫像構建是分析用戶的常用手段,通過以用戶為中心,合理劃分用戶維度,提取用戶屬性標簽,利用用戶真實數據結構化地表現用戶屬性特征[27]。針對用戶畫像的構建方法,主要分為兩類,一類在于從不同維度用戶屬性中定量獲取高價值信息,進而生成用戶標簽,構建用戶畫像[28],可直觀反映用戶靜態特征;另一類注重通過提供用戶歷史數據來模擬用戶特征,建立用戶概念模型,定性分析用戶需求,抽象用戶畫像[29-31],可識別用戶潛在變化信息。

書目系統用戶的分析可結合兩種構建用戶畫像的方法,剖析分類用戶需求,把握用戶動態發展特點,評估定位用戶能力,識別用戶靜態階段特征。據此,將用戶分析過程分為需求分類和能力定位兩部分,可有效兼顧用戶靜態固化特征和動態發展特征,逼近“用戶真容”。

3.1 用戶需求分類

智能書目從用戶的個性化需求出發,通過不同的服務方式滿足用戶多樣化的需求,通過剖析用戶需求的類別做好針對性的服務。從用戶角度出發,可將用戶對文獻的需求大致分為研究型、學習型、應用型、享受型四類[32],用戶使用書目目的分別為從事科學或戰略情報研究、學習科學文化知識、職業學習進修及業余創作研究、瀏覽欣賞。

本文從書目系統建設、服務角度出發,根據用戶為滿足自身需求而采取對資源使用手段的不同,將用戶需求分為檢索需求、閱讀需求、問答需求以及其他需求。

3.1.1 檢索需求

檢索需求指用戶為解決理解、表達等語言活動中碰到的問題而臨時產生的對個別義項的查詢需求。智能書目對具體的檢索信息進行語義和語用層次的挖掘,為懷有不同檢索目的的用戶量身定制個性化的精準服務。針對用戶清晰明確的顯性需求,智能書目根據用戶提供的特征信息全面且精準地搜尋最佳匹配結果;針對用戶模糊或潛在的隱性需求,智能書目以智能檢索的方式幫助用戶構建清晰明確、符合自身需要的規范檢索式。

智能書目提供的智能檢索功能,具體流程可分為四步(見圖4):首先根據用戶的活動記錄判定用戶潛在可能的需求,據此匹配用戶的輸入檢索信息,結合書目資源庫與之匹配關聯,通過關聯匹配結果指引用戶輸入信息,包括自動補全、校正檢測參考以及可能與之關聯的詞匯等,同時可通過語義挖掘推測用戶檢索的目的或意圖;其次,可依據前一步產生結果構建清晰明確的規范檢索式,借此分析用戶輸入信息的語義內容,更為準確地確定用戶的真實文獻需求,將隱形需求顯性化,促進檢索關聯匹配層次上升至語義和語用層次;再次,可依據檢索結果關聯推薦用戶可能需要進一步檢索的內容,并進一步監測用戶的檢索行為;最后,根據用戶對檢索結果的反饋可判斷性地產生相應的個性化后續服務,如用戶手動重構檢索信息或接納書目推薦的檢索信息,則在更新用戶活動記錄的基礎上,開始新一輪的智能檢索服務。

3.1.2 閱讀需求

傳統書目以推薦服務為主,對用戶閱讀過程中的需求關注較少,但一般用戶在閱讀之前對于文獻的閱讀方法、閱讀順序往往欠缺系統性的認識,需要進一步擴充自身知識背景方能無障礙地完成閱讀活動。智能書目為縮短用戶擴充自身知識背景而消耗的時間,以智能導讀的方式為用戶指示閱讀門徑、規劃閱讀階段和傳遞閱讀方法[33]。

智能導讀通過搜集用戶的個人信息、檢索記錄和借閱記錄,借助大數據分析挖掘技術,依據用戶的年齡、性別、專業、教育程度、閱讀愛好、閱讀時間、檢索記錄、下載記錄、瀏覽記錄、反饋記錄、評論記錄,提取用戶特征劃定不同類別的用戶群,生成包含用戶的個體特征、閱讀目的、閱讀行為、閱讀習慣等屬性[34]的畫像。基于不同用戶群的畫像,構建用戶的閱讀興趣發現模型、閱讀行為預測模型、閱讀目的挖掘模型等,計算分析得到用戶個體標簽,為實現精準化的導讀服務提供依據。

智能書目意在通過智能導讀的形式滿足用戶多樣化的閱讀需求,具體流程如圖5所示,首先精準化推薦用戶需求文獻誘發用戶閱讀興趣,進而以輔讀的提示幫助服務促進用戶無障礙閱讀,最后通過關聯推薦幫助用戶進一步理解文獻內容,提升閱讀層次。 其中,引讀服務階段實現資源的個性化、差異化訂制閱讀,重在引導用戶從零閱讀到開始閱讀,從單一閱讀到多元閱讀,從淺閱讀到深閱讀,從瀏覽式閱讀到精細化閱讀。輔讀服務階段結合用戶知識背景判斷用戶閱讀目的及難點,助力用戶在完成閱讀的基礎上加深對該領域的了解。擴展服務階段,智能書目可通過關聯推薦更深入了解文獻或該領域的其他文獻進而提供給用戶,誘發下一步的閱讀活動,實現個性化的指引,幫助用戶達到閱讀的預期效果。

3.1.3 問答需求

用戶因持有某一確定問題而產生的,在書目中尋求確定答案的需求即為問答需求。傳統書目檢索得到的大多為一些相關內容的文獻羅列結果,不能滿足用戶的問答需求。智能書目借鑒自動問答形式技術產品[35],將自動問答系統引入到智能檢索的服務之中,用于滿足用戶的問答需求。

自動問答系統接收自然語言問句,隨后返回給用戶一個準確的答案。智能書目的問答系統分為問題自動生成子系統和問答檢索子系統。問題自動生成子系統負責自動生成問題答案對語料庫,這主要借助于建設的書目資源庫生成不同專題的問題與對應答案語料庫,通過BERT模型剖析語料庫語義結構生成知識庫,進而自動生成問題答案對(見圖6)。問答檢索子系統負責語義解析用戶輸入問題,檢索匹配問題自動生成子系統的問題答案對語料庫,返回高度相關的最佳對應答案[36]。

通過BERT模型和文本標注技術,建立基于深度學習的生成式問答模型和檢索式問答模型,提高書目問答功能的效用。智能書目的自動問答系統可避免用戶在輸入確定問題后進行二次查找或逐一瀏覽檢索結果,以直接給出對應答案的快捷方式,大大節約用戶查詢時間,達到自動化、準確化、高效化的目的。

3.1.4 其他需求

除檢索、閱讀、問答三大需求之外,還存在探索式的導航瀏覽需求、精準化的訂閱推送需求、參與式的協同管理需求等特殊性的需求,智能書目在滿足主體需求的同時,需進一步將其考慮在內,實現用戶各種需求的定制化服務。例如,導航瀏覽的需求,可通過用戶的檢索頻次及趨勢,將最熱門領域或主題的最新進展以新聞播報的形式呈現給用戶;訂閱推送則可借由依據用戶個人信息、歷史活動記錄的智能推薦功能實現;協同管理則更多以用戶的檢索需求和評論信息作為書目資源庫納新、重組織的參考依據,實現用戶參與書目資源建設管理的目的。

3.2 用戶能力定位

為提供恰如其分的精準服務,智能書目將用戶的能力因素納入其考慮范圍,根據用戶的檢索、閱覽等歷史記錄和個人信息定位用戶能力,為精準恰當的書目服務提供主觀性的參考依據。

3.2.1 檢索能力

用戶的檢索能力作為智能檢索的重要參考依據,影響著系統在用戶檢索過程中提供的幫助服務質量。智能書目利用用戶的檢索歷史記錄,可動態評測用戶的檢索能力變化。利用用戶的檢索方式[37]、檢索策略、檢索詞頻次分布、閱覽等歷史記錄,可在一定程度判定用戶目前的檢索能力。

檢索方式分為一般檢索和高級檢索[38],用戶使用一般檢索和高級檢索的頻次比,可側面反映用戶使用檢索工具的部分能力。此外,用戶檢索策略的多樣性表征用戶的檢索思維能力,檢索依據不同可構成多樣的檢索策略,如關鍵詞、標題、作者、單位、全文、摘要等均可成為檢索依據,愈發多樣的檢索策略,說明用戶具備較為周全的檢索思維發散能力。再者,根據用戶針對相近檢索詞的檢索頻次和檢索之后的反饋活動,亦可間接反映用戶的檢索能力。

智能書目通過測定用戶檢索能力的高低,可用于調整智能檢索對用戶的輔助程度,尤其是用戶檢索輸入信息的錯誤識別與校正。如果用戶檢索能力較差,則更多以智能書目重構的檢索式為準,對用戶輸入信息產生語義關聯挖掘,將符合真實需求的備選規范檢索式推薦給用戶;如若用戶具備優秀的檢索能力,則更多地考慮用戶的具體輸入信息,在保證用戶輸入信息的原始語義條件下,輔之以淺層次的校正,保證檢索結果的精準性。從用戶檢索能力出發的智能檢索服務,在滿足用戶檢索需求的同時,又注重用戶的使用體驗。

3.2.2 知識背景

現代信息環境下,書目面對的用戶千差萬別,閱歷不同的用戶對書目提供的固定化服務的接受理解能力亦參差不齊,實現書目的智能化,則必須了解不同用戶的知識背景,提供對應的個性化、精準化的推薦和幫助服務。對用戶知識背景的了解,需建立在對知識的分類基礎上,據此分析用戶日志、用戶注冊信息、用戶閱覽歷史等,以獲取用戶在不同領域的認知程度分布狀況。

以圖7為例,根據一級學科、二級學科以及下轄研究方向可將知識分門別類,繼而根據用戶對不同領域的認知程度大小可分為精通、掌握、進階、入門、了解和陌生六個層次,通過分析A、B、C三名用戶的閱覽信息、檢索信息以及個人信息,挖掘不同用戶檢索和閱讀文獻的語用信息,判定A、B、C用戶在一級學科、工學下轄二級學科和計算機科學研究方向這三個不同層次的知識背景分布狀況。此外,亦可根據其他知識分類體系劃分知識類別和層次,定位用戶對不同層次知識類別的掌控程度,從綜合、全面、系統的角度定位用戶的知識背景水平,確保定位結果的準確性。

定位用戶對不同知識領域的熟悉程度,可用于判斷用戶的需求變化及趨勢,進而有助于精準化的關聯推薦,誘發用戶閱讀興趣,從而因材施教實現智能導讀。此外,用戶知識背景的定位亦可作為智能檢索的參考依據,從用戶知識背景動態發展階段出發,有利于透析用戶真實需求,構建最符合用戶需求的檢索式。

4 智能書目系統的服務分析與開發實現

智能書目的最終呈現形式表現為向不同用戶提供相宜知識服務的信息集成平臺,“以用戶為中心”作為智能書目的應有之義和核心內涵,應體現并融入在基于用戶數據驅動的智能書目系統平臺搭建過程中。

4.1 用戶能力與需求的交叉關系分析

基于用戶數據驅動的智能書目系統構建注重實現動態組編、智能導覽、新聞播報等多樣化功能,拓展用戶使用書目系統的選擇空間,增大書目資源庫與用戶需求之間的重合度。首先需通過信息采集手段,探明用戶檢索能力和知識背景,確定用戶能力范圍大小,繼而結合用戶的各種需求,確定二者之間的交叉關系;之后,智能書目系統的服務方向、服務策略、服務程度、服務方式均依據二者之間的交叉關系作出對應的決策。

當用戶能力與用戶需求在某一領域存在交集時,說明用戶在該方面的需求有一定知識背景,智能書目系統在智能檢索方面將用戶輸入信息設置較高的權重,保證用戶輸入信息的完整性,同時更多地推薦該領域新聞播報內容,便于用戶及時掌握前沿進展;其次,在導讀方面將深層次的文獻推薦給用戶,在導讀過程中適當減小該領域的基礎知識提示服務力度,更多專注于前沿知識的報導和提示,改善用戶閱讀體驗。

當用戶能力與用戶需求在某一領域不存在交集時,說明用戶在該領域尚屬新手,可能由于興趣或學習而對該領域產生探知需求。為此,智能書目系統在智能檢索方面適當減輕用戶輸入信息的權重,在用戶輸入信息的語義基礎上構建規范的檢索式,同時更多地推薦該領域的經典文獻和入門書籍,便于用戶掌握該領域的基礎知識;其次,在導讀方面注重由淺入深,先易后難,在智能導讀過程中,增強書目在該領域的知識提示服務力度,幫助用戶溫故而知新,同時擴大用戶知識面,關注用戶在無障礙閱讀過程中的獲得感。

4.2 開發流程

智能書目拓展傳統書目工作的文獻記錄、文獻揭示、文獻組織、書目編纂、書目控制、書目情報服務六步過程,將精準滿足用戶需求和定位用戶知識背景加入書目建設工作之內,由智能化技術手段實現,在系統構建過程中展現為信息收集、信息處理與分析、關聯評價模型構建、信息存儲、信息交互、信息呈現六個模塊(見圖8)。

其中前四者用于構建書目資源庫、評測用戶能力,信息交互模塊用于獲取用戶需求并提供相應的指引性服務,確定書目資源庫、用戶需求、用戶能力三者之間的分布狀況及交叉關系,指明信息呈現模塊的服務方向和服務程度,提供給不同用戶個性化的服務,促進書目資源庫、用戶需求、用戶能力三者之間交集最大化。本文構建的智能書目系統,操作環境為Linux,信息存儲數據庫為Mysql、Neo4j,選用的Web框架為Django。

4.2.1 信息收集

智能書目的信息收集模塊,包括書目資源庫收集和用戶信息收集兩部分內容。書目資源庫的收集通過指定網絡端的數字書籍信息源、書籍相關信息源,獲取URL集并去重排序,將處理后的URL集傳遞至分布式爬蟲框架,實時采集書籍的評論、簡介等相關信息;用戶信息的收集主要依托客戶端的用戶日志和數據埋點技術,獲取用戶個人記錄、用戶活動信息等,進而用于評測用戶的知識背景和檢索能力。

信息收集模塊可確保書目資源庫建設和用戶信息獲得的全面性,為書目系統的綜合個性化服務提供數據支持,此步為書目資源庫建設的物質基礎,對書目數據、用戶能力的范圍限定具有決定作用。

4.2.2 信息處理與分析

信息處理與分析模塊分為針對文獻信息、用戶信息的分析處理兩部分。用戶信息的分析處理首先通過信息過濾提取高價值的用戶個人信息、用戶活動信息,獲取單個用戶的屬性結構信息、檢閱書籍的關聯信息以及多個用戶之間檢閱書籍的共現網絡信息,據此定位用戶的檢索能力和知識背景,構建用戶畫像,挖掘用戶興趣,為用戶群的關聯聚類提供依據,繼而為智能書目系統在用戶使用過程中提供的幫助具有指引作用,同時在一定程度上可補充文獻的價值評價、推薦關聯等信息,并可結合文獻的引用信息構建評價指標,進而形成多元化的書目文獻評價體系。

文獻信息的處理分析,通過消重、去歧步驟獲取著者、書籍、工作單位、關鍵詞等之間的網絡結構信息,進而提取書籍之間的引文網絡信息、著者之間的合作網絡信息、工作單位之間的合作網絡信息、關鍵詞之間的共現網絡信息,同時提取書籍、著者、工作單位的屬性結構特征,提供書目分類組織的參考依據。該步驟重在規范著錄文獻的內外部特征信息實現數據的高度結構化存儲,保證書目資源庫的可操作性、系統性、規范性和實時性。

4.2.3 關聯評價模型構建

智能書目的關聯模型涉及文獻、著者、工作單位、用戶等多個層面的內容,通過創建諸如文獻參考引用、作者合作研究、用戶活動規律中蘊含的關聯指標,借助Aprior關聯算法、LDA聚類算法、知識分類方法,訓練優化文獻之間、著者之間以及用戶活動之間的關聯模型,進而提供推薦、導引、預測服務。瀏覽、借閱、檢索等用戶訪問信息,以及文獻之間的引證記錄,作為多樣化評價指標基礎,由此訓練得出的評價模型,用于計算編目次序的權重,篩選優質信息,提高書目服務質量。

關聯評價模型的建立作為信息處理分析的智能化基礎,是書目資源庫靈活組織、智能推薦的基礎,對于書目系統的個性化、關聯化程度至關重要。

4.2.4 信息存儲

書目系統經由信息收集、信息處理與分析、關聯評價模型應用等步驟之后,將規范、詳盡的文獻、著者、機構、用戶等多角度、多粒度信息以唯一且關聯化的本體形式表現,并將本體關聯網絡的節點和連線信息存儲至書目資源庫。至此,靜態書目資源庫的建設基本完成,而信息收集步驟仍采用實時監控手段收集用戶各類需求,為書目資源庫的動態維護更新提供指導。

此外,由信息收集、信息處理與分析過程獲得的不同用戶的檢索能力、知識背景信息亦存儲在智能書目系統中,用于確定用戶能力與書目資源庫的交集關系,為不同用戶獲得個性化服務提供決策參考依據。

4.2.5 信息交互

信息交互用于向書目系統傳遞用戶需求,主要分為用戶活動和系統響應兩個部分,其中用戶活動包括檢索、閱讀、瀏覽、問答等,由關聯模型兼顧挖掘用戶需求和定位用戶檢索能力,匹配與用戶相宜的書目資源,實現智能檢索、智能導讀、智能問答,具體展現為檢索信息的提示指引、糾誤補全、關聯推薦、盲點提示、閱讀指引、問答匹配等指導、輔助、答疑服務。除此之外,針對用戶輸入信息的語義內容匹配關聯存儲信息,系統響應后輸出檢索結果,之后提供語義、語用選項供用戶進一步篩選或組織。

書目資源庫與用戶之間的交互程度彰顯書目系統的智能性,即以指引提示解用戶之惑,借關聯推薦開治學之路,提高改善用戶檢索資源的效率及體驗,增強書目的治學門徑功能。

4.2.6 信息呈現

信息呈現作為書目系統的最后一環,重在為用戶提供多樣化的書目資源組織方式以及關聯推薦服務,組織方式的靈活性給予用戶廣大的選擇空間,增大書目資源與用戶需求之間的交集。智能書目打破固定羅列呈現方式,針對檢索結果的組織形式力求多樣,可指定檢索結果的組織形式,具體選項包括時間、地點、文獻類型等;此外,可指定文獻組織單元的內容大小,如學科領域、研究專題、關鍵詞等;亦可指定創作者組織單元的規模大小,將創作者進一步細分為作者、機構、團隊等。

再者,智能書目以動態組編方式滿足用戶特定需求,通過信息處理分析模塊挖掘匯總檢索結果,將知識演進歷程通過智能導覽形式呈現,同時結合用戶的個人信息,關聯推薦用戶潛在的需求內容。依據不同組織對象形成的書目可以相互嵌套,不同層級書目可依照用戶要求進行次序更改,在很大程度上賦予了書目十分寬松的變動空間。

4.3 驗證呈現

智能書目系統構建樣例,以南京大學圖書館約28萬本紙質館藏圖書書目數據展開,如圖9所示,現已實現功能主要包含檢索、導航、閱覽三項,分別用以滿足用戶不同需求。書目系統的檢索模塊在收集用戶數據基礎上,提示、指引用戶構建規范檢索式,實時推薦高度匹配用戶需求的相關圖書;在凝聚圖書知識屬性的主題詞信息構建的知識庫基礎上,實現知識的檢索發現,獲取某一領域交互式知識地圖,根據用戶對知識節點的點擊閱覽行為推薦最新相關圖書;根據圖書內外部特征生成檢索結果的組別,用戶可選定拖拽組別選項,實現檢索結果的動態組編,并可就具備連續性的圖書特征選項(如出版時間、厚度、價格等)展開排序。

書目系統的導航模塊,包括新書專區、知識專區、叢書專區、熱門專區四個子模塊,新書專區集中于呈現不同學科下轄知識點的最新圖書,知識專區聚焦于根據某一學科知識地圖查詢最新相關圖書,叢書專區致力于篩選不同學科下轄知識點的熱門叢書,熱門專區專注于以用戶借閱量挑選當下最符合用戶需求的高借閱量圖書。同時,不同學科導航專區,根據圖書摘要、簡介等蘊含的語用信息,實現入門書籍、教程書籍推薦等功能。

書目系統的閱覽模塊,用于呈現檢索詳情頁,根據書目信息采集用戶書簽、用戶評論、著者介紹、叢書簡介等相關信息,利用信息聚合功能處理同源異構數據,全面解析圖書內容;以圖書內外部特征為關聯節點,構建完整的圖書關聯網絡,在檢索詳情頁就圖書頁數、價格、出版社、著者等形式特征實現圖書推薦,根據圖書主題詞、學科屬性等內容特征挖掘相關圖書。

5 結 語

書目作為圖書館服務的基礎,在以人為本、由新興技術支撐的智慧圖書館建設中意義重大。為此,智能書目貫徹以用戶為中心的思想,由用戶數據驅動,落腳于優化書目資源庫的靈活個性化建設、用戶需求的精準針對性分類、用戶能力的全面綜合性定位三者之間的關系,為書目管理系統的智能化服務提供了一條現實可行的路徑,有助于智慧圖書館知識服務平臺的個性化、動態化、智能化建設。據此構建的智能書目系統,主要具備以下優勢:

(1)書目資源庫在服務精準性、組織系統性、展示動態性、更新實時性四個方面具備智能化的特點;

(2)根據用戶注冊信息提取用戶靜態特征,結合查檢閱覽行為捕捉用戶動態特征,確定用戶知識背景、用戶檢索能力,從檢索、閱讀、問答、導航等多個需求角度提供針對性的服務;

(3)通過指引補全式檢索、個性優質化推薦、啟發引領式導讀、分析歸納式導覽、多樣動態式組編、新聞播報功能,力求得到用戶的個性化需求、有限知識背景和書目資源三者之間的最優解,為每個用戶打造屬于自己的專屬書目。

智能書目的建設是一個長期的、不斷完善的過程,其中各個模塊的構建仍有拓展、延伸、改良的空間,后續有待于針對專一特定功能展開縱深或定量化的研究,如構建評估用戶能力的指標、優選作者姓名消歧的方法、探析用戶需求階段劃分的途徑等;另外,智能書目應具備開源性的特點,現有的智能書目系統仍具有橫向發展的潛力,用戶需求的多元化可為智能書目功能的橫向擴展提供參考,助力提高智能書目系統建設的全面性。

參考文獻:

[1] 柯平.\"后評估時代\"公共圖書館的戰略重點與發展方向[J].圖書館論壇, 2019,39(7):1-12.

[2] 初景利,高春玲.新時代圖書館與圖書館學的重新認識——兼論圖書館學教育的本原回歸[J].圖書情報工作,2020,64(1):25-31.

[3] 曹海霞,侯新宇,楊洋,等.展望\"十四五\",促進智慧圖書館大發展——第二屆中國高校智慧圖書館(館長)論壇會議綜述[J].新世紀圖書館, 2021(10):93-96.

[4] 王世偉.未來圖書館的新模式——智慧圖書館[J].圖書館建設,2011(12):1-5.

[5] 許磊.圖書館系統演變及其元數據管理[J].圖書館論壇, 2021,41(10):118-126.

[6] KINNER L,RIGDA C.The integrated library system:from daring to dinosaur [J].Journal of library administration, 2009,49(4):401-417.

[7] BREEDING M.Next generation library automation: its impact on the serials community[J].The serials librarian,2009,56(1-4):55-64.

[8] WANG Y,DAWES T A.The next generation integrated library system:a promise fulfilled [J].Information technology and libraries,2012,31(3):76-84.

[9] 殷紅,劉煒.新一代圖書館服務系統:功能評價與愿景展望[J].中國圖書館學報,2013,39(5):26-33.

[10] 周綱,孫宇.開創性的下一代圖書館服務平臺解決方案——FOLIO[J].中國圖書館學報,2020,46(1):79-91.

[11] 許磊,夏翠娟.第三代圖書館服務平臺的元數據管理——以FOLIO的Codex方案為例[J].中國圖書館學報,2020, 46(1):99-113.

[12] 吳冰芝.我國書目情報服務現狀及發展趨勢[J].現代情報,2005(1):43-45.

[13] 謝蓉,劉煒,朱雯晶.第三代圖書館服務平臺:新需求與新突破[J].中國圖書館學報,2019,45(3):25-37.

[14] 吳建中.走向第三代圖書館[J].圖書館雜志,2016,35(6): 4-9.

[15] 文思.《目錄學》(第五-十二章)[J].圖書館,1987(3):50-53.

[16] 謝敏明.如何構建圖書館書目搜索引擎[C].福建省圖書館學會2009年學術年會論文集,福建:廈門理工學院圖書館,2009.

[17] 郭哲敏.語義網環境下書目信息資源的組織——實踐方法與發展方向探討[J].圖書館理論與實踐,2015(9): 47-52.

[18] 彭斐章,陳傳夫.目錄學教程[M].北京:高等教育出版社, 2004:1.

[19] 劉煒,林海青,夏翠娟.數字人文研究的圖書館學方法:書目控制與文獻循證[J].大學圖書館學報,2018, 36(5):116-123.

[20] 詹麗華.我國中文電子圖書書目數據揭示研究[J].圖書館雜志,2021,40(10):64-71.

[21] 彭斐章,付先華.20世紀中國目錄學研究的回眸與思考[J].圖書館論壇,2004(6):5-10,57.

[22] 郭利敏,張磊.FOLIO的技術選型與運營模式研究[J].中國圖書館學報,2020,46(1):92-98.

[23] 羅良道.基于讀者視角的網絡學術資源組織[J].圖書情報工作,2004 (3):79-81.

[24] 王福泉,羅忠鳳,過仕明.基于讀者隱性知識的圖書館知識管理[J].情報科學,2010,28(2):219-222.

[25] GRANT C.The future of library systems:library services platforms[J].Information standards quarterly,2012, 24(4):4-15.

[26] 楊新涯,袁輝,沈敏.向服務平臺轉型的下一代圖書館管理系統實踐研究[J].圖書館雜志,2015,34(9):23-27.

[27] 宋雪雁,張夢笛.晉江文學城原創文學網站用戶畫像研究[J].圖書情報工作, 2020,64(23):63-74.

[28] 韓梅花,趙景秀.基于\"用戶畫像\"的閱讀療法模式研究——以抑郁癥為例[J].大學圖書館學報,2017,35(6):105-110.

[29] 單軫,邵波.國內圖書館領域用戶畫像研究的冷思考:困境與出路[J].圖書館學研究,2019(5):8-13,30.

[30] HUANG K H,DENG Y S,CHUANG M C.Static and dynamic user portraits[J].Advances in humancomputer interaction,2012(2012):1-16.

[31] TANG T,YIN Z,ZOU Y.A method for telecom user portrait modeling[C]//2017 5th International Conference on Frontiers of Manufacturing Science and Measuring Technology(FMSMT 2017).Advances in Engineering Re search(AER),Amsterdam:Atlantis Press,2017.

[32] 周維萍,牛振恒.對《圖書館服務五原則》的商榷[J].大學圖書情報學刊,2008(4):80-82.

[33] 費巍,李雅.談目錄閱讀功能的演變[J].出版發行研究, 2018(6):10-13.

[34] 陳臣,馬曉亭.基于小數據的圖書館用戶精準畫像研究[J].情報資料工作,2018(5):57-61.

[35] 周永梅.基于本體的自動問答系統[D].鎮江:江蘇科技大學,2011.

[36] 李州.自動問答系統若干關鍵技術設計與實現[D].成都:電子科技大學,2019.

[37] 周劍.本科生信息檢索能力實證分析——兼論《文獻檢索》課程改革[J].中國圖書館學報,2013,39(2):121-129.

[38] 凡慶濤,楊萍,杜赟,等.電子信息資源的使用統計分析與評估——以北京市科學技術研究院CNKI、萬方數據庫為例[C]//2017年北京科學技術情報學會年會——\"科技情報發展助力科技創新中心建設\"論壇論文集.北京:北京市科學技術情況研究所,2017.

[作者簡介]

彭賢哲 1995年生,南京大學信息管理學院博士研究生,研究方向為智能目錄、大數據分析與技術。 E-mail:pengxz_tm@163.com。石 進 1976年生,南京大學信息管理學院教授,博士生導師,研究方向為情報學、大數據分析與技術、智能目錄。E-mail:shijin@nju.edu.cn。 李 明 1970年生,南京大學信息管理學院副教授,碩士生導師,研究方向為學術評價、科學計量。 E-mail:njulm@nju.edu.cn。

猜你喜歡
用戶需求
基于用戶需求的圖書館移動信息服務
以用戶需求為導向的高校檔案利用研究
青年時代(2016年20期)2016-12-08 17:50:05
融媒體背景下健康類紙媒的轉型
天津企業涉外事務在線服務平臺開發研究
中國市場(2016年34期)2016-10-15 04:02:07
基于用戶需求的在校大學生寢室用具研究設計
基于用戶需求的政務微信發展策略探析
今傳媒(2016年5期)2016-06-01 23:47:05
探析網絡視頻的產業化發展
今傳媒(2016年5期)2016-06-01 00:17:22
基于智能手機的能源消耗分析及對策
論理解用戶需求對于品牌設計的影響
商(2016年9期)2016-04-15 09:47:56
基于用戶新需求的高校圖書館學科化服務
求知導刊(2016年6期)2016-04-06 00:54:00
主站蜘蛛池模板: 找国产毛片看| 一级香蕉视频在线观看| 亚洲欧美天堂网| 麻豆国产精品一二三在线观看| 亚洲六月丁香六月婷婷蜜芽| 欧美成人怡春院在线激情| 亚洲日韩日本中文在线| 亚洲男人天堂久久| 114级毛片免费观看| 黄片在线永久| 日韩精品毛片人妻AV不卡| 亚洲系列无码专区偷窥无码| 国产欧美日韩视频怡春院| 色悠久久综合| 91毛片网| 69av在线| 欧美α片免费观看| 国产91丝袜在线播放动漫| 99久久人妻精品免费二区| 亚洲永久免费网站| 特级毛片免费视频| 亚洲综合九九| 一区二区三区国产精品视频| 国产性爱网站| 毛片基地视频| 色婷婷电影网| 亚洲中文久久精品无玛| 国产成人狂喷潮在线观看2345| 国产亚洲精品精品精品| 在线观看国产小视频| 婷婷色婷婷| 久久久久无码精品国产免费| 狠狠色丁香婷婷| а∨天堂一区中文字幕| 91国内视频在线观看| 国产91无毒不卡在线观看| 国产乱码精品一区二区三区中文| 蝴蝶伊人久久中文娱乐网| 国产成人免费观看在线视频| 欧美性猛交一区二区三区 | 国产精品视频观看裸模| 一本久道久久综合多人| 最新痴汉在线无码AV| 狠狠亚洲五月天| 国产欧美视频在线| 在线色国产| 69国产精品视频免费| 欧美日韩国产精品va| 99热这里只有精品免费国产| 亚洲欧洲AV一区二区三区| 国产成人亚洲欧美激情| 一本一本大道香蕉久在线播放| 黄色国产在线| 精品少妇人妻一区二区| 日本伊人色综合网| 国产一级α片| 国产精品香蕉在线| 亚洲国产天堂久久综合| 国内精品免费| 免费无码AV片在线观看国产| 伊人天堂网| 婷婷色中文| 高清色本在线www| 91麻豆精品视频| 日本高清有码人妻| 五月婷婷精品| 免费福利视频网站| 亚洲 欧美 中文 AⅤ在线视频| 成人午夜天| 国产99在线| 欧美一级在线看| 国产精品区视频中文字幕| 亚洲一区精品视频在线| 欧美一区福利| 在线无码av一区二区三区| 91欧美在线| 99999久久久久久亚洲| 亚洲精品国产精品乱码不卞 | 精品伊人久久久香线蕉 | 国产精品无码AⅤ在线观看播放| 国产经典免费播放视频| 九九久久精品国产av片囯产区|