1 抽象概念
在數字圖書館時代,基于Web的電子數據庫已經成為重要的教育資源和研究資源,分析這樣的聯機系統的使用價值,提供有關用戶行為的有價值的信息,以及有關在一般領域的電子信息的應用成為了必然。此外,這些發現并改善使用效果的電子系統能否找出需要改進的地方,需要從用戶界面和功能文檔和產品培訓等方面得到有效的加強。本文以同方知網數據庫為例,2002年ELS科學公司提出培養信息素養是圖書館學的首要目標,并指出信息素養的能力來自于訪問、評估、以及根據各種來源問題利用信息求解、研究、決策、和持續專業的發展。鑒于信息檢索(IR)系統的重要性,輔助流程,IR系統的研究、評估和改進、以及滿足用戶的需求是圖書館研究的重要組成部分。
因特網和萬維網已經推出了新的強有力的檢索方式來尋找和共享信息。在科學領域,基于Web的文摘增殖和索引數據庫和電子期刊數據庫推進了研究人員的研究步伐。此外,基于網絡電子資源,促進用戶行為的探索遠遠超出了可能在打印環境中,作為Web服務可以被配置為記錄(日志)的所有相關用戶事務。通過分析這些事務日志,能夠獲得詳細用戶在做什么的畫面,以及他們如何使用此項服務。
本文分析了同方知網支持的事務日志(SDOS)電子雜志系統,并陳述了調查結果。同方知網是中國最大和最繁忙的全文科學、技術和醫學的數據庫。保守估計有6625,000用戶應用同方知網SDOS系統。通過日志分析用來獲得洞察了常年的用戶的使用行為,但大多數研究都集中在網上公開訪問目錄和傳統的IR系統。
2 總體分析
本節重點介紹了SDOS事務日志的全面檢查。調查結果在本節的關注報道訪問分布在注冊的IP地址和各類型的訪問時間,對于術語能否正確理解和認識。
2.1 IP地址分析
對于每SDOS接入,IP地址被記錄在事務日志中。雖然IP地址是識別用戶的一種手段,而且必須有某種關系IP地址和單個SDOS用戶之間,很多因素表明,它是不安全的假設一對一關系:
·用戶可從個人電腦共享訪問SDOS,其結果是,從IP共享PC的地址不唯一的識別各個用戶,設在個人電腦更是如此。
·SDOS可通過代理或緩存服務器進行訪問,在這種情況下,代理或緩存服務器的IP地址被記錄,而不是在最終用戶的IP地址。相同當一個機構使用所謂的“地址轉換”通過防火墻或應用其他設備。這可能會導致所有的訪問,從一個機構或部門來是后面一個單一的IP地址。記錄文件數據的分析表明,SDOS從不同的IP地址訪問。換句話說,主機的一小部分就可產生很大一部分的文章點擊總數。最繁忙的IP地址由文章下載3.6%,而在此之上底部連的IP地址取得0.1%全文的存取。這些研究結果強烈表明,大多數用戶都隱藏在代理服務器或緩存服務器地址,或防火墻或其他設備應用于地址轉換,因此,有不是一對一的個人用戶和IP地址之間的關系。
2.2 重復全文訪問
一個度量評估如何將電子資源滿足信息用戶需求確認是用戶的重復訪問。由于缺少一種機制,以識別個人用戶,只每個IP地址重復訪問可以在該研究中進行分析。SDOS自2012年6月提供的用戶名/密碼認證,在分析日志本文包含的只有少數訪問使用這種認證機制如果IP地址是根據全文文章的下載數排名,僅僅下載一篇文章。而下載至少兩篇文章的用戶,雖然他們的研究結果是基于訪問和個人用戶,而本次研究著眼于每個IP地址的全文下載,它的出現幾率在知網的一次性使用SDOS系統的用戶比重是相當低的。
2.3 日志類別分析
SDOS用法大致可分為14類,分布的14個類別的提請全文觀看是最常見類型的使用戶需求。由于SDOS的獨特之處在于它的大全文數據庫,全文查看最活躍的使用類別,這也清楚地表明用戶對瀏覽PDF格式的文章的偏好。另一個發現是,很多用戶之前沒有閱讀摘要便開始訪問全文。由于全文提供PDF格式,因此在訪問PDF文章,下載和打開文件,使得有幾秒鐘的延遲。若文章、全文摘要以HTML格式保存,則都可以無延遲。
為什么用戶還是喜歡訪問PDF全文直接文章。
·由于網絡的高速傳輸,進入PDF文件是顯然速度不夠快不成為一個問題,因此用戶可以承受的時間由直行到全文判斷文章是否有用;
·用戶可能已經讀過了知網數據庫中的一篇文章的摘要,并認為該制品是有用的;
·用戶可能訪問的文章,因為它已被其他地方引用,導致他們相信這是與他們相關。
3 電子雜志系統說明
SDOS支持兩種方式的導航:瀏覽和搜索。
瀏覽:
第1步:選擇期刊字母列表或期刊類別列表。在SDOS入口頁面,可以看到類別列表或一個字母索引。通過點擊將導致顯示日記列表,這些行動被歸類為期刊清單的訪問類型。
第2步:選擇從日志列表頁面特定期刊在此之后,有關問題列表頁面將會出現。一個名單事件被記錄下來。
第3步:選擇一個特定的問題后,會出現結果,內容的頁面,列出了文章在那個特定的問題。一個文章列表日志被記錄在日志文件中。
第4步:在選擇的文章之后,抽象可用接入類型,或全文可以被看作類型的訪問。
4 查詢行為分析
本節集中研究SDOS搜索行為,特別是查詢每個IP地址,查詢長度、查詢方式、查詢操作、查詢優化等。詢問和查詢術語的定義如下:
查詢:一個或多個查詢條件,并有可能查詢操作。查詢到底是確定提交的查詢中快速搜索文本框在SDOS條目頁面或簡單搜索或擴展搜索頁面。查詢詞:一個查詢詞是任何字符的字符串完整,邏輯運算符號被排除在外。
4.1 大約10.8%的用戶做了超過20個查詢
他們為什么提交如此多的問題?當他們提交的查詢,他們是否有一個特定的文章心里還是他們只是想找到屬于自己感興趣的話題的文章?這兩個問題是因為從作者的經驗,在服務用戶,幾個構成用戶利用電子雜志系統數據庫時數據庫和期刊系統在幫助用戶找到所需的信息時所扮演不同的角色。相比之下,電子期刊系統僅包括研究資料,如果電子雜志系統的主要切入點用戶在搜索信息,很多相關的信息將被錯過。不幸的是,因為電子雜志系統提供了直接的路徑全文,不少用戶放棄查找資料時關注數據庫。鑒于此,這可能是圖書館,以更好地明確不同的角色數據庫和電子雜志系統進行交替用戶服務的模式。此外,這個問題也反映了電子雜志系統掛鉤數據庫的意義。
4.2 查詢策略長度
一個查詢的長度被定義為包含在其中查詢字詞的數目。在SDOS查詢長度的85.2%含有一個,兩個或三個條件,雖然平均查詢長度為2.27條款。這一觀察強調有必要進一步研究的幾個問題。例如,
·做互聯網搜索服務和電子雜志系統的用戶表現出類似的搜索
·有沒有在國內和西方用戶之間的查詢長度方面結構性差異電子雜志系統
·做互聯網搜索服務和電子雜志系統國內用戶表現出不同的搜索在英語查詢策略
通常,包含關鍵字的有限數量的查詢出大致的結果。未經查詢策略進一步細化,這不是一項容易的任務,為用戶定位相關信息。鑒于此,提出以下兩個建議:
·圖書館員應教育有關查詢優化和使用查詢操作的用戶為更有效的搜索;
·電子資源應該利用技術,如相關反饋,查詢擴張,數據挖掘,以了解用戶的興趣,并主動引導用戶相關信息。
4.3 查詢方式
當在SDOS搜索,許多書目字段可以被使用。在許多的情況下,用戶可以通過限制提高定位相關條款的可能性的查詢在一篇文章中的特定字段。可以SDOS搜索領域包括作者姓名,文章標題,摘要,刊名,關鍵詞,ISSN,出版項目標識符,文章全文,以及日志分類等等。為了便于查詢的形成策略,SDOS為用戶提供了兩種查詢方式:簡單搜索和擴展搜索。簡單搜索允許用戶以匹配他們的查詢針對任何先前描述的字段或限制了它們的查詢到特定字段。擴大搜索允許用戶指定最多匹配任何領域或特定領域的兩個查詢。這兩個查詢可以通過組合布爾運算符 - AND,OR,NOT。此外,幾個查詢選項是可用的擴大搜索,允許用戶指定類別的期刊,文章類型,文章語言,日期范圍的限制,排名選項和返回的最大數量文章顯示每一頁上。
4.4 查詢字段
在用戶查詢的關鍵字字段的分布。 “任意字段”是默認查詢字段,匹配任何可搜索字段的,并且采用的是簡單的84.4%搜索。另一方面,擴展搜索用法的大約一半(49.3%),包含的字段。文章標題,作者姓名,和抽象是三個查詢領域中最常用的擴展搜索模式。在ISSN和PII領域很少無論是在查詢模式的使用,可能是因為這兩個字段都是主要由圖書管理員搜索。因此,最終用戶相對較低的使用似乎是合理的。
4.5 查詢優化
一個理想的IR系統只檢索相關文件。然而在現實中,IR系統檢索許多不相關的文件,這是幾乎不可能的,用戶能夠檢索所有通過一個單一查詢相關信息。有經驗的搜索者往往細化質疑的一部分進行搜索。
5 結論和未來的研究
分析了同方知網這個數據庫,SDOS電子期刊系統的使用情況,為了增加SDOS系統的特殊性和電子雜志的有效性和使用水平,系統在一般情況下,對圖書館建議和電子資源開發及管理人員建議如下:
圖書館方面:
·鑒于用戶很少看在線幫助文檔,指導用戶對電子資源的最相關和最有用的功能補償的應用;
·鑒于用戶很少閱讀版權聲明,告知用戶的使用條款和條件以及公平和合法使用的重要性;
·教育普及相關的搜索功能和戰略,幫助用戶高效利用電子資源。
電子資源開發方面:
·利用主動和相關的機制來自動通知用戶關于特色的系統功能和使用的條款和條件;
·提供多種查詢方式,以滿足初學者、高級用戶和專業搜索者;
·利用機制,如相關反饋和查詢擴展,以增強用戶和系統之間的相互作用,幫助用戶制定更有效的查詢。
電子資源管理方面:
·了解服務器負載模式,調整的硬件或軟件的維護任務;
·控制存儲設備的成本、效率、大小以達到最佳的折衷。
電子期刊系統可利用的關聯規則來引導用戶在瀏覽或發出查詢。例如,當用戶發現一個有用的文章,該系統可以顯示文章已下載其他用戶的標題及相關信息。此外,數據挖掘可以利用調查從搜索結果列表中選擇的查詢詞和文章之間的關聯。該系統然后可以使用所發現的規則來推薦物品的基礎上發出查詢的用戶。在這種方式,電子期刊系統可以主動、智能地幫助用戶找到信息,以滿足他們的信息尋求的目標。
參考文獻
[1]《多媒體互動電子雜志發展的瓶頸及出路》2007,(1) 曾凡斌;
[2]《生活型態與電子雜志用戶使用行為關聯研究》2009, 6-8頁 方聞;
[3]《電子期刊數據庫質量與圖書館應對舉措》2008, 27(9) 江梅 徐慶寧;
[4]《交互環境中電子雜志的生存發展探析》2010,7-12頁 韓冰。
作者簡介
苗林(1978-),吉林省長春市圖書館,館員。