李依軒

摘要:在網絡信息搜索過程中,搜索者輸入查詢內容到搜索系統中,從系統中獲得結果列表并評估搜索結果,在這個過程中,他們可能會修改或重新制定先前的查詢直到實現他們想要的目的。通過搜索日志分析,可以發現用戶經常修改或重新制定他們的查詢。Ozmutlu發現約28%的查詢都是之前查詢的重構型; Jansen [4]等的研究表明當忽略重復查詢時,約37%的查詢都是重構查詢。
關鍵詞:網絡信息;查詢重構;背景研究
1.研究背景
網絡信息搜索已成為人們日常最普及的互聯網活動之一,人們通過網絡搜索的方式了解自己所期望的信息。但是, 由于各類網絡信息的大量涌現, 使得網絡環境變得日益復雜, 信息搜索的效率隨之受到較大影響。對此, 許多研究者正試圖探索網絡信息搜索的特征和規律,以期研究出更有效的搜索工具、信息組織、反饋和提示方式[1]。Strohmaier等[2]研究發現,用戶向檢索系統表達信息需求的主要方式是不斷重構查詢,用戶重構的相關查詢是用戶意圖的直接表達,而查詢重構是識別查詢意圖的一種重要途徑。
任務類型對用戶的查詢重構行為有顯著作用。Chang Liu等[3]將任務劃分為簡單任務、分層任務和平行任務,探討三種不同任務類型下查詢重構行為特點。研究發現,一般情況下,簡單的任務包含最小數量的查詢重構,分層任務較多,并行任務包含數量最多的查詢重構。這可以由任務需要的信息的數量來解釋一部分,在簡單的任務時,用戶被要求找到一條信息,而在其它兩種類型的任務,用戶需要找到多條信息。因此,用戶必須發出更多的分層和并行任務的詳細查詢。
在網絡信息搜索過程中,搜索者輸入查詢內容到搜索系統中,從系統中獲得結果列表并評估搜索結果,在這個過程中,他們可能會修改或重新制定先前的查詢直到實現他們想要的目的。通過搜索日志分析,可以發現用戶經常修改或重新制定他們的查詢。Ozmutlu發現約28%的查詢都是之前查詢的重構型; Jansen [4]等的研究表明當忽略重復查詢時,約37%的查詢都是重構查詢。
1.1查詢重構原因
查詢重構是用戶與含有用信息的系統之間的反復過程。Fidel觀察到,在以下三種情況下,用戶會為提高查詢性能對查詢做出重構:1)檢索集合過大 2)檢索集合太小3)檢索集合偏離目標。Hsieh—Yee分析了以下三種情況下用戶搜索的策略:1)在檢索初期時;2)當被檢索的項目太多時;3)當無可用信息被檢索出來時。研究發現,對于查詢重構,當太多項目被檢索出來時在第一個查詢上添加詞匯,用更具體的詞匯或者嘗試另一個不同的搜索詞匯是主要的策略。當沒有相關信息被檢索到時的主要策略是使用其他詞語、用其他搜索引擎或者求助他人。可見,查詢重構類型使用與應用情境有關。Chang Liu等[3]將查詢重構定義為是在用戶與一個能在其中找到能夠滿足他們搜索目標的系統之間反復的過程。不過對查詢重構的概念到目前為止還沒有明確的定義,可以肯定的是,查詢重構是指修改原始的查詢方式,以更好匹配相關文檔的詞匯,最終提高搜索效率的網絡搜索行為[5]。
1.2查詢重構與查詢意圖研究
Strohmaier[2]等研究發現,用戶向檢索系統表達信息需求的主要方式是進行不斷的重構查詢,用戶重構的相關查詢是用戶意圖的直接表達,則查詢重構是識別查詢意圖一個重要途徑。目前幾乎沒有將查詢重構行為信息應用到查詢意圖識別的相關研究,而當前查詢重構行為信息主要應用在查詢推薦中,如Shi等提出了一種基于關聯規則的模型來挖掘與原查詢相關的查詢重構,以此生成候選查詢;Jones等利用根據查詢重構與原查詢共現信息,利用互信息度量查詢間相似性,以此生成候選查詢;張曉娟等[6]基于AOL查詢日志數據集,在不給定查詢意圖類目體系情況下,嘗試利用查詢重構來識別用戶查詢意圖。
2.查詢重構類型劃分
Fidel用兩種策略進行查詢重構分類:操作行為和概念行為。Rieh, S(2006)等擴展了的Fidel的分類,并確定查詢重構的三個方面:內容,格式和資源;并分為四個子面:專指化,泛化,替換同義詞,和平行查詢。這樣的分析為人們提供了一個關于如何重構查詢的全面描述,但這些分類很難實現自動應用算法。
基于Excite 搜索日志,Lau, T.開發的一種方法自動分類查詢四個交互式高級類型。基于查詢的內容、查詢的長度的變化(忽略相同查詢)的這些情況,在一種任務類型下的搜索任務包括:一般化,新穎型,重構型和專指化。Huang等開發了一個廣泛的分類系統,由此他們確定了12種查詢重構類型。除了Lau等 確認的三種類型:移除詞匯(同一般化),添加詞匯(同特殊化)之外,他們還發現其他類型包括文字重排,添加字,縮略式等等。所有的這些分析都將在服務器終端進行分析,而我們的研究應用在可控實驗的客戶端捕捉他們查詢重構的方式,?參照他們探究查詢重構的方法,通過記錄用戶的搜索過程,識別查詢類型,允許我們能夠在有限的時間內分析搜索過程的大量樣本。由此我們根據在兩個連續查詢中常用的詞匯和查詢長度的不同確定了五個重構類型。5個重構類型的分類見表1。
2.1任務類型劃分
三種類型的任務是根據用戶對信息的需要結構而設計得出的。
1 )事實發現型(fact-finding以下簡稱FF),信息需求是由一個單一的或定義的,獨立的資料片;
2 )信息采集型(information-gathering以下簡稱IG),信息需求是由同一層次多個獨立的概念組成,需要對信息的收集和處理;這是一個廣度的搜索;
3 )決策型(decision-making以下簡稱DM),需要用戶搜索某一主題知識的多層次多角度信息,答案的給出需要用戶的判斷。
3.研究意義
本研究的目的是探討用戶完成不同搜索任務時,查詢重構類型的使用情況。其影響因素主要包括任務類型和用戶對以前的搜索結果的滿意度。我們研究了這些相關因素對每個查詢重構類型的使用及其有效性的影響。這項研究的結果有助于理解不同查詢重構類型的使用情境及效用,對查詢系統改善查詢建議有很大的促進作用。
參考文獻:
[1] 朱明泉,張智君,任衍具. 互聯網信息搜索用戶行為模型的探索性研究[J].浙江大學學報(理學版),2006,04:475-480.
[2] Strohmaier M,Lux M,Granitzer M. How do Users Express Goals on the web?—An Ewploration of International Structures in Web Search[C].In: Proceedings of the 2007 International Conference on Web Information Systems Engineering (WISE’07).Berlin,?Heidelberg: Springer-Verlag,?2007:67—78.
[3] Chang Liu. Analysis and Evaluation of Query Reformulations in Different Task Types[J]. Proceedings of the American Society for Information Science and Technology,2001,47(1):1-9
[4] Jansen,B.J.,Spink,A.,Blakely,C.,&Koshman,S.(2007).Defining a session on Web search engines: Research Articles. Journal of the American Society for Information Science and Technology,58(6),862-871.
[5] Xiaobing Xue,W.Bruce Croft. Modeling Reformulation Using Query Distributions [J]. ACM Transactions on Information Systems (TOIS),2013,31(2)
[6]張曉娟,陸偉. 利用查詢重構識別查詢意圖[J]. 現代圖書情報技術,2013,01:8-14.
本文系:2021年度大慶市哲學社會科學規劃青年研究項目 “技術驅動背景下公共圖書館智慧服務研究”階段性成果之一