999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

搜索引擎個性化信息服務探討

2013-08-21 08:36:22
圖書館 2013年1期
關鍵詞:搜索引擎用戶服務

(南開大學商學院信息資源管理系 天津 300071)

1 搜索引擎個性化信息服務概述

1.1 個性化信息服務

馬忠庚等人將個性化信息服務定義為能夠滿足用戶個體信息需求的一種服務,即根據用戶提出的明確要求提供信息服務,或通過對用戶個性、使用習慣的分析而主動地向用戶提供其可能需要的信息服務〔1〕。個性化信息服務應該根據用戶的知識結構、心理傾向、信息需求和行為方式等來充分激勵用戶需求,促進用戶有效檢索、獲取信息以及有效利用信息等,并在此基礎上進行知識創新。劉蕤認為,個性化信息服務,是指針對用戶提出的明確要求,利用搜索軟件在海量信息庫中篩選出符合其需求的信息,或通過對用戶個性、使用習慣的分析主動地向用戶提供其可能需要的信息服務〔2〕。

比較上述二者的定義可以發現,個性化信息服務主要由對應的兩個方面共同構成,一個是用戶推動,即信息定制;另一個是機器推動,即計算機分析記錄用戶行為,發現潛在規律,建立獨立的用戶興趣模型,進而運用相關的技術與算法,主動向用戶提供盡可能滿足用戶喜好的信息與服務。

通過用戶個人的主觀描述以及機器客觀的深層分析與挖掘,必將帶來更加良好的用戶體驗。首先,每一位用戶都是一個獨立的個體,其知識結構、心理傾向、獲取信息的類型與方式都是特有的,所以,信息服務應當為用戶量身定做合適的服務內容與方式。其次,網絡信息資源類型、內容的多樣性,一方面為用戶提供了多種選擇,但同時也增加了用戶挑選所需信息的難度,降低查詢與瀏覽效率。若能提供個性化信息服務,用戶便可以在固定模塊或站點迅速找到具有很高權威性與可靠性的目標內容,并可實時獲得更新信息。最后,用戶的這種個性化信息需求,對某些站點服務器數據庫中信息資源原有的組織方式也會帶來新的挑戰,比如,原先所使用的分類方式面對用戶的查詢需求與興趣模型,可能會暴露其缺陷,并促進技術人員研究出更為高效的組織方式等〔3〕。所以,個性化信息服務的提出為傳統的信息服務業帶來了挑戰,但也面臨著很大的機遇。

1.2 搜索引擎的優勢與劣勢

1995年,雅虎用目錄式搜索方式敲開了搜索引擎的大門,以一種把各類網站分類、排序的方法將紛亂如麻的網絡信息理出些許頭緒。1998年,Google舉起了第二代搜索引擎的大旗,即關鍵詞搜索,搜索框的出現給用戶帶來了驚喜,它實現了檢索的機器化,其PageRank鏈接分析算法等新技術的出現更是提高了搜索質量與搜索效率。歸納起來,當前搜索引擎的優勢主要體現在以下幾個方面。

(1)超鏈分析。超鏈接的出現極大地方便了相關信息之間的跳轉。超鏈通常分為三類:錨點鏈接、內部鏈接以及外部鏈接。對于網站建設者來說,超鏈接使得站內的頁面之間互相有聯系,結構清晰且有層次,通過鏈接可以引導用戶。對于用戶來說,則可以更加快速地跳轉到自己感興趣的頁面。對于搜索引擎本身來說,則提供了一種對頁面的等級/重要性進行計算并排序的更為科學的途徑,譬如google的PageRank算法。

(2)反應速度快。搜索引擎極大地提高了人們手動查找信息的效率,它借助于計算機強大的計算能力以及自身內部的搜索算法,使得用戶在輸入關鍵詞并開始搜索之后不到一秒就可以得到相關結果的標題與摘要。用戶只需要瀏覽這些結果并點擊鏈接便可以輕松得到詳細的信息內容。

(3)操作簡便。不論是關鍵詞搜索還是目錄搜索,對用戶的技術要求都很低,用戶只需在搜索框中輸入自己的問題,而查找的過程與排序的算法都是透明的。任何人都不需要進行專業培訓、掌握專業技能,就可以進行簡單的搜索操作。

(4)網絡資源豐富。網絡資源類型多樣并更新迅速,網絡資源的開放性與獲取方式的便捷性,對用戶來說更是無法抗拒。而且,隨著用戶數量的增多以及用戶需求的多樣化,越來越多的傳統紙質文獻都會被數字化,更加方便大眾的使用。

縱觀前兩代搜索引擎可以發現,導航目錄式搜索引擎只能給用戶提供簡單的大致方向,而不能提供精準的結果;而關鍵詞搜索則以其機器內的固有算法,為用戶提供大量可能相關的網頁列表,至于哪些是真正滿足用戶需求的,依然要由用戶自己判斷,用戶體驗依然不夠好。網絡世界正在呼喚更為強大的第三代搜索引擎。微軟亞洲研究院高級研究員周明博士則定義第三代搜索引擎是“全信息基礎上的個性化搜索,并在此基礎上作推薦”的智能化搜索〔4〕。目前Web服務范式〔5〕發展非常迅速,一些Web服務商也在開發能夠在分布式以及異構環境下為用戶提供服務的技術。這種技術的應用將使用戶能夠在任何環境下得到所需要的任何信息〔6,7〕。譬如,Web服務不僅能夠定位用戶的具體地點,而且能夠記錄用戶的路線,并能夠根據這條路線為用戶提供可行性的建議等〔8〕。

隨著互聯網的發展,搜索引擎面臨著眾多的功能與技術上的革新。同時,隨著Facebook等社區網站的逐漸流行,社交網絡平臺和相關應用占據了互聯網的主流,而社交網絡所強調的是用戶之間的聯系和交互;Twitter、微博等提供微信息發布的個人媒體平臺逐步興起,又對搜索引擎的實時性提出了更高的要求;面對移動互聯網的快速發展,針對移動設備的各種新特點,提供適合移動搜索的搜索引擎又成為新的挑戰等〔9〕。這些發展潮流使目前的搜索引擎暴露出越來越多的弊端,越來越不合時宜,具體體現在以下幾個方面。

(1)被動接受用戶的提問,主動性明顯不足。當前的搜索引擎只能根據用戶輸入的關鍵詞,返回索引庫中已經被網絡蜘蛛抓取到的網頁標題與摘要信息。不論搜索者是誰,只要輸入的關鍵詞是一致的,返回的結果也完全相同。雖然目前一些搜索引擎包含個人主頁,并針對以往的搜索歷史進行話題推薦,但這種推薦機制層次很低,只是簡單匹配關鍵詞,不能了解用戶真正的需求愛好。而真正能夠滿足個性化需求的搜索引擎,不僅要返回機器算法認為相關的結果,而且應當盡可能地收集用戶行為信息,了解用戶的個性、知識結構、興趣愛好、職業等信息,從而在機器搜索結果的基礎上,過濾掉那些與用戶需求明顯不匹配的條目,減輕用戶挑選的難度。還可以利用協同過濾技術,將用戶興趣模型比較相近的用戶進行聚類,發現用戶新的潛在的興趣點,擴展更新興趣模型,改善搜索結果。

(2)因傳統搜索引擎固有的工作機制,使得搜索結果內容有一定的時滯。傳統的網頁搜索依賴網絡蜘蛛抓取的網頁建造索引庫。由于互聯網網頁眾多,同一個網頁被蜘蛛再次抓取必然要間隔一定的時間周期,而這對實施搜索是非常不利的。在大多情況下,用戶想要了解某些最新的信息,會求助于搜索引擎,所以搜索引擎必須要建立實時索引庫來收錄那些經常更新的站點,以及包含當下熱點新聞的站點,并盡可能與社區網站建立聯系,借助于社交網絡巨大的用戶群以及隨時隨地更新的信息庫,為搜索用戶提供最具時效性的相關信息。

(3)盡管現有搜索引擎已經開始設置個性化用戶界面,但實現程度依然很初級,不能實現記錄用戶特征智能化,滿足即時需求。智能型體現在兩個方面。首先是對用戶興趣模型的主動更新。每一個體的知識結構都是階段性的,其信息需求也將是階段性的。搜索引擎應該隨時隨地關注用戶的瀏覽行為以及瀏覽記錄,并對記錄進行分析,發現潛在的細微變化,并及時更新興趣模型。興趣模型的維護是一個動態的過程,而不應一勞永逸。過期的模型庫所反映的搜索結果甚至會使用戶感到反感,不利于用戶體驗。另一方面,體現在情境搜索,即針對“此時此地此人”來建立模型。建模的目的是為了更好地了解用戶需求。一般用戶的搜索都是與此情此景分不開的,需要搜索引擎可以定位用戶的地理位置。所以智能化為搜索引擎提出了很大的挑戰。

(4)對于專業性高或者復雜的問題找不出滿意的答案。網絡信息資源固然豐富多樣,但就目前來說,對于專業性強的問題,依然無法找到全面且權威的答案。這要歸因于搜索引擎與專業性網站的關系,大多數專業性的全文數據庫都是付費的,而且其內部有自己的搜索引擎,對外部的搜索引擎是屏蔽的,用戶當然得不到這類信息。而這部分信息才是最為全面準確的信息。

(5)網絡廣告干擾。搜索引擎本身就是一個商業化的產品,廣告商看到搜索引擎如此快速的成長趨勢以及大的用戶規模,便會利用這種良好的宣傳手段,搜索界面以及搜索結果中會滲入很多廣告宣傳性的條目,這些條目對大多數用戶來說都是干擾性的。

1.3 搜索引擎個性化信息服務現狀

艾瑞咨詢2010年統計結果顯示,中國搜索引擎的用戶覆蓋率(搜索引擎用戶覆蓋率是指搜索引擎用戶數量占互聯網用戶數量的比例)從2002年的25.4%迅速增至2012年的82.9%,搜索引擎的受眾規模與受眾粘性都在逐年增加,并將保持穩中有升的局面,它已經成為用戶進入網絡的第一入口。所以,提高搜索引擎的個性化信息服務程度,在提高網絡服務用戶體驗中占據著舉足輕重的作用。

1.3.1 國內論文期刊網站中有關搜索引擎個性化論文數目與內容統計

本文選取《中國期刊全文數據庫》(CNKI)為檢索數據庫。統計對象為與搜索引擎以及個性化相關的期刊論文,采用標準檢索。具體檢索策略為:在文獻內容特征中選擇主題字段,并將主題字段設置為搜索引擎和個性化,兩者之間是“并”的關系,選擇精確匹配。

對檢出的1847篇論文按照相關度進行排序,選擇前100篇作為統計分析的對象。采用excel軟件對論文的主要信息予以登記,對論文主題詞進行提取、歸類以及規范化。對關鍵詞的篩選與統計按照以下原則進行:舍棄出現次數少或者與主題相差較遠的關鍵詞,合并相近的關鍵詞,共獲得12個關鍵詞,并對各個關鍵詞在哪些論文中是作為關鍵詞出現進行了統計,如表1所示。其中“算法”主要是指相關度計算方法、PageRank算法、搜索結果聚類、過濾算法、排序算法等。“技術”則代表了Agent技術、中文分詞、人工智能以及建模技術等具體的功能實現方法。

表1 與搜索引擎、個性化相關的期刊論文關鍵詞及出現次數統計

由表1可見,當前個性化搜索引擎的研究重點主要在模型的構建與實現上,大多數研究者在論述自己的模型之前都會先對目前市場上所使用的搜索引擎進行系統性的分析說明,指出現有搜索引擎的諸多不足,進而從現有搜索引擎出發,對相關模塊進行改進,并指出其實現的可能性,以期更能滿足用戶個性化的信息需求。用戶興趣模型的構建以及用戶信息的采集與更新,都是滿足個性化需求的前提,其高詞頻的出現是意料之中的。而本體&語義以及Web挖掘的出現則表明,目前個性化搜索引擎的研究不僅僅停留在表面,已開始從更深層出發,運用本體論以及語義層次的相關技術,對用戶的網絡行為以及網絡數據庫中的網頁內容進行深層挖掘和匹配,使搜索引擎更加了解用戶,弄清其潛在的信息需求,精確化檢索式并對檢索結果進行個性化的排序。

除了統計以上關鍵詞,在這100篇搜索結果中,還有11篇是探討個性化搜索引擎在具體領域中的應用,例如,個性化基礎教育搜索引擎用于個性化教學的研究、農業專業搜索引擎個性化服務研究與實現、知識產權搜索引擎分析與設計等。搜索引擎的發展必將向著專業化、個性化、智能化的趨勢發展,而不僅僅向大眾提供大量異構的非專業化的雜亂信息。個性化搜索引擎在具體行業的應用體現并推動這種趨勢向前發展,大量個性化的垂直搜索引擎的出現恰恰體現了時代的需要。

1.3.2 現有搜索引擎個性化信息服務實例

iGoogle是Google提供的一項服務。該服務讓使用者按照個人的喜好方便地定制和整合不同來源的信息,使之成為個性化的門戶。該服務的實現主要借鑒了門戶(Portal)與門戶塊(Portlet)的思想,即一個完整的門戶頁面由用戶定制的門戶塊構成。用戶通過訪問一個聚合了不同信息來源的門戶頁面,避免了多次訪問的麻煩。個性化的定制選擇,為用戶提供按需實現的“一站式”服務。這也是目前國內搜索引擎的一個發展趨勢——門戶化,使用戶僅在搜索引擎時便可瀏覽訪問各種信息。

自定義主頁的功能使用戶可以根據自己的喜好分別選擇首頁的名稱、所需的小工具、頁面主題以及頁面布局等,并定制自己感興趣的新聞資訊,如財經、體育、娛樂等,從而構建只屬于自己的獨特的首頁,極大地滿足了用戶的個性化需求,用戶可以方便及時地獲取相關信息或登錄到收藏的站點。

雖然Igoogle已經有了一些突破,但仍存在很多需要改進的地方。譬如,新聞資訊的定制顯示完全依靠用戶的主動添加,而且顯示的資訊僅僅是標題和摘要,沒有有關內容的全局性描述,用戶還是需要自己判斷哪些信息是自己的興趣點所在。另外,對提供的信息是有關方面的最新信息,而沒有一個側重點,主題分類比較粗糙,不能夠精準表示用戶興趣,并且缺乏對用戶自身個性的深層挖掘,只是滿足了個性化服務的第一個層次,即用戶驅動。

2 搜索引擎個性化信息服務的基本架構

2.1 個性化信息服務工作模塊

一般的個性化信息服務工作模塊如圖1所示。

圖1 個性化信息服務工作圖示

個性化信息服務的首要前提是構建用戶興趣模型。用戶興趣模型的構建不僅需要用戶注冊登錄網站時所填的各項基本信息如性別、年齡、職業、愛好以及目前所在地等,還需要收集用戶的搜索歷史、經常瀏覽的網頁、收藏的網頁、各類新聞資訊以及在社區網站中所發布的信息等。從這些信息中獲得用戶的搜索策略、檢索式構成結構、主要興趣點、對某方面信息的喜好或厭惡強度以及對某類信息的需求程度等,進而更有針對性地從數據庫中找出適合的特定信息〔10〕,更高效的做法是依靠用戶的興趣模型完善用戶的檢索詞組合,獲得擴展的查詢,為用戶提供超出其預期的、更加滿足其需求的信息。提高用戶體驗將增強用戶對該服務的依賴性。需要強調的是,用戶興趣模型的構建是一個動態的維護過程,用戶的每次查詢都是對模型的一次補充與更新。

2.2 搜索引擎個性化信息服務工作模塊

搜索引擎個性化信息服務應當主要體現在:當不同用戶在同一時間輸入同一檢索詞時,搜索引擎所提供的檢索結果相異。這種相異性所依賴的是,搜索引擎返回的結果不僅僅是從索引數據庫中找出與檢索詞的內容相關度超過一定閾值的標題與摘要,而且還要將用戶的興趣模型考慮在內,不僅考慮內容因素,還要考慮該條目與用戶本身的興趣契合度,條目的排序則是綜合這兩方面因素的結果〔11〕。搜索引擎個性化信息服務框架如圖2所示。

圖2 搜索引擎個性化信息服務框架圖示

當搜索引擎利用傳統算法檢索出條目之后,并不直接將結果呈現給用戶,而是將初始的搜索結果與用戶的興趣模型進行匹配,不僅考慮到頁面的重要性與相關性,還要試圖猜測用戶的真正意圖,并將最有可能引起用戶興趣的結果排在前列,同時去除那些明顯不是用戶所需的信息。經過重新排序篩選的信息,按照用戶之前定制的界面顯示提交給用戶。雖然搜索引擎的檢索工作到此告一段落,但用戶興趣模型模塊還要跟蹤用戶的瀏覽行為,將用戶的注冊登錄、登錄頻率、登錄地點以及最終點擊的頁面等信息,分別進行記錄并加以分析,以便日后給用戶提供更加準確的搜索結果。對于登錄頻率越高的用戶,搜索引擎就越要重視其使用習慣,搜索引擎個性化信息服務中的個性化推薦功能就更加突出,并且對其反饋信息要給予最為優先、及時、詳細的回答與響應。登錄地點信息是在對用戶進行個性化推薦以及對搜索結果進行排序時,需要考慮的情景信息,從而為用戶提供更為可靠準確的信息。

3 搜索引擎個性化信息服務的層次

按照搜索引擎介入用戶生活的深入程度,搜索引擎個性化信息服務可以分為三個層次:個性化定制、個性化推薦以及決策支持服務〔12〕。第一個層次是個性化定制,作為最初級的個性化服務方式,實現起來最為簡單,搜索引擎只需要為用戶提供一個可塑造的界面,界面的風格與內容由用戶自己選擇設置。第二個層次是個性化推薦,不僅為用戶提供足夠的自由度,而且能根據用戶的特征進行有限的推測,并將推測結果顯示推薦給用戶。其優點是能根據用戶的反饋進行推測機制的改進與更新,難度在于用戶的特征模型是動態變化的,需要時時進行維護,并且推測機制的算法沒有很明顯的評價機制,評價體系的構建容易帶有主觀色彩,不易做到全面考核,這部分工作量很大。第三個層次是決策支持服務,不僅需要了解用戶的需求特征,而且加入了環境因素、時間因素等其他客觀因素,決策難度明顯上升,對用戶所處的現實環境也有了更為深入的了解。在這個層次上,搜索引擎已經成為每一個決策者離不開的幫手。

(1)個性化定制。這是個性化服務的最低層次。搜索引擎只需根據用戶顯示提供的有關個人喜好的基本信息,以及所定制的有關信息,簡單地將最新的、最熱的信息提供給用戶,不論通過Web頁面直接推送,還是定期或不定期地將有關更新信息發送到用戶的郵箱或者手機終端上。機器無需記錄用戶的瀏覽行為,或者動態維護用戶興趣模型。

個性化定制包括三個方面:服務界面定制、信息資源定制以及檢索定制。服務界面定制是由用戶選擇一種適合自己的界面主題以及布局,自己設置各類模塊的顯示方式以及位置。信息資源定制是信息服務提供商定期或不定期地將用戶定制的信息頻道以及信息欄目的更新信息發送給用戶,構建用戶獨特的Web頁面。由于每個用戶的檢索習慣不同,使用的檢索策略、檢索方法以及檢索結果的顯示、排序、選擇也都不同,所以,個性化的檢索定制為用戶提供了可以記錄自己檢索習慣的模塊,以后對其檢索行為都進行相同的處理。雖然個性化定制在一定程度上滿足了用戶的個性化需求,但這種個性化卻不具備足夠的智能性,只是滿足了個性化要求中的用戶驅動。

(2)個性化推薦。個性化推薦應用最廣的莫過于電子商務網站。例如,在卓越網上,不論用戶是否登錄,只要之前在網站上進行過搜索行為,那么在下次從同一個IP進入頁面時,便會在主頁上顯示“更多供您考慮的商品”,這些商品大多與上次搜索的商品是緊密相關的。推薦對于企業,尤其是電子商務企業的巨大潛在效用。具體來說,個性化推薦就是根據用戶的興趣以及以往的購買記錄,向用戶推薦其可能感興趣的商品和信息。

個性化推薦所運用的算法包括基于關聯規則的推薦算法、基于內容過濾的推薦算法以及基于協同過濾的推薦算法。基于關聯規則的推薦算法來源于數據挖掘中的關聯分析,通過大量的數據記錄,經過文本聚類進行關聯分析,從貌似不相關的散亂的信息集中發現潛在關聯。基于內容過濾的推薦算法,通過相關特征的屬性來定義項目或對象,系統基于用戶評價對象的特征了解用戶的興趣,依據用戶資料與待預測項目的匹配程度進行推薦,努力向客戶推薦與其以前偏愛的信息相似的內容。這種推薦算法簡單易操作,但是對用戶的興趣變化缺乏預見性。協同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對某一信息的評價,對該指定用戶對此信息的喜好程度進行預測,并將不小于一定閾值的信息推薦給用戶。這種推薦算法不僅能找到顯示的滿足用戶興趣的信息,而且還可以向用戶推薦某些隱性的、滿足用戶需求的信息,幫助用戶發現自己新的興趣點。協同過濾正在成為比較受歡迎的一種推薦算法。

個性化推薦在用戶搜索過程中也有很普遍的應用,比如搜索結果的智能匹配,當用戶輸入不完整的搜索請求或者出現語法錯誤時,搜索結果的開始便會顯示“您是不是要找”;而在微博、社區等站內主頁上,也會顯示“您可能認識的人”,“您可能感興趣的人”等等。總之,個性化的搜索引擎應能根據用戶以往的操作記錄或者個人信息,對搜索結果進行過濾并重新排序,盡可能提供精準的滿足需求的結果。

(3)決策支持服務。決策支持系統是通過數據、模型以及知識來輔助決策者進行科學決策的人機交互系統,它是管理信息系統的更高層次。通過向決策者提供分析問題、建立模型、模擬決策過程和方案的環境,調用各種信息資源和分析工具,幫助決策者做出更高水平、更加科學的決策。未來的搜索引擎除了應滿足用戶對基本信息的需求,還應該能幫助用戶針對特定問題做出科學合理的決策。這些問題通常都是結構化程度不高,難以用二維表格闡明邏輯關系,由于問題涉及的層面較多,用戶又不可能掌握所有相關的信息,若是簡單地將各個方面的信息羅列堆疊起來,容易使用戶在巨大的信息海洋中迷失,不利于管理者快速高效地做出決策。這就需要搜索引擎將模型、分析技術與現有的傳統數據檢索技術結合起來,幫助用戶對各種可能性組合進行可行性分析以及效果預測,比較并分析利弊。

這種能根據每個用戶的實際需求與面臨的現實問題以及所處的復雜環境進行面向單個用戶分析處理過程的搜索引擎,便是最高層次的個性化信息服務。搜索引擎本身不再只是解決某一個微觀問題的小工具,而是成為幫助決策者立足宏觀,不可或缺的一大智庫。搜索引擎要達到這種決策支持的水平,就需要充分運用數據倉庫、聯機分析處理、數據挖掘、模型庫、數據庫、知識庫等資源與技術,使這種現在只能由管理層擁有與使用的技能可以走入日常生活,真正做到面向用戶的個性化服務。

4 搜索引擎個性化信息服務的潛在問題

(1)硬件要求。個性化搜索引擎對傳統搜索引擎的硬件要求主要體現在兩個方面:第一,存儲器的容量。一旦要對每個用戶提供個性化信息服務,就不得不記錄用戶的個人基本信息以及個性化的動態信息,進而構建屬于用戶自己的興趣模型,而這個模型需要隨時隨地根據實際情況進行更新。這樣一來,用戶數量迅速增加,而要維護這部分數據,服務器本身就需要準備足夠的存儲容量。同時存儲空間應該可以靈活擴展,譬如,新數據的大量增加,歷史數據的銷毀,對騰出空間的再利用等。第二,存儲器的存取效率。由于用戶對搜索引擎的利用是隨時隨地的,所以對用戶信息地查詢也應該“隨叫隨到”。在這種情況下,最為簡便的方式便是在用戶的客戶端提供高速的緩存空間,來存儲那些更新活躍的個人信息,這樣也可以減輕服務器的壓力。

(2)技術要求。對存儲器的要求,除了容量以外,還有存儲算法以及存取方式的重新設計,以便在存儲容量有限的情況下,實現對存儲空間最為有效的合理利用。另一個技術上的要求是,用戶的興趣模型與初始搜索結果的匹配。首先是用戶模型的維護。除了將用戶的個人信息按照相關字段從復雜的行為中提取出來以外,還要能夠看到行為背后隱藏的趨勢信息,以便對用戶進行個性化的推薦,這就要采用數據庫的分析挖掘技術。用戶的數量過億,每個用戶的類型又千差萬別,瀏覽模式更是變化多端,機器所具備的分析挖掘能力不僅包括目前所具備的構建索引庫、網頁聚類、去重、排序等這些針對網頁數據庫的技能,還應該面向用戶,對用戶數據庫進行分析、聚類、建模,從而可以在網頁數據庫中挑選更加符合用戶個性與需求的信息。人與人之間的比較要比人與算法之間的匹配更加準確、精確,可信度、人性化程度也更高一些。

(3)用戶隱私。信息服務提供商要想給用戶提供更加精準的信息,就不得不了解用戶自身,了解用戶真正的信息需求。例如,在用戶的搜索引擎日志記錄中,記錄著用戶使用的檢索詞、對某個主題的檢索次數、檢索提問式的構成結構、用戶在檢索列表中選擇的某個URL、用戶的網頁整體瀏覽情況等信息。對于注冊用戶來說,還包括用戶的個人基本信息、用戶的IP、ID等信息,這些是用戶不愿意為他人所知的。一旦被機器提取并保存起來,就構成了對用戶隱私的威脅。隱私泄露不僅包括內部工作人員的主動泄密,還包括網絡黑客,即被第三方非法獲取。所以個性化信息服務對用戶信息的保密性提出了更高的要求。這不僅要求在技術上提供更加強硬的保護措施,網絡工作者自身也要提高自己的職業道德,嚴格遵守行業的道德操守,同時,對某些至關重要的信息,要提供特殊的保密措施。

(4)效果評測。各個搜索引擎為實現其個性化的信息服務,必然要進行各種探索,從而選出其認為最為有效、最為精確的算法,包括構建用戶興趣模型的算法、挖掘算法,匹配算法、檢索詞擴展算法以及搜索結果個性化排序算法等,這些都因不同的機構而異。因此,在對各個搜索引擎進行評測時,很難進行規范化處理。即使選定了評測指標,各個指標的權重設定也是一個不可忽視的難題。此外,由于搜索引擎提供的是個性化的服務,每個用戶對結果地反饋也不同,主觀因素占據很大的比重。所以,對搜索引擎的效果評測,應盡快制定出合理有效全面的算法,可以使結果更加公正、客觀、有效。

(5)用戶信任。盡管目前有些搜索引擎提供了個性化的主頁,但由于個性化程度不高并沒有引起大多數用戶的密切關注,甚至因登錄時的復雜操作而放棄繼續體驗。實際上,用戶對目前搜索引擎提供的個性化粘性不高的重要原因來源于搜索引擎自身。它并沒有提供給用戶所期望的那種面向自己的服務,只是提供給用戶一些可供選擇的小工具,這些小工具與搜索本身并沒有很大的關系。搜索引擎要想提高用戶的使用熱情,贏得更多用戶的信任,讓其都能夠加入到“使用-反饋-更新”的良性循環中,就必須提高自身的搜索功能,提供給用戶良好的體驗,這對搜索引擎以及用戶來說都將是兩全其美的。

1.馬忠庚,王學軍,鄧建波.Internet上的個性化信息服務.聊城大學學報,2005,18(4):83-86

2.劉蕤.利用購物搜素引擎進行個性化信息服務.現代情報,2004,9:77-79

3.饒增陽.以用戶需求為中心的個性化信息服務.南陽師范學院學報,2007,6(7):89-90

4.閱微網.人民網:靜悄悄的搜索引擎革命.2012-5-13.http://www.yuewe.cn/portal.php?Mod=view&aid=158232

5.Alonso,G.,Casati,F.,Kuno,H.A.and Machiraju,V.Web Services-Concepts,Architectures and Applications Data-Centric Systems and Applications.Springer,2004,Berlin,Heidelberg.

6.Liu,J.and Zhao,F.Composing semantic services in opensensor-rich environments.IEEE Netw.,2008,22:44-49

7.Berger,S.,McFaddin,S.,Narayanaswami,C.and Raghunath,M.T.(2003)Web Services on Mobile Devices-Implementation and Experience.WMCSA 2003,Monterey,CA,October 9-10,pp.100-109.IEEE

8.Murat Ali Bayir1,Murat Demirbas1 and Ahmet Cosar.A Web-Based Personalized Mobility Service for Smartphone Applications.The Computer Journal,2011,54(5):800-814

9,10.張俊林.這就是搜索引擎:核心技術詳解.北京:電子工業出版社,2012.1

11.李曉明,閆宏飛,王繼民.搜索引擎——原理、技術與系統.北京:科學出版社,2005.4

12.馬文峰.數字圖書館個性化信息服務的探索.圖書館雜志,2003,22(5):30-32

猜你喜歡
搜索引擎用戶服務
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
基于Nutch的醫療搜索引擎的研究與開發
主站蜘蛛池模板: 国产精品手机视频| 免费人成黄页在线观看国产| 亚洲成人一区二区三区| 18黑白丝水手服自慰喷水网站| 免费毛片全部不收费的| 亚洲成人播放| 99精品视频播放| 亚洲综合香蕉| 欧美日在线观看| 福利视频久久| 日本欧美在线观看| 午夜天堂视频| 亚洲精品无码av中文字幕| 国产欧美日韩另类| 国产精品一区在线麻豆| 国产经典在线观看一区| 无码专区国产精品一区| a色毛片免费视频| 在线观看亚洲人成网站| 麻豆国产精品视频| 91国内外精品自在线播放| 91丝袜美腿高跟国产极品老师| 国产浮力第一页永久地址 | 欧美午夜网| 毛片基地美国正在播放亚洲| 欧美成人第一页| 国产网站黄| 真实国产乱子伦高清| 四虎国产在线观看| 黄片在线永久| 久久久久久高潮白浆| 成年人福利视频| 911亚洲精品| 亚洲成a人片在线观看88| 91视频免费观看网站| 亚洲人成成无码网WWW| 波多野结衣的av一区二区三区| 99热这里只有精品免费| 国产农村精品一级毛片视频| 欧美精品高清| 国产亚洲男人的天堂在线观看| 日韩成人免费网站| 精品国产成人高清在线| 992Tv视频国产精品| 九色在线观看视频| 国产人免费人成免费视频| 亚洲天堂成人| 成人看片欧美一区二区| 日本国产精品一区久久久| 狂欢视频在线观看不卡| 在线视频亚洲色图| 福利在线不卡一区| 亚洲女人在线| 另类欧美日韩| 国内精品久久人妻无码大片高| 国产亚洲一区二区三区在线| 91精品最新国内在线播放| 国产一级在线播放| 1769国产精品视频免费观看| 黄色污网站在线观看| 欧美日韩午夜视频在线观看| 最新国产高清在线| 亚洲激情99| 久久先锋资源| 国产欧美亚洲精品第3页在线| 一区二区在线视频免费观看| 2022国产无码在线| 亚洲成A人V欧美综合| 国产免费网址| 欧美日韩免费观看| 黄色网站不卡无码| 国产成人高清精品免费软件 | 久久99国产视频| 婷婷六月天激情| 亚洲欧美综合精品久久成人网| 中文字幕在线不卡视频| 国产白浆在线观看| 国产无吗一区二区三区在线欢| 国产99在线| 91亚洲视频下载| 久久国产高清视频| 国产在线91在线电影|