每個月都有超過十億的用戶訪問Facebook,多數用戶用它查詢消息或者瀏覽圖片。Facebook則希望用戶在操作的同時能夠貢獻一些數據資料包括商戶地點和圖書的書名等,并相互檢查數據輸入-Facebook正在建立的強大知識庫可以讓它的軟件更為智能,搜索引擎更為有效。
米圖·辛格(Mitu Singh)是Facebook百科圖譜小組的產品經理。百科圖譜小組主要負責為網站的新功能“百科圖譜”搜集資料。米圖說:“我們正在把實際生活中的信息移到Facebook中來以便讓搜索結果更具體,更智能。”
百科圖譜是Facebook網站一個鮮為人知的功能。是擁有十多億用戶,一千五百億好友連接的社交圖譜的小兄弟。百科圖譜的內容包羅萬象,包括從紐約的餐館到哲學概念以及這些概念之間的聯系等。辛格和他的同事們笑稱他們的工作是“鐵飯碗”,因為要囊括這個世界上所有的詞條實在是任重而道遠。
信息的大量儲存對于Facebook的圖譜搜索服務至關重要。這個功能已于上個月開始向部分網站用戶開放。圖譜搜索區別于傳統搜索引擎,它能夠理解用戶搜索時輸入的短語并給出具體的人名,地點,書籍,電影名稱等而不僅僅是網站鏈接。
雖然Facebook從已有的維基百科等數據集中收集了一些信息,但是隨著搜索服務對于信息資源更加依賴,公司已經把重點轉向促使網站數以億萬計的用戶成為人力搜索小組的任務,這就像是谷歌網絡蜘蛛的真人版。辛格說:“建立分類器等方法已經不能滿足現有的信息需求,某種程度上講,我們需要用戶的幫助。”
僅僅靠觀察Facebook用戶的動態,辛格的團隊已經輸入了上百萬詞條。公司職員把數據里面得來的概念輸入到資料頁面中;而商戶,電影,虛構人物等信息,則在臉書用戶建立的網頁當中搜集。促使用戶給重復的內容加標簽帶給了百科圖譜小組對同一個概念的不同描述方式,例如NPR和National Public Radio都指(美國)國內公用無線電臺。對公司職員經歷的分析讓網站的搜索引擎能夠在輸入軟件工程師時同時蹦出編碼員的詞條。
最近Facebook網站上隨處可見各種提示,鼓勵人們輸入更多的信息。隨著新的搜索功能變得愈加重要,這些暗示也更加直接。博物館,商店等關于地點的網頁上附有“編輯”鏈接,人們可以更改或增加場館,商戶的開放時間,地址,電話等信息。辛格的團隊現在還正計劃在電影,書籍以及其他網頁開展一些類似的活動。
Facebook最精密的信息輸入工具是“地點編輯”界面。這個界面可以指引用戶在Facebook的百科圖譜已有的地點信息中更改錯誤或輸入新數據。其中的一種模式可以讓用戶快速點擊“是”或者“否”來排除重復的輸入。這個過程可能聽起來有些枯燥,但實際上卻非常受歡迎。辛格說:“我們發現人們非常熱衷于描述他們的家鄉和現居地,就像在維基百科上一樣。他們想確保這些地方的信息是正確的。”
Facebook運用各種社交渠道鼓勵更多的信息輸入。比如地點編輯頁面上會顯示并不斷更新用戶編輯信息所幫助的人數;分享舊金山眾多沃爾格林連鎖藥店的區別可以使超過一千人受益,這些的確是頗為有效的心理激勵。有時提示信息會提醒用戶最近有多少好友清理了數據。2012年,Facebook使用同樣的策略使美國器官捐獻志愿者的數目獲得了極大的提升。
百科圖譜這樣的信息資源對于將來的搜索是至關重要的。意識到這一點的并不只有Facebook一家。谷歌去年公開了新項目“知識圖譜”,它可以用于儲存信息以及信息之間的聯系。最近這個項目被應用于網站某些具體問題的回答當中。
谷歌和Facebook的圖譜能不僅僅可以增強搜索功能。Facebook更通過百科圖譜來評估人們最想從朋友更新中得到的信息。兩個公司也可能利用他們的圖譜最終獲取廣告投放。
萬維網發展了網絡技術和標準,而十幾年前就被預言過的語義網經過十幾年的研究成為網絡信息歷史上重要的里程碑。而今這兩個項目恰好成為語義網的良好示例。它們的核心是使語義網和數據儲存更為智能。讓更多傳統網頁上的計算器能夠理解人們要找的內容,形象和其他數據。
曼努·斯波尼(Manu Sporny)是萬維網RDFa(應用在包括谷歌和Facebook等公司,為網絡頁面增加語義數據的一項技術)小組的負責人。斯波尼說:“這個設計是為了給Facebook正在建設中的百科圖譜以及谷歌正在建設的知識圖譜提供關鍵技術支持”。