歐盟資助的SAPIR(Search In Audio Visual Content Using Peer-topeerInformation Retrieve,簡稱SAPIR)項目發明了一種新的基于P2P架構的按例查詢(query-by-example)方法,可以提供對數據密集型內容搜索的一種新途徑。
和傳統的搜索引擎通過文本關鍵字搜索不同,SAPIR按例查詢的技術通過內容進行查詢,例如通過一張建筑的照片查找這個建筑的相關信息,或者通過一段旋律查找完整的歌曲。研究人員說,通過按例查詢返回的結果更準確,同時消除了對圖片、視頻手動標記的需求。
實施基于內容的大規模搜索將需要一種和傳統文本搜索不同的框架,Google這些傳統搜索引擎有一個中央處理系統的框架不再適用。I B M研究中心的Yosi Mass 說:“因為我們正在處理的是圖像、視頻和音頻,基于內容的搜索,其數據非常密集,而P 2 P架構通過將數據分布在網絡中不同的點(PEER)上,來確保解決方案的擴展性,防止單點失效問題的出現。”
SAPIR系統會自動分析照片、視頻或錄音,提取其中的語義特征,以及使用這些特征在不同的點(PEER)中查找相似的內容。SAPIR還可以比較和新上載的圖片類似的圖像,自動使用和新圖像最相似的圖像的關鍵字來描述它。