胡泳 管理學者,作家
在語義網中,網絡變得聰明了,似乎被置入了某些推理能力。或許將來某個時候,具備人工智能的軟件代理人會替你在線處理所有繁雜的商業和個人事務

語義網是萬維網的延伸,不僅可用自然語言表現網絡內容,而且這些內容還可以被軟件代理人(software agent)所閱讀和使用。萬維網的創始人蒂姆·伯納斯·李將網絡看做一種數據、信息和知識交換的萬有媒介,可以說,語義網完全符合他的這一夢想。
伯納斯·李和兩位合作者在2001年發表于《科學美國人》的一篇文章中,描繪了軟件代理人漫游在網絡之中,替主人安排旅行、預約大夫、并在電話鈴響起時關閉音響的情景。語義網的作用第一次得到有力闡釋。這是一種偉大的遠見,但它在今天的互聯網上還無法實現。
雖然目前萬維網通過你的指尖所傳遞的東西之多堪稱奇跡——你可以找到挪威人對冰激凌的奇怪稱呼、下一班去巴黎飛機上的好座位、你長期心儀的CD令人難以置信的價格,但它卻無法避免一個根本性的缺陷——萬維網基本上是由數以億計的文本概要構成的,這些文本只能為人所讀。當然,你可以搜索關鍵詞,但如果你不去瀏覽一條條的搜索結果,還是不可能找到自己想要的信息。
如果網絡體驗想要再上層樓,這些文本中的信息必須被轉換成為機器也能夠加以閱讀和評估的數據。只有到了這一步,電腦才能接過我們現在手工從事的任務:找到離我們最近的餐館,預訂最佳的航班,買到最便宜的CD,等等。像G oogle這樣的服務在篩選網頁方面干得非常出色,但仍然只有人才能識別最終的目的物,也只有人才能把信息加以組合,比方說,計劃一場早該實施的滑雪。
萬維網還不那么如人意,一個人的網頁與他人的網頁沒什么不同。某個網頁可能擁有較高的Google排名,但網頁與網頁之間不存在基于“意義”(meaning)之上的差別。伯納斯·李預想中的語義網更像是一組組互聯的數據庫,所有信息都以某種結構化的方式存在其中。結構可以被有“意義”地描述出來,令電腦也能夠明白。
在語義網上,一個人不再是當你搜索他時出現在眾多網頁中的一個名字。他是一組聯系,聯結著他的工作場所、他的熟人、他的好友、他的日程,以及他所感興趣的東西。能夠把這些可見與不可見的事物串聯在一起,正是語義網的威力所在。
舉個例子,你想為一場即將舉行的會議安排晚宴。眼下你的做法是翻開通訊錄,然后發一圈電子郵件詢問誰能參加,別人可能回信對晚宴的時間和地點提出意見。就這樣來來回回,所有人最終同意了某種安排,這時再專門去訂位。
在語義網中,你的軟件代理人事先就知道如何安排一場晚宴。它拿到會議參加者的名單,從中選出可能要邀請的人。它甚至可能檢索你的通訊錄中是否有在會議舉辦地附近居住的朋友,一并邀請他們進來。一旦邀請名單被你確認,軟件代理人會通過一個日程庫與被邀請者的代理人商量晚宴的時間,從餐廳數據庫中根據排擋期和你的個人口味擇定餐廳,訂好位子,然后為參加者寄出方向圖。
不妨把這其中的差別想象為二維和三維的差別。人們可以看到,萬維網變得聰明了,似乎被置入了某些推理能力。將來某個時候,具備人工智能的軟件代理人會替你在線處理所有繁雜的商業和個人事務。
那些相信語義網的人將此當做一種顛覆性技術,可以用以擊敗現在的互聯網巨頭如Google和雅虎。而懷疑者則將其當做一場白日夢,是對一個永遠也不會完全得到解決的問題的幻想式答案。伯納斯·李提出語義網的構想已經六七年了,但前面說到的服務場景還不能夠看到。標簽(tagging)是個開始,像Flickr這樣的服務讓我們看到某種粗糙的語義網的樣子。Google Base是另外一個試圖把語義技術帶入更廣泛應用的例子,它通過標題、屬性、標簽、關鍵字、描述、位置、作者等元素,把用戶內容變成機器可理解的規格化語言,再以搜索的方式來呈現。
把一個真正的語義網付諸實施是個雞生蛋、蛋生雞的問題。直到有了足夠的電腦可以讀取的數據和使這些數據具備意義的超數據的出現,沒有人會創造任何有意思的服務。語義網中的代理人需要足夠的配料才能做出好吃的點心。
有些機構在做一些有趣的嘗試。亞馬遜想利用語義技術幫助用戶搜索自己的數據庫,柯達想用語義標簽幫助攝影者在線組織攝影作品,美國中央情報局想通過對自己的海外竊聽數據庫的語義加工,更輕易地篩選出人、地、事之間的聯系,以提早發現恐怖主義威脅。但是要讓語義技術為普通人所用,可能還需要5—7年。到那時,我們就可以讓我們的軟件代理人出發,給我們混亂的數字化生活帶來秩序了。