互聯網是個繁忙的地方。據統計,互聯網上每秒有6000條推特發出,有4萬多次谷歌搜索,還有超過200萬封電子郵件被發送。但這些數據只是略微提示了這個網絡的規模。截至2014年9月,互聯網上有約10億個網站,這一數字始終在變動。在這個大部分人熟悉的互聯網之下還有一個“深層網絡”,它包括搜索引擎沒有編入索引的部分。
將“表面”網絡的時刻變化與深層網絡的不可定量性結合起來就會很容易地發現,要估算互聯網規模是一項困難的任務。據統計,截至2016年3月中旬,在線網頁至少有46.6億個。這只涵蓋了可搜索到的網頁,并不包括深層網絡。那么,互聯網包含多少信息呢?加利福尼亞大學戴維斯分校傳播學教授馬丁·希爾伯特說,“對于這個問題可以從三個角度來看——互聯網存儲信息、傳播信息并計算信息。”
2014年,研究人員在《超級運算技術前沿與創新》雜志上發表了一項研究,估計互聯網的存儲量為100萬艾字節。一個字節是包含8個比特的數據單位,相當于單詞中的一個字母。1艾字節相當于100億億字節。評估互聯網傳播能力的一個方式是計量它的流量。根據思科公司的視覺網絡指數項目,互聯網現在進入“澤字節時代”。1澤字節是1000個艾字節。思科公司估計,到2016年底,全球互聯網流量將達到每年1.1澤字節,到2019年將達到每年2澤字節。思科公司稱,1澤字節相當于看3.6萬年的高清視頻,相當于把在線影片租賃提供商奈飛公司的所有列表播放3177次。
研究人員估計,要把整個網絡(包括深層網絡)的內容都打印出來的話,需要砍伐掉2%的亞馬遜雨林來造紙。在研究中,他們對在線文本的規模做了假設,他們估計平均每個網頁需要30張A4紙來打印。根據這一假設,互聯網上的所有文本將需要1.36×1000億張紙來打印。希爾伯特說,互聯網的規模是個活動目標,它在飛速增長。面對這些海量信息的時候只有一點值得欣慰:我們計算能力的提高比數據存儲的速度還要快。
全球數據存儲量每三年翻一番,而計算能力每一年半就翻一番。從很多方面來看,人工智能已經超過了人類的認知能力。“計算能力的提高是唯一讓在線數據暴增變得有用的事,我們正從信息時代走向知識時代。”希爾伯特說。