選自美國《大西洋月刊》 2016年2月23日羅賓遜·邁耶(Robinson Meyer)陳海曼/譯
?
臉譜網正在繪制世界人口地圖
選自美國《大西洋月刊》 2016年2月23日
羅賓遜·邁耶(Robinson Meyer)
陳海曼/譯
他們正在使用全新的人工智能(AI)技術和大量的計算能力來完成這些地圖的制作。

馬克·扎克伯格(Mark Zuckerberg)在巴塞羅那世界移動通信大會上發表演講
美國人居住在錯綜復雜的地圖網絡中。鍵入“漢堡王”(Burger King)到在線框,谷歌會顯示出十幾個附近的選項,每個都能連接到精確的經度和緯度。
但世界上還有很多地方,十分閉塞,信息不流通。或許這些國家開展了國情普查工作,但可能只有縣一級或者省一級的數據可用,沒有更詳細的數據。
以人口數據為例:超過74億人口遍布全球。有的人生活在擁擠的城區,有的人生活在與農場相連的小鎮,有的人獨自居住在叢林邊緣。但是其中有很多人口,沒人知道他們的確切住址。
現在,臉譜網(Facebook)宣布已繪制出近20億的人口地圖,這種規模勝于以往任何的項目。該公司的連接實驗室(Connectivity Labs) 這周宣布,它制作了20個國家(其中大部分是發展中國家)的全新的高分辨率人口分布圖。但是要到今年晚些時候,這些地圖中的絕大部分才會發布。這些地圖如果真的準確,它們就會是大多數國家有史以來質量最好的人口地圖。
這些地圖值得注意的另一個原因是:如果它們很準確,將預示著一個新的人工智能輔助時代的到來。
在富裕國家,可靠的人口信息被視為是理所當然的事情(甚至有書呆子笑話,要將人口密度從美國地理數據中刪除)。
人口分布圖在不同領域有幾十種應用。城市規劃者借它來估計城市密度,用以規劃和改善道路狀況。流行病學和公共衛生工作者使用它來跟蹤疫情或分析人們獲得衛生醫療服務的狀況。如果有災難發生,人口地圖可以用來確定應該為哪些地方優先提供緊急援助。
臉譜網對這種數據的興趣事出有因。全球大約有40億人還沒有使用臉譜網,這事關該公司的未來發展前景,所以它對地圖的興趣,有基礎設施方面的原因。該公司想知道,對于這些地方的人,用哪種方法上網最好:使用光纖,還是無人機、衛星或高空氣球?
以下就是臉譜網為什么會選擇這些國家的部分原因:20個國家的一些農村地區,人們仍然無法上網。這20個國家,包括尼日利亞、肯尼亞、烏干達、土耳其、烏克蘭、烏茲別克斯坦和印度。隨便說一句,臉譜網的免費網絡服務Free Basics 產品剛剛在印度被判了死刑。Free Basics和連接實驗室都隸屬于Internet.org,這個組織(經常以營利為目的)致力于擴大網絡以及臉譜網服務的覆蓋范圍。
但是,在所有這20個國家中,臉譜網是怎么做出更好的人口地圖,超越了當地政府水平呢?他們又沒有像谷歌街景車那樣到處考察轉悠,因為臉譜網擁有不可思議的計算能力。
這些地圖其實是這么制作的:首先,臉譜網的連接實驗室要拿到當前最可靠的世界人口信息,這是哥倫比亞大學(Columbia University)提供的一個數據集,被稱為“全球人口網格”(Gridded Population of the World)。它綜合了各地的人口普查數據,并把數據調整到相同的年份。雖然它是全世界目前最優質的人口地圖,但它的分辨率不怎么高:根據臉譜網所言,一個網格可以代表城市地區的幾平方公里,也可以代表農村地區的幾萬平方公里。
然后,臉譜網又從數字地球公司購買了大量的高分辨率衛星圖像。目前太空中大部分私人的高分辨率地球觀測衛星都是由這家公司經營的。當你在谷歌地圖上看自己的房子時,你通常是(但并不總是)通過數字地球公司的四個軌道鏡頭之一看到的。
數字地球公司的圖像大多數屬于“小度量的”,也就是說,網格的一條邊,不是數百公里,而是50厘米。臉譜網的開發人員訓練該公司的神經網絡算法,讓它識別在這些數據中,一棟建筑物從上面看起來是什么樣子。然后開始進行識別。該軟件根據它能看到的建筑物數量來估計城市人口密度,并且進行推算,把當前最佳人口數據分配到居住區中。
“他們設定了一個相當基本的假設:如果看見到一棟建筑物,必定就有人在那里。”哥倫比亞大學地球科學家說羅伯特?陳(Robert Chen)說。他是臉譜網所使用的基礎數據集“全球人口網格”團隊的主管。
你可能覺得這種方式聽上去很簡單,其實它本來就這么簡單。它僅僅需要訪問神經學習軟件,需要耗用大量計算能力。臉譜網估計它分析了20個國家的2160萬平方公里土地,“為此,我們用神經網絡處理了146億張圖像; 這是臉譜網每天分析的所有圖像數量的十倍多”。
羅伯特?陳警告說,臉譜網的數據不能被用來計算和當地居民有關的城市密度。但是,“在其他很多情況下,這些數據十分寶貴。”他說。
臉譜網還沒有發布這些地圖的最終版本。它說,最終版本將在今年夏天發布。在發布之前,羅伯特?陳的團隊將對它的準確性進行判定。雖然臉譜網的早期結果令人鼓舞,羅伯特?陳說,他仍然不知道這項技術會有多么精確,也不知道適用性是否廣泛。 “我們只看到了它的部分狀況。”他說,但是,如果該技術的效果令人滿意,臉譜網的這個項目就會新增另外6個國家。
如果事實證明這些數據很有用,那么連接實驗室的成功就會標志著一個重大勝利的到來,因為長期以來,開發人員在使用衛星數據時一直面臨著一個阻礙:用算法解析圖像。
在未來的五年里,硅谷投資的衛星公司將向公眾發布大量影像,遠遠超過以前的水平。這些影像的成本會比以往任何時候都更加便宜,而且也更加“新鮮”:由于衛星制造上的進步,以及火箭成本的下降,一些公司承諾提供每周六七次的重訪問率(revisit rates)。
如果公司,尤其是金融公司學不會如何用機器破譯這種新的數據,它們就不會有什么價值。公司必須懂得如何從影像中抽取信息,而不需要人員坐在桌子旁埋頭苦干。目前,像天空盒(Skybox)和笛卡爾實驗室(Descartes Labs)這樣的初創公司表示,他們已經在這方面取得了一些進步。如果臉譜網制作的地圖真的成功了,那么這個目標的可行性將會得到進一步的證實。
原文標題:Charting Our Water Future