


10年前,我坐著綠皮火車踏上了去往大學、通向理想之門的征程。我的專業是地理信息科學。直白地解釋,就是用編程技術去建模地理學問題,然后用地圖的方式展示分析的過程和結果。
近年來,大數據技術興起,越來越多的人通過空間大數據分析來關注社會經濟現象、社會群體、社會文化和人類行為等方面的問題。而這也正是我們的工作。
你知道每天有多少個自然村落在消逝嗎?答案是120多個。
這是我在做一項關于地名遺產的大數據分析項目時得知的答案。這些不斷消逝的村落,有些是因為合并而消失,有些是因為人們都去了城市而荒蕪。村落的荒蕪意味著村落地名的消失,更意味著一種彌足珍貴的地名文化的丟失。
為了更好地了解地名文化,我們不僅采集了大量數據,還遠赴成都進行實地調研。因為聽不懂方言,我們只能不斷找人翻譯。慢慢地,我們發現,當地的村落名稱很多都帶“龍”字。為什么會這樣呢?我們查不到可靠而詳細的文獻,只好再向當地的老人求教。通過訪問村民、社區文化站、當地政府,加之以數據分析,我們才得到了初步的結論。
空間大數據分析師用數據發現問題,并解決問題。這是一個艱難的過程,除了對技術的要求,還考驗你的實踐能力和耐心。
“八大菜系”你不陌生吧?但你知道現在位列八大萊系之首的是什么菜嗎?如果你的答案是“魯萊”,我的數據可能會讓你驚訝。
在一個關于飲食文化的大數據分析項目中,我通過代碼,獲取高德地圖上750萬個餐館興趣點數據,提取這些餐館相應的菜系,分析這些菜系在地圖上的空間分布特征和模式。
大數據分析的結果告訴我,以前排在八大菜系之首的魯菜,其地位已是岌岌可危,而川菜的發展勢頭相當迅猛,是目前分布最廣泛的萊系。
但調查到這里就結束了嗎?并不是。舉個例子,東北萊實際上是魯菜的一個分支,闖關東時期,很多山東人來到了東北,將魯菜與當地的食材和飲食習慣相結合,從而形成了現在的東北萊。現在東北菜的發展也很好,在某種程度上,可以說魯菜與時俱進了。如果你不了解闖關東,不了解魯菜的淵源,你就沒法做好大數據分析。
所謂大數據,并不是通過數據簡單地說話,而是要用專業素養分析數據,讓數據變得更有溫度,并且更有說服力。在一個關注社會低收入群體的項目中,我從相關部門拿到上海市數萬輛出租車的軌跡數據,采用GIS技術分析得到出租車群體的工作時長、工作時間節點及其居住地的空間分布特征。
分析這個有什么用呢?出租車司機其實是城市里的低收入人群,但他們又是城市最大的貢獻者之一。然而根據大數據分析,他們的住所基本聚集在一起,且離市區10公里以外。隨著經濟的發展,這些對城市貢獻最大的人,卻成了被疏離的一群人。政府應該怎樣關注他們?通過我們的大數據分析報告,政府可以調控出租車的稅收、滴滴對出租車的影響等。如果沒有大數據分析報告,政府可能投了大量的金錢,花了大量的精力,卻沒有用在刀刃上。
成為一名空間大數據分析師后,我越發強烈地感受到:技術是先進的,數據是有趣的。而更大的成就感在于社會價值,因為我們是在用實際行動關注社會,用專業知識、技能和自己的思考,或多或少地,有形或無形地影響這個社會。
作為一名地理學人,我很驕傲能用自己的熱忱和技術,詮釋大數據時代地理學作為自然科學、社會科學和人文學科的綜合體,在人們日常生活中所扮演的重要角色。