姓名:張海平
身份:空間大數據分析師
技能:用地圖讓數據說話,用數據讓生活更美好
十年前,我坐著綠皮火車踏上了去往大學,通向理想之門的征程。從蘭州到濟南,26個小時的車程,一路上大部分時間都是站著,實在熬不住的時候便席地而坐。九月的天特別熱,但更熾熱的是那顆對美好大學生活滿懷期待的心。從此,我便多了一個地理學人的身份。
我的專業是地理信息科學(GIS)。曾經,我和大多數人一樣,不好意思在人前說自己的專業是地理學,當然更不會說是地理信息科學。對于這樣一個在當時大多數人都不了解的小眾專業,解釋起來相當麻煩。我有時候會說它是計算機,有時候會說是測繪,但從來不會說是地理。但隨著學習的深入和對這個行業的了解,我逐漸喜歡上了它,一晃就是十年。
回顧十年的求學和工作生涯,我對地理的熱愛有增無減,對地理信息科學的鉆研持之以恒,對它的認識也逐步深化,并形成了自己的知識樹,我也因此成了一名高級空間大數據分析師。
提升自我的黃金時期
很多人說,大多數人的職業在大學畢業后的實習階段才開始算步入正軌,空間大數據分析似乎也不例外,真正的學習能力和行業興趣主要在這個階段得以挖掘和培養。但事實告訴我們,在大學里對專業知識的主動學習,將在很大程度上影響你未來職業的高度。
地理學、地圖學和編程技術是我們的核心課程。更直白地解釋,就是用編程技術去建模地理學問題,然后用地圖的方式去展示分析的過程和結果。
大一時,我第一次接觸到了C語言編程;大二時,我接觸到了第一個空間數據分析和地圖制作軟件。由于之前對這些毫無了解,而大學的課程往往快而粗,在課堂上遠不能掌握這些內容,于是我每天去機房泡幾個小時敲代碼,練習繪制地圖和分析地理數據。一開始是艱難和迷茫的,甚至很難真正入門,但隨著學習的深入,我漸漸喜歡甚至迷戀上了制圖分析和編程。
在接下來的日子里,我組建了學習團隊,開始學習更加高級的空間數據分析方法和更難的C++等編程語言。本科最后一年,我已經帶著團隊完成了幾個軟件開發項目,并在一段實習工作中作為主力參與了機場調度系統的研發。
在研究生階段,為了提高專業素養,我開始系統閱讀各類書籍,每個月至少讀10本書,一年下來就是上百本書。我漸漸發現,空間數據不再是一串冰冷的數字,展現在地圖上的不僅僅有結構之美,而且蘊含著人文之美、文化之善。此時,大數據技術開始興起,研究和分析工作也從傳統空間數據分析轉向空間大數據分析,并開始關注社會經濟現象、社會群體、社會文化和人類行為等方面。
用數據和專業素養解決問題
你知道中國現在有多少個村落嗎?
答案是40多萬個行政村,300多萬個自然村。
你知道每天有多少個自然村落在消逝嗎?
答案是120多個。
我在做一項關于地名遺產的大數據分析項目時,得知答案時和你一樣震驚。
中國的村莊經歷了幾千年的發展。這些不斷消逝的村落,有些是因為合并而消失,有些是因為人們都去了城市而荒蕪。村落的荒蕪意味著村落地名的消失,更意味著一種彌足珍貴的地名文化的丟失。于是,這些村落的地名文化一部分永遠消逝了,另一部分則成為了一種地名遺產。
這個項目的艱辛讓我記憶猶新。為了更好地了解地名文化,我們不僅采集了大量數據,還遠赴成都進行實地調研。當地的交通非常不便,而更大的困難在于語言溝通。因為聽不懂方言,我們只能不斷找人翻譯。慢慢地,我們發現,當地的村落名稱很多帶著“龍”字。為什么會這樣呢?我們查不到可靠而詳細的文獻,只好再向當地七八十歲的老人求教。就這樣,通過訪問村民、社區的文化站、當地政府,加之以數據分析,我們才得到了初步的結論。
這樣的經歷,每個空間大數據分析師都不會陌生。我們用數據發現問題,并用數據解決問題。這是一個艱難的過程,同時結合了數據分析和實地調查,完成這樣的項目少則一個月,多則半年。除了對專業素養和技術有要求,還考驗著你的實踐能力和耐心。
一臺電腦行走江湖
有的項目比較深入,需要實地調查。但其實在工作中,大多數的空間數據分析更酷更簡約,只需要一臺電腦就可以行走于世界中。
“八大菜系”不陌生吧?但你知道現在位列八大菜系之首的是什么菜嗎?如果你的答案是“魯菜”,我的數據可能會讓你驚訝了。
在一個關于飲食文化的大數據分析項目中,我通過自己寫代碼,獲取高德地圖上750萬個餐館興趣點數據,提取出這些餐館相應的菜系,分析了這些菜系在地圖上的空間分布特征和模式。
大數據分析的結果告訴我,以前排在八大菜系之首的魯菜,其地位已經岌岌可危了,而川菜的發展勢頭相當迅猛,已經是目前分布最廣泛的菜系。
大數據分析似乎很簡單,敲敲鍵盤就能得出結論。但要成為一名優秀的空間大數據分析師,專業素養必不可少。有些人表面上知道八大菜系,但對深層的飲食文化知之甚少。舉個例子,東北菜實際上是魯菜的一個分支,闖關東時期,很多山東人來到了東北,將魯菜與當地的食材和飲食習慣相結合,從而形成了現在的東北菜。現在東北菜發展得也很好,因此在某種程度上,可以說魯菜更加與時俱進了。
這些知識就涉及專業素養。如果你不了解闖關東,不了解魯菜的淵源,你就沒法做好大數據分析。所謂大數據,并不是通過數據簡單地說話,而是要用專業素養分析數據,讓數據變得更有溫度,并且更有說服力。
在另一個關注社會低收入群體的項目中,我從相關部門拿到上海市數萬輛出租車的軌跡數據,采用GIS技術分析得到出租車群體的工作時長、工作時間節點及其居住地的空間分布特征。分析這個有什么用呢?出租車司機其實是城市里的低收入人群,但他們又是城市最大的貢獻者之一,其工作從早到晚,方便了人們的出行。然而,根據大數據分析,他們的住所基本聚集在一起,而且是在離市區十多千米以外的地方。隨著經濟的發展,這些對城市貢獻最大的人,卻成了被疏離的一群人。政府應該怎樣關注低收入人群?通過我們的大數據分析報告,政府可以調控出租車的稅收、滴滴對出租車的影響等。上海市有5萬輛出租車,意味著有10萬人在做出租車司機。加上他們的家人,能夠影響到的是上百萬人。如果沒有大數據分析報告,政府可能投了大量的金錢,花了大量的精力,卻沒有用在刀刃上。因此,這是我們身為空間大數據分析師需要做的工作。
成為一名空間大數據分析師后,我越發強烈地感受到:技術是先進的,數據是有趣的。而更大的成就感在于社會價值,因為我們是在用實際行動關注社會,用專業知識、技能和自己的思考,或多或少地,有形或者無形地影響這個社會。
在這個信息革命主導的“大數據時代”,大數據分析師不可避免地成了一個非常熱門的職業。除了空間大數據分析師,三百六十行,可以說行行都有大數據。作為一名地理學人,我很驕傲能用自己的熱忱和技術,詮釋大數據時代地理學作為自然科學、社會科學和人文學科的綜合體,在人們日常生活中所扮演的重要角色。
(補充采寫:韓 政)