
記=本刊特約記者 姚尚汶 羅 旭
A=安德雷斯·韋思岸(Andreas Weigend)
他曾任美國互聯網巨頭亞馬遜公司首席科學家兼CTO,如今是阿里巴巴集團的全球顧問;他在斯坦福大學、加州大學、上海交通大學等高校任職,發表超過100篇機器學習技巧應用的科學文獻;他還是諸多創業公司,以及世界經濟論壇的顧問,被業內人士譽為“大數據的鼻祖”。他是安德雷斯·韋思岸(Andreas Weigend)。
這樣一位行業大牛,年過半百仍活力充沛,一路從北美洲來到亞洲。記者有幸跟隨著他,聽他暢談對數據教育的看法,以及對未來世界的預測。在他眼里,數據的意義歸根究底是一個字——人。
記:您曾在亞馬遜公司任職,還在高校教授過電子商務、大數據等相關課程。您能聊聊自己過去的工作經歷嗎?
A:有一晚我在家,電話響起,有人問我愿不愿意進入亞馬遜與杰夫·貝佐斯(Jeff Bezos,亞馬遜創始人及現任董事長兼CEO)一起工作。我當時對進入大公司不感興趣,因為我喜歡自己獨立做事情,不想受他人控制,也不想告訴別人我在做什么。這樣一種思考人生的方式,跟多數人對于職業生涯的想象很不同:進入大公司,努力地、慢慢地在公司里爬升。但后來我還是被說服進入亞馬遜,也很榮幸能與貝佐斯一起工作。
過去十年我都在教書,因為教育是最重要的事業;我也寫了一本書——《大數據和我們》;同時還與眾多大公司、中小企業及新創團隊合作。這些工作經歷看起來很碎片化,但核心在于:我只做自己并保有好奇心。我真正好奇的是人,以及如何透過數據去了解人類行為。
記:后來您來到中國,擔任了阿里巴巴的全球顧問。這又是一段怎樣的經歷呢?
A:2001年,馬云雇用我作為他的“數據教練”,因為他想要了解數據科學。他對數據是如此癡迷,甚至跟我說不要稱呼他為Jack Ma,而是“Data Ma” (數據馬)。我倆都有一個共識,就是世界變化太快了。之前,我和馬云對于“移動電話”沒有任何概念,直到2007年史蒂夫·喬布斯(Steve Jobs)發明了蘋果手機(iPhone),我們覺得那簡直是不可置信的點子。
記:科技發展給世界帶來了天翻地覆的變化。您不斷提到數據的重要性。作為數據科學的代表人物,在您眼中,“數據”究竟指什么?
A:每天起床,你做的第一件事是什么?我想多數人是看手機、看微信。這樣的操作讓騰訊公司知道你何時醒來,電信公司也會知道你何時醒來,因為你是通過基站連接微信。也許你醒來做的第一件事不是看手機,而是走進廁所開燈,那么電力公司設置的智能機器可以通過傳輸的數據知道你用了哪些電器;或者早起時,你在廚房喝了一杯咖啡,電力公司一樣能透過咖啡機的電能消耗數據知道你喝了多少毫升的咖啡。這些故事的重點在于:我們沒有隱私,數據無處不在,總是與我們在一起。

記:看來我們被數據包圍,自己留下的、被他人記錄和分析的數據多得超乎想象。關于數據,大家還有另一個看法,就是“比起人類的判斷,數據是不會出錯的”。您怎么看待這種說法?
A:對于這個問題,我不知道答案,但必須去試,才知道數據會不會出錯。銀行可以根據不同的條件算出某人貸款的還款幾率。假設你是銀行的員工,一位單身媽媽走進銀行說自己打算貸款。她有兩個孩子,但她曾因為養育孩子中止了學業,目前也沒有穩定工作。這時,你該說“抱歉,我們不能給你貸款,因為沒有任何數據證明你在未來能夠償還”還是 “這種情況真是糟糕,也許我們該給你一次機會”?我們是應該殘忍地相信通過數據計算出的還貸幾率,還是做決定時更加人道?我沒有答案。
記:您曾說“教育是最重要的事業”,而您本人也曾經在歐洲、美洲和亞洲教過不同的學生。您覺得學生在高中階段最重要的學習內容應該是什么?
A:現在,我們活在一個容易得到答案的時代,所以我覺得判斷答案真假的能力其實才是更重要的。當你拋出關鍵詞,搜索網站將回復無數個解決問題的答案,正確答案能很容易地被獲取,然而錯誤的也是。所以,評估答案的正確性比給出正確答案還要重要。在亞馬遜,我常說給出一項推薦很容易,但評估一項推薦很難。因為網站可以很容易地推薦某商品給你,但我們必須要思考什么是好的推薦,分析這項推薦是好還是壞。
記:提問勝過解答,這是您強調的學習內容。那么,青少年要怎樣才能提出好的問題?
A:如何提出好的、恰當的問題?如何以創造力去回答問題?我認為根源都來自于好奇心。我們需要讓中學生對自己身處的世界、自己創造的數據、大數據公司使用的數據感到好奇。我很幸運,有個物理學家父親,他時常帶我和兄弟們去散步,并沿路指著東西告訴我們有什么問題要問。因為與他人的問題相比,人們總是會對自己提出的問題更感興趣。在學校中,所有題型都難以令人興奮,比如物理課上,你靠著紙與筆能獲得答案,但有了計算機以后,這就不重要了。重要的是,當你迅速得到答案之后,能不能再提出下一個問題。
記:除了好奇心,您覺得中學生還需要具備什么能力?
A:除了好奇心外,我覺得中學生還要學的是“信息素養(Data Literacy)”。中學生不僅要學習生物學、地球科學、社會學,還應該學信息科學,尤其是信息科學的閱讀能力!信息科學的閱讀能力是指:你看見紙上的符號,從而理解和創造意義。舉例而言,我看著高鐵時刻表,然后思考和推演,進而決定我必須在1月2日下午1:30前抵達高鐵站才能趕上火車,并順利地在規定時間內到達目的地。這就是所謂的閱讀能力——你不需依賴他人解釋就能獨自理解其意義。網絡上充斥著各種信息,而你需要信息閱讀能力去分辨出差別,為我所用。
信息素養還包含“詮釋信息的能力”。我說的“詮釋”,不僅是指看一份地圖,知道某間餐廳在哪、怎么走,而且是指如何更好地理解和使用信息。記得我第一次來到亞洲,進入一間月餅店,不懂中文的我開始思考:“商家會用什么方式去標記蛋黃口味、豬肉口味以及牛肉口味的月餅?”我構思出一個“理論”:如果包裝上有黃色標記,那應該是蛋黃口味。當我告訴中國朋友這個想法時,他卻說:“這還用想,包裝上面肯定會有中文寫著它們各自的口味!”我覺得這樣理解信息的經驗很有趣:如果不識字,只能絞盡腦汁用某種巧合去詮釋;但識字的人,相對于你占有更多優勢,因為他知道“葫蘆里究竟賣的是什么藥”。
記:要怎樣做才能更好地具備信息素養呢?
A:有時記者會在新聞標題上加入一個大大的“73%”——其實這就是沒有信息素養的例子。因為他們不理解這個數字本身是沒有任何意義的,也許73%改成71%或79%也沒有任何不同。許多人也是一樣,對于有效數字(Significant Digits)并沒有任何概念,所以我認為不濫用數字,是邁向信息素養的第一步。
還有一點很重要:知道什么是重要的,什么不是。舉例而言,我不懂中文,所以當我看著“王”和“玉”,無法辨認“玉”的那一點究竟是什么意義。假設“王”的左下角出現了一些墨跡,那它應該被叫做“王”還是“玉”?我對中文的無知程度,和那些只將“73%”擺在頭條的記者對于數據一樣,不知道什么是重要的。
昨天我做了次腳底按摩,剛好那時候我餓了,就想叫一份水餃外賣。然而當我詢問店主時,他只簡短回復我:“不。”當時我有些氣憤,因為我以為店主不愿意讓我們點外賣是為了讓我以高價買他們的雞湯,我不喜歡這種壟斷行為。然而等到按摩結束后,我才發現店家已經為我們準備好了附贈的雞湯與果凍,我根本不需要另外點一份水餃,這才是他說“不”的真正原因。我頓時感到羞愧。這個故事并不是告訴大家要相信人性的光明面,而是指當你在異鄉旅行時,要意識到自己的感知有可能是錯誤的,而且錯誤會傳播,這也是數據素養中很重要的一部分。
記:那么這種辨別數據的素質可以怎樣運用到實際生活和工作中呢?
A:我們要學會分辨“可能的、可行的、不可行的以及不可能的”。可行的意思是“很有可能發生”;不可行的意思是“可能,但幾率不高”;不可能的意思是“真的沒任何機會”。舉例而言,把沙發從緊閉式窗戶丟出去是不可行的,而砸破窗戶后就可以做到,但幾率不大。所以這件事是“不可行”,而不是“不可能”,你在做之前要有所判斷。
我欣賞嘗試,也欣賞錯誤的發生,因為這給了包容多樣性一次機會,還能讓人從錯誤中學習,這種心態正是信息教育所需要的。在谷歌,當員工能夠糾正上層的錯誤時,他是會獲得獎賞的,這是谷歌的工作態度。