王春元

打開B站,找到“清華大學”賬號。我屏住呼吸,小心慎點,畢竟學渣還是有自知之明的。正在糾結選理科還是工科課程時,一個標題吸引了我的眼球:“畢導:好奇心給我帶來了什么?”仔細一看,這節時長60分鐘的課,吸引了22.2萬次播放量,1.6萬次點贊,有6846條實時彈幕,評分很不錯。有句話說得好:“學霸與學渣的差別往往是思維模式的不同。”于是,我打算先學一門“思維課”,打開腦洞。
主講人是畢嘯天,本科、研究生皆就讀于清華,高分子材料與工程專業2014級博士,曾任2012級輔導員,被大家親切地稱為“畢導”。2016年8月又開始運營自媒體,2016年一篇文章《清華博士:“秋衣外穿”更保暖》,有高達300萬的閱讀量,2017年的《微信搶紅包是先搶錢多,還是后搶錢多》更是火遍了朋友圈,從此“畢導”一稱流傳江湖。
在這堂課里,畢導從創作者的角度,跟大家分享了他一系列文章背后的創作歷程。原來,看似簡單的“秋衣外穿”理論,背后有傳熱學模型的理論分析,需要理工科的知識作為基礎,才能深入淺出地解釋原理。再比如“微信搶紅包定律”,畢導得出的結論是第一個搶紅包的永遠不會是手氣最佳的一個,越是排名靠后的手氣會越好。看似簡單的結論,背后的科學驗證過程卻很是波折。為了做這個實驗,畢導找來5部手機,請5個人來搶50塊錢的紅包,前后發了150次,然后統計這5個人每一次的數據,再從750個數據中去分析,去思考……
實際上,實驗的繁瑣復雜倒是其次,重要的是怎么找到解決問題的方法。“微信紅包先搶后搶有區別,這個規律能否被科學論證,以及如何算出什么時候搶紅包是最優策略是關鍵。在這個過程中,關鍵是你是否知道應該怎么做,以及應該調動哪些知識去做。”這時候有人回復說,可以用手機做實驗嘛,畢導又拋出新的問題:“那么你知道應該用幾個手機去搶,搶多少錢的紅包,一共需要進行多少次實驗,才能消去誤差,會不會存在意外情況,如果發現手機與手機之間存在誤差,又該怎么消除影響……”一波波問題如海浪一般拍打著我的大腦,原來,這就是從0到1的過程,寫一篇有趣的文章,背后的難度不亞于做一次完整的科學實驗。
畢導說,做自媒體主要是找選題,寫文章,做視頻。看似簡單,但為了把文章做得有趣好玩,常常要想破了腦袋,花很長時間去琢磨和嘗試。“在生活中,你比別人多想一層,比別人多做一點,你就會變得很好玩,生活就會變得很有趣。”這,就是好奇心與探索的硬核內容。
這個時候,我再去反觀,畢導的文章真的是科普文章嗎?好像并不是如此,看完一篇文章后,我們并不能從中得到很具體的知識,學到什么科研理論,卻能實實在在體會到畢導的思考能力,以及從他發現問題,面對問題,解決問題的思維方式中會心一笑。
當我們是小孩子時,常常喜歡問為什么。現在我覺得,我們成年人更應該多問問為什么,因為人類的好奇心永遠都不會消失。“我希望從‘接地氣講到‘桃花源,希望從我們共同的知識背景出發,最后引你入勝,帶領你到科學的桃花源,飛入到宇宙的世界。”畢導講完這段話時,彈幕幾乎都快溢出屏幕了,五湖四海的“學生”們紛紛表達著對畢導的贊許和認同。
所謂“大學之道,在明明德”。回到課程的標題“好奇心給我帶來了什么”,或許,其本身就是一次思維啟迪之旅。
聽完畢導的課后,我的內心有點小膨脹,準備挑戰一點高難度的課程。作為一名與文字打交道多年的文科生,我對互聯網界的IT人才一直有迷思,好奇每天用“非語言”和世界打交道的“程序猿”到底活在怎樣的世界里?每當聽大家樂此不疲地談論大數據、編程、人工智能等話題時,我的內心也是癢癢的,很想學習一些系統知識,于是,我決定從清華大學的UP主中尋找答案。
我選擇了《閑話AI:自然語言理解難在哪?》這門課,開課者是清華大學計算機系的青年教師劉知遠。瞧這課程的標題,就很高大上的樣子。令我意外的是,劉老師通過生動的逆向思維式解說,讓我很快理解了這門課的精髓。
劉老師說,交流的時候,人類用自然語言,計算機則通過編程語言。如今,人工智能已經在很多方面超越了人類,但在識別自然語言方面依然存在瓶頸。AI是由人類制造的,要讓這個機器不斷智能,我們就要從計算機的角度出發,不斷去鉆研編程語言,讓它更準確地理解人類的語言,從而為人類服務。
這番話不由得讓我聯想到,自己在寫文章的時候,經常會糾結用什么語句,什么詞匯來表達,才會讓讀者看起來更舒適。而對于AI來說,這樣的問題完全不存在。因為計算機“看到”的都是語言結構,它們對自然語言的理解,從本質上來說都是對結構的預測,只要它能從一句話中發現有結構的語義,就是讀懂了自然語言。
然而,中國文化博大精深,漢語的表達更是五花八門,要讓計算機準確識別人類的語言,程序員需要掌握的可不僅僅是編程語言這門單一的知識。“當我們搜索2019年的網絡熱詞時,會彈出‘上頭‘盤它‘我酸了‘我太難了等一系列詞語,它們都帶有創新性。”劉老師說,一位優秀的程序員,不僅要讀懂字面意思,還要會讀懂言外之意,不僅要學習計算機的專業知識,還要廣泛涉獵各類學科文化,否則在編寫代碼時就不能很好地表達出自然語言的內涵。“要能字斟句酌,精準理解消除歧義;還要瞻前顧后,理解語境;同時博學廣識,實現跨模態理解語義。社會性、心理學、語言學、神經語言學等書籍都要去閱讀……”哇哦,這么說來,“程序猿”并不是我想象中呆頭呆腦的一群人,而是一群知識淵博的語言通呢。
此外,自然語言的多義性、主觀性、社會性等特點,也會讓它在被計算機理解時造成困難。”劉老師在課程中舉了很多例子,最令我印象深刻的要數“吉尼斯世界紀錄因紀錄了最多吉尼斯世界紀錄被吉尼斯世界紀錄紀錄為紀錄吉尼斯世界紀錄最多的吉尼斯世界紀錄”這句話了,就連我都是讀了兩遍才讀順的,可想而知,要通過編程讓計算機去識別,的確是要好好把句子捋順嘍。劉老師說,這就是計算機語言處理過程中的難點。因此,從2013年開始,“深度學習”成為自然語言處理的一個探究領域,就是為了讓AI可以更精確地識別人類語言。
如此說來,身為一名文科生,雖然不懂編程語言,但是我的內心反而有種自豪感。因為,劉老師的課程讓我明白,“聰明”的AI想要破解人類的自然語言,還是很困難的。
在接受一番燒腦的知識洗禮后,我決定還是學習點簡單又實用的知識。
當我看到網站里一門名為“做好清潔、保濕和防曬,不交護膚智商稅”的課程后,眼睛一下亮了起來。主講人王植是一個膚白貌美的“小哥哥”,化學系大三的他不僅長得帥,而且聲音超級溫柔,還是清華大學科學護膚協會會長呢。
不過,王植可不是靠這些吸引觀眾的,隨后的知識讓我大開眼界。他說,要想護膚,先要全面客觀地認識自己。根據科學分類,皮膚有4個維度,分別是“Oily/Dry”“Resistant/Sensitive”“Pigmented/Non-pigmented”“Tight/Wrinkled”。我只知道第一組油皮和干皮,沒想到還有“耐受皮/敏感皮”“容易色沉皮膚/不容易色沉皮膚”“緊實的皮膚/有皺紋的皮膚”這樣的分法。這還沒完,這4組還可以分別組合,構成“ORPT/ORPW/DRPT/DRPW……”等16種類型的膚質。“不管你屬于哪種皮膚,要想保持好的狀態,清潔、保濕和防曬三個關鍵步驟都不可少。只要做好這3個步驟,就跑贏了99%的朋友,你看起來一定會比同齡小姐妹年輕許多。”
對于清潔這個步驟,王植說,干皮最好選擇氨基酸表活和兩性基表活為主的復配型潔面,以及含有甘油、透明質酸、丁二醇、氨基酸的保濕成分。油性皮膚在選擇時還需要細分。油皮耐受型皮膚可選含皂基和水楊酸、白柳皮提取物、葡糖酸鋅等有一定控油成分的復配型潔面,油皮敏感型則最好選用以氨基酸表活和兩性基表活為主的復配型潔面……
本以為是門輕松的課,但上著上著,我越來越覺得自己上的是一堂化學課。
責任編輯:曹曉晨