林木木
高考機器人的研究讓人重新審視已有的教育方式。“如果AI能夠做得更好,那說明,我們需要新型教育。”
6月7日17點,2017年高考第一日結束,數學學科停筆交卷的鈴聲劃破長空。北京第八十中學望京校區人潮涌動,結束數學廝殺的考生正陸續走出考場,有歡有悲,神色各異。
此時,相隔5公里外的麗都皇冠假日酒店,另一場同樣試題的考試已經展開,考生是名為Aidam的人工智能程序。經歷3年研發,被學霸君的200位技術工程師喂下50萬道考題后,Aidam開始正式嘗試2017年新課標文科數學卷。
同一時間,相隔千里之外的四川省成都市高新區,另一場機器人答題的活動也已經開始。比起Aidam,準星云學科技(以下簡稱準星)取名更為直接:AI-MATHS,據說已經是一位平均分達90的數學答題機手。
2017年的高考是兩家科技公司——學霸君和準星要征服的目標。事實上,這場AI與人的角逐6年前就開始了,而且還是“國家任務”。
從“拍照搜題”開始學習
2012年6月的一天,在投資公司工作的張凱磊收到一封同學發來的群郵件,內容是一篇Google尚未發表的論文,揭示這一輪人工智能學習的大浪潮。
這篇論文在發表后將引起巨大反響,很快,全世界都將知道Google在秘密實驗室Xlab做出關于“貓臉識別”的驚人研究。
“教學會因此迎來徹底變革。”張凱磊說。張凱磊南開大學數學系出身,曾在大二輟學創辦過一家教育培訓機構,因此這成了第一個跳入他腦中的想法。
10月,張凱磊果斷辭掉投資公司的工作,邀請陳銳峰博士加入,開始籌備創業。一年后,主打“拍照搜題”的學霸君面世,它將為日后的高考機器人Aidam提供大量的題庫儲備。
這個時期的中國高考機器人,正在襁褓中孕育著能量。
高考機器人開端于2011年。來自日本國立情報學研究所(NII)的新井紀子教授領頭發起 “東大機器人計劃”。她召集超過100名人工智能領域的專家組成專項團隊,目標是讓機器人Torobo能在2021年前通過東京大學的入學考試。
這一年,另一個中國人林輝,在無數次碰壁后,成立清華大學蘇研院大數據中心。林輝擔任數據中心主任,到2014年,大數據中心旗下的智慧教育事業部被分出來成立準星云學科技有限公司,林輝任CEO,并在不久后承擔起開發高考機器人AI-MATHS的責任。
“國家任務”
2015年7月21日,合肥一間會議室里,數十位專家領導圍坐在一張棕色的圓桌旁。
這里正召開國家“十二五”863計劃信息技術領域“基于大數據的類人智能關鍵技術與系統”項目啟動會暨研討會。會議探討并啟動“國家863類人智能項目”,主要任務是在3-5年時間內研制出能夠參加高考并考取大學的智能機器人。
這款智能機器人不僅可以儲存知識和高考題型,還將具有邏輯推理能力。此外,通過建立模型和算法,可以讓機器在大數據中找到數據之間的關系和差異,讓這個模型的結果和人的表現很接近,甚至在最終結果上超過人的表現。
項目由科大訊飛牽頭,聯合包括清華大學在內的30家院校和單位。當天,日本教授新井紀子也出現在會議席上。
時間回溯到5月的某一天,正在NII工作的新井紀子收到一封郵件,郵件由科大訊飛發出,意欲與NII共同開發考試機器人。郵件提到,中國將推出一個國家級項目來開發考試機器人,前三年的預算大概是30億日元,新井紀子在收到郵件后很感慨,他們在“東大機器人計劃”上的花費大概為每年數百萬日元。
她很快同意這項合作,并在7月到訪中國。
林輝的準星在人工智能領域的長期研究起到了作用。立項后,準星一舉中標高考機器人的數學應考項目,成為數學組別的組長單位。當時,人工智能識別、大數據處理等難關已經被準星攻破。
研發團隊立下目標,要在2017年6月與全國文科生一起考試,目標是考上一本。
這并不是一個容易實現的目標。當時,已經研究四年的Torobo還無法達到日本入學考試分數線。
找到數千萬學霸的解題經驗
高考是比圍棋更難的實驗,它要求機器有感知分析、認知聯想和推理驗證的能力,其泛化知識庫里的規則,遠比圍棋的黑白、點位置和吃子規則復雜得多。
很長一段時間,學霸君在機器學習上的進展極其緩慢。從2012年10月創業以來,學霸君的工程師做過許多努力,三年時間只把分數從0分提高到40分左右,之后兩年多的時間基本在原地踏步,無法取得突破,很多做這個項目的人最終都選擇離開。
2016年3月20號,張凱磊正在美國出差。晚上11點,他接到首席科學家陳銳鋒打來的電話,對方告訴他說,最近兩個禮拜,機器學習突然取得實質性突破,智能機器人項目可以開始做了。
陳銳鋒告訴張凱磊,一批龐大的數據喂進去之后,突然發現增速變快,兩周內分數增加了2到3分,這在之前是從未發生過的。在排除誤差之后,工程師們認定,新的方法被證實有效,雖然風險仍舊存在,但這個項目有了可預見的實現可能性。
難題一個接著一個。今年3月之前,學霸君一直無法攻克一個難題——如何將幾何語言轉換為機器能理解的語言。
幾何問題解決不了,挑戰高考試題就是無稽之談,張凱磊焦慮地在辦公室走來走去,突然靈機一動,想到一個無策之策。他召集幾何團隊的人員,命令說,從今往后,老師來學寫代碼,工程師學備課。
前期并無效果,經過幾個月的積累,3月的某一天,就像突然開竅了一樣,這個難題就這么消失了,張凱磊把這歸功于工程師與老師長期融合的結果。
以“拍照搜題”起家的學霸君,4年來累積超過7000萬道數學題目的題庫系統,加上學生大量手寫和上傳的題目,以及教輔書籍中的題目,共同構成Aidam的訓練數據庫。
取得階段性成果后,張凱磊定下目標——6月7日Aidam將在媒體下見證挑戰高考數學。
一分之差
6月7日,決戰的日子到了。下午5點過后,兩場千里之隔的“機器高考”開始了。
“105分。”主持人說出AI-MATHS的數學高考成績。這張高考試卷,花費了AI-MATHS 22分鐘。
與此同時,另一個高考機器人Aidam也在北京的一間會議室里快速地運算著,它這次的任務是與6名來自不同省份的高考狀元來一次對決。
比賽采用全國高考文科數學二卷,在一小時的考試時間內,兩人合力完成一套試卷。雖然是兩人合作,但中途不可以交流,開考前已決定好分工。最終,三組高考狀元分別得分為 146 分、140 分、119 分,平均分為135分,而 Aidam的成績為 134 分。
1分之差,曾經輸給阿法狗的人類,這次在高考面前打敗AI。
不過,毫無疑問的是,在運算速度上人工智能擁有巨大的優勢,Aidam在錄入完整的數學題目后,僅僅在 9分47秒就完成所有答題,而高考狀元們則花了 1 小時。
為什么我們還要耗費如此多的人力物力財力,造出一個機器人來,迎合我們所謂的“應試教育”?
學霸君CEO張凱磊的回答是,如果機器人能夠挑戰高考,有理由相信機器人可以輔導學生,在自動解題、自動批改與個性化作業上幫助學生,這對中國教育來說具有革命性意義。
(小穎薦自《看天下》)endprint