劉 佳
作為數(shù)字技術(shù)創(chuàng)新最活躍的領域之一,人工智能凝聚了計算機視覺、自然語言處理、跨媒體分析推理、智適應學習、群體智能、自主無人系統(tǒng)、智能芯片和腦機接口等關(guān)鍵技術(shù),加之大數(shù)據(jù)的積累、理論算法的革新、計算能力的不斷提高和網(wǎng)絡設備的不斷完善,目前人工智能的研究與應用已經(jīng)進入了一個嶄新的發(fā)展階段——其在基礎層、技術(shù)層、應用層的上下游產(chǎn)業(yè)鏈也正在逐步建成,人工智能的應用場景從硬件擴展到了軟件、服務與平臺體系,在工業(yè)、農(nóng)業(yè)、醫(yī)療領域的行業(yè)應用不斷深入,展現(xiàn)出巨大的市場潛力和廣闊的發(fā)展前景。而近期“橫空出世”并引起廣泛討論和關(guān)注的ChatGPT,即“人工智能有望在未來掀起一場新的工業(yè)革命”的一個有力佐證。
求木之長者,必固其根本;欲流之遠者,必浚其泉源。以見證者和親歷者的身份,合肥工業(yè)大學多媒體計算所教授、黃山青年學者王楊堅守著“自己去尋找、自己去發(fā)現(xiàn)”的科研初心,一步一個腳印地行走在深度學習、模式識別、多媒體計算等基礎研究的一線,不斷突破著自己的“天花板”。在他看來,亦步亦趨絕非長久之計,自主創(chuàng)新和彎道超車才是我國人工智能領域發(fā)展的必由之路,而他的愿望,是與團隊一道在理論創(chuàng)新和技術(shù)創(chuàng)新的層面持續(xù)發(fā)力,為我國人工智能發(fā)展貢獻力量。
2009年,忙于本科畢業(yè)設計的王楊,得到了一個改變他一生研究道路的建議:“大三的時候,我跟隨一位外國老師學習概率模型的知識,在發(fā)覺我概率學、統(tǒng)計學、線性代數(shù)的成績不錯后,他隨機問了我?guī)讉€相關(guān)問題來測試我對這些內(nèi)容的理解。而在得到我的回答后,這位老師就很積極地建議我先從發(fā)表相關(guān)領域的論文入手,循序漸進地去做以信息論和概率模型為切入點的數(shù)據(jù)驅(qū)動相關(guān)研究。”王楊回憶道。經(jīng)過一年的學習和接觸,已經(jīng)對相關(guān)領域產(chǎn)生興趣的他聽從了老師的建議,考取了天津大學的碩士研究生。在研究生導師的悉心指導下,王楊有的放矢、厚積薄發(fā),全力汲取著知識、累積著經(jīng)驗。這段經(jīng)歷,成了他日后走向人工智能領域的一把鑰匙,也為他展開后續(xù)研究打下了堅實基礎。

王楊
從“好讀書不求甚解”的門外漢,到初窺門徑的科研新秀,王楊并未滿足于此。在做數(shù)據(jù)驅(qū)動研究時,他發(fā)現(xiàn)相關(guān)數(shù)據(jù)并不足以支持研究運轉(zhuǎn),為此,他展開了基礎研究工作,并累積了一定數(shù)量的圖片數(shù)據(jù)。“這也激發(fā)了我的思考,能不能在這些數(shù)據(jù)的基礎上構(gòu)建更好的模式識別系統(tǒng)?如果可以,那我如何為這一模式識別系統(tǒng)建立更好的訓練方式和訓練集?”由淺入深思索激勵了他更為蓬勃的科研熱情,也讓他萌生了往機器學習和模式識別方向看一看、走一走的想法。就此,他考取了澳大利亞新南威爾士大學計算機科學與技術(shù)專業(yè)的博士學位,就此正式步入模式識別、機器學習、多媒體計算研究等研究方向,開展相關(guān)的學習和研究工作。
“轉(zhuǎn)換跑道”的日子,是辛苦而充實的。在“授人以漁”的博士生導師幫助下,王楊接受了系統(tǒng)的科研訓練并掌握了基本的學術(shù)方法,也得到了與業(yè)界不同細分領域?qū)<医涣饔懻摰臋C會。在此過程中,不斷有新的科研靈感閃爍于他的腦海,而以腳踏實地的研究將乍現(xiàn)的靈感變?yōu)楝F(xiàn)實、“去做有挑戰(zhàn)性的科研工作”的信念也就此埋在他的心間。游學澳大利亞期間,“兩耳不聞窗外事”幾乎成了他生活的常態(tài)——“新南威爾士大學附近有很多中餐館,甚至有一家就在我當時住處的樓下,但是我一次都沒有去過。”王楊笑著說道。最終,夜以繼日的勤勞結(jié)出了碩果。談及一路走來的心得和感悟,他將其歸結(jié)為“基礎+努力”——“其實我的天賦沒有那么高,是本科和碩士期間比別人起步早了一些的‘時間差’,再加上勤能補拙,才讓我得以在這條新路順利地走下來。”
與王楊越發(fā)明確自己要選的科研方向幾乎同時,國內(nèi)相關(guān)研究也同樣方興未艾。大量涌入的“新鮮血液”和不斷豐富的學術(shù)成果,讓王楊看到了國內(nèi)人工智能發(fā)展的巨大潛力,也讓他萌生了回國報效的想法。恰逢此時,同樣深耕于人工智能領域的青年學者、合肥工業(yè)大學計算機與信息學院院長汪萌向他伸出了橄欖枝。“我在攻讀博士學位期間,就和汪院長在多媒體計算領域有一些交流。可能因為是同齡人的緣故,我們的溝通特別順暢,這番經(jīng)歷也帶給了我很多啟發(fā)。等到我博士畢業(yè)、選擇回國后,汪院長更是為我提供了很多幫助和支持。”當時,在汪萌及其團隊的共同努力下,合肥工業(yè)大學計算機與信息學院取得了長足的發(fā)展,聚集了一批頗有建樹的年輕科研工作者,其牽頭成立的多媒體計算所也贏得了不斐的國際聲譽。高水平的學術(shù)團隊,讓王楊心向往之;良好的平臺、專注做學術(shù)的氛圍,為他從事科研工作提供了有力保障。就此,王楊作別澳大利亞,回到了分別數(shù)年的祖國并入職合肥工業(yè)大學計算機與信息學院。他期待用所學所思之成果,在祖國大地上開出新的花朵。

王楊(中)與團隊成員合影
“找到所研究領域中真正具有挑戰(zhàn)的方向和問題加以研究”是王楊回國后為自己定下的目標。從自身的經(jīng)歷出發(fā),他講述了確立這一目標的心路歷程:“2011年我出國時,當時國內(nèi)人工智能相關(guān)的文章和成果并不多。到現(xiàn)在,國內(nèi)相關(guān)會議和期刊論文的數(shù)量已經(jīng)呈現(xiàn)幾何式增長,但真正能夠解決本領域最核心的具有挑戰(zhàn)性問題的文章依舊是少數(shù)。然而,一國在領域內(nèi)的影響力和話語權(quán)往往是由這些真正‘觸及根本’、引起重大反響的成果決定的。就此,我下定決心,不要做簡單的重復,而是要去真正的前沿之地尋求突破。”
據(jù)王楊介紹,他目前所做的研究有兩個最重要的組成部分:其一是數(shù)據(jù),其二是模型。且數(shù)據(jù)和模型之間絕非孤立存在,而是互相促進的共生關(guān)系。“在數(shù)據(jù)量越來越大的情況下,它會隨之變得越來越復雜,而在這種大數(shù)據(jù)海洋‘沖擊’之下,傳統(tǒng)的理論和模型會發(fā)生變化。就像我們現(xiàn)在所做的研究,雖然基礎理論和模型是一樣,但是實際上在不同的大數(shù)據(jù)情況下,其網(wǎng)絡的訓練策略、架構(gòu)等都會產(chǎn)生變化。”
從這一事實出發(fā),王楊著力探索深度網(wǎng)絡學習的更多可能性。作為一個已經(jīng)存在數(shù)十年、且有相當數(shù)量研究成果的領域,他從深度學習的可解釋性和智能性入手,逐一闡述這一模型的變化性、獨創(chuàng)性及可應用性。
“深度學習就像一個一層套一層的黑盒,其本質(zhì)是上一層的輸出作為下一層的輸入。”王楊解釋道,“就像折紙一樣,對折一次可以出現(xiàn)2個分區(qū),再對折可以出現(xiàn)4個分區(qū),以此類推下去,深度網(wǎng)絡的層數(shù)越多、相應的分區(qū)也會越多,其識別的細膩度就會隨之提升。”由于深度學習高度依賴于訓練數(shù)據(jù)集,王楊選取了大量的數(shù)據(jù)訓練集對其進行優(yōu)化,進一步規(guī)避數(shù)據(jù)集“偏見”對最終結(jié)果的影響。在此基礎上,他還嘗試將多個深度網(wǎng)絡進行互相借鑒和訓練融合,從而得到遠優(yōu)于單一深度網(wǎng)絡輸出的結(jié)果。“在深度網(wǎng)絡調(diào)配協(xié)作的過程中,較為強勢的網(wǎng)絡被稱為‘教師網(wǎng)絡’,較為弱勢的則被稱為‘學生網(wǎng)絡’。基于人工智能模仿人類認知行為的最終目標,如何界定這兩種網(wǎng)絡的形態(tài)?如何進行人工智能模擬?如何進一步拓展深度學習網(wǎng)絡的智能化程度?這都是我們需要探索的內(nèi)容。”

王楊(右1)在指導學生
依托國家自然科學基金青年基金項目“基于合作式的多視圖數(shù)據(jù)深度子空間聚類的研究”、國家自然科學基金重點項目“網(wǎng)絡空間虛擬身份塑造及應用技術(shù)”和“多模態(tài)環(huán)境下的多媒體對話分析與理解”、國家自然科學基金面上項目“基于生成對抗網(wǎng)絡的無監(jiān)督跨域行人識別方法研究”等多個重要科研項目,王楊不僅在多個科研細分領域取得了亮眼的成績,也在這一過程中得到了充分的鍛煉和成長。在申請項目之初,作為新人的他并沒有很大的信心,此時又是汪萌院長的鼓勵讓他堅定地扛起了自己的科研責任——“很早之前,汪萌院長告訴我做科研要‘勇于創(chuàng)新、勇于突破’,而申請國家項目則是將現(xiàn)有的學術(shù)基礎及學術(shù)成果進行整合,而后在此基礎上真正去提出有價值的創(chuàng)新點,從而形成一個具有先進性的國家項目,這對于科研創(chuàng)新和產(chǎn)業(yè)落地都將有極為積極的意義。”
萬事開頭難。對于充滿干勁的王楊來說,這種困難同樣沒有縮減分毫。為了寫好項目申請書,他在春節(jié)都不曾休息,夜以繼日地埋首于各個項目的準備過程中。“當時時間緊、任務重,基本上每天都要工作到夜里12點左右。每寫好一次,我就和汪院長一起討論,然后再按照他的建議反復修改。”王楊回憶道。最終,功夫不負有心人,集合了鉆研和交流的合力,2019年,他如愿申請到了包括國家自然科學基金青年基金項目在內(nèi)的多個重要項目。回首這段經(jīng)歷,王楊頗為感慨地說:“項目申請成功之后,我當時非常高興,因為這一方面意味著,我學會了一項重要技能——學會了如何去寫作重點項目申請書;另一方面也意味著,我所做的研究是符合國家和行業(yè)發(fā)展趨勢的,是具有價值的。”
以此為起點,將學科發(fā)展、創(chuàng)新及成果融合于一個個具有挑戰(zhàn)性和前瞻性的科研項目中,王楊的科研之路正一步步綻放出屬于他自己的耀眼光彩。他先后在模式識別相關(guān)領域頂級雜志與會議上發(fā)表文章80篇,獲得2014年亞太數(shù)據(jù)挖掘大會(PAKDD)最佳論文獎亞軍,其中兩篇論文被選為國際人工智能聯(lián)合會議(IJCAI)最有影響力文章之一,7篇成為基本科學指標數(shù)據(jù)庫(ESI)高被引文章并全部進入Top 1%列表,王楊本人也于2022年入選美國斯坦福大學統(tǒng)計發(fā)布的人工智能與圖像處理領域全球頂級科學家名單。
褪去青澀、直面挑戰(zhàn)、創(chuàng)新不輟,在王楊看來,“明確認知、植根實際、著重創(chuàng)新”是科研之路得以行穩(wěn)致遠的不二法門。“首先,我要明確自己要做怎樣研究的問題。這是基于前期的科研成果和實踐積累,要全面、充分、深刻地認識這個問題,找出其核心,是做一切科研工作的基礎。其次,不單單要從問題出發(fā),更要考慮其落地的前景,從結(jié)合實際需求的角度入手,以應用為前景進行有實際意義的研究。最后也是最重要的,我不希望研究工作以簡單地重復或者單純以發(fā)表文章為目標,創(chuàng)新仍是科研工作的第一要義。同時,這個創(chuàng)新不是無本之木、無源之水,它必須是緊密地結(jié)合在自身科研基礎和應用背景下的創(chuàng)新,是兼顧基礎性和創(chuàng)新性的扎扎實實的創(chuàng)新。”
正如王楊所期待和追求的那樣,他的努力也同樣在產(chǎn)業(yè)化過程中結(jié)出了碩果。自2022年起,王楊團隊積極開展與相關(guān)企業(yè)的合作,通過國家自然科學基金重點項目等方式,集中解決產(chǎn)學研轉(zhuǎn)化“最后一公里”未打通的種種難題,以關(guān)鍵理論和模型為企業(yè)實際產(chǎn)品賦能。“在數(shù)據(jù)和模型層面,僅僅依靠我們和企業(yè)是遠遠不夠的。下一階段我要做的事,就是尋找更多的合作方,將理論成果更加廣泛地應用到具體實踐中,讓科研成果最大限度地發(fā)揮其作用。”談及產(chǎn)業(yè)化的前景,王楊如是說道。
人如其名,在王楊眼中,科研工作“獨木難成林”。身為一名高校教師,為行業(yè)發(fā)展培養(yǎng)新鮮血液同樣是他極為看重的工作內(nèi)容。在教學過程中,王楊從個人經(jīng)驗出發(fā),在教授知識的同時也向?qū)W生傳授思考問題的方法。在他看來,增強學生學習興趣最好的獎勵就是及時的反饋和有效的互動;此外,以創(chuàng)新為第一要務的王楊還特別看重學生舉一反三、主動思辨的能力。“光聽課、只會重復老師的思路是不夠的,要基于老師的授課內(nèi)容進行深入思考,并由此衍生出自己的見解。”在充分挖掘?qū)W生的特長和潛力的基礎上,王楊始終對學生的學術(shù)成果保持著“高標準、嚴要求”——“如果標準定得很低,那他們的成果將不會有很強的競爭力,進而在世界范圍內(nèi)激烈的科研競爭中‘失利’,這對學生的信心是一個重大的打擊,也會造成時間和成本的巨大浪費。而如果在最初,我就將標準定得高些,雖然剛開始做的時候會有點難,但當他有一定成果之后,一定會促使學生產(chǎn)生強大的信心和對相關(guān)研究的興趣,而這將是鼓舞他們在科研之路長期走下去的重要力量。”王楊解釋道。在他的努力下,學生勤學善思的科研習慣已逐漸形成,師生之間的“正向反饋路徑”也已建立,“學生們都很用功,也在不少行業(yè)內(nèi)頂級會議上發(fā)表了文章,作為一名教師,這也是讓我比較欣慰的一件事”。
與此同時,王楊也充分重視實踐與合作的力量。近年來,隨著人工智能的發(fā)展,王楊也將自己的研發(fā)重心由原來的模型和方法的探索逐漸轉(zhuǎn)向理論的創(chuàng)新和驗證,做實驗也成了他科研工作的主要內(nèi)容之一。“做實驗可以推動我們?nèi)ラ_拓更多理論,理論則能支持我們?nèi)プ龈嗟膶嶒灐@碚摵蛯嵺`來回交互、互相推動,這也是我們挖掘新理論的根基所在。”在此基礎上,他通過與高校、研究機構(gòu)的溝通交流,開展學生培養(yǎng)、學術(shù)交流、項目合作等多項合作,進一步推動學生的成長和科研水平的進步。帶好學生、做好科研、打好基礎、逐步擴展,是他為自己定下的工作目標。
持續(xù)的努力為王楊贏得了學界的認可。2019年,剛剛回國不久的他就被選為信息搜索領域國際雜志《計算機學會信息系統(tǒng)學報》(ACM Transactions on Information Systems)的副主編,當時的他是唯一一位尚未在這一雜志上發(fā)表文章的入選者。得益于共同培養(yǎng)學生的經(jīng)歷,王楊的科研思路、科研方法得到了雜志主編的認可,并促成了相關(guān)研究的進展——“當時主編認為其中一項研究的成果已經(jīng)達到發(fā)表的水平,但是我覺得這個深度還不夠,還有繼續(xù)挖掘的潛力。所以我就堅持將那個問題繼續(xù)深入研究,最終的結(jié)果也確實比原先的成果高出一倍以上。”王楊回憶道。他始終認為,獲得這一機會很大程度上源自自己對于“研究就要做得比別人更深”的執(zhí)著,而能以這份執(zhí)著得到業(yè)界的認可,是他的幸運,也是他繼續(xù)努力的動力之一。
談及未來的規(guī)劃,王楊坦言,他還是希望以學術(shù)研究為陣地,充分挖掘理論創(chuàng)新的更多可能。他常說做科研的過程就是一個不斷發(fā)現(xiàn)自己不足的過程,而他期待憑借自己和團隊的共同努力,找出不足、彌合差距,通過不斷完成一些具有挑戰(zhàn)的創(chuàng)新性工作,最終建設一支國內(nèi)乃至國際上具有一定影響力的科研團隊。當被問及具體的發(fā)展方向時,王楊認為盡管人工智能面臨著重重挑戰(zhàn),但仍是以算法為其關(guān)鍵所在。故此他選擇了人機交互方向作為下一步的主攻方向,以期解決“機器如何為人民服務?”“機器如何更好地工作?”“人機如何配合以達到和諧狀態(tài)并完成共同任務?”等問題,以點帶面地推動人工智能的未來發(fā)展。
在采訪的最后,王楊也談到了他對ChatGPT的理解——“ChatGPT不是簡單的‘問答工具’,它事實上是通過監(jiān)督學習將搜索到的信息圖進行分析和整合,這個過程不是一次性的,而是通過一手、二手、三手……不斷地將有價值的信息抓取并發(fā)送出來,這也是其被認為可以取代一些行業(yè)的核心競爭力所在。”而ChatGPT的問世也激發(fā)了他對于我國人工智能發(fā)展的思考:“經(jīng)過多年的發(fā)展,我們在解決問題和發(fā)表文章層面,數(shù)量和質(zhì)量都得到了很大的提升。然而在發(fā)表高質(zhì)量學術(shù)論文的基礎上,我國如何提出新的概念、新的解決方案,最終可以產(chǎn)出一個像ChatGPT這樣具有重大創(chuàng)新意義的概念或者產(chǎn)品,這將是我們要為之努力的方向。如果可以在這個過程中攻克一兩個關(guān)鍵問題,為我國人工智能行業(yè)發(fā)展貢獻力量,我覺得很榮幸。盡管命題宏大、道路漫長,但我堅信只要有夢想、有堅定的毅力、有扎實的行動,夢想就有實現(xiàn)的可能。”王楊笑著說道。