◎本刊特約記者◎陸金路
他是中國工程院院士;
他是清華大學計算機科學與技術系教授;
他實現了中國存儲系統從“一張白紙”到世界領先的突破;而今70多歲的他依舊踐行著“為祖國健康工作50年的”誓言……

初見鄭院士,看著他走路時矯健的步伐、談起專業來激情澎湃的樣子,你很難想象這是一位70多歲的老人。
說起清華大學,鄭緯民院士印象最深的還是時任校長蔣南翔先生對學生提出的那句口號:“為祖國健康工作50年”。鄭緯民院士始終記得這句承諾,記得清華大學對他的培養。從1970年畢業到如今,他已經為祖國健康工作51年了,但在他看來這還遠遠不夠。
科研的道路不會一帆風順,在這個過程中,鄭緯民院士始終把清華大學的校訓記在心里——“自強不息,厚德載物”。作為我國網絡存儲領域的領軍人物,他一直強調搞科研要自立自強,要做自主可控的產品?!耙鲇杏玫娜?,有用的事,先進的事”他始終把這句話掛在嘴邊。
20年前,在存儲領域有個叫網絡存儲器的東西,它并不是簡單意義上的硬盤。這個設備有很多優點,但是在當時情況下,我們自己還不會做這個東西,就只能依靠購買外國產品。日本、美國的幾家公司看中了我國當時無法生產網絡存儲器的現狀,把價格定得很高,甚至比主機賣的還要貴。為了打破這一現狀,鄭緯民院士和團隊暗下決心:一定要做一個自主可控的有知識產權的網絡存儲器!
在存儲系統領域,中國曾是“一張白紙”。1965年,當鄭緯民考入清華大學自動控制系的時候,算法、存儲、系統等基礎理論研究,國內還比較落后,沒有人能準確判斷中國計算機事業將會怎樣。2016年,鄭緯民院士和團隊獲得了“戈登·貝爾獎”,這個獎項曾被譽為世界超級計算機應用領域的“諾貝爾獎”,鄭緯民院士帶領團隊實現了我國高性能計算機應用成果在該獎項上零的突破。從1965年到2016年,這51年的漫長時光里,鄭緯民院士一直在路上。
提起獲得“戈登·貝爾”獎的往事,這位70多歲老人眼里的“光”更亮了。2016年,鄭緯民帶領團隊做了一個天氣預報的軟件,這個“千萬核可擴展大氣動力學全隱式模擬”聯合成果獲得“戈登·貝爾”獎,實現了我國在此大獎上零的突破。2017年,清華團隊再次借助“神威·太湖之光”超級計算機,成功設計實現了高可擴展性的非線性地震模擬軟件,再次斬獲“戈登·貝爾”獎。兩次獲獎,鄭緯民院士及其團隊付出的努力不言而喻。
51年的時間,鄭緯民院士在和團隊攻關的過程中,遇到過不少“卡脖子”的事情,但在鄭緯民院士的心里一直明白,人家國外要卡你脖子,最主要的原因還是因為我國在這方面不行。卡不卡脖子,關鍵看自己。就像網絡存儲器一樣,當我們自己掌握這門技術,我們自己會做了,國外就卡不了脖子了。因此,鄭緯民院士一直在想辦法提高我國這方面的技術水平,不管是計算機芯片也好、軟件也好、應用也好……當我們能做好,國外就沒有辦法制約我們了。
鄭緯民院士所處的領域——計算機體系結構,在之前很多年都不是熱門,甚至有些冷門,直到近年才慢慢被重視。當整個行業醉心于研究各類復雜精巧的算法時,鄭緯民院士卻敏銳地意識到數據存儲技術的廣闊發展前景。
鄭緯民院士告訴記者,在過去,做系統的人相對較少,主要通過向國外購買的方式獲得,因此自己就不去做了。但是國外一旦不賣給你,該怎么辦?并且在早些時候,大家都喜歡做算法,后來發現互連也很重要,最近這幾年,則是以存儲為中心了。同時,隨著數字化、信息化的發展,數據量增加的非常快,數據量也很大,這樣的數據要放在哪里?這成為了一個現實問題。如果把數據放在國外的存儲系統里,總歸是不安全的。所以,鄭緯民院士和團隊下定決心,一定要做自己的存儲系統,這樣才能保證安全。雖然剛開始的時候,性能、功能會稍弱一些,但是也不要緊,我們總歸是會把它做好的。
在鄭緯民院士看來,自己專業的冷門表現在,學生報考博士生的時候不太喜歡到這個專業來。在他們眼里,這個專業讀起來太辛苦!要6-7年才能畢業,畢業文章也不好寫。其他偏算法類專業的博士生可能4年就畢業了,但這個專業卻要花費更多的時間。最近幾年,情況好轉了不少。鄭緯民院士告訴記者,隨著被重視程度的提高,國內很多公司都要做系統,比如華為、阿里、騰訊,都很需要系統專業人才。因此從鄭緯民院士組里畢業的學生很受重視和歡迎。所以,近年來到鄭緯民院士專業組的人很多。特別是近年來,從計算機系畢業最優秀的本科生大多數選擇不出國,就留在清華大學,留在鄭緯民院士的組里,繼續為國家計算機事業攻關。說到這里,鄭緯民院士感到非常欣慰?!昂苄量?,但是也有樂趣,我們很想把這件事情做好”鄭緯民院士這樣告訴記者。
在教學上,鄭緯民院士一直鼓勵學生跨領域學習。比如,要做天氣預報軟件,怎么樣才能把天氣預報這個程序寫好?這就需要做這個程序的人既懂大氣方面的專業知識,又要懂計算機。鄭緯民院士告訴記者,清華大學在幾年前成立了一個地學中心,里面涉及了一些跟天氣預報有關的研究。當時,鄭緯民院士找來了一位青年教師,問他有沒有興趣做交叉研究?并給這位年輕老師出了一個主意:首先把天氣預報專業本科四年的書全部讀一遍,一邊讀一邊做。這位年輕老師按照鄭緯民院士的方法,真的把那些書都找來讀了。后來,他做出來的天氣預報軟件比那些只懂計算機的人做出來的優秀得多,現如今這位年輕教師已然是天氣預報領域的專家了!
交叉學科,要兩者結合才能做好。學氣象的人要懂計算機結構,學計算機的人要懂氣象專業知識。這樣才是真正意義上的學科交叉。鄭緯民院士曾經帶過一個碩士生,他就是原搜狗公司CEO王小川。他當時的研究方向是搜索引擎。后來,他想通過計算機做一款基因拼接軟件,當時的他對生物學很感興趣。鄭緯民院士很鼓勵他這一想法,并且告訴他要把生物基因的書讀一遍。后來他在鄭緯民院士的鼓勵下做出了一款基因拼接軟件。
在鄭緯民院士看來,學科交叉就是深度交叉,只有做到深度交叉,才會獲得成功。在教學的道路上,他一直這樣鼓勵學生。
“鼓勵年輕人從頭做先進的系統軟件”是鄭緯民院士對于人才培養的思考。他一直倡導,做系統軟件要從頭做。從頭并不是基于開源軟件在上面修改,而是鼓勵學生從頭寫。并且還要寫的比原來的軟件更好、更先進?!皬念^”、“先進”這兩點在鄭緯民院士心中十分重要。
鄭緯民院士說,過去,中國人從0到1這件事情做的少,而在從100到110這件事上做的多。這并不是說從100到110不好,而是我們更需要從“0”到“1”這種突破。尤其是現在,就是“從頭做先進軟件”的時候了!我們現在有這個底氣這樣說。這樣的底氣從何而來?鄭緯民院士給出答案……
鄭緯民院士和團隊最近做了一個分布式文件系統,這個系統就是鄭緯民院士和團隊從頭開始做的。這個文件系統做完后安裝在了鵬城實驗室“鵬城云腦II”這臺機器上。值得關注的是,“鵬城云腦Ⅱ”于去年11月和今年7月接連兩期奪得IO500總榜和10節點榜的雙料世界冠軍。11月12日,第三屆中國超級算力大會(ChinaSC 2021)在北京舉行,會上發布了2021國際人工智能性能AIPerf500排行榜,鵬城實驗室“鵬城云腦II”人工智能超算大科學裝置蟬聯排行榜冠軍,彰顯了其強大的智能算力優勢。今年5月份,“鵬城云腦Ⅱ”還在具有較大業界影響力的“MLPerf training V1.0”基準測試中取得了圖像處理領域模型性能第二名和自然語言處理領域模型性能第一名的好成績。
通過這個案例,我們就能理解為什么鄭緯民院士說“現在是時候從頭做先進軟件”了。
當前5G、大數據、人工智能等興新技術迅速發展,賦予了各行各業新的發展機遇。未來,網絡存儲領域如何發展?
在存儲系統方面,鄭緯民院士一直在做一個大容量、高可靠的存儲系統。這是因為,存儲系統里硬盤是有壽命的,一旦硬盤損壞,里面的數據就存在丟失的風險。為此,鄭緯民院士及其團隊特別想做的就是,硬盤損壞后,里面的數據是否可以保留下來。鄭緯民院士介紹說,要達到這個目的,通常辦法有兩個。第一個方法,在存數據的時候存三份,一份數據壞了,還有另外兩份數據,用這個辦法來保證硬盤壞了數據不會丟。但是這個辦法的不好之處在于,要多買200%的硬盤。第二個方法,用RAID 5、RAID6的方法做,這個方法的好處在,假如有5塊盤,它允許一塊盤壞,還有4塊盤是好的,就能把數據恢復出來。但是這個方法的缺點就在,一個盤壞了,一定要趕快把這塊盤拔出來,把一塊新的盤插進去,這樣才能做數據恢復,如果沒有及時把壞盤拔出來,又有一塊盤壞了,那數據就丟了。這也是現在數據中心管機器的人最怕的事。
這兩年,鄭緯民院士和團隊做了一個叫糾刪碼的東西,糾刪碼就是為了恢復數據用的。鄭緯民院士介紹說,比如一部電影,分成32段,把每一段都存到一個硬盤里去,存進去的同時做一個運算,產生糾刪碼。32段電影存入,就產生了16段糾刪碼。這16段糾刪碼,就是為了恢復數據用。它的好處在于當小于等于16塊硬盤壞掉都沒有關系,數據都能恢復出來。
鄭緯民院士的下一個目標是:研究一款存儲系統,即使盤壞了,數據也不會丟;有人來偷數據,即使偷走了也沒有用?!案呖煽俊⒆跃S護、高安全”是鄭緯民院士對于存儲系統的要求,也是未來行業發展趨勢。
“做有用的人、做有用的事”是鄭緯民院士對團隊每一位成員提出的要求,也是他終身踐行的目標。
從“0”到“1”,中國存儲系統的未來到底行不行?
“我看行!”這是一位院士對中國未來計算機事業蓬勃發展的信心。