王 芳 謝更好

2022年胡燏翀被評(píng)為華科大“校十佳青年教工”
截至2022年,我國已建成21個(gè)國家級(jí)大數(shù)據(jù)中心基地。一根根特殊的網(wǎng)絡(luò)虛擬專線,跨越千山萬水,實(shí)現(xiàn)了我國重要數(shù)據(jù)的同步傳輸和異地備份。而隨著海量數(shù)據(jù)的急速增加,存儲(chǔ)規(guī)模也越來越大。保障計(jì)算機(jī)系統(tǒng)在自然災(zāi)害等突發(fā)情況下的可靠性,是大數(shù)據(jù)中心的核心要求之一,已經(jīng)上升為國家戰(zhàn)略,寫入我國“十四五”規(guī)劃。
來自華中科技大學(xué)(以下簡稱“華科大”)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院的教授胡燏翀就是這樣一位長期扎根計(jì)算機(jī)系統(tǒng)數(shù)據(jù)可靠性領(lǐng)域的青年學(xué)者。近年來,他已針對(duì)大規(guī)模分布式存儲(chǔ)系統(tǒng)所面臨的“成本高、故障多、擴(kuò)展慢”三大挑戰(zhàn),圍繞極致存儲(chǔ)開銷、高效故障修復(fù)、高效存儲(chǔ)擴(kuò)展3個(gè)核心科學(xué)問題取得系列性成果,實(shí)現(xiàn)了高效可靠性存儲(chǔ)編碼在“理論-算法-系統(tǒng)”的完整技術(shù)鏈路?;谙嚓P(guān)成果,胡燏翀于2018年獲湖北省科技進(jìn)步獎(jiǎng)一等獎(jiǎng),2021年獲國家重點(diǎn)研發(fā)計(jì)劃青年科學(xué)家項(xiàng)目,2022年獲國家級(jí)青年人才計(jì)劃項(xiàng)目。
胡燏翀將自己的研究總結(jié)為“三快”:讓編碼速度更快,讓修復(fù)速度更快、讓擴(kuò)容速度更快。追風(fēng)逐電,向更快進(jìn)發(fā),讓數(shù)據(jù)存儲(chǔ)更可靠、高效、安全,是他研究工作的主要任務(wù)。當(dāng)前,相關(guān)先進(jìn)技術(shù)為國外壟斷。胡燏翀?jiān)叭臁毖芯?,正是滿懷科技報(bào)國熱情,希望攜手海康威視、華為、新華三、浪潮等民族企業(yè)同心協(xié)力產(chǎn)學(xué)研,實(shí)現(xiàn)我國在相關(guān)核心技術(shù)領(lǐng)域的自主可控,實(shí)現(xiàn)不利局面之下的彎道超車、自立自強(qiáng)。
1985年,在總結(jié)和吸收少年班的辦學(xué)成功經(jīng)驗(yàn)基礎(chǔ)上,中國科學(xué)技術(shù)大學(xué)(以下簡稱“中科大”)針對(duì)高考成績優(yōu)異的學(xué)生,仿照少年班模式,開辦“教學(xué)改革試點(diǎn)班”(又稱“零零班”),兩類學(xué)生由少年班管理委員會(huì)統(tǒng)一管理、相互補(bǔ)充、相得益彰。2001年,胡燏翀以優(yōu)異的成績被中科大少年班錄取,成為其中的零零班學(xué)子。
少年班精英云集,一向成績拔尖的胡燏翀?jiān)谶@里深刻感受到山外有山、人外有人的道理,因此奠定了終身學(xué)習(xí)、不斷精進(jìn)的人生態(tài)度。從小就對(duì)計(jì)算機(jī)感興趣的他,在少年班自由靈活的氛圍中,從大一開始就有針對(duì)性地學(xué)習(xí)計(jì)算機(jī)方面的內(nèi)容,并最終選擇計(jì)算機(jī)科學(xué)與技術(shù)作為自己的專業(yè)。
2005年本科畢業(yè)后,憑借突出的表現(xiàn),胡燏翀獲得直博資格,繼續(xù)留在中科大深造計(jì)算機(jī)軟件與理論方向?!拔夷菚r(shí)對(duì)科研滿懷憧憬,甚至這種激情至今影響著我。從來不管難不難,不懂就問、不會(huì)就學(xué),并總是得到導(dǎo)師積極的回應(yīng)?!痹谧陨砼蛯?dǎo)師許胤龍教授悉心的教誨下,胡燏翀開展了面向計(jì)算機(jī)存儲(chǔ)領(lǐng)域的可靠性編碼理論研究。彼時(shí),分布式存儲(chǔ)新型編碼研究剛剛興起,其中的前沿方向網(wǎng)絡(luò)編碼技術(shù)的創(chuàng)立者之一正是香港中文大學(xué)(以下簡稱“港中大”)網(wǎng)絡(luò)編碼研究所聯(lián)席主任楊偉豪教授。在聆聽楊偉豪相關(guān)講座時(shí),胡燏翀敏銳地察覺到分布式存儲(chǔ)與網(wǎng)絡(luò)編碼技術(shù)的發(fā)展?jié)摿?,?duì)相關(guān)研究萌生了興趣,也為之后的一段師生緣分埋下了伏筆。
分布式存儲(chǔ)以網(wǎng)絡(luò)技術(shù)為基礎(chǔ),利用小型服務(wù)器等搭建存儲(chǔ)池,以其廉價(jià)和高擴(kuò)展性的特點(diǎn)適用于對(duì)信息的海量存儲(chǔ)。但由于分布式服務(wù)器節(jié)點(diǎn)易發(fā)生故障而丟失數(shù)據(jù),如何保障數(shù)據(jù)的高可靠性就成為亟須解決的問題。2009年,經(jīng)過深入鉆研,胡燏翀關(guān)于分布式存儲(chǔ)容錯(cuò)的修復(fù)機(jī)制的研究成果發(fā)表在計(jì)算機(jī)通信領(lǐng)域頂級(jí)期刊《IEEE通信選定領(lǐng)域期刊》(IEEE Journal on Selected Areas in Communications,IEEE-JSAC)。這篇論文是早期網(wǎng)絡(luò)編碼和分布式存儲(chǔ)結(jié)合的重要論文之一,為胡燏翀后續(xù)在分布式大規(guī)模大數(shù)據(jù)中心下的可靠性編碼技術(shù)研究奠定了良好的理論基礎(chǔ)。“我也因此獲得了港中大的博士后職位,而我當(dāng)時(shí)的博士后導(dǎo)師就是楊偉豪教授。”
2010年到2015年,胡燏翀先后在港中大的網(wǎng)絡(luò)編碼研究所和計(jì)算機(jī)科學(xué)與工程系開展博士后研究。在網(wǎng)絡(luò)編碼研究所期間,胡燏翀成為第一批將可靠性編碼應(yīng)用到云存儲(chǔ)系統(tǒng)中的博士后研究員。相關(guān)成果發(fā)表在國際計(jì)算機(jī)存儲(chǔ)領(lǐng)域的A類會(huì)議“文件和存儲(chǔ)技術(shù)會(huì)議”(Usenix Conference on File and Storage Technologies,F(xiàn)AST)中,受到學(xué)界認(rèn)可。港中大的研究環(huán)境開放活躍,學(xué)術(shù)交流絡(luò)繹不絕,胡燏翀?jiān)谶@里進(jìn)一步接觸了學(xué)界的前沿思想,為后續(xù)科研生涯積累了豐富的底蘊(yùn)和資源。

胡燏翀(右一)組織進(jìn)行課題組會(huì)議
“華科大計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院院長馮丹教授,也是信息存儲(chǔ)系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室的主任,在國內(nèi)外存儲(chǔ)領(lǐng)域名聲斐然,我的研究也受到馮丹教授團(tuán)隊(duì)不少工作的啟發(fā)?!焙鸁堈f。2015年博士后工作結(jié)束,胡燏翀帶著沉甸甸的科研果實(shí)告別香港回到家鄉(xiāng)武漢,以副教授身份加入了華科大計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院的馮丹教授團(tuán)隊(duì),由此開啟了新的科研征程。
信息存儲(chǔ)系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室,亦是武漢光電國家研究中心光電信息存儲(chǔ)研究部,數(shù)據(jù)存儲(chǔ)系統(tǒng)與技術(shù)教育部工程研究中心。實(shí)驗(yàn)室的信息存儲(chǔ)技術(shù)研究始于1974年,已有40多年的歷史?,F(xiàn)有50余名教師、300余名博士和碩士研究生,是中國在信息存儲(chǔ)領(lǐng)域研究人員最多且水平一流的研究單位和重要的人才培養(yǎng)基地之一。在馮丹教授的團(tuán)隊(duì)中,胡燏翀不僅得到了來自各方的資金支持、項(xiàng)目支持,也獲得了成熟的科研路線等方面的指導(dǎo),接連承擔(dān)重要科研任務(wù)。其中,大比例(條帶)糾刪碼(Wide-stripe Erasure Coding,WEC)系列技術(shù)是他的代表性成果之一,也是他和團(tuán)隊(duì)在國際上率先提出的一項(xiàng)重要成果。
“海康威視與華中科技大學(xué)具有緊密的校企合作關(guān)系,共建‘海量信息存儲(chǔ)聯(lián)合實(shí)驗(yàn)室’。2018年,??低曁岢鲂枨?,希望能利用大比例編碼降低存儲(chǔ)成本。當(dāng)時(shí)國際上在這方面只有理論,相關(guān)的技術(shù)實(shí)踐只有一家國外公司在做,但細(xì)節(jié)并未公開?!睘榻鉀Q??低曈龅降碾y題,胡燏翀基于自己的網(wǎng)絡(luò)編碼技術(shù)背景,開始大海撈針一般的探索,不停地仿真,嘗試找到最好的編碼。其間,他一度陷入誤區(qū)?!爱?dāng)時(shí),最新的編碼成果都屬于小比例編碼領(lǐng)域,于是我也從這里入手,苦苦仿真,卻一直沒有得到想要的結(jié)果?!?/p>
后來,胡燏翀靈機(jī)一動(dòng),從2012年前后的網(wǎng)絡(luò)編碼技術(shù)的原始論文入手設(shè)計(jì)大比例編碼。他帶領(lǐng)團(tuán)隊(duì)在國際上率先提出了大比例糾刪碼系列技術(shù)成果,論文再次發(fā)表于“文件和存儲(chǔ)技術(shù)會(huì)議”(FAST),并由于在計(jì)算機(jī)領(lǐng)域的應(yīng)用,相關(guān)成果還發(fā)表于計(jì)算機(jī)超算領(lǐng)域頂會(huì)“全球超級(jí)計(jì)算大會(huì)”(Supercomputing Conference,SC)。??低晳?yīng)用相關(guān)成果后,不僅節(jié)省了20%的存儲(chǔ)成本,還超過了微軟云和亞馬遜云的存儲(chǔ)成本降幅。研究工作取得31項(xiàng)專利,授權(quán)19項(xiàng),并于2018年獲得湖北省科技進(jìn)步獎(jiǎng)一等獎(jiǎng)。此后,胡燏翀將大比例糾刪碼技術(shù)超低成本的優(yōu)勢(shì)分別應(yīng)用于高性能計(jì)算、大數(shù)據(jù)中心、全閃集群等不同領(lǐng)域之中,解決各種不同的需求。
面對(duì)海量增長的數(shù)據(jù)、越來越大的存儲(chǔ)規(guī)模,大力發(fā)展中國存儲(chǔ)產(chǎn)業(yè),掌握數(shù)字經(jīng)濟(jì)競爭主動(dòng)權(quán)勢(shì)在必行。然而,面對(duì)構(gòu)建傳統(tǒng)大規(guī)模存儲(chǔ)系統(tǒng)的主要存儲(chǔ)介質(zhì)——機(jī)械硬盤(Hard Disk Drive,HDD)已被美國和日本的三大廠商所壟斷(西部數(shù)據(jù)、希捷及東芝)的現(xiàn)狀,中國在HDD領(lǐng)域?qū)で笸黄飘惓@щy。與此同時(shí),隨著我國國產(chǎn)整機(jī)和閃存生產(chǎn)能力的逐步提升,研究“去HDD”大規(guī)模存儲(chǔ)系統(tǒng)下相關(guān)核心技術(shù),以固態(tài)硬盤(Solid State Disk,SSD)取代HDD的時(shí)機(jī)已經(jīng)到來。
“我們必須抓住這個(gè)彎道超車的機(jī)會(huì)。”胡燏翀語氣堅(jiān)定地說。在他看來,“去HDD”大規(guī)模存儲(chǔ)系統(tǒng)下相關(guān)核心技術(shù),將會(huì)是未來國家戰(zhàn)略和企業(yè)發(fā)展的重大需求之一,而當(dāng)前阻礙其大規(guī)模應(yīng)用的主要原因在于其成本高昂,是HDD成本的三至五倍。因此,他在2022年申請(qǐng)獲批了“面向低冗余成本的大規(guī)模全閃集群下大比例糾刪碼技術(shù)研究”的面上項(xiàng)目,將此前提出的大比例編碼技術(shù)應(yīng)用到SSD上,大大降低了SSD成本,為國內(nèi)大規(guī)模閃存集群提供了重要的技術(shù)支撐。
在高性能計(jì)算領(lǐng)域,胡燏翀指出,新一代高性能計(jì)算系統(tǒng)的研制,將大幅提升我國算力,滿足國家發(fā)展的戰(zhàn)略需求。但隨著并行計(jì)算系統(tǒng)規(guī)模擴(kuò)展到千萬核級(jí)別,處理器、內(nèi)存故障頻頻發(fā)生,同時(shí)網(wǎng)絡(luò)連通度也會(huì)因頻發(fā)故障而大大降低,因而系統(tǒng)的計(jì)算、存儲(chǔ)、傳輸三大性能將因“故障頻發(fā)”而受到嚴(yán)重影響。為應(yīng)對(duì)頻發(fā)的故障,保障千萬核并行計(jì)算系統(tǒng)的可靠性,須解決“大規(guī)模并行計(jì)算系統(tǒng)故障頻發(fā)下性能保障關(guān)鍵”科學(xué)問題。因此,他申請(qǐng)并獲批主持了國家重點(diǎn)研發(fā)計(jì)劃“大規(guī)模并行計(jì)算系統(tǒng)的可靠性編碼理論和技術(shù)研究”青年科學(xué)家項(xiàng)目。
針對(duì)“故障頻發(fā)下性能保障”關(guān)鍵科學(xué)問題,胡燏翀將通過研究,重點(diǎn)解決3項(xiàng)關(guān)鍵技術(shù):面對(duì)大規(guī)模并行計(jì)算系統(tǒng)節(jié)點(diǎn)故障的低開銷容錯(cuò)技術(shù),降低處理節(jié)點(diǎn)故障給系統(tǒng)所帶來的性能負(fù)擔(dān);面對(duì)大規(guī)模并行計(jì)算系統(tǒng)低連通度網(wǎng)絡(luò)的高效傳輸技術(shù),提升低連通度網(wǎng)絡(luò)下的傳輸效率;基于大規(guī)模并行計(jì)算系統(tǒng)故障特征的容錯(cuò)優(yōu)化加速技術(shù),進(jìn)一步提升系統(tǒng)容錯(cuò)性能。最后,基于相關(guān)成果,構(gòu)建起可驗(yàn)證的并行計(jì)算系統(tǒng)函數(shù)庫、仿真軟件和原型系統(tǒng),轉(zhuǎn)化落地,解決實(shí)際問題。
近5年來,胡燏翀?jiān)诓恍概ο乱寻l(fā)表論文50余篇,包括計(jì)算機(jī)學(xué)會(huì)A類會(huì)議/期刊25篇,B類會(huì)議/期刊15篇。技術(shù)應(yīng)用于??低?、華為、浪潮、中興等多家民族企業(yè)。
回首學(xué)術(shù)生涯,胡燏翀最感恩的就是諸位導(dǎo)師與學(xué)術(shù)前輩?!拔业牟┦可鷮?dǎo)師許胤龍教授畢業(yè)于北大數(shù)學(xué)系,他的研究側(cè)重理論,做事情十分嚴(yán)謹(jǐn),培養(yǎng)了我嚴(yán)謹(jǐn)踏實(shí)的科研作風(fēng)。在港中大,我的博士后導(dǎo)師之一李柏晴教授側(cè)重系統(tǒng)工程,對(duì)研究領(lǐng)域孜孜不倦,具有令人尊敬的工匠精神,培養(yǎng)了我注重研究深度的習(xí)慣和工程實(shí)踐的能力。來到華科大以后,馮丹教授大大拓寬了我對(duì)科學(xué)研究的理解,我在她的點(diǎn)撥下,對(duì)科研工作有了整體把握,具備了獨(dú)當(dāng)一面的能力?!焙鸁埖目蒲械缆芬虼酥饾u步入正軌,不斷取得成果。
科研之余,胡燏翀擔(dān)任院長助理,負(fù)責(zé)科研和學(xué)科建設(shè)工作,協(xié)助學(xué)院完成雙一流建設(shè)相關(guān)工作。同時(shí),他還熱心教育,2015年以來他指導(dǎo)的研究生多次獲得華科大研究生國家獎(jiǎng)學(xué)金,他還帶領(lǐng)學(xué)生于2021年獲得“華為中國大學(xué)生ICT大賽”TECH4ALL特別獎(jiǎng)(4/50),研究成果智能音樂手套能夠幫助聽覺障礙者感受音樂,受到中央電視臺(tái)采訪報(bào)道。此外,他曾參與教研項(xiàng)目,獲得優(yōu)秀圖書獎(jiǎng)一等獎(jiǎng);參與教育部-阿里云產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目?;谕怀龅谋憩F(xiàn),2022年胡燏翀被評(píng)為華中科技大學(xué)“校十佳青年教工”。
胡燏翀喜歡讀科幻小說,腦海天馬行空的同時(shí),步伐卻格外堅(jiān)實(shí)。他說,科幻允許對(duì)現(xiàn)實(shí)技術(shù)進(jìn)行未來推測,而科研則讓大量科幻的推測變?yōu)楝F(xiàn)實(shí)。“這一路以來我之所以堅(jiān)持創(chuàng)新,就是想要改變現(xiàn)實(shí)?!比斯ぶ悄軙r(shí)代的到來,讓大數(shù)據(jù)中心也面臨著升級(jí)為智能數(shù)據(jù)中心的局面。未來的智能數(shù)據(jù)中心的可靠性需求場景會(huì)如何發(fā)展?胡燏翀給出自己的答案:“我想相比以往,數(shù)據(jù)存儲(chǔ)不僅要安全,還要響應(yīng)更快,與人的互動(dòng)更高效。同時(shí),在數(shù)據(jù)存儲(chǔ)的精確性上會(huì)有所下降。”面對(duì)這種新的應(yīng)用場景,胡燏翀正和同行做著各種各樣的準(zhǔn)備工作,凝練新的破局思路,從國家需求出發(fā),產(chǎn)學(xué)研結(jié)合,讓更多成果實(shí)現(xiàn)轉(zhuǎn)化,助力國家實(shí)現(xiàn)技術(shù)上的自立自強(qiáng)。