編譯 凌寒
馬蒂·海德(Marti Head)博士有一種不好的預感。那是2020年2月中旬。她剛剛結束工作旅行回到田納西州的家中。她自以為在某個地方被傳染了感冒,可能是在機場。
她身體上確實感覺很糟糕。但這種被她形容為“心里一麻”的不好感覺來自外界傳來的消息。傳染病方面的工作經歷給海德提供了她所需要的關于新型冠狀病毒能做什么的全部信息。
所以,當她開始流鼻涕、喉嚨發癢時,海德把自己和丈夫隔離。她并沒有躺在床上看垃圾電視節目來等待康復,而是蜷縮在家庭辦公室一角的隔離區域里——手里拿著紙巾和茶——開始追蹤。
海德是一名藥物神探。作為一名訓練有素的計算機化學家,海德使用復雜的計算機模擬來尋找一些分子,這些分子能夠破壞想要感染人類細胞的病毒的齒輪。海德在一家大型制藥公司工作了幾十年,尋找能夠對抗病毒感染引發的疾?。ū热绨滩。┑乃幬铩5?020年2月,她已在田納西州的橡樹嶺國家實驗室任職。轉到公共部門就意味著海德有義務在危機時刻找到一些可能對公眾有益的東西,這也就意味著她有權限使用世界上最強大的超級計算機之一。
馬蒂·海德在Summit上的研究可能會發現治療感染者的藥物
當抗擊COVID-19的戰爭正在全國各地的重癥監護室和急診室進行時,另一道防線正在田納西州集結。美國最聰明的計算機科學家正在將運算速度為每秒200千兆次的超級計算機Summit打造成抗擊新冠病毒的機器。唯一的問題是:即便疫情席卷全球,他們也必須保持機器運轉,這就需要現場技術人員的持續監控。
2020年1月,當布朗森·梅瑟爾(Bronson Messer)博士決定回到橡樹嶺國家實驗室重操舊業時,他對自己說,總得有人來做這件事。梅瑟爾是計算機天體物理學家,他喜歡把時間花在思考諸如“宇宙中的鈾都是從何而來?”之類的問題上。從2010年到2011年,梅瑟爾曾在橡樹嶺領先計算中心擔任科學總監一職,在這期間,他把自己的研究放在一邊。這項工作在很大程度上需要以犧牲自己的工作為代價,來幫助其他研究人員在Summit上實現他們的數據目標。梅瑟爾說,他想念科研生活,所以選擇離開。但在2019年底,該職位再次開放。梅瑟爾知道怎么操作,并說服自己重返該崗位。然而,他不知道的是,這個角色在兩個月后將會變得多么混亂和高風險。
2020年3月22日,特朗普總統宣布成立COVID-19高性能計算聯盟,旨在將研究新冠肺炎相關解決方案的研究人員與包括Summit在內的16臺國家級超級計算機進行匹配。幾天之內,梅瑟爾的辦公桌上就堆起了一堆項目,比如弄清COVID如何攻擊機體,以及尋找可能拯救生命的藥物。這些研究人員都需要占用Summit的時間。梅瑟爾則需要負責確保最聰明的頭腦和最有價值的項目能登上文件堆的頂端。到4月份時,他每周都要花三到四天的工作時間來給申請使用機器的研究人員分配使用時間。
布朗森·梅瑟爾和他的團隊為通過Summit運行的每一個查詢編寫代碼
當提案涌入梅瑟爾的收件箱時,保羅·阿布斯頓(Paul Abston)正在試圖解決這一問題,那就是,如果疫情發展到像預期的那樣嚴重,他將如何保持Summit繼續運行。阿布斯頓是橡樹嶺領先計算中心的基礎設施和運營小組負責人。他的職責就是保證燈火通明和電腦正常工作。隨著高性能計算聯盟的成立,Summit被指定為關鍵性基礎設施——其重要程度等同于美國的電網和輸水管道——實際上它被要求保持在線?,F在,每一位從事Summit相關工作的員工都是必不可少的。如果中心出現停電、漏水或新冠疫情暴發,阿布斯頓必須想辦法保證它繼續嗡嗡作響。
說它嗡嗡作響并不是夸張的說法。超級計算機更像高倍望遠鏡而不是筆記本電腦。Summit是由9 468個CPU和27 756個GPU組成的集合。他們被儲存在冰箱大小的機柜里,就像新兵訓練營的新兵一樣排成一排,隨時準備接受命令。每個機柜內有18個節點,每個節點包含2個CPU和6個GPU。約300千米長的高速電纜將所有的CPU和GPU連接起來。管道在天花板上穿進穿出,輸送水來冷卻機柜,這一過程每小時消耗高達13兆瓦的電力——足夠為1萬多戶家庭供電。步入放置Summit的建筑是一種聽覺體驗,就像站在海邊一樣。
計算可以通過Summit被遠程推送。但Summit畢竟是臺機器,是機器就會出故障。至少每周都會出現通訊問題或存儲故障,導致某人的工作無法保存,阿布斯頓說道。這些還只是軟件問題。如果管道發生泄漏,那么流經整個房間來冷卻機器的15 000升左右的水將會成為一場噩夢。網絡攻擊或對電網的攻擊也是如此。阿布斯頓的任務是保護很多東西——他需要一群工作人員的配合。最起碼要有一些人在崗,這就意味著阿布斯頓需要盡其所能阻止新冠疫情的暴發。
首先,他準確審查了在同一時間里,他能允許最少多少人留在這棟大樓里。緊接著他檢查了員工的工作站。如果有些人的任務必須在狹小的空間里完成,那么他就會試著把他們轉移到可以單獨工作的地方。然后他考慮到了測試的問題。值得慶幸的是,橡樹嶺國家實驗室在疫情開始時就建立并開始運行自己的測試設施。
這是組成Summit的260排機架之一
這是很有必要的。4月份的時候,田納西州每天都有數百例新病例。到了秋天,每日新增病例已達數千。在整個冬季,情況異常嚴峻,每日新增病例最多時超過1萬,每日新增死亡病例也逾百例。盡管如此,阿布斯頓還是保持著一切運轉正常。當他的同事在被配偶或孩子感染需要隔離時,他會盡力做好日程安排。有時他就親自上陣填補空缺。但是,無論發生什么,阿布斯頓都不能讓暴發的新冠疫情阻止Summit的穩步前進。
雷·史密斯(Ray Smith)很喜歡講述這樣一個關于阿巴拉契亞山脈的24 000多公頃農田如何成為美國科學的秘密中心的故事。1939年,愛因斯坦寫信給羅斯福總統,警告他使用鈾進行裂變鏈式反應可能會產生大量能量,他相信德國正在進行這項研究?!八麄儞淖约簳圃斐稣◤?。”橡樹嶺市的歷史學家史密斯說道。
羅斯福知道美國需要采取行動。史密斯說,羅斯福向時任參議院撥款委員會主席的肯尼斯·麥凱勒(Kenneth McKellar)參議員求助。他說:“參議員,我需要投入一大筆錢來抵御戰爭。并且我不能讓媒體或任何人知道這筆錢的數額和用途。你能幫我嗎?”
這位來自田納西州的參議員回答說,他能幫上這個忙——那么要在田納西州的什么地方開展工作呢?
1943年,克林頓工程師工程即后來的橡樹嶺國家實驗室,在曼哈頓計劃的指導下建成并開始運作,生產武器級钚。來自全國各地的科學家很快就來到一個地圖上沒有的新城鎮報到。
戰后,橡樹嶺仍然是科學中心。近年來,它以擁有全美最強大的超級計算機而聞名。傳統上講,我們談起超級計算機時主要是說它們的計算速度能有多快。專業術語就是“FLOP”,也就是“浮點運算”,橡樹嶺計算機與計算科學實驗室副主任杰夫·尼科爾斯(Jeff Nichols)說道。浮點運算就是加法或乘法運算,我們會以超級計算機每秒能做的運算次數總和來給超級計算機打分。每秒可進行一百萬次運算,就稱作百萬次浮點運算。每秒可進行十億次運算,就稱作十億次浮點運算,萬億次就稱作萬億次浮點運算。
Summit是一臺200千兆次浮點運算的機器,這意味著它每秒可以進行200千兆次運算。但回溯到2009年左右,超級計算機的搭建者遇到的一大阻礙就是,如何繼續擴大FLOP的容量而不讓這些機器變成消耗能源的怪物。尼科爾斯說,當時在橡樹嶺的超級計算機Jaguar每小時耗電量高達8.2兆瓦。“我們知道,如果我們要把計算能力提高一倍,那么耗能也會增加一倍,但我們不能再這樣做?!彼f道。
控制室監控著Summit的37 224個處理器
為了尋找解決方案,超級計算機的設計者想知道他們是否可以使用游戲處理器來提高機器的能源效率。尼科爾斯說,GPU的功能可能是CPU的10倍。然而,問題在于它們沒有那么準確。如果超人在跳躍的時候,他的腳并沒有完全觸碰到建筑物的邊緣,那么我們的想象力可以填補這個空白。如果一臺超級計算機在進行關鍵的藥物研究時錯過了一次運算,那臺超級計算機就沒用了。
尼克爾斯說,Summit的搭建團隊找到了總部位于加州圣克拉拉的GPU制造商NVIDIA,詢問他們是否可以制造出具有CPU精確度的GPU。通過改變芯片中使用硅的類型,NVIDIA成功實現了這一目標:他們創造出了能源效率高又能進行精確計算的GPU。橡樹嶺第一臺使用GPU搭建的超級計算機被命名為Titan。它的能力強于Jaguar 10倍。2017年,Titan被Summit取代,同樣的,Summit的威力再次超過Titan 10倍。
當然,威力大是好事,但這并不是唯一重要的事情。像海德和丹·雅各布森(Dan Jacobson)博士這樣的研究人員真正需要的是一臺智能型超級計算機。人工智能是Summit相對于Titan的最大優勢,它允許超級計算機用戶建立模型,然后告訴機器尋找可能與模型相似的模式。如果沒有這種機器學習,你就只能讓一臺電腦去尋找精確匹配。這無助于尋找可能與病毒相結合的分子。如果沒有精確匹配,你的搜索就會一無所獲;而實際上,那些可能已經足夠接近成功的東西卻被忽略了。機器學習讓研究人員可以非常具體地明確哪些結果是他們需要的和不需要的。如果電腦沒能給你想要的,你可以教它做得更好。
多虧了一種被稱為張量核的特殊類型的處理器核心,Summit在機器學習方面變得極為迅捷,且學習速度很快。張量核允許計算機對相關數據進行分組和比較,以識別其中的關聯并查看它們是如何相互作用。普通核心會在運算出現時將其敲出,但張量核心卻可以把這個運算同有關聯的運算進行比較。
來自全國各地的科學家紛紛在Summit上申請新冠肺炎相關項目,并獲批了使用時間。但是,也許在該計算機上進行的兩個最重要的查詢恰好從科學范圍的兩端攻擊病毒。一個想知道新冠病毒如何攻擊機體,這樣我們就能更好了解這種疾?。涣硪粋€則想找到阻止病毒傳播的方法。
該實驗室的雅各布森負責編寫代碼,以確切了解冠狀病毒的感染模式為何會是醫生之前從未見過的。雅各布森是計算生物學家,他的主要工作方向是系統生物學,包括在細胞水平上破譯生物有機體相互關聯的復雜性,解開各種神經精神疾病的病因,如阿爾茨海默病和自閉癥。
丹·雅各布森和他的團隊在橡樹嶺的超級計算機上建模和分析生物系統
雅各布森早在我們其他人之前就一直關注著這場疫情。當首例病例的報告出現時,他通過另一個項目聯系了大使館的工作人員。他立刻明白了人類可能面臨的麻煩。雅各布森說:“有幾次危急關頭,當時我們都說,是的,這次可能真的會非常糟糕?!?/p>
雅各布森在數據中尋找某種能夠揭示細胞內部和細胞之間的分子關系究竟發生了什么的模式。一開始,沒有太多數據可以使用。但之后,隨著全球許多科學家暫停了其他研究,轉而從事與新冠病毒相關的科研項目,就像打開了消防水管,雅各布森想要所有的這些數據。他喜歡從整體上研究生物學,利用來自所有類型詢問的大量數據來尋找系統之間的模式和有趣的交互作用。當涉及冠狀病毒時,他積累了一切信息:基因表達信息、免疫系統信息、生理學數據、遺傳學數據、蛋白質結構數據、電子健康記錄、環境數據、微生物組數據和尸檢數據。目標就是找到人們感染、發病、康復時變化的模式??赐晁袞|西“可以讓我們發現原本經常被忽略的東西。如果你一次只關注一個方面,你就是在采用非常傳統的方法”。他說道。你可能會找到你想要的一個東西,但“你會忽略掉其他重要的東西,因為你的關注點太狹窄”。
馬蒂·海德也想快點輪到她。在加入橡樹嶺國家實驗室之前,海德在制藥業巨頭葛蘭素史克工作了20年,其中有一部分時間是在尋找能夠攻擊細菌的藥物。而抗擊新冠病毒的難度明顯要大得多?!凹毦腔畹?,所以你可以殺死它們。他們會反擊,但你可以殺死它們。”她說道,“病毒并不是真正意義上的生命體,要殺死并非真正意義上活著的東西要困難得多?!?/p>
海德的藥物搜尋寄希望于找到能夠從本質上阻礙病毒運作的分子,而不是直接殺死病毒。在一個案例中,她和她的同事開始主要研究蛋白酶,這種酶本質上是將感染了冠狀病毒的細胞中的蛋白質鏈切割成微小的蛋白質片段,然后這些微小的蛋白質片段就會執行病毒的命令。海德需要大小和形狀都恰到好處的分子來與他們在蛋白酶上找到的小溝槽接合。第一步是編寫一種算法,該算法能從本質上搜索大小和形狀都可能適合與病毒接合的分子。
但僅僅讓這兩個部分互相契合是不夠的,海德如是說道:“蛋白質并不會待在那里,以靜態的方式等待我們做點什么。它們一直在運動,這是它們的特性,所以我們需要了解這些運動。”
只有當人們為它編寫代碼時,超級計算機才能稱得上超級。梅瑟爾說,有一種錯誤的概念,就是登錄Summit后,你只需要點擊能夠幫助你運行查詢的程序就行了。Summit上絕大多數的運算都需要有人來編寫所有的算法。研究人員編寫一些代碼,但從事代碼開發的研究生才是Summit的命脈,梅瑟爾補充道。
讓為這些項目編寫代碼變得困難的是,你想要尋找的答案極少是單一答案。因為你并不想只得到一個答案,所以if-then的算法是行不通的。“當我運行天體物理學代碼時,最終是得不到答案的?!泵飞獱栒f道。相反,他會看著一串可能為他指明答案的數據流產生出來。梅塞爾說:“然后我必須深入到所有生成的數據中去,以便能夠推斷出一些科學見解。”
要弄清楚為什么冠狀病毒會讓這么多人生病,雅各布森也必須深入到一大堆亂糟糟的數據中。
雅各布森從一開始就在關注病毒是如何附著在細胞上。這一點他已經知道了:新冠病毒的目標是ACE2蛋白質,這不是病毒通常會結合的典型受體。當他開始研究其他冠狀病毒——比如引起普通感冒的冠狀病毒——的數據時,他意識到,許多冠狀病毒是以腎素-血管緊張素系統(RAS)中的目標蛋白質作為進入細胞的切入點。RAS部分負責調節血壓以及液體和電解質平衡。雅各布森認為他應該從那里開始。
此前,新冠病毒似乎只是一種呼吸系統疾病的病毒,所以靶向RAS有點出乎意料。他的下一步是使用Summit來評估來自感染和未感染患者的肺組織樣本中的基因表達。Summit進行了搜索,完成了25億次運算。這項分析產出了一批數據,這些數據揭示了正常情況下基因是如何被調控的,以及這些調控模式是如何因SARS-CoV-2感染而急劇改變的。
“然后,我靈光乍現。在我的職業生涯中,因為靈光乍現的瞬間而有所發現的情況并不多見。”雅各布森說道。但數據明確顯示:新冠病毒導致了RAS的大規模失調。
雅各布森繼續在Summit上工作。由于計算機的強大計算能力,雅各布森能夠看到許多細胞功能的變化——從炎癥和滲透反應到透明質酸的合成和降解,再到電解質平衡和凝聚,都以某種方式與RAS相關。從結果數據集可以清楚看到:RAS和胰舒血管素-激肽(緩激肽)系統之間發生了一些奇怪的事情,這兩種系統都在炎癥反應中發揮作用?!叭缓笪覀兩钊胙凶x了臨床文獻,以了解當這些系統失調時會發生什么。”他說道,“你看看身體不同部位的這些預測癥狀,它們與COVID-19的情況十分吻合?!?/p>
這項研究幫助我們重新定義了對新冠的討論,它既是一種呼吸系統疾病,也是一種血管疾病。緩激肽系統的失調會導致血管原發性滲漏——這就能夠解釋為什么醫生會在患者的肺部看到那么多液體。多虧了Summit和雅各布森以及相似科研團隊的研究,臨床醫生開始考慮維生素D——一種已知的RAS調節因子——是否可能幫助到一些患者。雖然只是走到戶外、曬曬太陽肯定無法預防新冠,但有證據表明,它可以降低感染的嚴重性。
同樣,緩激肽假說將作為緩激肽B2受體拮抗劑的藥物艾替班特帶入了臨床試驗。盡管這些藥物不是治療新冠的靈丹妙藥,但緩激肽假說正在幫助醫生了解他們所看到的情況。
當雅各布森還在研究嚴重疾病的病因時,海德卻在忙活另一件事,她在尋找一種能夠戰勝這種嚴重疾病的藥物。
尋找藥物需要很大耐心。雖然海德擁有許多專利,并在藥物測試過程中對一些分子進行了相當深入的研究,但她還沒有找到一種能夠作為有效藥物進入市場的分子。在開發過程中可能會出現的問題太多了:也許這個分子只在實驗室條件下能與蛋白質接合;或者,它被注射到小鼠體內時可能有效,但以膠囊的形式吞下后,在胃酸的作用下就無法存活。
“我們需要的它就是萬里挑一。”她說道。這一說法為我們描述了找到一種符合全部條件的分子的概率。
多虧Summit,海德找到了這個萬里挑一的線索。它叫作MCULE-5948770040,它能夠結合并抑制主要蛋白酶。2021年3月下旬,她發表了一篇預印本論文,目前正在接受同行評審。與此同時,新的變種使她的工作更加重要。到目前為止,疫苗似乎對新變種是有效的,但是如果情況發生變化,那么治療方法將再次成為抗擊新冠的最寶貴工具。拜登政府2021年6月宣布:為與海德等人的藥物開發項目提供30億美元資金,以強調開發有效新冠藥物的重要性。
但海德的想法超出了變種的范圍。她真正希望構建的是代碼,這是抗擊下一次疫病大流行的出發點,因為總會有下一波疫情。“我們希望這些平臺做好準備,這樣我們就可以迅速應對下一次寨卡、埃博拉、流感和冠狀病毒。”她說道,“上天保佑,只要我們愿意持續投入并保持警惕,當SARS-CoV-3來臨時,我們就會有數據、平臺和全球各地的人來應對?!?/p>
資料來源 Popular Mechanics