



編者按:“數據是燃料、模型是引擎、算力是加速器”,這個類比幾乎已經成為AI領域的共識。但是在各地的人工智能教育經驗介紹中,涉及算力設備建設和管理的寥寥無幾。為什么青少年AI教育中很少有人提到“算力”?本期對話邀請了溫州科技高中的特級教師謝作如、上海師范大學王龔教授和上海開源信息技術協會的章津楠先生,他們將圍繞“算力”這一話題展開討論。
謝作如 溫州科技高中AI科創中心負責人,浙江省特級教師,XEdu項目負責人。
王 龔 上海師范大學分析測試與超算中心主任,教育部教育信息化技術標準委員會委員。
章津楠 上海開源信息技術協會副理事長,OpenHydra項目發起人。
我們用于辦公的基本上屬于基礎算力,由中央處理器(CPU)組成。今天討論的算力,顯然指的是智能算力。智能算力主要由圖形處理器(GPU)、專用集成電路等異構計算芯片組成,常用于處理大規模數據和復雜算法模型,如圖像識別、語音識別、自然語言處理等。
青少年AI教育為什么需要“算力”
謝作如:兩位嘉賓好,很高興就“算力”這一話題展開本期的對話。我是一名中小學信息技術教師,這幾年的研究重點就是青少年AI教育。在今年9月5日的2024Inclusion·外灘大會上,香港科技大學校董會主席、美國國家工程院外籍院士沈向洋針對“未來人工智能、大模型如何才能深入產業”問題,再次強調了“算力、算法、數據”,并表示“講卡傷感情,沒卡沒感情”。可見,“算力”一詞在AI領域絕對不能忽視,更無法回避。但有趣的是,雖然“算力”一詞處處可見,實際上很多人并不理解。那么,AI為什么需要“算力”?二者是什么關系?能不能先請兩位科普一下?
章津楠:根據計算機處理能力,算力一般可劃分為基礎算力、智能算力和超算算力。我們用于辦公的基本上屬于基礎算力,由中央處理器(CPU)組成。今天討論的算力,顯然指的是智能算力。智能算力主要由圖形處理器(GPU)、專用集成電路等異構計算芯片組成,常用于處理大規模數據和復雜算法模型,如圖像識別、語音識別、自然語言處理等。現在AI的主流技術是神經網絡,數據經過每一個神經元節點都要進行浮點運算,對處理器的要求非常高。
近年來,以Open AI為代表的生成式人工智能(GenAI)席卷全球,引發了各大互聯網巨頭在“算力”領域的競爭。同時,國內“智算中心”的建設正如火如荼地進行,在全球AI競爭日益激烈的當下,算力已經成為AI時代的“戰略儲備”——宛如當年電氣時代的“石油”。據權威報告統計,基礎算力、智能算力、超算算力分別呈現穩定增長、迅速增長、持續增長的態勢,2016—2024年的年平均增速分別達18.99%、78.97%、23.45%,預計到2026年,我國智能算力規模將達到561EFlops,我國所有數據中心所需年耗電量至少達到6000億千瓦時,數據中心耗電量占我國用電量比重預計將從2016年的1.86%增長至2026年的6.06%。未來,算力就是推動AI新時代的能源。
王龔:我補充一點。AI的技術路線非常多,其中比較知名的技術方式就是神經網絡。神經網絡是通過模擬人類的神經元系統對輸入的數據進行學習,實現對數據模式的識別與數據結果的預測。在實際運行過程中,輸入的數據量甚至會達到萬億字節級別。如此大量的數據,帶來的是龐大的運算壓力,在AI發展的初期,一次數據學習(模型訓練)可能需要幾天甚至幾個月的時間。今年獲得諾貝爾物理學獎的杰弗里·辛頓,在他對AI的研究過程中也長期受到了運算壓力的掣肘,直到GPU算力的出現。起初辛頓也不相信GPU能夠賦能AI的發展,多次拒絕了學生使用GPU的建議。但在2008年首次使用了GPU后,辛頓改變了他的觀點,開始主動使用GPU進行研究,并在2012年引起了AI革命。
謝作如:感謝兩位的科普,的確,沒有算力的發展就沒有AI的發展。雖然在基礎教育階段,AI教育還不是一門獨立的課程,但是一些先行一步的地區已經開始做積極的探索,力度較大的地區如深圳、廣州、武漢、青島、溫州等。2023年7月,深圳市發布《深圳市推進中小學人工智能教育工作方案》,提出要大力促進AI與教育教學深度融合,著力培育具有AI創新潛質的青少年群體。2024年9月,上海市發布了《上海市推進實施人工智能賦能基礎教育高質量發展的行動方案(2024—2026年)》,在四年級和七年級開設AI地方課程。我相信接下來國內各個省份都會有所動作,紛紛出臺政策。
但是,我們也要清楚地認識到一點,那就是當前基礎教育中AI教育似乎并不“關心”算力。據不完全調查,即使在北上廣深之類的一線大城市中,學校中購置算力服務器的也寥寥無幾,建設帶GPU的機房就更少了。王龔教授對基礎教育非常熟悉,曾有過上海教委信息化處的工作經歷。請您來分析一下,青少年AI教育不“關心”算力的背后,可能是哪些原因引起的?
王龔:當前青少年AI教育不“關心”算力的現象背后有著諸多原因,我簡要總結為“一個認識”與“兩個困難”。
AI領域在這幾年中蓬勃發展,帶動了青少年AI教育從最開始注重編程和過程控制,過渡到符號主義,又進步到深度學習,現在逐漸形成以大模型為核心的教育體系,AI教育的發展相當快速。但是,部分教育工作者對AI教育的認識還停留在原地,如部分教師仍認為AI教育就是編程教育或者是機器人教育。與過去的AI教育相比,當前AI教育更為復雜,如2022年發布的《義務教育信息科技課程標準(2022年版)》就將“算力+數據+算法”稱為AI的三大技術基礎。但倘若教師對AI的認識不足,那自然會產生對“算力”不關心的現象。
從實際困難來看,基礎教育人才與經費的短缺也造成了青少年AI教育主動地不“關心”算力。首先,算力作為新型基礎設施,需要管理人員具備一定的專業知識,而基礎教育機構內不一定具備相應的人才,這對算力的運維產生了阻礙。其次,算力本身的購置成本比較高,機構的經費或難以負擔算力的支出,這對算力的獲取產生了阻礙。目前,很多地方的政府在教育投入項目中并沒有算力方面的預算。因此,就算部分基礎教育工作者認識到了算力對青少年AI教育的重要性,但仍然會迫于現實困難主動地忽略算力。
謝作如:王教授的分析非常到位。在上一次對話(本刊2024年第16期《走向國際共識的中小學AI教育》)中,我強調了AI實驗在AI教育中的重要地位。這里的AI實驗包括模型訓練和推理。我一直認為AI教育需要解決兩大問題,一是“AI如何工作”,二是“智能如何產生”。前者關注的是模型推理,后者強調的是模型訓練。 但遺憾的是,目前包括高校在內,很多AI通識課往往僅滿足于理論的講解,而沒有實際操作。很多人甚至以為會寫提示詞和大模型對話就是AI教育的核心內容。如果不去考慮“智能如何產生”,算力自然就不重要了。相對來說,訓練模型對算力的需求比較高。
章津楠先生還有一個身份——知名的私有云企業創始人,并且長期負責智算業務。有很多高校購買過他們的服務。我想請章先生介紹一下,在您的客戶中有沒有來自基礎教育的,也就是說有沒有為中小學的客戶做過算力業務?從您了解到的信息判斷,中小學如果購買并維護一臺算力服務器,可能會遇到哪些困難?
章津楠:坦白而言,現在教育領域的算力主要集中應用于頂級學府,基礎教育的算力資源相當匱乏,幾乎沒有像樣的GPU資源。幾乎沒有在中小學中看到有GPU設備,就連教育管理部門也不多見。而且即使有GPU資源,也不是用于AI教育的。
對于一所高校來說,購買GPU服務器僅僅是萬里長征的第一步。從GPU服務器到實際應用于AI研究,教師和學校需投入大量精力在AI環境搭建和準備上。因為僧多粥少,各個項目組還需要排隊搶占資源。這種場景讓人不禁想起當年IBM大型機排隊使用的日子。從目前我走訪的中小學來看,中小學的AI水平處于“完全無知”的狀態,無基礎算力資源,無教師來維護,更別提需要在算力的基礎上有一套專業的工具支撐AI教學。中小學即使有經費購買了算力服務器,根據目前的師資能力,也無法有效利用GPU算力來開展對應的AI教學。建議先開展師資培訓,在讓教師對算力、算法和模型有一定的了解之后,再開啟AI教育的征途。
青少年AI教育如何破解算力難題
謝作如:章先生的確是算力行業內的專家,一下子就切中了要點。我在溫州中學工作過很多年,去年才轉崗到溫州科技高中。我分別在2021年和2023年,為這兩所學校購買了算力服務器,用的是NVIDIA tesal T4 顯卡。我購買算力服務器的理由很簡單,因為學校開展人工智能課程,學生一旦掌握了深度學習模型算力的流程,就會有一種“沖動”,希望通過收集數據集訓練各種模型,去解決一些生活中的真實問題。如果沒有算力服務器,很多模型訓練的工作沒法正常進行。要注意,這不僅僅是訓練速度“慢”的問題,而是很多模型的訓練框架就沒有考慮非GPU的環境,如AI翻唱方向的VITS模型,計算機視覺中的分割、超分、關鍵點等模型。
記得有一次和信息科技課標組的一位專家討論“算力”的問題,他提出可以用租商業算力的方式來解決。的確,為了訓練VITS模型,我曾經購買過商業公司的算力,還寫了一篇題為《借助商業服務破解AI科創活動的算力難題》的文章,發表在《中國信息技術教育》雜志上。但即使有過這樣的經歷,我還是堅持認為中小學實施AI教育,需要配備算力服務器。我想考一下章先生,請您猜測一下,可能是什么原因導致我堅持這樣的觀點?
章津楠:從這段時間接觸智算業務的情況來看,首先從預算的角度來看,高校、科研院所對按月付費的方式還是有一定自由度的,有條件按照租賃的方式支出對應的科研經費。而從基礎教育來看,則沒有類似的經費來支撐算力的租賃服務,也就是沒有專項的經費。其次,基礎教育的大部分學習任務要在40分鐘的課堂上完成,如果算力在云端,大量的訓練數據要從本地上傳到服務器,這對于基礎教育的課堂來說幾乎是災難——一堂課大部分時間都在解決網絡的傳輸問題。最后,從數據安全和可控的角度來看,算力放置到學校內或者教育網內相對來說內容更加可控。
王龔:我補充兩點我的想法。第一,云端算力的使用有賴于網絡環境的支撐,當前基礎教育學校在教育數字化轉型過程中面臨著“網絡限制”,也正是因為此,《教育部等六部門關于推進教育新型基礎設施建設構建高質量教育支撐體系的指導意見》中才將信息網絡新型基礎設施作為核心任務之一,如果區域的教育部門在該區域內為基礎教育學校保障了良好的網絡環境,能夠保障師生在40分鐘課堂教學的過程中高效便捷地獲取算力支撐,那么云端算力授課倒不失為一個好選擇。
第二,由運營商通過“云、網、邊、端”的模式對學校提供算力保障服務。上海在“十四五”期間構建的教育虛擬專網方案就能較好地解決網絡算力保障問題,通過專網在部分關鍵節點部署邊緣計算的算力服務器,減少延遲和傳輸壓力。當然,我也認為,有條件的學校還是可以購買本地的算力服務器用以支撐校內的AI教學。通過網絡與終端的靈活配置,由專業的人做專業的事情,實現更靈活、穩定的AI教育支持。
謝作如:章先生的分析和我的真實想法基本一致。在大班教學的環境中,穩定的教學環境是基本條件,何況購買了云端算力還需要搭建環境。王教授的補充,實際上已經給出了解決“算力”難題的一種方案。我們可以梳理一下,沒有算力,無法深入實施AI教育,除非我們滿足于淺嘗輒止,但為什么在基礎教育中“算力”成為難題?其一,購買算力服務器需要經費,規模小的學校承擔不起這筆費用;其二,即使購買了算力服務器,也需要好的管理產品。王教授的方案,實際上是為規模較小的學校提供了算力解決方案。
我是在2019年底開始自學神經網絡和深度學習的。至今還清晰地記得,第一次對“算力”產生需求是用循環神經網絡(RNN)訓練自動作詩機的案例。那時候是2020年初,很感謝浙大的“智海-Mo”平臺不僅幫我解決環境搭建的難題,還提供了免費的GPU算力,讓我從10小時訓練時間降低為1小時。從那之后,我就特別關心AI教育中如何解決算力的問題。
王教授是上海師范大學的分析測試與超算中心主任。顧名思義,“超算中心”顯然是管理學校算力設備的。王教授您來介紹一下上海師范大學的算力建設,如何為不同院系提供算力?提供的是哪些AI環境(系統軟件)?
王龔:上海師范大學是上海市重點建設高校,是一所以文科見長并具教師教育特色的文、理、工、藝等學科協調發展的綜合性大學,學校現擁有90余所附屬學校,為上海各類各級教育機構輸送了大量教師與管理者,今年正值學校70周年校慶。因為關注到AI對教育未來會產生的深遠影響,學校成立了分析測試與超算中心,我也是剛剛調任中心不久。前期,受益于中心的算力支持,學校發布了全國第一個教師教育大模型MetaClass,獲得了社會的廣泛關注。超算中心擁有獨立的機房,提供的AI環境很多,除了常見的Pytorch、Tensorflow、Paddle和MXNet等,還有一些科研領域常用的環境(AI for Science),如AIphafold2。
謝作如:聽說王教授正在做一個非常重大的政府項目,這個項目有助于破解上海基礎教育的算力難題,能具體介紹一下嗎?
王龔:目前我所任職的超算中心正在積極聯絡和整合社會資源,構建上海教育算力平臺以應對上海基礎教育面臨的“算力從哪里來,算力到哪里去(怎么送到使用者手上去),算力該怎么用”三大難題,也分別對應了硬件設施、傳輸網絡、使用平臺三大部分。
算力是應用與學習人工智能的必要基礎設施,基礎教育的首要難題是如何獲取可靠穩定的算力支撐。 中心一方面積極聯絡算力廠商打造教育領域的專用算力基礎設施,另一方面積極對接算力云企業以算力共享的方式將現有的算力設施直接引入教育領域,雙管齊下穩步打造教育領域算力基礎設施,從而規避高昂的投資成本、過長的建設周期等現實問題對當前人工智能教育實施造成的影響。可以預見的是,在教育領域專用算力規模達到一定標準前,采購云端算力、算力共享等方案仍然是當下最主要的解決方案。
在打造教育領域算力基礎設施的過程中,中心同步對接了基礎電信運營商,籌備建設算力使用者以及實際算力之間的數據傳輸網絡,推進前面提到的教育虛擬專網方案落地。除去部分有條件建設本地算力的教育機構,所有采用算力共享、購買云端算力方案的機構都需要評估自身網絡環境是否能夠支撐中小學課堂教學的需求,如在實際課堂教學過程中師生能否穩定地獲取算力完成任務。教育網絡環境的建設需要大量的投資,短時間內恐怕難以滿足所有學校的算力訪問需求。借助5G等新技術的使用,中心聯合基礎電信運營商,嘗試組建教育領域的5G移動專網,快速部署滿足支持算力使用的靈活網絡環境。
最后,當算力送到了師生手中時,師生應該如何使用算力?教師在教學過程中又如何對學生的算力使用進行管理?目前,中心接洽了OpenHydra項目組,引入了開源AI教學平臺OpenHydra,幫助師生在課堂中使用算力。
章津楠:我很高興地聽到OpenHydra將成為上海師大算力設施中核心環境的好消息。我和謝老師都是OpenHydra項目的發起人之一,見證了其發布和迭代的所有過程。OpenHydra是一個開源項目,旨在為AI教育提供一個開箱即用的學習與實踐平臺。OpenHydra的使命是“用開源的方式助力AI教育”,愿景是“讓每個孩子學習真正的AI,讓教師家長了解真正的AI,讓每個學校都能開出AI課程”。
謝作如:章先生的介紹讓我回憶起當時討論OpenHydra項目的一些細節。我一開始僅僅希望中小學有一個能切分算力的工具,能把一張卡分給多個學生同時使用。后來終于意識到自己的想法過于簡單,對中小學教師來說需要的是一個完整的解決方案,而不是一個小程序,畢竟他們不是專業的服務器維護人員或者開發工程師,最好能做到一鍵啟動,開箱即用。因此,將OpenHydra定位成一個AI教學環境是準確的。實際上OpenHydra不僅僅是為中小學的AI教育設計,同時也適合中高職甚至大學。據我了解,在國內大學中也就浙江大學有“智海平臺”、華東師大有“水杉在線”,很多高校的算力服務器并不考慮AI通識課的教學。
作為國內的開源文化愛好者和踐行者,我主編了浙江教育出版社出版的高中信息技術國家課程教材《開源硬件項目設計》,和幾位教育創客共同發起了開源硬件“掌控板”項目,但我還是很好奇,您為什么會想到將這個項目開源?對于大部分IT企業來說,OpenHydra這個項目幾乎是填補空白的一個軟件,怎么舍得開源?
章津楠:首先我跟謝老師一樣,是一個開源文化愛好者,也是受益者。開源本身也是自己長期投入的一個方向和愛好。其次,開源本身是一種很好的分發和推廣的方式,通過開源的方式可以快速推廣和普及。在不同領域都有知名的開源項目,如操作系統領域的Linux,手機操作系統領域的Android,云計算領域的OpenStack、K8S,大模型領域的LLaMa等,都是借助開源的方式,快速形成以此開源軟件為生態圈的周邊軟硬件發展,從而進一步降低了使用門檻和可獲得性。最后,AI的快速發展也是依賴于開源,如開源的算法、開放的模型。算力相關軟件也需要保持更加開源、開放的方式,從而讓更多的人以更低成本、更好地接觸AI、了解AI、創造AI。
青少年AI教育需要國產算力設備的支持
謝作如:對于大部分人來說,算力是一個全新的名詞。以我為例,居然是在2021年才知道“GPU”指的是英偉達的顯卡。也就是說,并非所有的顯卡都能叫做“GPU”。因此,我在談起“算力”問題的時候,常常要回答是不是只能買英偉達顯卡設備的問題。
我在上海人工智能實驗室主持開發XEdu項目的時候,就一直在思考XEdu如何與國產算力設備結合的問題。兩位都是算力設備方面的專家,能不能分析一下國產算力如何應用于中小學的AI教育?
章津楠:國產算力目前還處于初級階段,目前更需要市場去應用和實踐,從而打磨好軟硬件的生態。目前OpenHydra和XEdu已經著手在適配沐曦、曙光DCU、華為昇騰等廠商。雖然在適配過程中也有不少問題,但可以明顯感受到國產算力企業在積極配合,他們也在努力構建自己的開源生態。在當下,通過AI教育來促進國產算力企業的生態建設,應該是一個很好的契機。中小學(包括中高職在內的初學者)的AI教育對算力要求沒那么高,一般會選擇成熟的模型或者開發框架,因此在投入不大的情況下,也能快速打磨和適配整個國產化軟硬件開源生態圈。在此,我也呼吁國產算力的企業能更加關心AI通識教育的算力切分、AI教學場景的開源生態建設,提高AI基礎教育中問題的優先級,為中國的AI人才培養提供更好的算力支持土壤。
王龔:沐曦、曙光DCU、華為昇騰等國產算力企業經過這幾年的努力發展,產品逐步成熟穩定。不論從產品供給、技術支撐或是成本考量的角度來看,采用國產算力構建我國教育領域專用算力基礎設施是非常可取的方向。當前,上海師范大學的超算中心也與國產算力企業開展了密切的合作,企業愿意在建設初期先行進行算力投入,加快教育專用算力基礎設施的建設。我們團隊也在與國家(上海)互聯網交換中心共同推進《教育行業跨主體、多元異構算力交互技術要求》,并在申報國家標準,以期實現異構算力的無縫調用。
謝作如:俗話說,隔行如隔山。一開始我并不了解國產算力設備的使用還存在軟件生態的問題。在設計XEdu的時候,我們并沒有想到環境搭建是如此復雜。但“無心插柳柳成蔭”,居然為國產算力企業的普及應用提供了新的解決方案,這一點很振奮人心。從AI通識教育入手,國產算力企業也許可以走出一條不一樣的路來。
感謝王龔教授,也感謝章津楠先生。我們今天的對話焦點雖然圍繞著中小學,實際上具有普適價值。從基礎教育到職業教育,乃至普通高等教育,相信本期的對話對AI通識教育的實施都會有一定的參考價值。
章津楠是我的學弟,是一家私有云企業的聯合創始人。去年九月份,經溫州大學的一位老師引薦,我們在徐匯西岸見面。那天恰好有一位做機器人教育的朋友來找我,我們三人在實驗室的五樓聊AI教育。我介紹了自己對中小學AI教育的理解,介紹了開箱即用的AI開發工具XEdu,同時也介紹了浦育平臺的缺陷——無法支持商業算力,注定難以支撐日益增長的AI教育需求。
那段時間,我一直在尋找一款簡單易用的算力切分工具,即能夠把一塊GPU“分割”為多塊。因為中小學不可能為每一個學生都分配一張GPU,也不可能讓學生排隊使用。那天,做機器人教育的朋友不認同我的觀點,說中小學教師不可能教學生訓練模型,水平遠遠達不到,而且也沒有必要學這些。章津楠當時沒有表態,這讓我很沮喪。想不到兩個月后的第二次見面,他就給我帶來了好消息:我想要的工具他能做,已經有了雛形,而且準備開源。于是,就有了OpenHydra項目的故事。
認識王龔教授則是因為DFRobot朋友的介紹。王教授和我有很多共同的喜好。例如,我們都欣賞DFRobot的產品,又很嫌棄他們慢條斯理的工作風格;我們都喜歡行空板,但又嫌棄行空板“柔弱”的算力。我認識很多高校教育領域的教授,但對算力有深入研究的很少,于是與王教授相見如故。無論是開發XEdu還是OpenHydra,他都能給我們很多建議,對接各種資源。第一屆中小學人工智能與創客教育大會也因為他的支持而得以成功舉辦。
回顧自己這幾年推廣AI教育的經歷,遇到很多挫折也結識了好多朋友。一個人的力量是有限的,但會因為不同人的加入而得到放大。創客教育如此,人工智能教育也是如此。感謝每一位為AI教育付出努力的朋友!