馬世強



2016年是人工智能(AI)大放異彩的一年。先是圍棋人機大戰(zhàn)中AI勝出,之后又有了AI飛行員戰(zhàn)勝人類飛行員的報道。據(jù)美國辛辛那提大學官方網(wǎng)站消息,該校開發(fā)的人工智能“阿爾法”在空戰(zhàn)模擬器上擊敗了人類飛行員——經(jīng)驗豐富的美國空軍退役上校基恩·李。有人稱這具有深刻的軍事意義,但這樣的評論顯然不足以滿足讀者的好奇心,爆炸性的新聞只有多方面分析才能得到最準確的結論。就讓筆者通過美國人的說法再加上自己的判斷來進行一番分析,以期得到有用的信息。
AI擊敗人類飛行員還是新聞?
上面的標題可不是嘩眾取寵。讓我們看在模擬空戰(zhàn)中落敗的那位上校怎么說:“這是我見過的最具侵略性、敏捷性、變化性和可靠性的AI。”這說明作為空中格斗專家的基恩·李上校已經(jīng)不是頭一次與AI飛行員交手了。實際上,20年前的電腦游戲中就有空戰(zhàn)游戲,里面不斷提高的得分標準也可以看成是不斷提高水平的AI飛行員。不管玩家的經(jīng)驗積累得多豐富,總有一個水平更高的AI飛行員在等著與你過招。既然早已經(jīng)有這樣的電腦游戲,隨著科技的進步,AI飛行員打敗人類飛行員已經(jīng)不能算是新聞了。
請注意相關的新聞中還透露出這樣的信息:在早期版本中,“阿爾法”的表現(xiàn)一貫優(yōu)于空軍研究實驗室的其他標準計算機程序。換句話說,這次獲勝的“阿爾法”擊敗了其他的AI對手。按照這種說法,AI飛行員早就存在了。因此,我們有充足的理由說AI飛行員擊敗人類飛行員算不上新聞了。目前,世界不少國家的空軍在進行模擬器訓練時早就存在AI對手,在各航空大國試驗室的模擬器中也有AI飛行員,用來研判研制的新機是不是能適應未來的空戰(zhàn),它們是不被人們注意的AI飛行員。
從某種意義上說,早期的AI是電腦中虛擬的飛行員,這次試驗只不過讓AI真正獲得了一個飛行員的名份。因此可以說AI戰(zhàn)勝人類飛行員,多少有些媒體玩噱頭的意味。
早期模擬器中的空戰(zhàn)程序涉及的數(shù)據(jù)太少,模擬的范圍也很單調,有些地方處理的得比較生硬,避開了信息收集方面的限制,對抗結果往往有人為因素,讓使用者感覺不是很靠譜。而現(xiàn)在AI編輯得更為詳盡,模擬雙方的性能數(shù)據(jù)更為完善,不過究其實質還是一種電腦“蠻荒之力”的運用。嚴格地來說,人們早已經(jīng)通過最基本的方法實現(xiàn)了AI飛行員的大部分工作能力,真的有AI,它也是一個遲到者。
AI飛行員為什么能戰(zhàn)勝人類飛行員
美國人認為:人類飛行員在40000英尺的高度(12200米)以1500英里/時(2415千米/時)的速度飛行時,犯錯的成本是很高的,而“阿爾法”可以增加容錯率。事實上,AI可以在動態(tài)的環(huán)境中考慮和協(xié)調最佳的戰(zhàn)術計劃,并作做出精確的響應,比人類要快250倍。從評論的角度看,以上言論專業(yè)性很強,這讓一般的讀者不容易理解。不過,要是對空戰(zhàn)典型過程及著名的能量空戰(zhàn)理論有充分了解,再將戰(zhàn)機機動性受到人體限制等方面聯(lián)系在一起考慮,則理解起來就容易多了。
在空戰(zhàn)中飛行員發(fā)現(xiàn)敵機后,就要根據(jù)雙方的態(tài)勢做出相應的機動飛行,盡量占據(jù)有利“地形”——這包括高度及方位,并能根據(jù)敵機的速度、高度及方位變化做出相應的調整。而做到恰到好處的機動飛行及調整很不容易,早了會暴露意圖,晚了會損失掉寶貴的占據(jù)有利態(tài)勢的時間。飛行員只能是根據(jù)經(jīng)驗盡量地做好這一切。空戰(zhàn)高手能夠做得更好,因此取勝的概率就大一些。但有時也不免失手,被菜鳥飛行員擊落。而AI飛行員可以根據(jù)機上傳感器收集到的戰(zhàn)場信息不斷地連續(xù)做出最佳的反應,并且能夠根據(jù)對手的軌跡變化做出及時的應對。雖然實質上也稍有延遲,但遠遠領先于人類飛行員的反應速度和操縱精準度。因此,可以將空戰(zhàn)過程每一步都就做到極致,這樣就在空間與時間的轉換過程中獲得先機。
能量空戰(zhàn)理論簡單來說,就是要讓戰(zhàn)機以最小的能量損失獲得最大的空間位置移動。更通俗的說法是飛機的動能與勢能的轉換過程中損失要盡可能小,機動位移的空間則要盡可能地大。AI就可以做到這一點,或者說要比人腦做得好。
從時間的角度看,飛行過程中精度的重要性在幾秒時間中并不重要。重要的是在長達幾分鐘的飛行中不斷地做出大量精確的操縱,戰(zhàn)機最后決定勝負的優(yōu)勢態(tài)勢也是不斷地做出正確的反應后累積而成。AI飛行員可以直接將傳感器得到數(shù)據(jù)進行處理,并迅速轉化為飛機的操縱動作,這過程要比飛行員至少快上0.05秒。每次油門及舵面的變化都快,而且是恰到好處。要知道,現(xiàn)在的電傳飛控系統(tǒng)可以在1秒之內做出近百次決策,氣動舵面可以反應出數(shù)十次的微動來。這樣一來,一段時間累積下來的效果就相當驚人了。這意味戰(zhàn)機占位及能量的恢復與儲存都要比有人機快得多,因此AI駕駛的三代機其機動性能也就會高出人類飛行員駕駛的三代機,達到四代機的水平。
有觀點認為AI飛行員的無過載值限制,可以充分發(fā)揮戰(zhàn)機的機動性能。這段話前半句并不準確,畢竟它駕駛的戰(zhàn)機機體強度會受到過載值的限制;后半句的表述還是相當?shù)臏蚀_。AI飛行員在模擬器上使用的雖然是過載并不大的三代機,但它可以盡可能地延長過載時間來實現(xiàn)比有人駕駛戰(zhàn)機更高的機動性。而人體則由于受黑視的限制不能在高過載值下飛得太長。一場空戰(zhàn)要經(jīng)歷數(shù)十次高過載機動,持續(xù)空中態(tài)勢的轉換也有累積效應,這是AI相對于人類飛行員的另一項優(yōu)勢。
以上兩點優(yōu)勢就是AI飛行員戰(zhàn)勝人類飛行員的重要原因。通過文中的空戰(zhàn)過程圖可以看出:面對敵方兩架四代機的機動飛行,4架AI駕駛的三代機通過持續(xù)的對應機動飛行,最后獲得攻擊敵機的機會并將其擊落。
基恩·李還特意強調:Al駕駛戰(zhàn)機連續(xù)躲避來襲導彈的技能給人以深刻印象。理由應該很簡單:做不到這一點前面的兩點優(yōu)勢都無用,但這兩點優(yōu)勢也是能夠躲避成功的關鍵因素,前者做到在合適的位置開始機動,并能夠在合適的位置開始下一輪的機動,以欺騙導彈進入大機動過載飛行中,后者則能以最大的姿態(tài)(飛行軌跡)變化讓來襲導彈在大過載機動飛行中急劇減少能量,兩者結合,最終讓來襲導彈失去目標或動力后墜落。
AI飛行員的可怕之處
AI駕駛第三代機戰(zhàn)勝了第四代機,這意味著AI飛行員就是一個現(xiàn)有戰(zhàn)機戰(zhàn)力倍增器,因此也就有讓人害怕的資格,但它真正讓人害怕的地方是什么?
關于AI的厲害,媒體或相關業(yè)界早就給出了說法:AI最可怕的地方就在于它能思考,具有學習能力。并且由此產(chǎn)生了機器人會取代人類統(tǒng)治世界的擔心。這個觀點已經(jīng)成為共識。縱觀目前網(wǎng)上的評論,也都認為能夠自主學習是AI飛行員最可怕的地方。
那么,發(fā)布消息的美國人自己是怎么說的:“阿爾法”一經(jīng)拷貝,將自動學習安裝在其他地方和其他版本的“阿爾法”,并獲得最強的性能。阿爾法的學習能力很強,可以從“他人”那里學到空戰(zhàn)經(jīng)驗。可再一想,“一經(jīng)拷貝,將自動學習”的做法不就是個復制過程?以市面上400美元的電腦結合可以復制的AI程序就能讓“王牌”飛行員大量產(chǎn)生,能思考有什么可怕的7歷史上不會思考的野蠻群體戰(zhàn)勝會思考的文明群體不也經(jīng)常發(fā)生?
在不久前的人機圍棋大戰(zhàn)后,就有觀點吹捧AI的自主學習能力:具有自主學習能力的AI將導致產(chǎn)生新的戰(zhàn)法及戰(zhàn)爭思想。這實際上是走火入魔的結論,真有這樣的戰(zhàn)法和思想,人腦加上時間沒理由想不出來。AI操縱飛機的過程是將過程變化極致化,也就是說成千倍成萬倍地細化;而新的戰(zhàn)法及思想則是觀念性的東西,往往受到客觀規(guī)律的限制。因此,上述的結論經(jīng)不起推敲。
關于AI的自主學習能力可以換一種說法:在生死悠關的戰(zhàn)場上學習空戰(zhàn)技能,一架無人戰(zhàn)斗機還沒有學會就有可能被打下來。在墜毀之前是不是需要將失敗的過程數(shù)據(jù)化后發(fā)給其他無人機供它們參考?
從空戰(zhàn)的角度看,電腦完全可以根據(jù)敵我雙方戰(zhàn)機的性能及雙方態(tài)勢做出大量的前景性分析供AI飛行員決策,在這中間并不存在不可預測的“黑洞”,因此所謂的學習能力往往有臆斷的成分。“市場上銷售的電腦就能勝任,僅靠程序就獲得讓人眼熱的學習能力”真有天方夜譚的感覺。縱觀相關評論,幾乎一致認為AI的特點就是會思考。參與模擬空戰(zhàn)的老飛行員這樣的地強調:我很喜歡AI同時躲避數(shù)十枚敵方導彈并對多目標進行攻擊的場面,還有協(xié)調隊友、記錄行動,同時觀察學習敵人戰(zhàn)術的能力。對于這段話不必當真,因為電腦的優(yōu)勢就是處理速度高,瞬間就能“學完”全部課程,在這樣的情況下再用“學習能力”一詞不免顯得愚腐。把敵機擊落了,到底是電腦的“蠻荒之力”起主要作用還是學習能力強導致?相信大部分專家會認為是前者。
美國人表示:“‘阿爾法在模擬環(huán)境中已經(jīng)是一個致命的對手。我們將繼續(xù)開發(fā)‘阿爾法,和其他的飛行員一起訓練并擴展其功能。擬真度也需要增加,我們將會構建更加真實的空氣動力學和傳感器模型。”通過這段話可以得出結論,這位Al飛行員并不是天生的王牌,而是經(jīng)過“學習”后的程序修改后天形成的。這種學習過程其實還是電腦編程過程,只不過是編程的過程更隱密化了。讓電腦自己完全編程,看上去就給人感覺是電腦自己在學習。如果說AI飛行員能在空戰(zhàn)中學到新東西,這個學習過程也只不過是好上加好。而構建空氣動力學及傳感器模型顯然在空戰(zhàn)時不可能進行。因此對于AI來說,學習好后再上戰(zhàn)場上才靠譜。只是這樣一來,能思考的意義有多大?
毫無疑問,這次的AI飛行員是在掌握了對方戰(zhàn)機及導彈性能的基礎上展開對抗。在不了解對方的情況下,AI的學習能力可否有上佳表現(xiàn)?例如,對方的導彈射程及過載性能都大幅度增強。這無疑將會給空戰(zhàn)帶來更多的變化因素,但萬變不離其蹤。真要出現(xiàn)這種情況,AI飛行員的應對與之前也不會有什么不同。因為人們可以提前為AI制定應對這種情況的能力,僅僅是多寫些應對程序并提高對方戰(zhàn)機性能數(shù)據(jù)的過程。這完全就是一個“道高一尺魔高一丈”的形式。在這方面,電腦的“料敵從寬”遠超人類,完全可以事先臆造出一架強大無比的敵方戰(zhàn)機,然后在此基礎上確定自己的飛機如何應對。因此,從本質上說,這與學習能力還是沒有直接的關系。
無人戰(zhàn)斗機因AL唾手可得?
通過美國人的評述,似乎無人戰(zhàn)斗機已經(jīng)站在空軍的大門口。
與以前的人機大戰(zhàn)相比,這一次是讓AI跳出電腦之外獲得了一個飛行員的名份。可不要小看這個名份,因為這會讓人產(chǎn)生無人戰(zhàn)斗機的出現(xiàn)指日可待的強烈感覺。從某種意義上講,讓AI駕駛模擬器中的戰(zhàn)機,已經(jīng)足以說明無人戰(zhàn)機近在眼前——AI既然能在模擬器上打敗人類飛行員,難道不就是意味著無人戰(zhàn)斗機離我們不遠了?
有人認為這次空戰(zhàn)還只限于超視距空戰(zhàn),這意味著AI飛行員更多的是處理雷達提供的敵方信息并做出相應的反應。這種作戰(zhàn)相對簡單,因此還不能說AIl已能勝任飛行員工作。其實,AI飛行員駕駛三代機連續(xù)躲避數(shù)枚空空導彈更能說明問題,實現(xiàn)這樣的戰(zhàn)術動作對判斷分析能力的要求超過了戰(zhàn)機間的格斗。
之前人們普遍認為,無人戰(zhàn)斗機出現(xiàn)的關鍵是能否制造出取代人類大腦的電腦。而這次AI戰(zhàn)勝人類飛行員則說明,普通的市售電腦也行。
模擬器中電腦操縱的無人機可以和飛行員進行“不流血”的空戰(zhàn),為什么現(xiàn)實中的無人機就不能依靠現(xiàn)有的電腦實現(xiàn)自主的空戰(zhàn)過程?空戰(zhàn)不需要人腦的創(chuàng)造力及感情。實際上,對于空戰(zhàn)來說,無人機能否像人那樣思考和活動都無關緊要,重要的是能根據(jù)傳感器提供的信息來做出相應的反應。
從理論上講,只要為電腦準備好足夠的空戰(zhàn)指令和不斷輸入足夠量的所需信息,要讓其完成空戰(zhàn)所需要的反應決策判斷還只是小菜一碟。目標的方位、高度、飛行速度、外形大小信息等都是無人戰(zhàn)斗機完成戰(zhàn)斗任務所要必須知道的。而讓電腦根據(jù)上述信息做出最恰當?shù)姆磻⒉焕щy。問題是怎樣才能獲得足夠的信息。對此,高性能雷達、熱成像儀、紅外及激光傳感器、光學攝像機等就是無人戰(zhàn)斗機所必須要裝備的。目前,要制造出像人眼一樣的光學探測器還是有很大困難的。不過,AI飛行員戰(zhàn)勝人類飛行員,充分說明了人眼收集視覺信息的豐富度對空戰(zhàn)勝負其實沒有太多意義。故此,AI并不是決定無人戰(zhàn)斗機能否出現(xiàn)的唯一因素,獲取空戰(zhàn)所需信息的各類傳感器也是必不可少。
毫無疑問,近年來出現(xiàn)的分布式孔徑紅外系統(tǒng)是AI駕駛戰(zhàn)機成為可能的關鍵。正是這套系統(tǒng)的出現(xiàn),讓AI飛行員跳出機器外獲得了飛行員身份的“許可證”。這套系統(tǒng)可以向飛行員提供連續(xù)的全向覆蓋的豐富飛行信息,其信息獲取的豐富程度足可以使AI做出正確的判斷。已經(jīng)有專家預言;25年后無人戰(zhàn)機將控制天空!
現(xiàn)在的問題,是這次人機空戰(zhàn)中模擬器中的數(shù)據(jù)獲取,是不是嚴格按照現(xiàn)實獲取手段生成。如果還是模擬器自身生成,則無人戰(zhàn)機的出現(xiàn),還要等到機上傳感器能夠達到這一要求。
AI能否決定未來空戰(zhàn)結局
現(xiàn)在人們已經(jīng)形成共識:未來的天空主人是無人戰(zhàn)斗機。但媒體更為直接,說是AI能決定未來空戰(zhàn)。前一種說法反映了科技發(fā)展趨勢,后一種說法則有些形而上學的味道。
前面說了,無人戰(zhàn)斗機需要的AI并不需要多高的智商,這也意味著交戰(zhàn)雙方的AI水平不會有太大的差異。當雙方都讓AI飛行員駕駛戰(zhàn)機,再說AI決定未來空戰(zhàn)結局是不是可笑?
戰(zhàn)斗機無人化后,直接的好處就是可以縮小飛機的體積和重量。如果保持體積和重量不變,則可以大幅度增加飛機的有效載荷。專家認為,未來的無人戰(zhàn)斗機在尺寸和重量上只有有人戰(zhàn)機的一半左右,或者是在此基礎上將節(jié)省的尺寸和重量轉化為戰(zhàn)斗機的航程及速度等指標。
毫無疑問,這些都是戰(zhàn)斗機無人化的結果。但要將功勞都算到AI上卻有失公平。畢竟,早期的AI早已經(jīng)能在電腦中擊敗人類飛行員。而現(xiàn)在,快速發(fā)展的機上傳感器將在無人機空戰(zhàn)中起到關鍵性的作用。因此,說AI決定未來空戰(zhàn)結局是不嚴謹?shù)摹?/p>
可以設想,如果敵我雙方的AI駕駛四代機對陣,人們會發(fā)現(xiàn)智能水平不會出現(xiàn)太大的差距,而戰(zhàn)斗機的隱身能力、速度、機動性及攜彈量等硬性指標,將始終影響并決定交戰(zhàn)態(tài)勢的轉換及漂移。這其中,也包括空戰(zhàn)程序編制的完善度。完善度可以歸結到AI的智能水平中去。但是認真說來,完善度只是反應后才能表現(xiàn)出來。因此,這一點應該是與AI引以為榮的判斷能力無關。AI的判斷能力高超,而機體的反應速度(推力的提升及響應精度)不行,機上傳感器的探測精度也差一拍,則到最后還是會在空戰(zhàn)中落敗。可以說,未來戰(zhàn)機的發(fā)展,在很大程度上仍然取決于硬件的水平。
在評論AI意義時,不能不提到機載武器的重要性。導彈的出現(xiàn)可以說降低了人類飛行員的價值。同樣的影響也會體現(xiàn)在AI飛行員身上。導彈的智能水平在AI面前雖然不入流,但它可以用最為簡單有效的方式來體現(xiàn)戰(zhàn)機的存在價值。在空戰(zhàn)中,導彈的作用不可替代。如果二者選其一,相信空軍還是會選擇導彈而不是AI。
需要指出的是,AI飛行員讓三代機具有了躲避導彈的功能。因此,提高導彈的AI水平就成為關鍵。真到了這一步,戰(zhàn)機的硬件水平又成了關鍵。相信在導彈與戰(zhàn)機之間的戰(zhàn)斗,將是采用了AI的導彈勝出。不過即便如此,還是不能說AI決定空戰(zhàn)結局——采用AI的導彈如果沒有更遠的有效射程、更高的過載及更快的響應速度等硬件因素的支持,仍然會陷入對方的機動陷阱中。另外,未來機載激光武器將會成高智能導彈的克星。
有人認為,無人戰(zhàn)機具有的高過載能力將對空戰(zhàn)結局產(chǎn)生很大影響。這個認知其實并不完全正確。現(xiàn)有的有人戰(zhàn)機,設計的極限載荷通常都小于10g,而人體抗負荷能力可達到12g。這表明在某種程度上,戰(zhàn)機的極限載荷更多的是受到設計上的限制——高的抗過載能力意味著加強結構要付出極大代價,會影響其他性能。就目前戰(zhàn)機向重型化發(fā)展的趨勢看,無人戰(zhàn)機因取消飛行員獲得的機體減重和過載方面的優(yōu)勢,并不能真正改變這種情況。因此從這個角度看,AI飛行員在高過載機動飛行上仍有一定的限制,也不可能決定未來的空戰(zhàn)態(tài)勢。
美國人在消息報道中多次提到,人類飛行員與AI飛行員駕駛的戰(zhàn)機之間的指揮與配合。高仿真飛行模擬器中的電腦既然能承擔起讓無人機與有人機作戰(zhàn)的重擔,也完全有能力應對無人機大機群的作戰(zhàn)指揮。
相對于電腦的天然優(yōu)勢,人腦這種“過時的指揮單元”將很難適應未來瞬息萬變空戰(zhàn)場。現(xiàn)在,各國的空軍將若干臺空戰(zhàn)模擬器聯(lián)網(wǎng),已經(jīng)可以在電腦中進行幾十架飛機的空戰(zhàn)模擬演習(人機對抗)。只要規(guī)定好交戰(zhàn)參數(shù)和規(guī)則,電腦中的“敵方指揮官”絕對不會出現(xiàn)應付不過來的情況。而指揮演習的人類軍官,在面對海量信息和快速變化的交戰(zhàn)態(tài)勢時,則會出現(xiàn)盲然不知所措、被動地在大屏幕前靜等結果的情景。
因此,未來的大規(guī)模空戰(zhàn)離不開AI。但要辯證地看問題,則還不能說AI就要決定一切。因為這里面還存在著指揮信息有效收集及傳遞的問題。不過,早期的偽Al智能水平,已經(jīng)能夠滿足空戰(zhàn)集群的指揮需要了。
編輯:石堅