“算法”提喻的話語陷阱

2023-03-06 19:37:47朱恬驊

中國圖書評論 2023年1期

□朱恬驊

【導讀】當前對于“算法”的文化批評聚焦于其社會效應中顯現的非中立性。然而,就算法作為處理某個數學問題有限而確定的步驟而言,它具有數學上的中立性?？萍季揞^所代表的一眾行為主體,試圖借“算法”的名義占有中立性,以掩蓋先于算法的人為決策(如對于問題本身的定義、數據來源和維度選擇、標簽類目和結果的使用方式等),逃避其社會責任。對算法中立性“神話”的批判,在無形中落入了這種假托“算法”之名的話語圈套。作為替代,可以使用“模型”的概念,凸顯人為決策引入的非中立性,從而將對“算法”的批判重定向為對技術中起主導作用的“規范共識”的批判。

在談論當今高新技術的社會影響時,“算法”無疑已成為一個關鍵詞匯,以“算法”為定語的術語,如“算法社會”“算法治理”“算法規制”“算法意識”等紛至沓來,大有令人應接不暇之勢。有國內學者認為,“算法社會”是雅克·埃呂爾(Jacques Ellul) “技術化社會”在當代的具體體現, “算法”已經成為數字時代的問題關鍵。[1]在文化批評的語境中,“算法”被視為技術決定論乃至“技治主義”的核心要素,是一系列社會現象特別是負面現象產生的直接原因,它放大社會偏見與歧視,激化社會矛盾,加劇社會不公。在這種觀點看來, “算法”體現了某種價值判斷,如何種信息是值得推薦的而何種信息則應被阻止,而將“算法”視為一種中立性的事物完全是人為建構的神話。

但在另一方面, “算法”的本來含義同數字的計算息息相關,即便在計算機技術的語境中,它也被定義為一種單純的數學過程。例如,在久負盛名的《計算機程序設計的藝術》(TheArtofComputerProgramming)中,高德納(Donald E.Knuth)將“算法”一詞界定為“一組有窮的規則,這些規則給出求解特定類型問題的運算序列”,明確它具有有限性、確定性、能行性等特征。[2]1:4-5而在同樣被奉為經典教材的《算法導論》(IntroductiontoAlgorithms)一書中,托馬斯·科爾曼等也將算法定義為“定義良好的計算過程”“用來將輸入數據轉換成輸出結果”。[3]3這種數學意義上的“算法”似乎有著不言而喻的中立性,從而與針對“算法”的文化批評形成了對壘之勢。

一、“算法”(algorithm)一詞的源流

從詞源上看,英語的“algorithm”來自algorism,后者則來自12世紀歐洲翻譯者對波斯數學家花剌子米(Muammad ibn Mūsā al-Khwārizmī)姓氏的拉丁化“algorizm”。在拉丁文譯文殘篇“花剌子米如是說”(dixit algorizmi...)中,詳細記錄了使用印度數字(今阿拉伯數字)進行四則運算的方法[4],使得這一原本意為“花剌子模人”的姓氏在歐洲獲得了“計算方法”的意義。久之,人們將“algorism”同古希臘語表示“數”的(arithmos)一詞相比附,“algorithm”的拼寫方法由此產生,盡管二者之間并無詞源上的關聯。這種比附體現了人們將“algorism”與“數”相關聯的意識。

不過,對于漢語讀者而言,“算法”的歷史實則更為源遠流長。姑且不論中國古代數學中關于計算方法的記述存在以“(算)術”命名的傳統(如《九章算術》), “算法”二字就已經出現在《漢書·律歷志》中:“其算法用竹,徑一分,長六寸,二百七十一枚而成六觚,為一握?！贝颂幍摹八惴ā彪m然是指算籌的制作之法,但到唐代,講述計算方法的“算法”已作為書題出現。值得一提的是,南宋末年流行的民間百科《事林廣記》就設有“算法”一節,所載“算法源流”條目語云:“夫算法者,伏羲始畫八卦,周公敘述《九章》。至于玄元、益古、如積、細草,其旨淵奧,難可尋繹,初學者無所措手。其加減因折乘除之法,所以上揆星躔,下營地理,巨無不攬,細無不規?！蔽闹兴信e之“玄元、益古、如積、細草”即為籌算天元術(解高次方程)的方法名稱,足見此時的“算法”已經固定為“計算方法”之意。

科學史學者指出,宋元時期的中國數學發生了從“實物語言”主導到“文本語言”主導的轉變,也就是從使用算籌等實物計算工具進行操作,轉向由對算籌操作的文本記錄而形成符號操作。[5]“算法”詞意的變化恰好暗合這種轉變,從最初制作計算工具的方法到操作這些工具的方法,再到將操作方法文本化而開始顯現為書面符號的變換逐步走向抽象。

這就使得古代“算法”同今天人們所談論的計算機算法,并非只有語詞上的關聯?，F代意義上的算法肇始于圖靈(Alan M.Turing)的《論可計算的數》(On Computable Numbers)[6],文中提出了著名的“圖靈機”這一數學模型。不同于實際建造的計算機,這種設想中的機器可以擁有兩端無限長的計算紙條,但每次只能對紙條上的一個符號進行操作,無論是讀取(執行)還是擦除、改寫。圖靈機在數學上的應用為求解希爾伯特“判定性問題”(Entscheidungsproblem,即是否所有數學問題都是可判定的)提供了一種重要的等價形式,但主導其行文的精神則在于對計算本身進行了規則化的描述,以使之成為一系列關于符號的操作。它明確了計算機器所可能操作的“數”的性質,而這進一步來說又是通過對“計算過程”本身進行定義得到的,因而成為定義“算法”時參照的對象。

1954年,小馬爾可夫(Andrei A.Markov, Jr.)將算法定義為數學中的精確操作,具有三個主要性質:其步驟不允許任意性,而且應當是普遍可理解的,因而具有確定性;算法接受一類數作為輸入,而不只是在某個特定值上運作,此即群體性;算法應當傾向于獲得確定的結果,而且對于正確的輸入而言,輸出也應當是符合預期的,此即結果性。[7]不滿于這種文字性的描述,小馬爾可夫通過他所定義的“正規算法”(normal algorithms),將算法形式化為一種對于字母表(符號)和字串的操作,并指出其與遞歸函數、λ演算和圖靈機具有等價性。這一定義也被稱為“馬爾可夫算法”(Markov algorithm)。

沿著形式化的路徑,數學家們對算法做出了更為精細的定義。2012年,《計算機協會通訊》(CommunicationsoftheACM) 在 “編者按”中將其總結為“抽象狀態機”(abstract state machine)和“遞歸器”(recursor)兩條路徑[8],二者大致可分別追溯到圖靈機和丘奇(Alonzo Church)的遞歸函數。另一方面,尋求算法哲學本體論意義的嘗試并未中斷。羅賓·希爾(Robin K.Hill)從不同的形式化定義出發,認為一種更為簡潔而易于大眾理解的文字定義仍然是有效的,并將算法歸結為“一個有限的、抽象的、有效的、復合的控制結構,在特定限制下完成特定目的”[9]。

無論是在中西文語境中的原本含義,還是在丘奇、圖靈等開創的現代意義上,“算法”一詞都指向對一組有限符號進行有明確定義的操作。但是當代對于“算法”一詞的運用,顯然已經遠遠超出了上述數學意義的有限性和明確性。歸結起來,可以說“算法”成為了一系列技術手段和非技術決策的總體性象征,一種以部分代全體的提喻修辭法。

二、成為技術提喻的“算法”

在種種以“算法”為定語的術語中,當屬“算法社會”的覆蓋面最為廣泛。美國科羅拉多大學哲學教授約翰·加納(John Carnes)可能是最早采用這一術語的學者之一。在1985年舉辦的國際哲學與技術學會雙年會上,他在一篇探討職業與教育的文章標題中亮出了“算法社會”(algorithmic society) 之名。[10]2021年,里克·彼得斯(Rik Peeters)和馬克·舒倫伯格(Marc Schuilenburg)在所編文集《算法社會:技術、權力與知識》中,將“算法社會”歸納為“一套實踐和話語,牽涉到政府和私有部門之間的混合聯系,它由一套相對較新的數據驅動技術支撐,通過自己的知識模式和形成新主體的特殊方式,為社會的治理增加了新的層次”[11]195。

值得注意的是,在上述界定中并未出現計算方法意義上的“算法”本身,而是借此指代了“一套相對較新的數據驅動技術”。盡管我們也可以將計算的方法視為一種“技術”,如維特根斯坦曾經將讀圖稱為“技術”(Technik)[12]249;但是掌握一種抽象的計算方法、一種操作符號的思想,畢竟無法比擬于建造一種自動運算的機器,將它們配置并部署到現實生活的某個情境中,切實地發揮作用。后者是今天的人們談論“技術”時的主要意涵所在。而從針對“算法”中立性的批判來看,對于技術運行結果的評判往往構成了論者展開辨析的出發點。為人詬病的數據的采集、特征的選取、目標的設定等雖然也以各種方式在算法中得到體現,但它們本身并非算法運行的結果,而是在算法得到設計之前就已經決定了的事物。

這就意味著對于“算法”中立性的批判,實際并不是針對作為計算方法的算法本身。它的名稱實際指代了諸多先于算法設計的決策和算法本體之外的數據。“算法”成為各類計算機技術特別是人工智能技術的提喻(synecdoche)。

技術的提喻此前多以實物的形態出現。西蒙棟(Gilbert Simondon)曾舉例分析了儀表盤、尾氣管等汽車部件對于汽車性能的暗示作用。通過這些部件夸張的外形設計,制造汽車的技術得到了象征性的顯現,即所謂的“技術顯像”(technophanie)。[13]39在他看來,技術顯像的出現標志著一種將技術重新納入“文化堡壘”中的努力,也就是為技術因素(如汽車的加速性能)賦予文化上的含義(如與英雄氣概相關聯)。與此類似,“算法”這一名稱在相當程度上為人工智能技術中多變、復雜而缺乏可解釋性的技術構成賦予了一個概括性的名稱。

算法所描述的計算過程之所以有意義、被采納,有賴于一系列在此之前和在此之外施加的對輸入—輸出對應關系的規約,而這正是科技巨頭企圖利用算法作為數學過程的中立性所掩蓋的。它們的邏輯是:由于算法是中立的,它本身無法做出價值的評判,而僅僅以計算的結果排列或推薦用戶消息或新聞內容,社交網絡、手機應用等技術產品也就是中立的。但是從設計的角度來看,如果廣告的投放以轉化率為唯一的衡量標準,在此規定下設計并運作的算法也就不可能將廣告內容的合規與否納入檢測的范圍。換言之,“算法”之所以被征用為人工智能技術產品的提喻,其目的不在于澄清或代表其中的作用機制,而是在于遮蔽算法以外參與人工智能技術建構的社會觀念因素。

三、“模型”取代“算法”

作為一種技術構建,形形色色的人工智能技術應用從一開始就受到了社會因素的規定。芬伯格(Andrew Feenberg)對于技術的社會構建論觀點在此仍然適用:“技術包含著美學、倫理和文化領域中規范共識的成果,而不僅僅是純粹的效率至上或用戶至上渴望獲取的狂熱?！盵14]15作為諸種概念“物質化”(materialize)的結果,技術產品體現了這些“規范共識”的作用,并為之準備了自動的“次級施行者”(secondary agent)。

但是數學意義上的算法并不是這樣的技術產品,二者間存在著巨大的鴻溝:一種“數學上可行”的算法在現實中完全可能是不可行的。算法所提供的是一種維特根斯坦所說的“象征的機器”,沿著邏輯的必然性“運作”, “從一開始就在自身中包含著它的作用方式……它將造就的各種運轉,似乎已經完全決定好了”。[12]89這也就意味著,算法和圖紙一樣,無法突破紙面而“生長”出現實的機器,后者由于物理的限制而可能產生出預料之外的結果。更不用說,算法對輸入和輸出數據所做的數學上的預設無法從現實中直接取得,而是需要經過技術上的轉換。這些現實技術的成分是算法發揮作用的前提。

另一方面,從文化批評引入“算法”概念作為批判靶標的動機來看,其所關心的也不是作為數學過程的算法本身,而恰恰是將其近似、轉變,由通用性的計算方法具體化為滿足外部特定要求的上述技術,也就是“算法”的提喻。問題在于,批評者對此往往并不自知。如同科技巨頭企圖將數學意義上的算法同他們的技術產品短接以賦予后者“中立性”,批評者也將他們從技術中發現的非中立性倒轉為“算法”的性質?？梢?“算法”作為技術的提喻并不恰當。人們需要一種更具概括性的話語,顯性地揭示技術獨立于數學過程并受制于社會關系的方面,才能讓文化批評真正進入“規范共識”的層面,也就是現實中業已存在著的偏見、不平等或技治主義傾向,從而合法地發揮批判的作用。

“模型”提供了一種可行的替代方案。盡管“模型”不像“算法”那樣存在較為公認或形式化的定義,我們仍可以從人工智能技術的語境中看到,模型突出的特點在于定義了算法所需求解的問題本身。如果從最初華倫·麥克庫洛(Warren McCulloch)與瓦爾特·皮茨(Walter Pitts)對于神經元的數學建模算起[15],“模型”在人工智能的領域中就不僅包含了對于某個問題的解決方法,而且首要地呈現了對模糊問題進行嚴格定義與描述的要求。特別是在當代以機器學習為主要路徑、人工神經網絡為范式的人工智能技術中,嚴格意義上的算法主要在數值優化的基礎環節發揮作用,而更為整體性的“模型”才與具體的用途相關聯。

以藝術領域的人工智能技術應用為例,2016年,列昂·蓋蒂斯(Leon A.Gatys)等人在提出有關“藝術風格轉移”時,即通過一組矩陣來定義圖像中的“風格信息”,并進一步將已有的模型同他們提出的新結構適配、嵌合。[16]他們用一組良好定義的(well-defined)矩陣替代了藝術上存在爭議的“風格”概念,“風格”的接近則通過評估矩陣之間的差異得到。這樣,模型確定了算法所要優化的目標函數有何意義,而所需求得的參數又應滿足何種條件。最終,整體計算過程的性能或實用性則在相當程度上由模型所要求的訓練數據(圖像)決定?！帮L格”的模型是否有效并不是通過深入矩陣元素和某種關于“風格”的藝術理論之間的對應性上建立的,而只是研究者的一種人為規定,體現了他們所持有的、局部性的“共識”。

因此,如果說算法至多只是將與應用相關的信息隱含在對計算過程的描述之中,模型則將計算過程得以決定之前的先決條件和可能的輸入范圍,清晰呈現在人們的面前。即便是那些強調通用性的模型,如文本處理領域能在文本分類、自動摘要、生成等方面發揮作用的GPT-3,也有明確的作用范圍(現代英語文本,特別集中在說明性文本)。而這又是因為模型對于數據的來源、性質和意義進行充分的考慮。由于英語維基百科的內容在GPT-3的訓練過程中占有重要地位,其在處理說明性文本時顯然就更可能存在優勢。而當人們用GPT-3相同的算法甚至結構,用另一種語言的文本、另一組數據進行“訓練”之后,所獲得的新模型體現的顯然已是另一種語言、另一些文體所具有的特征了,因而至多只是與GPT-3同構的另一個模型。遑論不同語言的文本涉及不同的具體處理方式,如中文文本是按照字符還是按照詞為單位進入算法,都為模型引入了新的自由度。

當然,模型和算法一樣,并不是具體的技術產物本身,它同樣是對技術的一種抽象。但是,這種抽象仍比算法更為接近最終的實現;而且它給出了人們對于數據可能性范圍和達成目標的認識和理解,從而直接地顯現出技術之所受制與反映的“規范共識”。仍以前文提及的“風格轉移”為例,當蓋蒂斯等人以凡·高的《星空》為例證,說明其模型的有效性時,無疑就已包含了他們以凡·高的油畫為一種典型繪畫風格的藝術認識。這些作者顯然也沒有預想到,如果以水墨畫為目標風格,其輸出結果并不能如應對油畫時那般令人滿意;這種“偏見”并不是由于算法本身所造成的,而是由于模型的設定和訓練過程導致。例如,北京大學的段凌宇團隊在此基礎上重新設計了目標函數,并選取了徐悲鴻的畫作圖像作為水墨畫的代表進行訓練,取得了令人滿意的結果。[17]而由此取得的新模型,在應對水墨風格時就獲得了一定的優勢,盡管在底層上可以認為二者中起作用的“算法”是高度相似乃至相同的。

模型的改變同共識的改變相關。由于包含了更多具有現實意義的信息,模型成為數學意義上的算法和技術產品之間的橋梁,明確顯現了技術的社會建構性質。以“模型”取代“算法”作為人工智能技術的提喻,有助于人們跳出“算法”提喻的話語陷阱,從對技術的間接批判更快地轉入對技術的社會建構中“規范共識”的直接批判:如何將真正具有廣泛代表性的社會共識通過技術得到表達,而不是那些只服務于少數人利益的“共識”。如是,從人工智能技術的種種社會后果出發的文化批評才能建立起合法性,免于陷入盧德主義的困境。

注釋

[1]賈開.算法社會的技術內涵、演化過程與治理創新[J].探索,2022(2):164-178.

[2][美]Knuth D E.計算機程序設計藝術[M].李伯民,范明,蔣愛軍譯.北京:人民郵電出版社,2016:1.

[3][美]Cormen T H,Leiserson C E,Rivest R L,等.算法導論(原書第2版)[M].潘金貴等譯.北京:機械工業出版社,2006.

[4]Crossley J N,Henry A S.Thus Spake Al-Khwārizmī:A Translation of the Text of Cambridge University Library Ms.Ii.vi.5[J].HistoriaMathematica,1990,17(2):103-131.

[5]朱一文.數學的語言:算籌和文本——以天元術為中心[J].九州學林,2010(7):82-105.

[6]Turing A M.On Computable Numbers,with an Application to the Entscheidungsproblem[J].JournalofMathematics,1936,58:345-363.

[7]Markov A A.The Theory of Algorithms[J].TrudyMat.Inst.Steklov,1954,42:3-375.

[8]Vardi M Y.What Is an Algorithm?[J].CommunicationsoftheACM,2012,55(3):5.

[9]Hill R K.What an Algorithm Is[J].PhilosophyandTechnology,2016,29(1):35-59.

[10]Announcements:Federal Agency[J].4SReview,1985,3(1):42-48.

[11]TheAlgorithmicSociety:Technology,Power,andKnowledge[M].M.Schuilenburg,R.Peeters.London:Routledge,2021.

[12][英]維特根斯坦.哲學研究[M].陳嘉映譯.上海:上海人民出版社,2005.

[13]Simondon G.SurLaTechnique[M].Paris:Presses Universitaires de France,2014.

[14][加]安德魯·芬伯格.可選擇的現代性[M].陸俊譯.北京:中國社會科學出版社,2003.

[15]McCulloch W S,Pitts W.A Logical Calculus of the Ideas Immanent in Nervous Activity[J].TheBulletinofMathematicalBiophysics,1943,5(4):115-133.

[16]Gatys L A,Ecker A S,Bethge M.Image Style Transfer Using Convolutional Neural Networks[A].Proceedingsofthe IEEEConferenceonComputerVisionand PatternRecognition[C].2016:2414-2423.

[17]He B,Gao F,Ma D,et al.Chip-GAN:A Generative Adversarial Network for Chinese Ink Wash Painting Style Transfer[A].2018ACMMultimediaConferenceon MultimediaConference-MM’18[C].2018:1172-1180.

“算法”提喻的話語陷阱

一、“算法”(algorithm)一詞的源流

二、成為技術提喻的“算法”

三、“模型”取代“算法”

二、成為技術提喻的“算法”

三、“模型”取代“算法”