范玉吉 周豐 張璐
編者按 2023年10月13日上午,“人工智能時代的美育與非遺文化傳播”學術研討會暨2023上海市美學學會青年學術沙龍,在上海第二工業大學學術交流中心舉辦。此次會議由上海市美學學會、上海市第二工業大學外語與文化傳播學院共同主辦。來自上海高校、研究機構、企業的學會學者,與上海第二工業大學師生近百人齊聚一堂,圍繞主題開展了一場歷史與時代匯流、傳統與創新交織的學術討論。
審美是否會被算法操控?
范玉吉
大數據、算法和人工智能已經深刻地融入了我們的日常生活,小到衣食住行,大到上天入海,無處不在。而作為一種傳播技術,它們對以互聯網為基礎的現代傳播生態的影響更是顛覆性的,隨著智能傳播時代的到來,從信息采集到信息生成,再到信息傳播,都是在智能技術的主導下進行的。從數據收集、算法訓練到大數據模型的應用,數據深刻地影響了智能傳播的技術邏輯和文化邏輯,使人類在智能傳播的生態環境中不知不覺就失去了自我,為數據技術所控制。我們可以回想一下,在智能傳播環境中,我們的每一個點贊、每一次評論、每一張照片、每一段視頻,甚至我們隨意瀏覽的一個網頁都會深刻反映出我們的審美趣味和審美能力,我們的心理、我們的情緒、我們的價值觀、我們的信仰等都以0和1組合成的不同編碼方式被算法所感知,從而使互聯網比我們更了解我們自己。在大多數情況下,我們“理性”所喜歡的東西并非我們“欲望”所想要的東西。或許我們自以為喜歡陽春白雪,但實際上我們可能更喜歡下里巴人;有時我們以為自己是高雅藝術的“鐵粉”,但實質上卻是通俗藝術的“腦殘粉”。在互聯網時代,我們的指尖每敲擊一下鍵盤,就會成為互聯網海量數據的一部分。我們已經進入了大數據時代,這個時代對我們的生活及我們與世界交流的方式都進行了基礎性的重構。我們不用再去追究構成這個世界的因果關系,而是要關注各事件間的相互關系,算法技術僅僅通過我們在鍵盤上敲擊出來的數據,就可以關聯(分析)我們的意識,甚至比意識更隱秘的潛意識。被稱為“大數據時代的寓言家”的維克托·邁爾-舍恩伯格早在2013年出版的《大數據時代:生活、工作與思維的大變革》一書中就明確指出,“大數據已經撼動了世界的方方面面,從商業科技到醫療、政府、教育、經濟、人文以及社會的其他各個領域”[1]。而2019年英國倫敦政治經濟學院的尼克·庫爾德里(Nick Couldry)和美國紐約州立大學的尤利西斯·A.梅西亞斯(Ulises A. Mejias)兩位教授在他們合著的《連接的成本:數據殖民與資本主義的掠奪》(The Costs of Connection: How Data Is Colonizing Human Life and Appropriating It for Capitalism)一書中揭示了數據控制人類生活的本質,并提出了“數據殖民”這一重要概念。[2]今天的人類及其日常生活都被數據所控制,人成為數據的木偶,失去了自主性。就以審美領域為例,大數據通過控制人的審美意識,進而控制了人的活動,并進一步向縱深發展。
人工智能影響并控制人類審美的底層邏輯是數據。在數據科學家看來,“一切皆可量化”,不僅管理效益、決策影響、信息價值、公眾形象等“無形之物”可以量化,就是偏好、態度和判斷等抽象事物也可以量化。[3]這種量化僅僅是人工智能的開始。首先,人工智能通過對海量的數據進行分析,利用已知估量出未知,從個別推論出一般,就可以對人們的審美偏好、審美標準、審美價值等進行“抽象化具象”,即算法運用大數據對個體的審美經驗進行分析,得出一般的審美標準,從而“創造”出讓大多數人都欣賞的美的樣式,如“網紅臉”就是對無數美的形象抽象化之后的具象。其次,利用大數據對人工智能的大模型進行訓練,訓練中“喂”給人工智能的數據越多,人工智能則越“聰明”,而“喂”給人工智能的數據與算法結合后,會將數據固有的價值偏向和算法自身的價值偏向內化成人工智能的價值偏向,使人工智能帶著價值立場工作。如生成式人工智能ChatGPT和Sora主要是由西方的數據“喂養”出來的,那么它們就不可避免地帶有西方的價值觀和審美觀。在Sora根據用戶的文本提示所創造出來的視頻中,雖然深度模擬了真實物理世界,但這個世界是西方式的,其所生成的角色也帶有典型的西方審美特征。
在未來,隨著人機交互界面的進一步融合,甚至當腦機成為人類的標配時,大數據或將完全控制和改變我們的審美觀念和審美價值。
一、被算法操控的審美
哈奇生說,“我們對事物之美有一種自然的知覺能力或感覺能力,它是先于一切習慣、教育或榜樣而存在的”[4]。人類的審美能力本質上說就是一種美感能力,而對于達到人類智能水平的人工智能來說,將人類的美感通過情緒智能機器人的算法重新設計出來是完全可能的。[5]對于愛美的女性來說,什么樣的臉型是最美的?關于這個問題,大數據給出了最精確的答案——“網紅臉”——“大歐雙(歐式平行雙眼皮)、高翹鼻、圓潤的額頭、飽滿的蘋果肌、半永久的一字眉”,這就是一張標準的“網紅臉”。從“美麗經濟”到“美女經濟”,人造美人幾乎已經成了一種影響到全社會的選擇,但也有研究者一針見血地指出,“作為網紅經濟一個鮮明的代表符號,網紅臉不僅是一陣流行風潮而已,它關乎技術與審美,也關乎流量與欲望”[1]。愛美之心人皆有之,但人們所愛之美應該是什么?這個美一定與其所屬民族的歷史文化相關,一定和其所處時代的發展相關,并且每個人的美會因個人的自身條件而產生不同的樣式。世界之所以豐富多彩,就是因為有著不同的美的樣式和類型,即所謂各美其美,美美與共。每個人應該有自己獨有的美的特質,先秦時“手如柔荑,膚如凝脂,領如蝤蠐,齒如瓠犀”的衛莊公夫人莊姜,西漢時“纖便輕細,舉止翩然”的漢成帝皇后趙飛燕,盛唐時“回眸一笑百媚生”“云鬢花顏金步搖”的楊貴妃,她們的美就不同,有的壯碩,有的瘦小,有的豐腴,有的纖細,其美各不相同,但各美其美,各有意味,環肥燕瘦,并未影響其美的獨特、美的自然。但今天,我們卻完全將自己的審美判斷交給了算法,讓它代我們做出選擇。大衛·薩普特指出,“算法不停地旋轉和降維你的數據集,直至它能讀懂你、透視你。它使臉書能用點‘贊情況預測你的性格,從表情、照片甚至你與屏幕的互動來評價你的精神狀態。算法的高維理解完勝你對自己的了解,但它們并不具備完美的預測能力和公平公正的態度”[2]。算法通過對我們使用網絡的行為所產生的數據進行“分析”,可以“窺視”我們的心理,從我們所認同的美的類型中測算出一個美的“公約數”,進而再通過生產出來的信息告訴我們應該擁有什么樣的美的類型。其實,在審美方面,我們只不過是被算法計算出來的結果洗了腦,在科學方法的“暗示”下,我們認為自己應當擁有科學計算出來的美的類型。當整個互聯網都在流行“網紅臉”的時候,當我們手機里的照片都經過算法“美顏”之后,我們其實已經喪失了對美選擇和判斷的能力,或者說我們擁有的僅僅是一種盲從的美。
算法推薦降低了我們選擇的難度,同時也使我們在舒適的信息接受中失去了審美判斷力,我們會盲目地喜歡、點贊、信服那些傳播量大的內容,會盲目地相信他人的評論,今天很少有女性在照片拍攝或視頻聊天時不用“美顏”工具,網絡購物中也很少不受網絡推薦的影響,甚至只要是網紅的“景點”都會成為人們的打卡勝地。實際上智能媒體是比傳統更“專制”的媒體,它靠算法形成的“傳播霸權”控制人們的意識,開啟人們欲望程序啟動鍵,從而形成了比過去更嚴重的“傳媒無意識”。它剝奪了人們想象的能力,創造了萬人共有的欲望,制造了虛假幸福的承諾,算法霸權讓智能媒體“徹底背叛了啟蒙原則,讓人們面對‘異化卻徹底放棄了反抗”[3]。我們在并不自知的情況下,將審美的判斷力交給了算法。
二、被智能傳播影響的審美
智能傳播中對受眾影響最大的是“精準推送”。在大眾傳播語境下,受眾的個人性及其獨特性被嚴重忽視了,廣大受眾被假設成了一個無差別或其差別可以忽略的整體,[4]即使是為廣告營銷而對受眾進行細分,也仍然是以“受眾群”的方式出現[5]。但是在智能傳播中,受眾的概念發生了革命性的改變,基于大數據建立的模型開始對用戶的數據進行挖掘和篩選,從中找到每個用戶的習慣、意愿、渴望、好惡、情感等關鍵細節信息,然后讓想要傳播的信息內容在對的時間出現在對的受眾面前。[1]這就是大數據作用下精準推送的實質,它不僅改變了信息的傳播方式,而且提高了信息傳播的精準度,使信息刺激和受眾反應之間產生了直接且明顯的效果。從審美角度看,大數據可以將特定的審美類型精準地推送到喜好它的用戶面前,越是喜歡,則越容易收到這樣的審美類型信息產品。
但是這樣的智能傳播卻可能因形成了“信息繭房”或造成了“過濾氣泡”而對人們的審美多樣性造成影響。“信息繭房”和“過濾氣泡”是研究智能傳播不可忽略的兩個重要概念,它們分別被用來描述智能傳播對人們信息獲取所造成的障礙。
“信息繭房”(information cocoons)這一概念由哈佛大學法學院教授凱斯·桑斯坦在其著名的《信息烏托邦:眾人如何生產知識》[2]一書中提出。桑斯坦認為,互聯網給人們帶來了更多的資訊和選擇,但在看似更加民主和自由的信息選擇表象下,其實蘊藏著對民主和自由的破壞。在信息傳播中,公眾自身的信息需求受其個人的興趣、愛好、價值觀、審美趣味等因素影響,往往只關注自己想要的信息,但實際上他們并不清楚自己想要的信息是出于知情的需要還是知情的欲望,也就是說,潛意識在不知不覺中剝奪了人們意識的選擇權,在信息搜尋中只是選擇滿足欲望的信息而非滿足需要的信息。而算法則會根據用戶信息選擇的偏好而不斷“精準化”地向用戶推薦其潛意識所喜歡的信息,久而久之,用戶就會被禁錮在由信息構成的“繭房”中,從而造成信息接收的片面化和單一化。如果一個用戶喜歡看通俗的,甚至是庸俗的短視頻,那么系統就會不斷地給他推薦這樣的短視頻,久而久之,他的審美能力和審美趣味就會降低。
“過濾氣泡”(Filter Bubble)這一概念由互聯網觀察家伊萊·帕里澤在《過濾泡:互聯網對我們的隱秘操縱》中提出,他發現搜索引擎為用戶提供了在信息過載的世界里智能化、個性化、快速化獲取信息的方案。但與此同時,它也可以通過解讀用戶偏好,隨時過濾掉異質信息,為用戶提供個性化的信息。但令人不安的是,搜索引擎也會對用戶進行隱秘操縱,它會為每個用戶構筑起信息和觀念的“隔離墻”,令用戶處在一個由“網絡泡泡”構成的環境中,從而給多元觀點的交流造成障礙。帕里澤指出,過濾泡因其滿足了后物質主義而放大了個人的表達欲求,用戶若置身其中,它將會操縱公共領域,侵蝕群體的共同經驗,排斥對話,使人變得越來越狹隘和自私。[3]每個用戶都只有處在一個信息不斷更新交疊的環境中,才能獲得新的認知,而如果其只是被困在一個文化單一、價值單一的環境中,其多樣性就會被網絡所閹割,從而對社會缺乏基本的判斷與認知,形成單一甚至可能是扭曲的趣味。
以上兩個概念所描述的現象,不僅表明算法對人們的信息獲取產生了技術性壟斷,實際上還會對人的審美和認知產生惡劣影響,使人的審美能力發展受到限制,甚至偏離正常的軌道。算法推薦給網絡用戶的內容看似個性化,但這個“個性化”背后卻隱藏著單一化。用戶的審美偏好導致算法只是將一個類型的內容精準地推送到用戶面前,這些內容雖然看似數量龐大,其表現形式也似乎豐富多彩,但實際上卻是單一類型內容的機械累加。用戶每天都在不停地刷手機,瀏覽數以千計的短視頻,但大都是一些重復的題材和內容,而且越是獵奇、怪誕、浮夸、庸俗的內容,越容易迎合用戶那些并不高雅的趣味。短視頻文化是典型的快餐文化,不僅沒有營養,甚至還是一種精神毒品,令人成癮,使人完全喪失批判的能力和立場,從潛意識層面給受眾帶來負面的影響,加速了人的異化,造成了人的主體性的喪失。[1]就審美而言,世界是五彩斑斕的,人們的審美也應該是豐富多彩的,但如果受到算法推送的圍困,就會造成審美趣味和審美能力的片面化和單一化。
三、警惕智能傳播中的文化殖民
隨著全球經濟陷入持續的結構性低迷,貿易保護主義不斷抬頭,貿易摩擦不斷發生,全球化正在面臨著新的挑戰,甚至產生了“逆全球化”的現象。但是隨著互聯網的普及,在互聯網領域里全球化似乎呈現出不一樣的狀況,西方國家的信息輸出無論從數量上看還是從影響上看,都有全球化的趨勢。互聯網被宣稱是一個信息自由的王國,但作為全人類重要的文化現象,互聯網具有雙向交流的功能,理應是一個各領域信息均衡傳播的信息自由市場,但事實卻并非如此,在互聯網的世界里充斥著以西方為主的信息霸權,由于技術、語言、文化等原因,在網絡發達國家與網絡欠發達國家之間存在著一個巨大的數字鴻溝,在數據流通方面網絡欠發達國家存在著明顯的數據逆差,也就是說由西方網絡發達國家傳入網絡欠發達國家的數據遠大于網絡欠發達國家傳入網絡發達國家的數據,這在本質上就是“信息逆差”。隨著人工智能的發展,數據變得越來越重要了,被稱作“21世紀的石油”,“沒有大數據就沒有人工智能”已經成為一種共識。隨著神經網絡和深度學習技術的發展,人工智能技術得到了飛速發展,深度學習攜手大數據,引領了人工智能的第三次熱潮。[2]從本質上說,人工智能是借助深度學習的算法技術,由海量的大數據訓練出來的,數據越豐富、越多樣,訓練出來的人工智能也就越“智能”。但數據本身是包含著價值觀的,有什么樣價值觀的數據就會訓練出持有什么樣價值觀的人工智能。更為重要的還有技術配置也并非完全價值中立,資本、政治、技術都會對算法的中立性造成損害,而人工智能在自動學習中也會產生價值偏差,“理論上技術不能擺脫人類控制,但在實踐中它正沿著本質上獨立的路線前行”[3]。當今的網絡發達國家基本都是西方國家,他們壟斷了全世界80%以上的數據,數據包含西方在政治、軍事、經濟、文化、信仰等方面的價值要素,這些要素會隨著數據深刻影響他們的人工智能,而這些人工智能在非西方國家廣泛使用,會造成價值的單一化,并進而產生新的文化殖民。
有研究者運用ChatGPT-4進行過測試,面對同樣的問題,用英語、德語、日語提問,其結果雖有差異但并不明顯。但如果用漢語提問同樣的問題,ChatGPT-4則會給出差別較大的答案,有的甚至會存在明顯的種族主義或民粹主義色彩。如果用Sora來自動生成視頻,則這種傾向會更加嚴重。就審美而言,用西方數據訓練出來的人工智能會將西方的審美價值作為基準,對非西方國家的審美標準和審美形態予以排斥。算法是人設計和制定的,人的價值觀自然也會被植入算法中,從而形成算法歧視或算法敵視。在不同文化之間,處于強勢文化的西方國家會借助算法對弱勢文化進行歧視。同時,被大數據喂養出來的人工智能則會借助算法推薦,將“它”認為優秀的文化(強勢文化)精準推送給其他處于“劣勢”文化的國家用戶,從而形成新的文化殖民。
后殖民主義理論產生于全球化背景下,側重于分析新形勢下帝國主義的文化侵略、第三世界的精英知識分子的文化角色和政治參與、關于種族/文化/歷史的“他者”表述,以揭露西方形而上學話語的局限性[1]。隨著互聯網的發展,在文化全球化展開的同時,新一輪的文化殖民已經開始了,這次的文化殖民可以理解成“后后殖民主義”。后后殖民主義不像此前的后殖民主義那么明顯、那么激烈,它是通過最不引人注目的技術手段進行貌似中立的文化傳輸,它們把技術中立置于最顯著的位置,讓所有被殖民的國家和人民都放松了警惕,然后以最顯著的效果完成它們的殖民大業。西方國家以人工智能和看似完全中立的算法技術為掩護,以最大的算法偏見為手段,將西方的文化和價值觀滲透進被殖民國家人們的意識中。數據逆差已經成為影響文化軟實力的重要因素,因此必須加強數據流通,促進數據貿易,扭轉數據逆差,讓數據自由流通成為阻斷后后殖民主義的重要屏障。
人工智能藝術的實證研究
周 豐
人工智能藝術的實證研究主要是針對人們對人工智能藝術的感官反應,即人工智能藝術在主體的接受中所引發的效果。雖然當前人工智能的創造性仍停留于組合創造力與探索創造力,而并沒有達到轉換創造力,即在新的概念層面上產生新的理念。[2]但我們已然看到大量人工智能藝術的存在,有些甚至能夠獲得人類藝術大獎,例如2022年9月,《紐約時報》報道稱,桌面游戲開發者杰森·艾倫在軟件Midjourney的幫助下獲得了數字藝術獎,藝術家們指責艾倫作弊,盡管他沒有違反任何規則,他甚至告訴了人們他使用了Midjourney。2023年春,攝影師鮑里斯·艾爾達格森(Boris Eldagsen)以一張人工智能生成的圖像獲得了索尼世界攝影獎。因此,人工智能藝術至少在效果上是被人接受的。
一、人工智能藝術實證研究的目的
人工智能藝術是否為藝術是有爭議的。這種爭議多是聚焦于人工智能藝術的創造性何在,它與人的藝術又有何區別。顯然,針對這些問題,我們有很多理論的分析,都是基于傳統的美學理論而來的。但人工智能“創造”的本質是一種程序算法,對于一般人而言程序就像是一個“黑箱”,我們很難將其“創造”的過程與人的心靈過程相匹配。因此,人工智能藝術的生成與傳統藝術的生產在傳統的美學理論中是斷裂的。然而,人工智能藝術的審美效果是明顯的。這就意味著,我們并不應從人工智能藝術的“來路”將其判定為“藝術”,而應基于它在我們身上引發的“效果”,“來路”與“效果”這樣一對矛盾便是人工智能藝術備受爭議的所在。那么,我們將如何克服爭議?從“效果”出發能否進入對“來路”的解釋?
人工智能藝術的實證研究就是這樣一種嘗試:實證意味著是從藝術欣賞的“效果”出發,將藝術感知的“效果”量化。因此,人工智能藝術的實證研究能夠繞開傳統的理論分析而直接從“效果”出發對其“藝術性”作出判斷。對其“效果”量化后,可將其與傳統藝術的效果相對照,看它們會有何種程度的匹配。
人工智能藝術的“效果”并不只是存在于人們的“接受”之中,它同樣是其“生成”的構成。人工智能所生成的藝術并沒有真正形成自我判斷,微軟小冰詩集的“集結”、《太空歌劇院》的獲獎,這些都需要人加以選擇或進一步修改。“人的執行”在于主體對人工智能藝術的感知與反應,但最終這種執行并沒有被作為人的行為來認識,而是作為“人工智能”的附屬,或者說是作為人工智能的整體性來認識的。個體的人是以自身的審美素養來完成他對人工智能藝術之生成的判斷與修改,這些實際上都是人在“效果”之中對人工智能的反饋。因此,個體以“效果”的名義對人工智能藝術的接受已然被納入到了人工智能藝術的總體“生成”之中。那么,從效果出發的實證研究就能夠將“效果”從人工智能的總體生成之中剝離出來,回到人的感知與反應。
二、人工智能藝術實證研究的方式
對于藝術感知的實證研究是審美心理學的重要傳統,可以說,從心理學誕生之初的實驗心理學就有實驗美學的藝術感知研究,而人工智能又是認知心理學研究的一部分。因此,今天人工智能藝術的實證研究也是審美心理學之一種。
實驗的根本在于“目的”和“操作性界定”,有什么樣的目的,就需要什么樣的操作性界定,這也決定了實驗的結果及其可靠性。因此,人工智能藝術的實驗是合乎當今認知心理學實驗,尤其是審美心理學實驗的研究路徑的。當前關于人工智能藝術的研究目的有:人工智能藝術與人之藝術的藝術性比較研究,人們對于人工智能藝術的偏見,不同文化背景的人對人工智能藝術的接受,以及人工智能藝術在不同藝術形式中所引發的效果差異,等等。
作為材料的人工智能藝術作品是從哪里來的?實驗中的人工智能藝術也是需要劃定邊界與進行選擇的。宏與庫蘭(Hong & Curran)在一項研究中選擇了三種不同的人工智能生成器生成的作品,谷歌的藝術生成軟件深夢(AI DeepDream)和創意對抗網絡(Creative Adversarial Networks,CAN)生成器,以及一個自20世紀70年代以來就一直在生成藝術品的計算機程序Aaron。[1]選擇的多樣化是為了尋求實驗結果的普遍性和可靠性。此外,在人之藝術與人工智能藝術的對照中,還要考慮二者材料的對等性,如抽象對抽象、肖像對肖像、風景對風景等。這些都是實驗可靠性的保障。
從人工智能藝術實證的結果來看,利瑪(Lima)等人認為,當被試知道是人工智能生成的藝術時,他們就會貶低相應的作品。被試還傾向于將抽象圖像歸結于人工智能而將現實主義的圖像歸為人的作品。[2]甘格哈伯特拉(Gangadharbatla)等人認為,被試很難區分人工智能藝術和人之藝術,尤其是人工智能生成的古典音樂和人演奏的古典音樂,即使是專業人員也很難區分。[1]還有些因素會影響人們對人工智能藝術的評判:如道德身份[2]、文化差異[3]及人工智能所使用的語境[4]。有人認為,來自美國的被試要比中國的被試對人工智能生成的詩歌和繪畫更具批判性。詹森和斯科拉(Jansen & Sklar)認為,藝術家對人工智能的看法不同:協同創作的人工智能要比說教式的人工智能更受歡迎,而藝術家最愛批評用人工智能自動實現創造性的工作。[5]然而,也有人指出,對人的藝術作品和人工智能藝術作品的評價差異很大。人的藝術在構圖、表達和審美價值方面要更勝一籌。此外,知道一件藝術品是由人工智能創作的,通常不會影響參與者對藝術品藝術價值的評估。他們認為生成式人工智能并未通過圖靈測試。[6]
曾經的圖靈測試只要“蒙混過關”即可,而今天的圖靈測試則要明確告知被試者哪個是出自人工智能哪個又是來自人類。在此,確定主體對人工智能藝術的評價是以一系列的操作呈現的,而不是靠“蒙”的判斷。在另一項實驗中,他們又指出,如果被試之前持有人工智能不能創造藝術的前見,那么,他們對人工智能藝術的評價就會更為負面。人們對人工智能具有創造性的信念與對其創作的音樂的評價呈正相關。[7]如此一來,人工智能藝術的評判標準便更加明確并得到提升。那么,這對于人工智能藝術的發展來說也將更具指引性。
三、人工智能藝術實證研究的可能性
顯然,當前的人工智能所生成的藝術是基于作品的形式特征而實現的。正如“詩人小冰”的詩歌是從大量的詩歌文本數據庫中提取的,Midjourney也是根據大量的繪畫藝術作品作為底層數據,即便是今天的ChatGPT也是以大語言模型為基礎的。而且,這些模型或數據庫基礎并不是零散數據的隨意結合,而是一種算法,或更為直接地說,是以某種形式特征作為骨架。
人工智能藝術之生成或是包含了“效果”,或是不考慮“效果”。而且,“包含”并不是說就是內在于人工智能算法的,它仍是由人來完成的,只是,我們在人工智能之創造性的崇拜中忽視了人的存在,只將其作為人工智能的附屬。說其不考慮效果是因為,人工智能藝術并不能表達情感或態度。傳統藝術的創作是有態度的,即使是杜尚的現成品藝術《泉》,也表達了他對當時藝術觀念的不滿,或者說在藝術理念上表達了他自己的觀念。人工智能藝術的生成并不能將其指令者的某種態度表達出來,我們給予其關鍵詞或提示語,其生成只能是一種大而化之的,如悲傷、難過或是開心喜悅,它不是具體的某種情境式的情感。
關鍵詞或提示語是帶有輸入者的某種態度和傾向的。正類似于“測字算命”,求者所寫的“字”其實是當下心理狀態的一種反映,而算命先生根據“字”和求者的表情(包括言語、動作),去判斷求者的心之所想。這是兩個心靈直觀的相互理解。然而,人工智能所依據的只是算命先生所見之“字”,它將在多大程度上偏向輸入者的態度,這是神經美學實驗所能給予的論斷。一般情況下,人工智能藝術的輸出并不具有特定的情感或意蘊,那么,人工智能藝術的實證研究所要做的其實就是對“效果”的量化。為了“效果特征”能與人的情感態度的表達相適應,我們仍需要更為細致的量化。如此一來,依據這種量化的效果去進一步地調試人工智能藝術的生成,有可能使其進一步生成意蘊與情感。
人工智能藝術未包含的“效果”可以通過人對人工智能藝術的反饋或修正重新呈現出來。例如2019年,德國電信公司組織了一個由人工智能專家和音樂家構成的團隊,創作了貝多芬未完成的“第十交響曲”:《貝多芬第十交響曲——人工智能版》。在此過程中,團隊成員在每個步驟中都要對人工智能進行指導和更正。在最初的幾個月里,由人工智能生成的樂章聽來十分機械,但這些樂章都有專人調整,使其貼近貝多芬的風格。諸多音樂家根據音樂理論幫助人工智能做出整個曲目結構等關鍵性決策,反饋給人工智能,最終于2019 年11月完成樂譜。因此,這種單個而恰切的生成準確地說是由人和人工智能共同完成的,或者說,人工智能是人的媒介。
人工智能藝術的實證研究所得的數據某種程度上就是人工智能藝術的“效果特征”。這種“效果特征”能夠與其原本數據庫中的“形式特征”一樣,作為一種底層數據去進一步生成藝術作品,這樣的話,“效果”就不再僅僅是接受層面的主體性表現,而且也是藝術生成的主體性構成,只不過這個主體性是借用技術的形式反饋到藝術生成之中的。
偶然與控制:早期生成藝術與當代AIGC的理念差異
張 璐
人工智能生成內容(Artificial Intelligence Generated Content,簡稱AIGC)技術始于20世紀60年代,如今常被認為是對生成藝術(Generative Arts)的延續。但兩者的理念其實背道而馳。生成藝術界的先驅承襲20世紀初的觀念藝術思想,憧憬計算機藝術“不似人類的”,以表現去人類化的中立;相反,目前AIGC創作者追求作品“更似人類的”,以代替人類的勞作。這一對立既與時代精神的變化有關,也與任何技術在藝術中的生命周期有關。
一、觀念革命:從精確控制到模糊控制
觀摩藝術史上的那些美感藝術,無論在繪畫、雕塑、文學還是戲劇中,我們都會發現,摹仿現實是古代藝術家最重要的手藝。在一門手藝中,藝術家所追求的是控制信息的傳遞,而手藝或者說藝術就是控制的方法:大腦(描繪出藍圖)精確地控制手,手控制筆,筆畫出大腦要的線條。對雕塑家、演員、舞者、作家而言也都是如此。在這個過程中,創作者的意志完全灌注在其作品中:作品100%由大腦構想并實施——如果我刻刀下的蘇格拉底像比其他雕匠鑿子下的更逼真,那我的作品就是杰作。從古代藝術到19世紀的新古典主義藝術都是如此。
這門手藝的核心價值是描繪現實,但在1841年攝影術及伴生的攝像術出現后,它遭到了沖擊。這間接催生了20世紀諸多觀念藝術。這些新的藝術理念不再追求目之所及的真實。受精神分析學的啟發,藝術家們圍繞在“反摹仿”觀念的周圍,開始用藝術探索不可見的內心世界,讓藝術在光學鏡頭和化學藥水無法捕捉到的世界中煥發生機,并發展出了拼貼藝術、超現實主義、達達主義等流派。于是,放棄可見的外部世界,追求表現內心世界成為了一種重要的藝術道路。無論是雨果·鮑爾在《達達主義宣言》中所說的,作品應當“擺脫被遮蔽、被道德化、被歐洲化、被耗盡”[1];還是安德烈·布勒東在《超現實主義宣言》中所說的,在自由最大化的、不帶有任何約束和偏見的、被動和無意識的精神活動中,“每一秒鐘都會有一句與我們清醒的思想并不相干的句子流淌出來”[2],都無不宣告著藝術家想借這種變革創作出反刻板印象的、去掉歷史包袱的、中立的作品。這種中立化的政治訴求,也是20世紀初逐漸出現的技術制(technocracy)的思想產物之一。[3]由于內心世界的獨特性,如此創作的作品帶有明顯的偶然性。放棄控制、認可偶然,也成了觀念藝術的信條之一。在這種理念下,原本的精確控制變成了一種模糊控制。典型的美術作品是杜尚的《被單身漢剝光的新娘》,其中的“婚紗”是由搬運工意外失手造成的。但杜尚對這次意外感到驚喜,認為偶然勝過了藝術家的“手藝”。同樣,在文學界也產生了烏力波運動。這些都是計算機生成藝術的思想來源。
此后很長時間里,藝術家都用近似于自我催眠的方式或借助觀眾的互動來實現偶然性——如瑪麗娜·阿布拉莫維奇的行為藝術作品《節奏0》(Rhythm 0)——直到能制造“偶然”的機器出現,才真正實現了“忘我”。
二、技術革命:從人工模糊到算法模糊
計算機在20世紀末再次掀起了新一輪的技術革命,就像攝影術在20世紀初那樣。如果說化學顯影讓手的精確性落伍了,那么計算機編碼讓腦也面臨類似的危機。
1963年,在第一屆計算機藝術大賽(CAC)上,第一名由美國陸軍彈道研究實驗室創作的作品《飛濺圖》(Splatter Diagram)奪得[4]。這份作品因一次意外而產生,它起初只是計算機測試虛擬彈道時所產生的故障形成的,然而藝術家和理論家很快明白了,算法擁有制作出中立、偶然的作品的潛能。1967 年,不萊梅大學的教授納克(Frieder Nake)利用計算機生成了彩色圖像《漫步光柵3號》(Walk Through Raster, 12.1.1967 Nr.3)[5],展示一種有限的偶然,這是一種可控的不可控。創作者只確定了作品的面積、生成元素的形狀(中空方框)、兩種顏色(橙與黑),但不控制這些元素在這個范圍內如何呈現,這些皆由計算機的隨機數控制。算法生成了一幅抽象畫,在這幅畫中,納克放棄了絕大部分的控制,作品不是由他本人大腦100%構想的,其意志屈從于算法的隨機選擇,從而實現了忘物(沒有德國文化)乃至忘我(沒有納克的選擇)。這就是最早期的計算機進行全自動創作的生成藝術(Gen-Art),也是如今AIGC的起點。它的出現讓傳統的畫筆變成了被文化必然性限制住的保守形式。一些思想家因此渴望通過計算機介入藝術創作帶來文化的解放。
對此學者們持有不同的看法。本塞(Max Bense)保持了樂觀的態度,認為計算機至少比人中立,能測量、統計、歸納并由此創造出所有人都喜愛的作品[1];莫勒(Abraham André Moles)和利奧塔(Jean-Fran?ois Lyotard)則從各個方面對這種樂觀表示了懷疑[2];梅茨格(Gustav Metzger)是最激烈反對計算機中立性的思想家和藝術家,他指出,計算機設備最終會和所有其他技術一樣被資本主義所利用,導致它所產生的內容并沒有任何中立性可言[3]。這些爭論的背后,其實是藝術家作為第一施動者(agent)的主體性問題,也就是藝術家的大腦和手,究竟在計算機輔助的作品創作中發揮了什么不可或缺的積極作用,以及計算機作為第二施動者的黑箱問題,即計算機所生成的內容如何能代表全人類的中立思想。但無論爭議如何,當時的思想家與觀念藝術家一樣,期望計算機能為藝術帶來中立的、反民粹的、反資本的新鮮空氣。這種訴求與二戰后的社會氛圍息息相關。
三、當代精確控制:算法藝術的幼年形態
雖然最早的生成藝術不一定需要計算機參與,只要求有一段脫離創作者控制的程序,它可以是純粹的物理或化學程序(比如梅茨格的一些作品),但經歷80多年的發展,目前生成藝術更多趨向于“算法藝術”,即創作者利用代碼制作的算法進行藝術創作。原理上,它是從隨機像素點的噪聲圖像開始,根據輸入的代碼限定,進而形成可以辨識的圖像,最終將目標優化成接近輸入者意圖的形象。它有兩種實現形式:一是直接通過編碼語言(如Javascript、Java、C/C++、Python、R等語言)實現;二是通過算法庫(如Javascript下的p5.js、three.js)實現。
與早期的計算機生成藝術不同,隨著算法的迭代、算力的增加、大數據的出現,近年來的AI在“筆觸”的控制方面愈發精準。程序在下筆的瞬間,能夠完成人類之手無法完成的肌肉控制。筆觸偶然性的減少,推動了創作者可以在技術層面追求有更高復雜度的畫面內容,因此人像、多人場景代替了抽象畫成為近年的主流。近年在AIGC繪畫比賽中的優勝作品往往都是人像,因為它顯示了算法對描繪人類面部的精準控制,但這似乎又回歸了早年手工繪畫的追求。AI達到了古羅馬雕刻家和文藝復興畫家的水準,但創作者作為第一施動者的控制欲也重新回歸了。可以說,早期計算機藝術家憧憬的是計算機能夠“不似人類”地作畫;而當前AIGC藝術家所追求的則是“更似人類”地作畫。
生成藝術從“反控制”到“控制”的轉變是技術而非觀念導致的。與傳統手工美術在20世紀從“美感藝術”走向“觀念藝術”的路徑不同,生成藝術的路徑是相反的。這并非說兩者有本質的不同,恰恰相反,它們本質是相同的。雖然早期的生成藝術家大多數來自計算機實驗室,但當代的生成藝術家在美術學院受訓,他們重復了傳統手工藝術家所選擇的道路;只不過他們起步晚,因此還在模仿傳統手工藝術的早期階段。事實上,手工藝術也是從抽象(拉斯科洞穴)到具象(古羅馬雕塑)發展的。但因為在新現實主義及攝影術之后,具象技法已經無法再進步,按巴迪歐的說法,具象藝術已經飽和化(saturation)[1],創作范式必須改變,這就導致了觀念藝術的革命。
這種范式革命在短短百年的攝影史中最明顯:因為工具(沖印方式、鏡頭組和濾鏡、三腳架、閃光燈)讓攝影技術很快飽和,攝影師無法創造出比同行更優秀的畫面。因此,21世紀初的攝影家為避免陷入具象的內卷,就轉向虛構的外卷——不再追求呈現紀實畫面,而是變得與20世紀繪畫一樣,探索觀念與風格。繪畫經歷了幾千年成熟和衰老的過程,攝影只用了一百多年就復現了。
因此,生成藝術從“觀念”走向“美感”,是因為它正處在幼年期,其具象技術尚未飽和。當前的生成藝術家致力于學習新代碼,以提升對作品的控制力,這如同早期畫家尋找新植物來制作色彩更準確的顏料。待其飽和之后,生成藝術也會走向與手工畫、攝影一樣的觀念藝術之路,從控制走向偶然。
可以說,“技術”與“觀念”兩個維度的變革在藝術演變的過程中交替出現。當某一種藝術類型在其技術飽和的時代,觀念革命會引領新的潮流(如詩體到散文體的變革);在其觀念飽和的時代,若恰巧出現技術革命,那么也可以為這類藝術注入新活力(如工程學和材料學之于建筑);兩者也可能同時發生。若兩者長期都沒有出現,那么這種藝術類型就會變得陳詞濫調,進而萬馬齊喑。
〔本文系上海市哲學社會科學項目“巴迪歐美學視域下的融媒體數字審美研究”(2022ZWY012)及上海第二工業大學同名項目階段性成果〕
【作者簡介】
范玉吉:華東政法大學傳播學院院長,教授,博士生導師,上海市美學學會副會長。
周 豐:上海社會科學院哲學研究所助理研究員。
張 璐:上海第二工業大學外語與文化傳播學院講師。
(責任編輯 牛寒婷)