關於AI藝術的五個論點
我認為 AI 藝術正處於類似早期電影的原始階段,在發展出獨特語言前僅能模仿舊媒介。雖然快速的大眾普及使其顯得平庸,但 AI 最終將賦予個人創作者力量,讓電影與遊戲開發等複雜領域實現民主化。
維吉尼亞·吳爾芙(Virginia Woolf)在電影黎明時期(1926年)寫道,她對這種新媒介是否能長久發展表示懷疑:
「『安娜 [卡列尼娜] 愛上了渥倫斯基』——也就是說,那位穿著黑色天鵝絨的女士倒在了一位穿著制服的紳士懷裡,他們在一間佈置極其精良的圖書館沙發上,以極其多汁、深思熟慮且無窮無盡的手勢接吻,而一名園丁順便在外面修剪草坪。我們就這樣在世界最著名的名著中蹣跚前行。我們用單音節的單字拼湊它們,而且還是用文盲小學生的潦草筆跡寫成的。一個吻就是愛。一個破碎的杯子就是嫉妒。一個笑容就是幸福。死亡就是一輛靈車。這些東西與托爾斯泰寫的小說沒有絲毫聯繫,只有當我們放棄將畫面與書本聯繫起來的嘗試時,我們才能從某些偶然的場景中——比如修剪草坪的園丁——猜測出電影如果聽任其自然發展,可能會做些什麼。但是,它的手段究竟是什麼?如果它不再寄生,它將如何挺胸行走?」
回顧 1911 年版《安娜·卡列尼娜》^([1]) 的片段,你就能明白她的意思。每一個場景都是從一個尷尬的中距離拍攝的。構圖糟糕,動作抖動,像素少得可憐,而且還是單色的。
*攝影機是靜止的,即使動作發生在場景周圍的不同位置。
它讀起來(看起來?)更像是舞台劇的盜版錄影,而不是我們今天所熟知的電影。早期的電影製作人不僅過度專注於改編古典文學作品,而且是透過模仿相鄰的、成熟的媒介來實現的,而不是探索自身媒介的邊界。這種動機是可以理解的:你想利用既有的市場,你不想做太奇怪的事情嚇跑那些妓女投資者,「完美模仿 x」是一個多麼明確的獲勝條件。
我不怪維吉尼亞·吳爾芙懷疑電影是否真的有任何表現手段。但電影業慢慢振作了起來,到了 1955 年他們拍攝我最喜歡的電影《茜茜公主》(Sissi)時,他們已經成功發明了特寫鏡頭、從多個角度拍攝場景,以及色彩和聲音。
然後到了拍攝《芭比》(2024年)時,他們又發明了更多的東西,比如攝影機的縮放和平移、替身演員的把戲(這樣就不需要兩位非常昂貴的電影明星同時出現在片場),以及花費數億美元製作一部電影。
也許這個行業會繼續發明更多的東西!只是這個行業花了幾十年的時間才開始進入狀態,僅此而已。
我不認為這個故事只發生在電影界。《解構反對 AI 藝術的論點》 指出,攝影、錄製音樂以及數位繪圖和編輯工具也存在類似的動態。
2. 快速的大眾普及讓 AI 藝術顯得比實際更平庸
這次的不同之處在於這項閃亮新技術的快速可及性。
極度簡化地說,從歷史上看,新發明往往滲透得非常緩慢:超昂貴的原型機最初僅供少數專注的專家和富有贊助人使用,他們與製造商(或者本身就是製造商)存在緊密的反饋循環,然後是長達數十年的逐漸民主化。想想書籍/手稿、照相機、電影錄影機、個人電腦。這給了文化適應的時間,也讓真正的工藝能與新玩具並行發展。
現在想像一下,如果我們是在智慧型手機已經普及到每個人的口袋之後才發明照相機。在某個平凡的週二早上,地球上的每個人突然都有了一個相機 App。那會產生什麼立即且壓倒性的結果?一場瞬間席捲全球、由最平庸的照片組成的海嘯:海灘日落、可愛女孩、多汁漢堡,以及多到數不清的貓咪照片。
當然,每個人都會爭先恐後地譴責它是一個毫無價值、微不足道的噱頭,完全無法產生任何具有「真正藝術價值™」或任何價值的東西。
也許當他們看到第一張來自活躍戰區、深空或顯微鏡另一端的照片時,他們會改變主意。或者,直到有人想到以極快的速度連續拍攝大量照片(每秒數十次),然後在螢幕上以極高的速度播放這些照片並配上聲音,這一切才會發生。而且我確信,有些人會固執地堅持他們最初那種不屑一顧的反應直到最後,仍然堅持攝影不是一種真正的藝術形式。
我認為我們目前正卡在討論的這一步,但為什麼不呢?吳爾芙在盧米埃兄弟的第一部短片公開放映 30 多年後,發表了她的那封「黑粉信」。這意味著我們可以集體對 AI 藝術保持錯誤看法直到 2050 年,而且仍然算走在時代尖端。
3. AI 藝術將使更多媒介民主化
長篇電影、任何長度的動畫卡通和電子遊戲,都是很難由一個人或少數幾個人完成作品的媒介。團隊對各種事情都有好處,但他們也會束縛你——他們需要資本、管理協調工作,以及磨平藝術願景上的分歧。
2000 年代的音樂界發生了一件美妙的事情,叫做「FL Studio 現在變好用了」。當我還在小學時,兩個只比我大幾歲的孩子在一個製作電子音樂的網路愛好者論壇上相遇。幾乎沒有接受過正式的音樂訓練,主要靠身邊現有的電腦,他們就能創作出小曲子與他人分享並交流技術。
Porter Robinson 和 Madeon 後來創作了定義我青春期的閃耀、高亢的 EDM。他們在過程中學習音樂理論,開始與其他藝術家合作,並繼續創作非常棒的音樂。但在開始時,他們只是在臥室裡瞎搞的青少年。
我希望這能發生在更多媒介上!我想要看到明顯由一個憂鬱青少年製作的前衛卡通,其製作價值能與《獅子王》或《小美人魚》相媲美。我希望它們在網路上爆炸式增長,以至於我們最終對它們帶有一種輕微的蔑視,就像我們今天對待 SoundCloud 饒舌歌手那樣^([2])。我希望電子遊戲的製作對任何 15 歲少年來說,都像錄製臥室流行音樂或拍攝 TikTok 影片一樣容易。是的,變異性會很高,中位數會很垃圾,但那又怎樣?其他一切已經是這樣了,而且我們有篩選技術來處理;好的作品會浮出水面,而我們都會因為有更多樣化的選擇而變得更好。
如果更多的藝術表達模式不再受限於電影攝影機或遊戲引擎的技術專長、實際演奏樂器的熟練程度或色彩理論,那是件好事。強大的 AI 可以讓大眾更容易上手,他們會在過程中學習所需的知識。
4. AI 藝術將促使其他藝術媒介做出有趣的回應
一旦相機可以廉價地捕捉寫實的形象,它就解放了畫家,讓他們能以更多的深思熟慮(或者說是絕望)去探索其他方向。這就是我們得到 印象派^([3]) 以及之後一切的原因:
藝術家不再與攝影競爭模仿現實,而是專注於「一件他們不可避免地比照片做得更好的事情——透過進一步將其在構思圖像時的主觀性發展成一種藝術形式,而這種主觀性正是攝影所消除的」。
舞台劇和電影之間也上演了類似的故事,儘管在較小且較混亂的程度上:
在整個世紀中,戲劇在 19 世紀受到嘲笑後,其藝術聲譽有所提高。然而,其他媒體(尤其是電影)的增長導致其在整個文化中的作用減弱。鑑於這種變化,戲劇藝術家被迫尋求與社會互動的新方式。為回應這一點而提供的各種答案促成了構成其現代史的轉型。
在第一種情況下,人像畫是許多畫家在歷史上被吸引的一個引力點。當這種需求突然消失時,一場生動的藝術運動蓬勃發展,這就是我們擁有莫內和梵谷的原因。在第二種情況下,電影取代了戲劇作為大眾廉價娛樂的角色,然後戲劇也走向了更奇怪的方向(雖然,呃,開誠布公地說,我對這是否是一件好事不太有信心,因為我其實不是實驗劇場的愛好者)。也許今天的電影比原本的樣子更奇怪,如果 YouTube 沒有反過來取代大眾廉價娛樂的位置的話!
我們所理解的藝術媒介,是媒介固有的技術限制和非固有的激勵機制的混合體。在最好的情況下,擺脫某些激勵機制可以使從業者更好地探索其技術能力的廣度。
AI 藝術家將會找到某些目前舊媒介服務得不夠理想的利基市場,這將成為推動舊媒介充分伸展並進行更多探索的動力。^([4]) 我期待看到結果。
關於電影和戲劇,最終還發生了一種非常有趣的雙向性。人員和技術繼續在兩種媒介之間往返流動,這大概是件好事(儘管讓一些戲劇勢利小人感到沮喪)。最近,你知道那個為大眾廉價娛樂新據點製作 《藥水賣家》(Potion Seller) 的傢伙,最後執導了 2024 年最好的電影之一 嗎?
你可以想像某種從 AI 生成媒體中湧現的電影攝影技術,事後看來理所當然,但與電影業目前的發展方向平行。這種技術隨後可以回流到傳統電影製作中。所有的電影裡都應該有更多的「蝦耶穌」(shrimp Jesus),這就是我一直說的。
5. AI 藝術的手段需要時間來顯現
總體而言,當今 AI 的創意應用正陷入與早期電影相同的陷阱:我們用它來生成我們已經熟悉的各類事物:靜態文本、圖像、影片、軟體。我們不讓它展現出 AI 特有的奇異之處。所以現在的問題是:AI 藝術的手段是什麼?
現在還處於非常早期的階段,但我認為 Gary Hustwit 2024 年的紀錄片《Eno》可能具有啟發性。Eno 很少同意拍攝紀錄片,但他是一個新技術愛好者,Hustwit 用 AI 的角度誘使他參與了這部片。總而言之,他最終錄製了 30 小時與 Eno 的訪談,並分別收集了 500 小時的檔案素材。然後他手動為每一段影片分配權重,並創建了一種演算法,為每次放映生成一部獨特的 90 分鐘紀錄片。你可以在這裡看預告片,但要看真正的紀錄片,你需要去戲院看一場專屬的放映。
Ben Davis 可能是我最喜歡的當代藝術評論家。他寫道:
「我已經看過三次《Eno》了。我愛 Brian Eno,所以這不是件苦差事,我可以說每個版本都包含了一些可能在 Eno 職業生涯的某個敘述中處於核心地位的事件,而其他兩個版本則沒有包含。... 語調是一致的,且始終感人……我想像,要組裝所有的部分並加權所有的概率來生成這種一致的個性是非常、非常困難的——這可能需要更多的勞動,而不是更少。」(強調為我所加)
(這是一部很棒的紀錄片!如果你能趕上放映,一定要去看。但是,呃,如果你去了,你應該祈禱能看到一個大衛·鮑伊比 U2 更多的剪輯版本。Davis 再次寫道:「誠然,說你因為一件藝術品的『個性』而觀看它,也意味著你可能會在它狀態好或不好的日子遇到它。」)
除了實驗紀錄片,涉足 AI 的藝術家還在做很多其他事情!比如,嗯姆姆姆,從 iPhone 備份中製作一個你 16 歲時的印象,然後讓你與一個扮演那個角色的 LLM 交談。喔,呃呃呃,讓人類每週對數千件生成的作品進行投票,然後最好的作品會被鑄造成 NFT?
好吧,聽著,我完全承認目前這些都不怎麼好。但真的沒有理由期望它現在就好;我們現在使用的是相當於針孔照相機的東西,知識體系尚未建立。
但這將是一個非常短暫的現狀,特別是如果資本繼續流動的話。技術將會改進,創作者將會根據效果進行更新,我們將會弄清楚什麼是最佳實踐,以及應該避開什麼。
我們需要大約三十年的時間來弄清楚這些破事!讓它醞釀吧!就讓 AI 醞釀吧。肯定不會有什麼壞事會因為讓 AI 醞釀三十年而發生。
-
^(^) 吳爾芙觀看的可能是 1920 年的改編版,但遺憾的是我在網上找不到那個版本。
-
^(^) 我也恰好認為 SoundCloud 饒舌歌手可以非常出色,但這與主題無關。
-
^(^) 需說明的是,這是當時藝術家探索的更廣泛的文化、哲學和藝術問題中的一個因素,但我的理解是,這是一個重要的因素。
-
^(^) ……在最好的情況下。在最壞的情況下,它們會萎縮並消亡。但這是我願意做出的犧牲 o7
相關文章