Automatizacija umjetnosti

Kada ih se sagleda iz materijalističkog ugla, alati bazirani na umjetnoj inteligenciji zapravo služe komodifikaciji podataka dostupnih na internetu.

piše:

Krajem kolovoza u američkoj državi Colorado u sklopu lokalnog festivala održano je natjecanje likovnih umjetnosti (engl. fine arts). Osim za tradicionalne kategorije poput fotografije, slikarstva i kiparstva, poziv je također bio otvoren za radove iz digitalnih umjetnosti i digitalno manipulirane fotografije. Upravo se pobjednički rad u potonjoj kategoriji pobrinuo da jedno lokalno natjecanje održano u sklopu državnog sajma dobije znatnu količinu pozornosti na društvenim mrežama i medijima diljem svijeta. Rad pod imenom Théâtre D’opéra Spatial kreiran je pomoću automatiziranog generatora slika Midjourney – drugim riječima, autor rada je tek unio niz tekstualnih uputa, pričekao nekoliko trenutaka dok je algoritam istreniran na javno dostupnim podacima generirao originalnu sliku te zatim između više rezultata odabrao onu kojom je bio najzadovoljniji. Odabir žirija da nagradu od 300 dolara dodijeli djelu koje je gotovo samostalno kreirao softver potaknula je mnoge da preispitaju implikacije te odluke za budućnost umjetničkog rada i umjetnosti same.

Zapravo je bilo neizbježno da se prije ili kasnije pojavi neka slična, pomalo sokalovska priča. Naime, razni alati bazirani na takozvanoj umjetnoj inteligenciji postaju sve dostupniji široj javnosti. Tako je prije dvije godine tvrtka OpenAI predstavila GPT-3, jezični model izgrađen na golemoj količini tekstualnih podataka pomoću procesa strojnog učenja – to jest, procesa automatiziranog programiranja koje na temelju dostupnih podataka obično preuzetih s interneta i niza posebnih algoritama stvara digitalne modele koji bi inače zahtijevali značajne količine ručnog programerskog rada. Zbog navodnog straha od zlouporabe, OpenAI nije dopustio slobodan pristup svom jezičnom modelu, već ga naplaćuje tvrtkama koje model koriste za gradnju raznih aplikacija. Međutim, pristup je ipak omogućen pojedinim istraživačima i novinarima. Tako je britanski The Guardian objavio op-ed koji je kompletno napisan pomoću GPT-a 3, dok je tijekom jednog istraživanja u GPT-3 ubačen opus Daniela Denetta kako bi se testiralo laike i stručnjake u kojoj mjeri mogu razaznati je li autor teksta stroj ili poznati filozof. Pokazalo se da su obje grupe imale poteškoća sa zadatkom, što ukazuje na visoku razinu sofisticiranosti modela ili, u zlobnijoj interpretaciji, da je filozofski žargon dosta lako oponašati generatorom fraza. Nakon što su jezični modeli poput GPT-a već pronašli svoju mejnstrim primjenu u olakšavanju pisanja – kako marketinških tekstova, tako i proze – dostupni su postali i još spektakularniji alati za automatizaciju stvari za koje se činilo kako ih nije moguće automatizirati.

Upravo generatori slika kao što su Dall-E 2 tvrtke Open AI, Googleov Imagen, već spomenuti Midjourney i Dall-E Mini zadnjih mjeseci zaokupljaju maštu mnogih. Ponovno je riječ o različitim digitalnim modelima, ovaj put istreniranim na vizualnim materijalima, koji omogućuju prevođenje opisa unesenog u prirodnom jeziku u sliku. U suštini, moguće je stvoriti vizualne reprezentacije gotovo svega što možemo zamisliti u bilo kojem stilu koji želimo – od fotografskog i nadrealističkog do mimike stilova individualnih poznatih umjetnika. Iako je pristup navedenim generatorima ograničen – deklarativno zbog brige oko etičnosti i moguće zlouporabe, ali vjerojatnije zbog monetizacije i visokih energetskih troškova – pojavile su se i opensource alternative koje su se unatoč znatno slabijoj kvaliteti slika pobrinule da feedovi društvenih mreža postanu zatrpani maštovitim kreacijama poput: neprekidnih nizova Homera Simpsona u stilovima različitih filmova, Borisa Johnsona koji se svađa s labudovima, Isusa na poznatoj pozadini Windowsa XP ili pak kao gosta u policijskog drami iz osamdesetih, goleme lignje koja sastavlja Ikein namještaj, itd. Međutim, sadržaj je najbolji u trenucima kada nešto pođe krivo – prepoznatljivi glitcheviti i pomalo uznemirujući uradci nastali korištenjem opensource alata Dall-E Mini imaju čak i određene značajke nečeg originalnog.

Kao što se iz gore spomenutih primjera može primijetiti, korisnici_ce imaju tendenciju povezivati udaljene i proizvoljne ideje – posebno iz sfere pop kulture – koje u slučajevima kad bi njihova kreacija zahtijevala veću količinu rada vjerojatno nikad ne bismo imali prilike vidjeti. Drugim riječima, dostupnost automatiziranih generatora slika omogućila je brojnim ljudima da bez mukotrpnog rada i višegodišnjeg vježbanja ilustriranja, skiciranja ili slikanja stvore vizualne reprezentacije ideja koje su dosad bile ograničene tek na maštarenje. U boljim bismo okolnostima možda mogli biti oduševljeni novim oblicima umjetnosti, “demokratizaciji” kreativnosti, načinima na koje će se potencijalno izmijeniti digitalna komunikacija, no lakoća kojom je moguće kreirati slike u mnogima izaziva određenu količinu zazora – pogotovo kada se u obzir uzmu lekcije o načinim rada digitalnih kompanija usvojene u toku prošlog desetljeća. Stoga se u vrijeme kada dezinformacije, teorije zavjera i lažne vijesti nagrizaju povjerenje u institucije, mogućnost neograničenog stvaranja proizvoljnih vizualnih reprezentacija mnogima čini kao neodgovorno dodavanje ulja na vatru.

Međutim, kad su u pitanju automatizirani sustavi bojazan o načinima na koje će utjecati na tržište rada pojavljuje se na vrhu ljestvice briga. Dostupnost generatora slika je zapravo prvi slučaj u kojem je ljudski rad direktno i vidljivo zamjenjiv umjetnom inteligencijom. Rad umjetnica, ilustratora i dizajnera ionako je potplaćen ili čak neplaćen, a sada se na tržištu pojavio još jeftiniji način proizvodnje sadržaja koji pruža itekako zadovoljavajuće rezultate, što opravdano uzrujava mnoge. Primjerice, Charlie Warzel, pisac newslettera za američki magazin The Atlantic, nedavno je na vlastitoj koži iskusio bijes umjetnika na Twitteru. Pripremajući newsletter o suđenju Alexu Jonesu, poznatom voditelju nebulozne desničarske emisije, umjesto da iskoristi neku stock fotografiju ili angažira ilustratora, Warzel je tekst odlučio opremiti pomoću Midjourneyja. Iako nije djelovao u lošoj vjeri ili s eksplicitnom namjerom da nekome uskrati priliku za posao, Warzel se ipak našao na meti oštrih kritika.

“Ono što me zabrinjava u mom slučaju je to što je Midjourney bio tako jednostavan za korištenje, tako lako dostupan, i k tome je riješio problem (apstrahiranje Jonesove slike na vizualno privlačan način), a da pritom nisam trebao potrošiti puno vremena, ili imao bilo kakav poticaj zastati i razmisliti. Lako mi je zamisliti da i drugi upadnu u ovo kao ja”, napisao je Warzel u samokritičkom osvrtu na čitav slučaj. Međutim, unatoč reakcijama koje dolaze iz umjetničkih krugova i online zajednica, mediji u sve većoj mjeri počinju koristiti generatore slika umjesto angažiranja ilustratora, čemu, između ostalog, svjedoči i naslovnica nedavnog izdanja The Economista.

Iako možda na prvu ruku nije očigledno što je problematično u korištenju neke nove tehnologije, u slučaju generatora slika situacija nije tako jednostavna. O nepoštenim praksama mnogo govori činjenica da su digitalni modeli kojima ih se sad zamjenjuje i istiskuje s tržišta, dijelom izgrađeni i na radovima samih živućih umjetnika i umjetnica. Stavljanjem vlastitih radova na internet dizajneri, fotografkinje i ilustratori riskiraju da će biti iskorišteni u treniranju i poboljšanju algoritama koji ugrožavaju njihovu egzistenciju. Velike digitalne kompanije koriste automatizirane alate kako bi sakupile dostupne tekstove, snimke, zvukove i slike stvorene entuzijazmom nebrojenih ljudi i pretvaraju ih u robu bez eksplicitnog pristanka – pritom ne mareći previše ni o izrabljivanju rada osoba iz siromašnih područja koje koriste za ručno označavanje podataka ili o tome da njihovi modeli okoštavaju sve seksističke, rasističke i šovinističke predrasude kojih je materijal pokupljen s interneta prepun.

Kako je to na svojem Instagram profilu sažeo umjetnik David O’Reilly, “koristeći milijune dolara od ulagača, Dall-E je požnjeo goleme količine ljudske kreativnosti koju nije platio, koju ne posjeduje i čije zasluge ne kreditira, ali unatoč tome zahtijeva vlasništvo nad svime što napravite (pronađete) s njim. Plaćanje te usluge koristi isključivo tehnološkoj tvrtki koja parazitira na stoljećima ljudskog truda – što je sranje. Dall-E potkopava rad kreatora svih vrsta, najočiglednije fotografa, ilustratora i konceptualnih umjetnika koji su dijelili svoje radove na internetu, a nikada nisu pristali na to da budu uključeni u aproprijacijski model strojnog učenja. Radi se o otimanju od prošlih generacija koje se zatim naplaćuje. Čista prevara.”

Dakle, kada ih se sagleda iz materijalističkog ugla, automatizacijski sustavi poput onih koje nazivamo umjetnom inteligencijom zapravo služe komodifikaciji raznih vrsta neuređenih ili strojno nečitljivih podataka dostupnih na internetu – ukratko, komodifikaciji zajedničkih dobara. Unatoč tome što su podaci u principu dostupni svima, treniranje tekstualnih i vizualnih modela iziskuje golemu komputacijsku moć koju posjeduje tek nekolicina velikih tehnoloških kompanija – iako se konačno pojavljuju i napori koji nisu financirani privatnim kapitalom. Međutim, rješenje nije u jednostavnom odbacivanju tehnologije. Kako je to u nedavnom intervjuu sažeo teoretičar Evgenij Morozov, “još uvijek moramo artikulirati – a potom i implementirati – viziju kako sve te tehnologije učiniti funkcionalnima za sasvim drugačiji politički i ekonomski projekt, onaj koji bi se bavio problemima poput klimatskih promjena i nejednakosti – i nadamo se da bi to učinio bez žrtvovanja tehnoloških alata i znanosti.”

Ovaj članak objavljen je u sklopu projekta Kultura na prekretnici koji je sufinanciran sredstvima Fonda za poticanje pluralizma i raznovrsnosti elektroničkih medija.