Hem Underhållning Hallucinatorisk AI-konst tar över på sociala medier

Hallucinatorisk AI-konst tar över på sociala medier

förbi admin
0 kommentar

Teddybjörnen Paddington är på en abortklinik. Jesus Kristus släpper en atombomb. Freddie Mercury äter ramennudlar inuti en tvättmaskin.

Dessa hallucinatoriska motiv, och flera andra, har på sistone tapetserat sociala medier med bilder i ett rutsystem om nio paneler. De är skapade av AI-appen Dall-E, namnet är en fonetisk legering av surrealisten Dali och roboten Wall-E. Appen omvandlar inskriven text till bilder. Modellen har tränats genom att titta på miljontals bilder på internet med tillhörande bildtexter. Så småningom har AI:n lärt sig att vända på processen, det vill säga rita en bild utifrån textangivelse.

Men någonting är konstigt med bilderna. Inte bara att motiven är bisarra, där grundregeln tycks vara att en känd person (rapparen Snoop Dogg) placeras i en så apart miljö som möjligt (slaget vid Gettysburg).

Nej, det som gör att bilderna verkligen fångar blicken är att någonting är lite fel i dem. Ansikten är förvridna, anletsdrag uttänjda, fingrar har sju leder, ett öra har blivit köttigt och missfärgat. Resultatet är mardrömslikt på ett sätt som bara Bosch eller Brueghel har kommit nära, men liknar inget som skulle kunna födas i ett mänskligt sinne.

Jag tittar på min egen skapelse ”Leif GW äter en polkagrisstång” och världen var definitivt en bättre plats innan de bilderna skapades – på de flesta av dem ser den berömde kriminologen ut att sluka stängerna med sina näsborrar. Motiven är helt enkelt hemska.

– Det är intressant att du säger ”hemsk”, som kommer av ordet ”hem”, något vi är hemma i, säger Jonna Bornemark, professor i filosofi som forskar på artificiell intelligens.

– Vi känner igen bildens beståndsdelar eftersom de är mänskligt producerade, men när de speglas i det här mediet och den tekniska processen med alla enorma data som måste hanteras blir det förvridet och obehagligt. Det som på tyska kallas unheimlich, att något inte står rätt till.

Den version av Dall-E som är öppen för och testas av allmänheten heter Mini och är en mindre kraftfull version av den ännu inte släppta Dall-E: Mini är 27 gånger mindre och tränad på 15 miljoner matchningar mellan bild och text (jämfört med den fullskaliga varianten som tränats på 250 miljoner matchningar). Så illustrationerna som produceras är ett slags medelvärde av träningsbilderna: nästan trovärdiga, men uppfattas ändå som konstiga.

– Det blir som en skrattspegel. De läskiga sidorna kommer fram när vi kastas ut ur oss själva, det väcker känslor i oss som är roliga att vara i, men också lite obehagliga, säger Bornemark.

Jonna Bornemark

Foto: Linnéa Jonasson Bernholm / Appendix fotografi

Den starka känsloeffekten är också bidragande till att de blivit så framgångsrikt virala. Twitterkontot Weird Dall-E Generations har 700 000 följare och samlar alla märkliga önskningar och dess förverkliganden. Här finns verken ”Jesus korsfäst på månen under Apollo 11-landningen”, ”Robotdammsugare i Marianergraven” och ”Rocky Balboa slåss mot Michelingubben”. Många bilder är förlagda till Nürnbergrättegångarna eller slutna psykiatrianstalter. Bilderna är så bisarra – och inte sällan stötande – att de lyckas bryta igenom flödet av sinnesintryck på sociala medier.

Att mata en AI med konstiga spörsmål påminner om när smarta assistenter som Siri och Alexa lanserades. Då uppstod en tävling bland användare att ställa besynnerliga frågor till dem. ”Kan du ta livet av dig, Alexa?”, ”Tror du på Gud, Siri?”, ”Tycker du att jag är tjock?”. Att söka humor i en situation gör folk mest hela tiden, men det sker något särskilt när AI är inblandat, säger Richard Johansson, universitetslektor på Institutionen för data- och informationsteknik på Chalmers.

– Visst blir det en extra humornivå just eftersom vi använt AI för att rita bilden. Om man själv hade ritat bilden hade det inte varit lika kul. Textgenererande AI-program brukar kallas ”stochastic parrots”, och det är kanske något liknande som att det är komiskt om en papegoja säger något absurt? Återigen, om man själv sagt samma sak hade det väl inte varit något särskilt.

Men de märkliga Dall-E-skapelsernas experimentlusta handlar även om att testa systemets gränser. Man vill veta hur avancerat det är. Vad är vitsen med att be det rita en sommaräng i full blom när den kan visa Paddington på en abortklinik? Så vi ger Dall-E allt svårare och svårare uppgifter, alltmer skruvade, för att se hur nära ett verklighetstroget resultat den kommer, men även hur galet det blir när den gör fel.

Enligt Jonna Bornemark är alla bisarra indata, allt trams och tänjande på den goda smaken vanligt när människor möter AI.

– Det finns en fascination i att världen pratar tillbaka till oss, att det inte bara är vår värld, utan att det finns andra perspektiv där ute. Då är det spännande att ställa sig i dialog med det: ”Vad händer om jag gör så här?” Det blir en annan experimentlusta än med levande varelser, för man kan även vara sadistisk och få utrymme för alla sådana sidor.

Ett exempel är när Microsoft lanserade chattboten Tay på Twitter 2016 för att den skulle lära sig förstå konversation. Det tog det inte lång tid – mindre än 24 timmar – innan den assimilerat allt uselt med internet och blivit en kvinnohatisk och transfob rasist. Sedan dess tränas de flesta AI-modeller i slutna miljöer och på färdiga data snarare än att göra användarna delaktiga.

Men inte ens det är en garanti för att AI:n inte skulle bli fördomsfull eller snedfördela, säger Bornemark.

– Amazons anställningsrobot är ett exempel på när vi försökt göra neutrala beslutsfattare av AI. Men eftersom den matades med alla underlag om vilka som tidigare klarat arbetsansökan blev AI:n misogyn och rasistisk i sitt urval. AI:n summerar bara det vi stoppar in, och med det kommer oundvikligen mänskliga värderingar. Men mänskliga värderingar är inget vi ska försöka bli av med utan något vi måste odla.

”Jesus stjäl en cykel”

”Jesus stjäl en cykel”

Foto: Dall-E Mini

Kanske kan Dall-E:s bilder fungera på samma sätt. De blir speglande illustrationer av människans drömmar – de fantasifulla önskningarna är ju ett utslag av mänsklig inbillningsförmåga snarare än AI:ns kreativitet: ett färdigmålat Rorschachtest av vårt kollektiva, undermedvetna synsätt sammanställt på nio paneler.

Eller så är en bild på Jesus som stjäl en cykel bara en bild på Jesus som stjäl en cykel.

Du kanske också gillar