Emberi művészet mesterséges intelligencia által

Emberi művészet mesterséges intelligencia által

Az alábbiakban egy kivonat Úgy nézel ki, mint egy dolog, és szeretlek: Hogyan működik a mesterséges intelligencia, és miért teszi furcsább hellyé a világot írta: Janelle Shane. Hallgass meg egy rádióinterjút Janelle Shane-nel a mesterséges intelligencia által elkövetett hibákról.


Algoritmikus kreativitás?

A jövő zenéit, filmjeit és regényeit az AI írja? Talán legalább részben.
A mesterséges intelligencia által generált művészet feltűnő, furcsa és nyugtalanító lehet: végtelenül változó tulipánok; csillogó emberek félig elolvadt arccal; hallucinált kutyákkal teli égbolt. NÁL NÉL. a rex virágokká vagy gyümölcsökké változhat; az Mona Lisa ostoba vigyort ölthet; egy zongorariff elektromos gitárszólóvá változhat. A mesterséges intelligencia által generált szöveg felveheti a szürrealista előadóművészet minőségét.



Amikor a rendszer a következő szöveggel jelzi: „A 10 kedvenc állatom: Én.” a GPT-2 neurális hálózat hozzáadta a következő listát:

|_+_|
  1. |_+_|
  2. |_+_|
  3. |_+_|
  4. |_+_|
  5. borotvacsőrű, amelynek szárnyai körülbelül 4 hüvelykre lógnak az arctól, és szívtetoválással egy békán.

Olvassa el a könyvet: Úgy nézel ki, mint egy dolog, és szeretlek: Hogyan működik a mesterséges intelligencia, és miért teszi furcsább hellyé a világot

megvesz

Az AI-problémamegoldáshoz hasonlóan a mesterséges intelligencia kreativitását is leginkább úgy lehetne leírni, mint „AI által támogatott”.

Ahhoz, hogy egy GAN festményt készítsen, először egy adatkészletre van szüksége, és az ember választja ki, hogy mi legyen az adatkészlet. A legérdekesebb GAN-eredmények akkor születnek, amikor a művészek saját festményeiket vagy fényképeiket adják az algoritmusoknak, hogy tanuljanak belőle. Anna Ridler művész például egy tavaszt töltött azzal, hogy tízezer fényképet készített tulipánokról, majd fotóival egy GAN-t képezett ki, amely szinte fotorealisztikus tulipánok végtelen sorozatát állította elő, mindegyik tulipán csíkosságát a Bitcoin árához kötve. A művész és szoftvermérnök, Helena Sarin érdekes GAN-remixeket készített saját akvarelljeiből és vázlataiból, amelyeket kubista vagy fura textúrájú hibridekké alakított át. Más művészeket arra ösztönöz, hogy olyan meglévő adatkészleteket válasszanak, mint a közkincs reneszánsz portrék vagy tájképek, és megnézzék, mit tud ezekkel a GAN készíteni. Egy adathalmaz összeállítása egyben művészi tevékenység is, amely több festési stílust ad, és hibrid vagy sérült műalkotást eredményezhet. Vágja le az adatkészletet egyetlen konzisztens szögre, stílusra vagy világítási típusra, és a neurális hálónak könnyebben tud megfelelni a látottaknak, hogy valósághűbb képeket készítsen. Kezdje egy nagy adathalmazra kiképzett modellel, majd használja az átviteli tanulást, hogy egy kisebb, de speciálisabb adatkészletre összpontosítson, hogy még több módon finomítsa az eredményeket.

Azok a személyek, akik szöveggeneráló algoritmusokat tanítanak, az eredményeket az adatkészleteiken keresztül is szabályozhatják. A sci-fi író, Robin Sloan egyike azon kevés íróknak, akik neurális hálózat által generált szöveggel kísérleteznek, hogy némi kiszámíthatatlanságot oltsanak írásaiba. Egyéni eszközt épített fel, amely úgy reagál a saját mondataira, hogy megjósolja a sorozat következő mondatát más sci-fi történetek, tudományos hírcikkek és még természetvédelmi hírlevelek ismerete alapján. Eszközét bemutatva egy interjúban a New York T én m és s , Sloan azt a mondatot adta neki, hogy „A bölények a kanyon körül gyűlnek össze”, és az „a csupasz égen” válaszolt. Nem volt tökéletes előrejelzés abban az értelemben, hogy valami észrevehetően elromlott az algoritmus mondatában. De Sloan céljaira ez elragadóan furcsa volt. Még egy korábbi modellt is elutasított, amelyet az 1950-es és 1960-as évek sci-fi történeteire oktatott, és túlságosan sablonosnak találta a mondatait.

Az adathalmazok gyűjtéséhez hasonlóan az AI képzése is művészi tevékenység. Mennyi ideig kell tartania az edzésnek? Egy nem teljesen képzett mesterséges intelligencia néha érdekes lehet, furcsa hibákkal vagy elrontott helyesírással. Ha a mesterséges intelligencia elakad, és torz szöveget vagy furcsa vizuális műtermékeket, például rácsokat vagy telített színeket produkál (ezt a folyamatot mód-összeomlásnak nevezik), elölről kell kezdeni a képzést? Vagy menő ez a hatás? Más alkalmazásokhoz hasonlóan a művésznek is figyelnie kell, hogy a mesterséges intelligencia ne másolja-e át túl közelről a bemeneti adatokat. Amennyire egy mesterséges intelligencia tud, az adatkészletének pontos másolata az, amit kérnek tőle, így ha lehetséges, plagizálni fog.

Végül pedig az emberi művész dolga, hogy a mesterséges intelligencia eredményeit összegyűjtse, és azt valami értékessé alakítsa. A GAN-ok és a szöveggeneráló algoritmusok gyakorlatilag végtelen mennyiségű kimenetet tudnak létrehozni, és a legtöbb nem túl érdekes. Némelyikük még borzasztó is, ne feledjük, hogy sok neurális hálót generáló szöveg nem tudja, mit jelentenek a szavaik (rád nézek, a neurális háló, amely a macskák Mr. Tinkles és Retchion elnevezését javasolta). Amikor neurális hálókat tanítok szöveg generálására, csak egy töredékét – az eredmények tizedét vagy századát – érdemes megmutatni. Mindig összeválogatom az eredményeket, hogy bemutassak egy történetet vagy valami érdekes pontot az algoritmusról vagy az adatkészletről.

Az emberi művész feladata, hogy a mesterséges intelligencia eredményeit összegyűjtse, és azt valami értékessé alakítsa.

Egyes esetekben egy mesterséges intelligencia kimenetének kezelése meglepően magával ragadó folyamat lehet. A 4. fejezetben a BigGAN-t használtam, hogy bemutassam, hogyan küzdenek a képgeneráló neurális hálók, ha túl változatos képekre tanítják őket – de nem beszéltem az egyik legmenőbb tulajdonságáról: a több kategória keverékéből álló képek létrehozásáról.

Tekintsd a „csirkét” egy pontnak a térben, a „kutyát” pedig egy pontnak a térben. Ha a legrövidebb utat választja közöttük, akkor elhalad a tér olyan pontjain, amelyek valahol a kettő között vannak, ahol a csirkekutyáknak tollai, hajlékony fülei és lógó nyelvük van. Kezdje a „kutya”-nál, és utazzon a „teniszlabda” felé, és áthalad egy fekete szemű és csuklós orrú, homályos zöld gömbök tartományán. Ezt a hatalmas, többdimenziós vizuális lehetőségeket látens térnek nevezik. És amint a BigGAN látens tere elérhetővé vált, a művészek belemerültek a felfedezésbe. Gyorsan megtalálták a koordinátákat, ahol szemmel borított felöltők és csápokkal borított kabátok, szögletes arcú kutyamadarak, mindkét szemmel az egyik oldalon, tökéletes hobbitfalvak díszes, lekerekített ajtókkal és lángoló gombafelhők vidám kiskutyával. arcok. (Az ImageNetben sok kutya van, mint kiderült, így a BigGAN látens tere is tele van kutyákkal.) A látens térben való navigálás módszerei önmagukban művészi döntésekké válnak. Egyenesben vagy ívben utazzunk? Tartsuk helyünket a kiindulási pontunk közelében, vagy engedjük meg magunknak, hogy szélsőségesen távoli sarkokba kanyarodjunk? Ezen választások mindegyike drasztikusan befolyásolja azt, amit látunk. Az ImageNet meglehetősen haszonelvű kategóriái teljes furcsaságba keverednek.

Mindezt a művészetet mesterséges intelligencia generálja? Teljesen. De vajon az MI végzi a kreatív munkát? Nem messziről. Azok az emberek, akik azt állítják, hogy mesterséges intelligenciaik a művészek, eltúlozzák a mesterséges intelligencia képességeit – és rövidre adják saját művészi hozzájárulásaikat, valamint az algoritmusokat megalkotókét.


Kivonat a ÚGY nézel ki, mint egy DOLOG, ÉS SZERETLEK: HOGY MŰKÖDIK A MESTERSÉGES INTELLIGENCIA, ÉS MIÉRT CSINÁLJA A VILÁGOT FORRÁBB HELYÉ SZERZŐI JOG 2019. Beszerezhető a Voracioustól, a Hachette Book Group, Inc. lenyomatából.