How AI Systems Mimic Human Creativity

Innholdsfortegnelse:

How AI Systems Mimic Human Creativity
How AI Systems Mimic Human Creativity
Anonim

Key takeaways

  • DALL·E er et nytt nevr alt nettverk som kan tegne bilder basert på tekst.
  • Nettverket er et av et økende antall AI-prosjekter som kan etterligne menneskers kreative produksjon.
  • Eksperter sier at bilder tegnet av AI ikke er originale kreasjoner.
Image
Image

Flytt over, Picasso. Et nytt nevr alt nettverk kan tegne bilder basert på tekst.

DALL·E, en portmanteau av navnene til kunstneren Salvador Dalí og Pixars WALL·E, kan ta hvilken som helst tekst og lage et bilde fra den. Systemet bruker et nevr alt nettverk som er trent på milliarder av bilder og teksteksempler. Det er et av et økende antall AI-prosjekter som kan etterligne, men ikke gjenskape, menneskers kreative produksjon.

"Fordi naturlig språk er i konstant utvikling, og veldig avhengig av kontekstuelle nyanser, er det en svært viktig prestasjon å lære en maskin å forstå språk godt nok til å tegne et bilde," Tamara Schwartz, professor i cybersikkerhet ved York College of Pennsylvania, sa i et e-postintervju. «Se for deg en politiskissekunstner, det er et sjeldent talent, som har evnen til å lage et bilde basert på en vitnebeskrivelse.»

Using Big Data for å produsere bilder

DALL-E ble opprettet av AI-forskningsselskapet OpenAI og fungerer ved å samle enorme mengder data fra internett. Dataene behandles deretter av en naturlig språkmodell og trenes til å produsere bilder fra tekst. DALL-E fungerer på samme måte som den nylig utgitte GPT-3, en språkmodell laget av OpenAI som kan bli bedt om å generere originale tekstpassasjer. GPT-3 ble trent ved å bruke en halv trillion ord med internetttekst og kan produsere overraskende naturtro tekst.

Å lære en maskin å forstå språk godt nok til å tegne et bilde er en svært viktig prestasjon.

Michael Yurushkin, grunnlegger og CTO av BroutonLab, et datavitenskapsselskap, sa i et e-postintervju at DALL-E er "en av menneskehetens få vellykkede forsøk på å etterligne vår kreativitet og fantasi." Han la til: "Det er lettere å innse hvordan AI forutsier noe ved å gå gjennom relevante data, men det er vanskeligere å forstå hvordan det er i stand til å generere tegninger av ting den aldri har "hørt" om før."

Schwartz er nøye med å merke seg at AI ikke skaper informasjon, men heller tar språkdata og transformerer dem til bilder.

"Den første kreativiteten kommer fra mennesket som konstruerte oppgaven," sa Schwartz. "Det er en viss "kreativitet" hos AI, fordi den eksperimenterer med ulike kombinasjoner av data og deretter velger fra en rekke potensielle utdata. Imidlertid undersøker et menneske utdataene og lærer AI hvordan man velger fra de mange kombinasjonene."

Robotdetektivarbeid?

En maskin kan eksperimentere med denne data- og objektkombinasjonen mye raskere enn en menneskelig kunstner. Schwartz bemerket at DALL-E en dag kunne samarbeide med en detektiv som prøver å rekonstruere et åsted gjennom en skisse, basert på øyenvitne.

"Når vitner avgir sine uttalelser, kan datamaskinen ta den muntlige, naturlige språkinformasjonen og lage en tegning av scenen, eller mange tegninger av scenen," sa hun. "Disse visualiseringene kan deretter integreres for å skape et mer presist bilde av tapte bevis. Denne visualiseringen kan berikes ved å integrere tidligere bilder av stedet før forbrytelsen."

Flere andre AI-drevne programmer kan produsere kunst. For eksempel bruker Ai-Da et robotarmsystem og ansiktsgjenkjenningsteknologi sammen med kunstig intelligens for å lage kunst. Systemet kan analysere et bilde foran maskinen, som mates inn i en algoritme for å produsere robotens armbevegelser.

Menneskelige kunstnere bør imidlertid ikke bekymre seg for at robotoverherrer vil erstatte dem, hevdet Ahmed Elgammal, direktøren for Art and Artificial Intelligence Lab ved Rutgers University, i The New York Times i fjor.

"Selv om definisjonen av kunst er i stadig utvikling, er det i sin kjerne en form for kommunikasjon mellom mennesker," skrev han. "Uten en menneskelig artist bak maskinen kan AI gjøre lite mer enn å leke med form, enten det betyr å manipulere piksler på en skjerm eller notater på en musikalsk hovedbok. Disse aktivitetene kan være engasjerende og perseptuelt spennende, men de mangler mening uten interaksjon mellom artist og publikum."

Etter å ha sett på DALL-Es arbeid, forstår jeg Elgammals poeng om at de AI-skapte bildene ikke er kunst. På den annen side er de bedre enn noen kunst jeg kunne lage. Så, egentlig, hva er forskjellen?

Anbefalt: