Midjourney-grunnlegger David Holz om virkningen av AI på kunst, fantasi og den kreative økonomien

midt på reisen er en av de ledende driverne for den nye teknologien for å bruke kunstig intelligens (AI) for å lage visuelle bilder fra tekstmeldinger. Den San Francisco-baserte oppstarten kom nylig med nyheter som motoren bak kunstverket som vant en pris i en delstatskonkurranse i Colorado, og det er neppe det siste kompliserte problemet som AI-kunst vil møte i de kommende årene.

Midjourney skiller seg fra andre i rommet ved å fremheve den maleriske estetikken i bildene den produserer. Plattformen prøver ikke å lage fotorealistiske bilder som kan forveksles med fotografier, og administrerende direktør David Holz sier at han personlig er veldig urolig over den uhyggelige kvaliteten på deepfakes og annet arbeid som simulerer virkeligheten for tett. I stedet sier Holz at Midjourney er designet for å låse opp kreativiteten til vanlige mennesker ved å gi dem verktøy for å lage vakre bilder bare ved å beskrive dem.

Men til tross for det humanistiske, forbrukerorienterte fokuset til selskapet, er det uunngåelige spørsmål om implikasjoner for kommersiell kunst og profesjonelle kunstnere. Jeg intervjuet Holz for en bredere del om de potensielle forstyrrelsene AI-kunst sannsynligvis vil forårsake i produksjonen av bilder for underholdning, videospill og publisering. Her er et lengre utdrag fra samtalen vår der Holz gir mer dybde og kontekst når han tar opp disse problemene og forklarer sin visjon for selskapet, industrien og teknologien. Intervjuet er redigert for lengde og klarhet.

Rob Salkowitz, Forbes-bidragsyter: Hva er din rolle og tittel?

David Holz, Midjourney. Jeg er grunnleggeren og administrerende direktør. Jeg foretrekker vanligvis bare å bli kalt grunnleggeren, fordi administrerende direktør høres veldig forretningsmessig ut, og vi er ikke veldig forretningsdrivende. Vi er et anvendt forskningslaboratorium som lager produkter.

Hva er Midjourneys oppdrag?

Vi liker å si at vi prøver å utvide fantasien til den menneskelige arten. Målet er å gjøre mennesker mer fantasifulle, ikke lage fantasifulle maskiner, noe jeg synes er et viktig skille.

Kan du gi en kort historie om selskapet så langt?

Vi begynte å jobbe med fantasidelen av selskapet vårt for omtrent halvannet år siden. Det var noen gjennombrudd på diffusjonsmodeller, folk som forstår klipp, openAI, den slags ting. Nesten alle som er involvert i dette er San Francisco, og vi innså alle at dette kommer til å bli alvorlig, at det er forskjellig fra mange andre ting.

Hva ser Midjourney på som fordelen med denne tekst-til-bilde-teknologien for næringslivet og samfunnet?

Jeg er definitivt mer opptatt av samfunnet enn næringslivet. Vi er et forbrukerprodukt, men kanskje 30–50 % av brukerne våre akkurat nå er profesjonelle. Flertallet er ikke det. Kunstnere på plattformen forteller oss at den lar dem være mer kreative og utforskende i begynnelsen, og komme opp med mange ideer på kort tid.

Akkurat nå bruker våre profesjonelle brukere plattformen for konsept. Den vanskeligste delen av [et kommersielt kunstprosjekt] er ofte i begynnelsen, når interessenten ikke vet hva de vil ha og må se noen ideer å reagere på. Midjourney kan hjelpe folk å konvergere til ideen de vil ha mye raskere, fordi det er veldig arbeidskrevende å iterere på disse konseptene.

En annen fordel for kunstnere er at det gir folk selvtillit på områder de ikke er trygge på. De fleste om ikke alle kunstnere føler at det er en del av kunsten de ikke kan gjøre det bra. Det kan være farger, komposisjon, bakgrunner. Vi har en kjent karakterdesigner som bruker produktet vårt, og folk spør ham hvorfor du vil bruke en AI siden du allerede er så god. Og han sa, "vel, jeg er bare god på karakterdelen. Dette hjelper meg med resten, verden, bakgrunnen, fargene.»

Omtrent hvor mange bruker produktet?

Millioner bruker det. Vår Discord er over to millioner. Det er den største aktive Discord-serveren til nå.

Tillater Midjourneys lisens kommersiell bruk av bilder generert av plattformen?

Ja. Men hvis du jobber for et selskap som er større enn en million dollar i årlig omsetning, ber vi deg kjøpe en bedriftslisens.

Hvordan ble datasettet bygget?

Det er bare en stor skrap av Internett. Vi bruker de åpne datasettene som er publisert og trener på tvers av disse. Og jeg vil si at det er noe 100 % av folk gjør. Vi var ikke kresne. Vitenskapen utvikler seg virkelig raskt når det gjelder hvor mye data du virkelig trenger, kontra kvaliteten på modellen. Det kommer til å ta noen år å virkelig finne ut av ting, og innen den tiden har du kanskje modeller som du trener med nesten ingenting. Ingen vet egentlig hva de kan gjøre.

Søkte du samtykke fra levende kunstnere eller arbeid fortsatt under opphavsrett?

Nei. Det er egentlig ikke en måte å få hundre millioner bilder og vite hvor de kommer fra. Det ville vært kult om bilder hadde metadata innebygd i dem om opphavsrettseieren eller noe. Men det er ikke en ting; det er ikke et register. Det er ingen måte å finne et bilde på Internett, og deretter spore det automatisk til en eier og deretter ha noen måte å gjøre noe for å autentisere det.

Kan artister velge bort å bli inkludert i dataopplæringsmodellen din?

Vi ser på det. Utfordringen nå er å finne ut hva reglene er, og hvordan man kan finne ut om en person virkelig er kunstneren til et bestemt verk eller bare setter navnet sitt på det. Vi har ikke møtt noen som vil ha navnet sitt tatt ut av datasettet.

Kan artister velge bort å bli navngitt i ledetekster?

Ikke akkurat nå. Vi ser på det. Igjen, vi må finne en måte å autentisere disse forespørslene på, noe som kan bli komplisert.

Hva sier du til kommersielle artister som er bekymret for at dette vil ødelegge levebrødet deres? På et visst tidspunkt, hvorfor skulle en art director ansette en illustratør for å produsere arbeid som konseptkunst, produksjonsdesign, bakgrunner – den slags ting – når de bare kan skrive inn spørsmål og få nyttig utgang mye raskere og til mye lavere kostnad?

Det er fortsatt mye arbeid. Det er ikke bare som "lag meg en bakgrunn." Det kan være ti ganger mindre arbeid, men det er mye mer arbeid enn en leder kommer til å gjøre.

Jeg tror det er to måter dette kan gå. En måte er å prøve å gi samme innholdsnivå som folk forbruker til en lavere pris, ikke sant? Og den andre måten å gå frem på er å bygge mye bedre innhold til prisene vi allerede er villige til å bruke. Jeg opplever at de fleste, hvis de allerede bruker penger, og du har valget mellom vilt bedre innhold eller billigere innhold, faktisk velger vilt bedre innhold. Markedet har allerede etablert en pris som folk er villige til å betale.

Jeg tror at noen vil prøve å kutte artister ut. De vil prøve å lage noe lignende til en lavere pris, og jeg tror de vil mislykkes i markedet. Jeg tror markedet vil gå mot høyere kvalitet, mer kreativitet og mye mer sofistikert, mangfoldig og dypt innhold. Og de som faktisk er i stand til å bruke liker artistene og bruke verktøyene til å gjøre det, er de som kommer til å vinne.

Disse teknologiene skaper faktisk en mye dypere forståelse og leseferdighet i det visuelle mediet. Du kan faktisk ha etterspørselen, overgå evnen til å produsere på det nivået, og så kanskje du faktisk øker lønningene til artister. Det kan være rart, men det er det som kommer til å skje. Tempoet i den etterspørselen øker for både kvalitet og mangfold vil føre til at noen fantastiske og uventede prosjekter blir laget.

En generasjon studenter ble uteksaminert på kunstskoler, mange av dem med stor gjeld, og regnet med relativt godt betalte jobber innen underholdningsproduksjon, videospillproduksjon, kommersiell kunst og så videre. Hvordan påvirker fremveksten av AI tekst-til-bilde-plattformer fremtiden deres?

Jeg tror noen vil prøve å kutte kostnader, og noen vil prøve å utvide ambisjonene. Jeg tror de som utvider ambisjonene fortsatt vil betale alle de samme lønningene, og de som prøver å kutte kostnader tror jeg vil mislykkes.

Ai brukes vanligvis i stor skala til ting som telefonsentre eller innsjekking av bagger på flyplasser og den typen jobb som folk egentlig ikke bryr seg om å gjøre. Og verdiforslaget er at det frigjør folk til å gjøre mer givende, mer interessante typer jobber. Men kunstjobber er givende og interessante. Folk jobber hele livet og utvikler ferdighetene sine for å få denne typen jobber. Hvorfor vil du peke denne teknologien på det nivået av økonomien som et slags forretningsfokus og prioritet for tingene du gjør?

Personlig er jeg ikke det. Tingene mine er ikke laget for profesjonelle artister. Hvis de liker å bruke det, så er det flott. Tingene mine er laget for folk som, som, det er denne kvinnen i Hong Kong, og hun kom til meg, og hun sier: «Den eneste tingen i Hong Kong som foreldrene dine aldri vil at du skal være, er en artist, og jeg er bankmann nå. Jeg lever et godt bankliv. Men med Midjourney nå begynner jeg faktisk å få en smak av denne opplevelsen av å være den personen jeg faktisk ønsket å være.» Eller en fyr på lastebilstoppet som lager sine egne baseballkort med ville bilder, bare for moro skyld. Den er laget for disse menneskene, fordi, som folk flest, får de aldri gjort disse tingene.

Det er viktig å understreke at dette ikke handler om kunst. Dette handler om fantasi. Fantasi brukes noen ganger til kunst, men det er det ofte ikke. De fleste av bildene som er laget på Midjourney blir ikke brukt profesjonelt. De blir ikke engang delt. De blir bare brukt til disse andre formålene, disse menneskelige behovene.

Ikke desto mindre er resultatet av produktet ditt bilder, som har kommersiell verdi i profesjonell sammenheng i tillegg til alle disse andre egenskapene. Og dette er veldig forstyrrende for den økonomien.

Jeg tror det er som om vi lager en båt, og noen kan rase med båten, men det betyr ikke at båten handler om kappseiling. Hvis du bruker båten til å kappseile, så kanskje, ja, visst. I det øyeblikket er det. Men den menneskelige siden er virkelig viktig, og jeg tror at vi ikke er... Vi ønsker å få bilder til å se pene ut. Vi ser ikke på oss selv som å prøve å skape kunst som en del av vår greie. Vi vil at verden skal være mer fantasifull. Vi vil heller lage vakre ting enn stygge ting.

Tror du at noen statlige organer har jurisdiksjon eller myndighet til å regulere denne teknologien? Og i så fall, synes du de burde?

Jeg vet ikke. Regulering er interessant. Du må balansere friheten til å gjøre noe med friheten til å bli beskyttet. Teknologien i seg selv er ikke problemet. Det er som vann. Vann kan være farlig, du kan drukne i det. Men det er også viktig. Vi vil ikke forby vann bare for å unngå de farlige delene.

Vel, vi vil være sikre på at vannet vårt er rent.

Ja, det er sant.

Kilde: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- kreativ-økonomi/