Een creatieve nieuwe wereld met generative AI

10 maart 2023

Leestijd 10 minuten

Mensen zijn vrij goed in het analyseren van dingen, maar machines nog veel beter. Machines kunnen reeksen gegevens analyseren en daar patronen in herkennen voor een groot aantal toepassingen. Ze worden steeds slimmer. Dit noemen ze artificial intelligence (AI).

Naast dat wij mensen goed kunnen analyseren, kunnen we ook heel goed dingen creëren. Denk aan het schrijven van teksten, het ontwerpen van producten of code schrijven. Tot voor kort konden machines het creatieve werk van mensen niet overnemen, maar zelfs daarin worden de machines slimmer. Machines kunnen nu ook zelf dingen creëren, zonder dat het al bestaat. Dit noemen we generative AI. In dit artikel lees je over het marktlandschap, de modellen en toepassingen van generative AI.

Generative AI

De ontwikkelingen binnen generative AI gaan hard. Ze zullen niet alleen sneller en goedkoper worden, maar soms zelfs beter worden dan wat de mens creëert. Elk beroep waarbij het maken van origineel werk een groot onderdeel is, is aan herziening toe. Sommige functies zullen volledig vervangen kunnen worden door generative AI. In andere functies zal het juist toegepast worden om het werk sneller, makkelijker en beter te maken.

Waarom moet je het nu gebruiken?

Voor generative AI geldt hetzelfde als AI in het algemeen: betere modellen, meer gegevens, meer computers. Generative AI verandert zo snel dat we het amper kunnen bijhouden. Daarom de verschillende golven van generative AI in grote lijnen op een rij:

Golf 1. Kleine modellen voeren de boventoon

Voor 2015 heersten de kleine modellen. Deze modellen kunnen goed worden ingezet voor analytische taken als levertijdvoorspelling en fraudeclassificatie. Voor algemene generatieve taken zijn ze niet uitgebreid genoeg. Het genereren van tekst of code op menselijk niveau was toen dus nog ver weg.

Golf 2. De race op schaalbaarheid

De tweede golf loopt vanaf 2015 tot op heden. De modellen wordt steeds groter en beginnen op bovenmenselijk niveau te leveren. GPT-3 van OpenAI springt eruit; het levert sprekende demo’s voor taken als het genereren van codes tot het schrijven van flauwe grappen. Ondanks al het onderzoek zijn de modellen niet veel verspreid. Ze zijn groot en moeilijk te draaien, niet breed toegankelijk en duur om als clouddienst te gebruiken. Toch beginnen ook de eerste generative AI-toepassingen.

Golf 3. Beter, sneller en goedkoper

Vanaf 2022 tot heden wordt generative AI steeds beter, sneller en goedkoper. Er zijn nieuwe technieken die de kosten verlagen, betere algoritmes en grotere modellen. Voor ontwikkelaars wordt toegang uitgebreid van gesloten bèta naar open bèta, en in sommige gevallen open source. De sluizen voor verkenning en ontwikkeling was vanaf nu mogelijk.

Golf 4. Killer-apps voor generative AI

Momenteel zitten we in de 4^e golf. Nu de platformlaag steeds beter, sneller, goedkoper en toegankelijker wordt, is de toepassingslaag rijp voor een explosie van creativiteit. De verwachting is dat toepassingen zoals camera’s, GPS en connectiviteit een nieuwe golf van generative AI zullen motiveren. Tien jaar geleden was er een marktopening voor een handvol killer-apps. Nu is de verwachting dat er ook killer-apps zullen ontstaan voor generative AI.

Naarmate de modellen groter en groter worden, leveren ze resultaten op menselijk niveau en vervolgens zelfs bovenmenselijke resultaten.

Marktlandschap

Hieronder is een schema te zien dat de platformlaag beschrijft die elke categorie zal aandrijven en de potentiële soorten toepassingen die daarop zullen worden gebouwd.

Modellen

Tekst is het meest geavanceerde domein. Natuurlijke taal is wel moeilijk goed te krijgen en de kwaliteit is belangrijk. De modellen zijn momenteel vrij goed in algemene teksten die niet al te lang zijn. Maar naarmate de modellen beter worden kunnen we ook hogere kwaliteit en langere inhoud verwachten.
Het genereren van code zal op korte termijn waarschijnlijk een grote impact hebben op de productiviteit van ontwikkelaars, GitHub CoPilot laten dit bijvoorbeeld zien. Het creatieve gebruik van code zal ook toegankelijker maken voor niet-ontwikkelaars.
Afbeeldingen zijn een recenter verschijnsel, maar ze zijn viraal gegaan. Het is veel leuker om door AI gegenereerde afbeeldingen te delen op Twitter dan tekst. Er is een opkomst van beeldmodellen met verschillende esthetische stijlen en technieken om beelden te bewerken en aan te passen.
Spraaksynthese bestaat al enige tijd, denk bijvoorbeeld aan ‘Hey Siri’ of ‘Hey Google’. Consumenten- en bedrijfstoepassingen worden inmiddels net zo goed. De lat voor toepassingen zoals film en podcasts ligt vrij hoog. De spraak klinkt menselijk en niet mechanisch. Maar ook hier zal er nog verdere verfijning en optimalisering plaatsvinden.
Video- en 3D-modellen maken een snelle opmars. Mensen zijn enthousiast over het potentieel van deze modellen om grote creatieve markten zoals bioscoop, gaming, VR, architectuur en fysiek productontwerp te ontsluiten. De onderzoeksinstellingen brengen momenteel fundamentele 3D- en videomodellen uit.
Andere domeinen. Er vindt diepgaand modelonderzoek plaats op vele gebieden, van audio en muziek tot biologie en chemie.

De onderstaande grafiek laat de verwachting zien voor de vooruitgang van basis modellen en de bijbehorende toepassingen die mogelijk worden. Vanaf 2025 is het echter slechts een gok.

Toepassingen van generative AI

Hieronder zijn nog wat toepassingen uitgelicht. Er is nog veel meer, maar hier wat hoogtepunten:

Copywriting: Er is een groeiende behoefte aan gepersonaliseerde content voor sales, marketing en klantondersteuning. Hiervoor zijn er perfecte toepassingen voor taalmodellen. De korte vorm en het karakter van de tekst in combinatie met de tijdsdruk van organisaties zullen de vraag naar geautomatiseerde oplossingen stimuleren.
Verticaal gerichte schrijfassistenten: De meeste schrijfassistenten zijn momenteel horizontaal. Maar er is een kans om dit ook verticaal te doen. Dat betekent toepassingen voor specifieke markten. Denk aan het schrijven van juridische contacten tot scenarioschrijven.
Het generen van code: De huidige toepassingen geven ontwikkelaars een turbo en maken hen veel productiever: GitHub Copilot genereert nu bijna 40% van de code in de projecten waar het is geïnstalleerd. Maar de nog grotere kans is wellicht het toegankelijk maken van codering voor consumenten. Leren programmeren kan de ultieme programmeertaal op hoog niveau worden.
Generatie van kunst: De wereld van kunstgeschiedenis en popculturen is gecodeerd in de grote modellen. Hierdoor kan iedereen thema’s en stijlen verkennen die voorheen een leven lang in de vingers zou hebben gezeten.
Gaming: er is een visie om het gebruik van natuurlijke taal modellen te ontwikkelen die riggable zijn. Dit eindstadium is nog ver weg, maar er zijn meer opties die directer zijn en op korte termijn bruikbaar zijn. Denk hierbij aan het genereren van texturen en skybox art.
Media & reclame: Er liggen grote kansen om het werk van bureaus te automatiseren en reclameteksten en -creaties direct voor de consument te optimaliseren. Multimodale generatie zou hierbij verkoopboodschappen combineren met aanvullende visuals.
Ontwerp: Prototyping van digitale en fysieke producten kosten veel tijd en geld. High-fidelity renderings van ruwe schetsen en aanwijzingen bestaan al. Als 3D-modellen beschikbaar komen, zal het generatieve ontwerpproces uitbreiden met de productie van teksten en objecten. Je nieuwe sneakers kunnen dan door een machine ontworpen worden.
Sociale media en digitale community’s: nieuwe toepassingen zoals Midjourney kunnen nieuwe sociale ervaringen creëren nu consumenten leren in het openbaar te creëren.

Intelligentie en verfijning van het model

Generative AI-toepassingen worden gebouwd bovenop grote modellen zoals GPT-3. Als de toepassingen steeds meer gebruiksgegevens krijgen kunnen ze de modellen verfijnen. Dit kunnen ze doen om twee redenen:

De kwaliteit en prestaties van het model te verbeteren voor hun specifieke probleemgebied.
De omvang en kosten van het model te verkleinen.

Plug-ins

Er bestaan momenteel al generative AI-apps die grotendeels als plug-in in bestaande softwaresystemen kunnen. Aanvullingen van code gebeuren in je IDE (Integrated Development Environment), beeldgeneraties gebeuren in Photoshop of Figma en zelfs Discord-bots kunnen generative AI in digitale/sociale gemeenschappen integreren. Ook zijn er een aantal generative AI-webapps die op zichzelf staan, denk aan Copy.ai of Jasper.

Een plug-in kan een zeer effectieve manier zijn om je eigen toepassing op te zetten. Ook kun je daarmee het kip-en-ei probleem te overwinnen van gebruikersgegevens en modelkwaliteit. Je hebt namelijk distributie nodig om genoeg gebruik te krijgen van je modellen om het zo te verbeteren, maar je hebt ook weer goede modellen nodig om gebruikers aan te trekken. Deze distributiestrategie werkt vooral goed in de marktcategorieën sociaal en consumenten.

Generative AI meest geschikt voor de basis

De meeste generative AI-demo’s zijn ‘one-and-done’. Je geeft input, de machine geeft output en deze kun je houden of opnieuw proberen. De modellen worden steeds meer herhalend, dat je met de output kunt werken om het aan te passen, verbeteren of variaties te maken.

De meeste resultaten van generative AI worden gebruikt als eerste ontwerpen of prototypes. De toepassingen zijn met name goed in het ontwikkelen van een eerste idee of meerdere ideeën om het creatieve proces op gang te brengen. Maar als de modellen steeds slimmer worden kunnen we in de toekomst verwachten dat de toepassingen ook ingezet kunnen worden voor het eindproduct.

De beste generatieve AI-bedrijven kunnen een duurzaam concurrentievoordeel creëren door uitstekend te functionering op het gebied van gebruikersbetrokkenheid, data en modelprestaties.

Duurzaam concurrentievoordeel

Generative AI-bedrijven kunnen duurzaam concurrentievoordeel behalen door continu te blijven werken aan zowel de gebruikersbetrokkenheid/gegevens en modelprestaties. Om dit te kunnen doen moeten bedrijven drie dingen doen die met elkaar in verband staan:

Buitengewone gebruikersbetrokkenheid;
Meer gebruikersbetrokkenheid omzetten in betere modelprestaties;
De uitstekende modelprestaties gebruiken om meer gebruikersgroei en betrokkenheid te stimuleren.

De beste generative AI-bedrijven zullen zich waarschijnlijk focussen op specifieke gebieden, zoals ontwerp, code of copywriting. Eerst zullen ze diep in toepassingen worden geïntegreerd door distributie en hefboomwerking. Later zullen ze de bestaande toepassingen vervangen door AI-native workflows. Er zal flink wat tijd in zitten om deze toepassingen op de juiste manier te bouwen, maar de beste toepassingen zullen duurzaam zijn en een kans hebben om massaal te worden.

Knelpunten

Ondanks dat er een groot potentieel ligt bij generative AI zijn er ook genoeg knelpunten rond bedrijfsmodellen en technologie. Zaken als auteursrecht, veiligheid, kosten en vertrouwen zijn nog lang niet opgelost.

Generatieve AI staat nog in de kinderschoenen. De basis staat net goed en de toepassing komt nog maar net op gang.

Ogen wijd open

Generative AI staat dus nog in de kinderschoenen. De platformlaag staat nog maar net goed en de toepassing is nog maar net op gang gekomen. De modellen vandaag de dag zijn goed genoeg voor eerste concepten en prototypes van teksten, afbeeldingen, video’s, etc. Naarmate de tijd vordert, zullen de toepassingen steeds slimmer en beter worden en op den duur zijn ze op zichzelf staand te gebruiken.

In de toekomst is generative AI niet weg te denken. Hoewel sommige toepassingen nog ver weg lijken, zullen we er ons toch op voor moeten bereiden en AI slim voor ons laten werken.

Dit artikel is herschreven van een artikel op Sequoiap.com

Zelf aan de slag met AI?

Wil jij leren hoe je slimme prompts kunt maken binnen tools als ChatGPT, Midjourney en vele anderen? Wil je leren hoe je de beste output krijgt en welke tools het meest geschikt zijn voor jou? En wil je actief aan de slag met je nieuwe kennis? Volg dan de 1-daagse training AI prompting & tools.

Bekijk training