Home / Blog / Deze AI maakt beelden op basis van woorden (en helpt Judgment Day voorkomen)

Deze AI maakt beelden op basis van woorden (en helpt Judgment Day voorkomen)

LATER LEZEN

In 1984 was mijn basisschool een van de eerste basisscholen in Nederland waar computeronderwijs werd gegeven. Ik herinner me dat we commando’s moesten ingeven waarna de cursor figuren kon tekenen: een 360-graden cirkel bijvoorbeeld. Ik was totaal onder de indruk, van de computer en van mezelf.

Nu, 38 jaar later, kan je computers de opdracht geven beelden te produceren op basis van een paar woorden, zoals ‘A bowl of soup that looks like a monster, knitted out of wool’. Een voorbeeld daarvan is DALL·E 2, een kunstmatige intelligentie die zowel fotorealistische beelden als pentekeningen kan maken. Ook kan DALL-E 2 variëren op bestaande beelden. De hogeresolutiebeelden zijn heel indrukwekkend.

De techniek is volgens de makers handig om mensen creatief mee los te laten gaan, maar laat ons ook zien hoe AI onze wereld ziet – en dat is belangrijk als we veilige kunstmatige intelligenties willen maken (die niet zullen leiden tot Judgment Day).

Hoe het werkt, uitgelegd op Technology Review:

“First, it uses OpenAI’s language-model CLIP, which can pair written descriptions with images, to translate the text prompt into an intermediate form that captures the key characteristics that an image should have to match that prompt (according to CLIP). Second, DALL-E 2 runs a type of neural network known as a diffusion model to generate an image that satisfies CLIP.”

Er zitten nog beperkingen aan. Zo vindt het programma het lastig om twee objecten met twee kenmerken te combineren, zoals een rode kubus bovenop een blauwe kubus. Er zitten ook beperkingen aan op basis van beleid, wat een vorm van censuur is: geen ‘offensive images’, dat wil zeggen geen geweld en geen porno, en geen politieke beelden, waarbij politiek ongespecificeerd blijft. Om deepfakes te voorkomen mag DALL-E ook geen beelden van echte mensen maken.

DEEL DIT BERICHT