Il nuovo modello DALL.E di OpenAI trasforma le tue parole in opere d'arte

OpenAI, la startup di ricerca sull'intelligenza artificiale, ha annunciato (si apre in una nuova scheda) DALL E 2, un aggiornamento del suo generatore di text-to-image che sembra un grande passo avanti.

Essenzialmente, DALL·E 2 può creare arte partendo da input di linguaggio naturale, come: "un dipinto di una volpe seduta in un campo all'alba nello stile di Claude Monet". OpenAI afferma che l'obiettivo è creare "immagini e opere d'arte realistiche e originali" in grado di "fondere concetti, attributi e stili".

È un'impresa davvero impressionante per un'azienda che ha intrapreso diverse iniziative di intelligenza artificiale, tra cui GPT-3 (si apre in una nuova scheda), che può produrre una prosa davvero notevole.

aprire l'IA

(Credito immagine: OpenAI)

Il documento di ricerca OpenAI di accompagnamento approfondisce molto più in dettaglio il funzionamento di DALL E 2. Utilizzando modelli CLIP contrastanti, DALL E 2 viene eseguito in due passaggi: il primo crea un'immagine CLIP incorporata con una didascalia di testo e il secondo genera un'immagine basata su esso.

I risultati sono davvero impressionanti e potrebbero avere enormi ramificazioni per l'industria dell'arte e del design grafico, in particolare gli studi di videogiochi, che attualmente impiegano designer per costruire scrupolosamente mondi e concetti.

DALL·E 2 si basa sul lavoro di OpenAI con DALL·E 1, che è stato annunciato (si apre in una nuova scheda) a gennaio 2021. Il nome è una combinazione di Salvador Dalí e WALL·E.

Un nuovo mondo coraggioso

OpenAI è una delle startup più interessanti che lavorano sull'IA in questo momento.

Fondata nel 2015 da Elon Musk, Sam Altman, Ilya Sutskever e altri, l'obiettivo è produrre "AI amichevoli" a beneficio dell'umanità nel suo insieme. La startup senza scopo di lucro compete con DeepMind di Alphabet.

DALL·E 2 è un ottimo esempio di questo lavoro nella pratica, spingendo i limiti di ciò che è possibile quando si tratta di generare immagini utilizzando l'IA. Il servizio può anche modificare le immagini esistenti secondo le specifiche dell'utente.

C'è, ovviamente, molta strada da fare. I ricercatori hanno notato che le loro basi CLIP possono essere facilmente indotte a etichettare un elemento come un altro. Ma nel tempo, questi difetti verranno risolti e migliorati.

OpenAI prevede di rilasciare presto DALL·E 2 per selezionare ricercatori.