Korben

J’ai testé DALL-E 2

mercredi 27 juillet 2022 à 10:04

Grâce à Fooohx, lecteur de Korben.info et soutien sur mon Twitch, j’ai testé en live cette semaine l’intelligence artificielle DALL-E 2 en bêta. Pour ceux qui auraient loupé le phénomène, DALL-E est un projet d’OpenAI qui est capable à partir d’une simple phrase de produire des images.

Là dernière fois, je vous ai parlé de Craiyon qui fait la même chose, mais avec DALL-E, on dépasse clairement mes espérances en termes de qualité. Je vais vous spoiler : Ce truc est dingue !

Je lui ai d’abord demandé de me refaire quelques bébés pour mon site en essayant d’être le plus précis possible. Ce n’était pas parfait en termes de compréhension, mais niveau rendu visuel, c’est ouf.

Quelque chose de plus simple comme « bébé hacker avec des lunettes de soleil » c’était déjà beaucoup mieux.

Ensuite, on s’est demandé s’il était capable de générer des logos. Je lui ai donc demandé un logo si Mac Donalds vendait des chaussures. Et voici le résultat.

Puis je me suis demandé s’il était capable de générer des personnalités. Alors Jésus, ça passe…

Abraham Lincoln, c’est moins précis, mais on le reconnaît aussi.

Dora l’exploratrice version GTA, ça passe aussi…

Par contre, Gérald Darmanin avec un gilet jaune, il ne m’a pas sorti le ministre présumé innocent, mais toute une tripotée de gars qui ont des physiques de Gérald habillés en gilet jaune.

À un moment, je me suis trompé, je lui ai également parlé en français et DALL-E 2 s’en est presque très bien sorti.

En anglais, le résultat est quand même plus juste (ours rose).

Un des aspects qui fait également la force de DALL-E, c’est qu’on peut lui préciser des styles. Vous l’avez vu dans mes captures, je précise par exemple « Professional Photo » ou « realistic photo ». Mais vous pouvez ajouter des trucs comme « Rendu 3D ».

Ou encore Digital Art..

Mais également des styles artistiques comme pixel art, ou à la manière d’artistes comme Monet ou Keith Haring.

J’ai également tenté des choses très utilitaires comme une image pour Twitch, des pochettes d’album ou encore un écusson militaire.

Comme vous pouvez le voir, dès qu’il y a un peu de texte, l’IA est perdue et place des lettres qui se rapprochent du sujet, mais sans vraiment écrire correctement. Je pense que c’est un axe majeur qu’ils vont devoir travailler.

Enfin, pour terminer, je lui ai demandé des trucs qui demandent un peu d’imagination comme « Et si Dieu était une femme », ou « Mona Lisa un homme » ou à quoi ressemble la tête d’Internet, une bataille médiévale épique entre des tomates et des radis ou encore une « photo qui aspire au bonheur et à la plénitude ». Et voici le résultat :

Comme vous pouvez le voir, il n’y a pas de limites. Les résultats sont parfois éloignés de ce que j’ai demandé, mais c’est super rare. Et chaque image, si elle vous plaît, peut à son tour être déclinée dans d’autres versions automatiquement. Quoiqu’il en soit, en termes de qualité, on est quand même sur quelque chose de super propre. Vous pouvez constater le gouffre entre DALL-E 2 et Craiyon par exemple.

À titre perso, si ça reste gratuit, je compte bien m’en servir parfois pour mon site, afin d’avoir des images d’illustration qui collent avec mon sujet et qui n’appartiennent à personne si ce n’est à OpenAI (faudra lire les CGU là-dessus).

Et vous, qu’en pensez-vous ? Moi je suis bluffé.

Encore merci à tous ceux qui ont participé à ce test en live sur ma chaine Twitch et qui m’ont proposé certaines de ces idées.