L’intelligence artificielle peut-elle créer de l’art ?
Ces derniers mois, des images singulières, parfois surréalistes, ont circulé sur les réseaux sociaux : des photographies, des dessins ou des aquarelles, parfois bien réalisés, d’autres fois confus et étranges, mais tous produits par une intelligence artificielle.
Des machines qui parlent et peignent comme des êtres humains. Ce n’est plus de la science-fiction : depuis des années, l’intelligence artificielle (IA) développe des algorithmes capables d’analyser nos capacités créatives dans des milliards de textes et d’images, et de les reproduire – souvent avec des résultats surprenants.
Les progrès des logiciels, pas limités à la technologie d’un casino en ligne canadien comme le nôtre, qui génèrent des images à partir de textes semblent être la nouvelle ère : comment tout cela fonctionne ?
Une collaboration entre l’homme et la machine
Le logiciel utilisé est, plus précisément, un modèle de langage appelé Generative Pre-trained Transformer (GPT) développé par la compagnie OpenAI, capable de générer des images (mais aussi des textes) sur la base d’une entrée textuelle.
Ce type de modèle doit normalement être géré par ses chercheurs, qui sélectionnent, éditent et saisissent des documents et des textes dans le système afin que l’intelligence artificielle puisse les analyser, en apprenant les mécanismes de l’écriture ou de l’art humain.
La principale caractéristique du GPT-3 (la dernière génération, née en 2020) est sa relative indépendance : une fois qu’il a reçu les énormes masses de documents sur lesquelles se baser, le modèle de langue évolue, comme s’il apprenait tout seul, sans avoir besoin d’explications. Avant cette innovation, des modèles similaires nécessitaient encore des orientations.
La petite histoire de GPT
Ce logiciel a été développé par OpenAI, une société américaine à but non lucratif cofondée en 2015 par l’entrepreneur technologique Sam Altman et Elon Musk, PDG de Tesla et de Space X, dans le but affiché de démocratiser la recherche dans ce domaine, c’est-à-dire de permettre à chacun de créer des systèmes d’intelligence artificielle.
En 2019, la société a présenté GPT-2, la deuxième itération du projet, capable de générer des textes, même poétiques, tout à fait crédibles. La qualité de la production de ces modèles s’est considérablement améliorée avec GPT-3, une version sortie en été 2020, avec laquelle il est possible de créer des textes souvent indiscernables des textes humains. Dans le document de présentation du projet, les chercheurs d’OpenAI ont eux-mêmes noté que la capacité de GPT-3 à générer plusieurs paragraphes de contenu synthétique que les gens ont du mal à distinguer des textes écrits par des humains est une réussite inquiétante.
L’art créé par l’intelligence artificielle
Les images créées par l’intelligence artificielle proviennent d’une version particulière de GPT-3, conçue pour générer des images à partir de descriptions textuelles, en utilisant un ensemble de données de correspondance texte-image. Le nom de ce modèle est DALL-E, un croisement entre le nom du peintre surréaliste Salvador Dalí et celui de WALL-E, le robot vedette du film Pixar du même nom.
GPT-3 et DALL-E semblent n’être que le début d’une génération d’intelligences artificielles génératives, capables de produire du matériel iconographique avec rapidité et expertise.
En mai, Google AI, la division de l’entreprise dédiée aux intelligences artificielles, a présenté Imagen, une technologie capable de produire des résultats similaires, voire parfois supérieurs, à ceux de DALL-E. Cependant, nous savons encore peu de choses sur Imagen, et il convient de prendre les résultats présentés avec prudence, notamment parce qu’ils peuvent ne pas représenter la moyenne des résultats produits par le système.
La technologie propre à OpenAI n’est pas toujours en mesure de produire des résultats conformes à la demande initiale. Bien que ce soient les images générées avec succès qui font les gros titres et circulent le plus, DALL-E présente également certaines limites, par exemple la tendance à réitérer les préjugés raciaux et sexistes sur les images qu’il produit. Ce phénomène est tellement courant dans le domaine des logiciels de reconnaissance faciale qu’il a conduit de nombreux chercheurs à conseiller à OpenAI de ne pas permettre à DALL-E de produire des visages humains.
Les contraints de l’intelligence artificielle dans l’art
La direction indiquée par ces technologies semble plutôt claire : dans un futur proche, nous pourrons générer des images plus ou moins indistinctes des quadri ou des photos réelles en utilisant les intelligences artificielles. Cependant, même si les répercussions artistiques et culturelles d’une innovation similaire sont difficiles à calculer, elles sont déjà perceptibles dans le milieu.
La propriété intellectuelle
Un mélange de droits d’auteur, de brevets et de secrets commerciaux est utilisé pour protéger le code source d’une IA et la technologie dont elle a besoin pour fonctionner, mais très peu de précédents juridiques ont été rédigés en tenant compte de l’art généré par l’IA. Mais, une fois que vous avez créé votre chef-d’œuvre généré par l’IA, qu’est-ce qui vous empêche de vous l’approprier, de l’utiliser à des fins commerciales ou d’empêcher les autres de l’utiliser ? Apparemment, selon les règles actuelles, l’art généré par l’IA n’a pas de propriétaire. Ainsi, la protection du droit d’auteur nécessite actuellement un auteur humain.
La créativité
L’intelligence artificielle comme outil pour tester ses limites avec la composante humaine n’est pas une mauvaise idée. Mais si cela va tuer la créativité d’un artiste ? DALL-E, apparemment, crée un court-circuit dans notre compréhension de la créativité.
Laisser un commentaire