Passer au contenu

L’IA DeepMind peut maintenant générer n’importe quelle image réaliste de tout objet

L’intelligence artificielle DeepMind est désormais capable de générer des images artificielles de tout objet avec un réalisme bluffant.

L’IA DeepMind, propriété de Google, a encore frappé fort. Une fois de plus, les chercheurs derrière ce projet viennent de démontrer les capacités impressionnantes de leur intelligence artificielle avec une nouvelle démonstration inquiétante.

Après l’inquiétante intelligence artificielle capable de transposer les visages (et plus) en toute transparence, cette fois-ci, DeepMind propose de créer n’importe quelle photo de toute pièce, le tout d’un réalisme épatant. Avec la collaboration de chercheurs de l’Université Heriot-Watt, les ingénieurs de DeepMind ont publié un article dans lequel ils décrivent une IA qui génère des photos d’aliments, de paysages et d’animaux domestiques avec une cohérence impressionnante. Les images générées sont parfois même impossibles à différencier d’une vraie photographie.

Dans ce travail, nous avons entrepris de combler le fossé de fidélité et de variété entre les images générées par [notre système d’IA] et les images du monde réel“, expliquent les chercheurs. “Nous trouvons que les techniques actuelles sont suffisantes pour améliorer considérablement le résultat.

Pour y parvenir, les chercheurs ont mis au point un algorithme d’apprentissage machine non supervisé de type “Generative Adversarial Networks” (GAN), ou “réseau (neuronal) de génération par confrontation” en français. En clair, il s’agit de deux réseaux neuronaux fonctionnant en parallèle mais effectuant des tâches différentes : l’un génère des images, le second les confronte à des échantillons d’images existantes pour les comparer.

158 millions de paramètres pour générer une image

Le système mis au point par les équipes (et baptisé “BigGANs”) est d’une puissance sans précédent, avec pas moins de 158 millions de paramètres pour la génération d’images, 2048 échantillons d’images de comparaison à chaque traitement, accompagné de quelques améliorations matérielles comme l’augmentation du nombre de canaux de traitement, ont permis ce résultat impressionnant.

Pour comparer les images générées à des échantillons existants, les ingénieurs se sont appuyés sur les bases de données d’images annotées d’ImageNet et JFT-300M, une basse de données de 300 millions d’images du monde réel étiquetées dans 18 000 catégories.

Après deux jours de tests sur les Tensor Processing Units (TPU) de Google (des circuits spécifiques dédiés à l’intelligence artificielle), les résultats tombent : L’IA a obtenu les meilleurs scores connus à ce jour aux deux systèmes d’évaluation des performances d’intelligences artificielles de type GAN (Inception Score (IS) et Frechet Inception Distance (FID)).

Évidemment, une fois de plus, de telles performances soulèvent des questions quant à l’éventuelle utilisation de ce type de technologie à des fins malveillantes. Leur impact pourrait être catastrophique à l’avenir, même si des intelligences artificielles effectuant le travail de reconnaissance aideront à détecter ce qui s’appelle les “deep fakes” (contrefaçons d’images et vidéos). Par exemple, la start-up Truepic a fait une levée de fonds de 8 millions de dollars en juillet avec pour objectif d’offrir des services de détection des contrefaçons.

Source

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech

Cliquer pour commenter
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *