Ce n’est pas le premier film de l’histoire du cinéma et, malgré une légende tenace, les spectateurs ne se sont pas enfuis de la salle en hurlant lors de sa première projection. Mais L’arrivée d’un train en gare de La Ciotat est sans doute le premier à être passé au crible de technologies d’intelligence artificielle. Le résultat est une image d’un réalisme étonnamment contemporain.
L’arrivée d’un train en gare de La Ciotat fait partie du catalogue actuel de 1408 films tournés par Auguste et Louis Lumière entre 1895 et 1905 (réalisés en pratique par Louis). Filmée en 1895 et projetée publiquement en janvier 1896, cette séquence de 50 secondes montre une locomotive à vapeur venir du fond de l’écran en suivant une belle diagonale en ligne de fuite pour s’arrêter à quai en gros plan. Si l'œuvre a fait partie d’un vaste programme de restauration en 2015, un internaute russe du nom de Denis Shiryaev, développeur et YouTubeur actif, a réussi à monter la résolution de l’image en qualité 4K, soit 4096 pixels de large au minimum, et appliquer une vitesse de défilement de 60 images par seconde.
Rappelons qu'en 1895, les techniques de captation permettaient d’obtenir un taux de défilement de 16 à 18 images par seconde, en noir et blanc et sans son. C’est avec le cinéma en son synchronisé que sera fixée la norme de 24 images par seconde.
La technique de fabrication des deepfakes
Denis Shiryaev a utilisé une méthode très en vogue de l’intelligence artificielle, celle des réseaux génératifs antagonistes (GAN). Ils sont très utilisés en matière de création artistique et ce sont aussi ces algorithmes qui servent à fabriquer des "deepfakes".
L’idée du GAN consiste à pouvoir produire une image artificielle qui soit cohérente avec un corpus d’images existant. En l’occurrence, le développeur utilisé deux outils. L’un, appelé DAIN, a réussi à générer des images manquantes en partant de celles qui constituent le film. L'algorithme les a intercalées là où il était nécessaire pour lisser le film et limiter les saccades, qu’il s’agisse des mouvements des personnages, des reflets, des ombres, des rendus de matière. Le principe consiste à analyser les images qui se trouvent avant et après l’endroit où il compte en placer une artificielle. C’est ainsi que l’on obtient un taux de 60 images à la seconde.
L’autre outil, Gigapixel, ajoute des pixels. Il complète littéralement l’image pour en gommer le grain typique du celluloïd et augmenter la résolution. Le résultat est un défilement très fluide et à la texture très réaliste. Des défauts sont toutefois visibles, notamment des sautes d’images et des zones floues dans les détails (doigts, visages, feuillages). Ce travail n’a en fait qu’une valeur expérimentale, ludique, il ne s’agit en aucun cas d’une restauration. D’ailleurs, du son a été rajouté sur cette version « IA » du film, histoire de brouiller un peu plus les repères temporels. Un puriste n’aurait jamais commis un tel forfait !