ezff

Pour parvenir à lire sur les lèvres, le logiciel a écouté 5000 heures d'émission de la BBC.

Getty Images

Après avoir triomphé du champion du monde du jeu de Go, DeepMindrevient. Cette fois-ci la société britannique a développé une intelligence artificielle capable de lire sur les lèvres et de convertir la voix humaine en texte.

Publicité

LIRE AUSSI >> Jeu de go: l'ordinateur a battu l'homme, mais ce n'est pas (si) révolutionnaire

Le taux d'exactitude de ce programme est supérieur à celui des meilleurs spécialistes humains. Baptisé LipNet, il parvient à un taux d'exactitude de 46,9% dans la reconnaissance des phrases prononcées, contre 23,8% pour le professionnel ayant servi de témoin. Et alors que jusqu'à présent les logiciels de reconnaissance labiale travaillaient sur des mots isolés, LipNet va plus loin et prédit désormais des phrases entières.

Pour apprendre à lire sur les lèvres des humains, le logiciel a écouté pas moins de 5000 heures d'émission de la BBC.

Message à un téléphone, transcription, doublage de films

Ce programme a été développé par les chercheurs de DeepMind en association avec des scientifiques de l'université d'Oxford.

Dans les conclusions de leur étude, les chercheurs ont déjà trouvé les potentielles applications de cette nouvelle forme d'intelligence artificielle: "Une machine capable de lire sur les lèvres ouvre la voie à de multiples applications comme la dictée d'instructions, la dictée de message à un téléphone dans un environnement bruyant, la transcription et le doublage de films sans son, la compréhension de discours où plusieurs personnes s'expriment et, plus largement, l'amélioration de la performance de la reconnaissance vocale".

On ne peut également s'empêcher de penser à ce que l'utilisation d'un tel programme pourrait donner entre les mains d'agences de renseignement.

Publicité