Illusttration d'un robot volant des journaux

On a trouvé les premiers médias entièrement générés par IA

© DJ Rahmil via Dreamstudio

Des fermes de contenus utilisent des IA pour copier et réécrire des articles de presse et les publier - sans les créditer ni les rémunérer...

Vous voulez générer un peu d’argent en créant un média sans trop vous fouler et sans vous encombrer de journalistes ? Il existe une solution. Il suffit de piller les articles de grands sites comme Reuters ou CNN, de les réécrire puis de les publier sur un site internet qui ressemble vaguement à la home page d’un journal en ligne pour engranger les revenus de la publicité programmatique. Le plus beau dans tout ça ? Il est possible d’automatiser complètement ce processus grâce à l’intelligence artificielle.

Comment reconnaître un site d'information généré par IA ?

Cette entourloupe qui était largement prévisible avec l’arrivée des IA génératives comme ChatGPT a été repérée par NewGuard, une société spécialisée dans la détection de sites de désinformation. Après les livres pour enfants entièrement générés par IA, l’entreprise annonce avoir répertorié 37 sites montés par des fermes de contenus. Pour les trouver, NewGuard a repéré des articles comportant un message d’erreur typiquement généré par ChatGPT comme « En tant que modèle de langage, je ne peux pas réécrire ce titre… » ou « Désolé, en tant que modèle de langage d’IA, je ne parviens pas à déterminer quels contenus doivent être reformulés sans contexte ou informations supplémentaires… ». Certains sites comme topgolf.kr semblent même être générés totalement de manière automatique avec une centaine d’articles copiés sur différentes sources. Certains articles, comme ceux du site GlobalVillageSpace.com comportent une mention pour rendre le texte « compatible avec Google », ce qui indique que les personnes derrière ce copier-collé ont bien ajouté dans leur demande à ChatGPT que l'article soit compatible avec les stratégies de SEO. L’objectif est bien évidemment d’être en bonne position dans les résultats de recherche, si possible devant le média d'origine, afin d’accumuler de l’audience et de ramasser de l’argent issu de la publicité. 

Les marques financent la création de ces médias

D’après NewGuard, 15 des 37 sites trouvés embarquaient de la publicité programmatique mettant en avant 55 grandes entreprises mondiales, des chaînes d’hôtels ou des services financiers entre autres. De par la nature automatique et opaque de ces mises en ligne, ces entreprises ne savent pas que leur publicité est affichée sur ces sites frauduleux. Si NewsGuard a repéré seulement 37 sites, l’entreprise indique qu’il existe des centaines voire des milliers de sites de ce genre. L’article indique qu’il reste cependant difficile de détecter ces plagiats même avec les outils censés les repérer comme Grammarly. Cette difficulté de détection jouait déjà pour une autre affaire de copie – de livre cette fois-ci – qui est sortie au début du mois d'août. L'autrice Jane Friedman a en effet découvert une douzaine de livres générés par IA à partir de son travail, et signés de son nom. Le début d'une longue série de plag.IA ?

David-Julien Rahmil

David-Julien Rahmil

Squatteur de la rubrique Médias Mutants et Monde Créatif, j'explore les tréfonds du web et vous explique comment Internet nous rend toujours plus zinzin. Promis, demain, j'arrête Twitter.
premium2
commentaires

Participer à la conversation

Laisser un commentaire