"Il ne s'agit pas de remplacer notre Comité éditorial par une machine: plutôt que cette dernière serve de filtrage-assistant, dans une détection, moins de la qualité littéraire, que de l'absence de qualités", explique Quentin Pleplé, cofondateur et responsable technique de short Edition.

"Il ne s'agit pas de remplacer notre Comité éditorial par une machine: plutôt que cette dernière serve de filtrage-assistant, dans une détection, moins de la qualité littéraire, que de l'absence de qualités", explique Quentin Pleplé, cofondateur et responsable technique de short Edition.

Philippe Caza/Les Amis de la librairie d'Arthaud

Les mathématiques et de la littérature peuvent-elles faire bon ménage? Short Edition nous apportera peut-être la réponse. La maison d'édition française va en effet tester un algorithme mêlant Data mining et Big Data pour tenter de déterminer la qualité littéraire d'un livre. "Nous nous appuyons sur une base de données des oeuvres proposées par Short, et qui ont été évaluées par cinq à dix lecteurs. À partir de ces premières datas, nous commençons à faire apprendre la machine: l'intelligence artificielle va traiter les données et établir des liens entre la qualité et les exigences", résume Quentin Pleplé, cofondateur et responsable technique de short Edition interrogé par Actualitté.

Publicité

25 000 oeuvres seront donc soumises au programme, qui effectuera une première série d'évaluation. Cet embryon d'intelligence artificielle "absorbera" de nombreuses références qui lui permettront "d'apprendre" et de déterminer avec plus de précisions la qualité littéraire d'un livre, rapporte le site d'information spécialisé. Pour la première phase, l'ordinateur disposera de critères larges pour évaluer les éléments dont les indicateurs sémantiques -répétitions, figures de style-, l'ampleur du champ lexical -argot, vulgaire, mots rares-, la longueur des phrases, des paragraphes, le style -quantité d'adverbes, d'adjectifs, de pronoms, de verbes, de noms etc.-, les fautes d'orthographe et de ponctuation et la lisibilité du texte -simple à appréhender, rébarbatif, complexe-.

Pas question de se passer de la lecture humaine

Un tel projet peut, à première vue, soulever de nombreuses inquiétudes. Doit-on laisser une machine juger à notre place? L'intelligence artificielle peut-elle être suffisamment subtile pour détecter la beauté d'un texte? L'algorithme ne va-t-il pas entraîner un "lissage" et une uniformisation des textes quand les auteurs comprendront les critères et s'adapteront en conséquence? Quentin Pleplé rassure: "Il ne s'agit pas de remplacer notre Comité éditorial par une machine: plutôt que cette dernière serve de filtrage-assistant, dans une détection, moins de la qualité littéraire, que de l'absence de qualités". En clair, l'ordinateur va mettre en avant les critères qu'on lui demande de détecter, qui seront alors révisés par humain. Un gain de temps évident pour les éditeurs.

Et Quentin Pleplé d'insister "Nous ne pourrons nous en servir qu'à compter du moment où la marge d'erreur sera considérée comme acceptable, et suffisante pour être fiable. Même à cet instant, nous ne nous passerons pas d'une lecture humaine".

Si l'ambition de Short Edition, qui travaille avec trois laboratoires spécialisés en intelligence artificielle -le LIMSI, le LIRIS et le LIG- aboutit, cet algorithme pourrait servir à de nombreux secteurs... dont celui de l'Edition, évidemment, mais aussi pour la presse -et notamment pour les contenus participatifs-, comme le note Actualitté.


Publicité