Les mathématiques et de la littérature peuvent-elles faire bon ménage? Short Edition nous apportera peut-être la réponse. La maison d'édition française va en effet tester un algorithme mêlant Data mining et Big Data pour tenter de déterminer la qualité littéraire d'un livre. "Nous nous appuyons sur une base de données des oeuvres proposées par Short, et qui ont été évaluées par cinq à dix lecteurs. À partir de ces premières datas, nous commençons à faire apprendre la machine: l'intelligence artificielle va traiter les données et établir des liens entre la qualité et les exigences", résume Quentin Pleplé, cofondateur et responsable technique de short Edition interrogé par Actualitté.
25 000 oeuvres seront donc soumises au programme, qui effectuera une première série d'évaluation. Cet embryon d'intelligence artificielle "absorbera" de nombreuses références qui lui permettront "d'apprendre" et de déterminer avec plus de précisions la qualité littéraire d'un livre, rapporte le site d'information spécialisé. Pour la première phase, l'ordinateur disposera de critères larges pour évaluer les éléments dont les indicateurs sémantiques -répétitions, figures de style-, l'ampleur du champ lexical -argot, vulgaire, mots rares-, la longueur des phrases, des paragraphes, le style -quantité d'adverbes, d'adjectifs, de pronoms, de verbes, de noms etc.-, les fautes d'orthographe et de ponctuation et la lisibilité du texte -simple à appréhender, rébarbatif, complexe-.
Pas question de se passer de la lecture humaine
Un tel projet peut, à première vue, soulever de nombreuses inquiétudes. Doit-on laisser une machine juger à notre place? L'intelligence artificielle peut-elle être suffisamment subtile pour détecter la beauté d'un texte? L'algorithme ne va-t-il pas entraîner un "lissage" et une uniformisation des textes quand les auteurs comprendront les critères et s'adapteront en conséquence? Quentin Pleplé rassure: "Il ne s'agit pas de remplacer notre Comité éditorial par une machine: plutôt que cette dernière serve de filtrage-assistant, dans une détection, moins de la qualité littéraire, que de l'absence de qualités". En clair, l'ordinateur va mettre en avant les critères qu'on lui demande de détecter, qui seront alors révisés par humain. Un gain de temps évident pour les éditeurs.
Et Quentin Pleplé d'insister "Nous ne pourrons nous en servir qu'à compter du moment où la marge d'erreur sera considérée comme acceptable, et suffisante pour être fiable. Même à cet instant, nous ne nous passerons pas d'une lecture humaine".
Si l'ambition de Short Edition, qui travaille avec trois laboratoires spécialisés en intelligence artificielle -le LIMSI, le LIRIS et le LIG- aboutit, cet algorithme pourrait servir à de nombreux secteurs... dont celui de l'Edition, évidemment, mais aussi pour la presse -et notamment pour les contenus participatifs-, comme le note Actualitté.
- Intelligence artificielle : ces innovations de Google qui vont transformer notre quotidien
- Intelligence artificielle : "Claude" arrive en Europe et veut concurrencer ChatGPT
- Intelligence artificielle : OpenAI dévoile GPT-4o, un nouveau modèle d’IA générative