L'Inserm et la start-up Owkin appliquent l’intelligence artificielle à la santé
La start-up Owkin, spécialiste de l’intelligence artificielle en matière de santé, et l'Inserm ont noué un partenariat afin de fournir aux chercheurs des données et des outils de recherche pointus.
L’un encadre des centaines d’équipes de chercheurs spécialisés dans leur domaine. L’autre a mis au point des logiciels d’analyse prédictive pour accélérer les découvertes en santé. Ensemble, ils veulent "faire parler les données de santé" des patients. Pour cela, l’Inserm et Owkin vont pouvoir se servir des données du Health Data Hub. Annoncée par le Président de la République la semaine dernière dans le cadre du rapport Villani, cette infrastructure regroupera les données du Système national des données de santé et de la recherche clinique et biologique.
"Nous avons mis au point la plateforme Owkin SOCRATES, qui permet aux chercheurs académiques, hospitaliers ou de l’industrie pharmaceutique, de créer leurs propres algorithmes afin de traiter les données qu’ils auront récoltées. Grâce au machine learning, elle permet de découvrir de nouveaux biomarqueurs", explique Gilles Wainrib, le fondateur d’Owkin. Avec 13 000 chercheurs et 300 centres de recherche à travers le monde, la force de frappe de l’Inserm est considérable. D’autant que le partenariat n’a pas de limite de durée.
Fier de notre partenariat avec @Inserm ce matin pour apporter aux chercheurs notre technologie Socrates, et rendre encore plus efficace la transformation de data en decouvertes et connaissances scientifiques. #AIforHumanity
— OWKIN (@OWKINscience) 4 avril 2018
Du big data au smart data
Pour le moment, 300 équipes ont déjà été sélectionnées pour être impliquées dans le projet. "Le cancer, les maladies infectieuses, l’épidémiologie, la neurologie, les neurosciences… Voilà autant de domaines que nous avons choisi d’explorer. Nous profitons pour cela de données très hétérogènes, qui mélangent l’imagerie médicale, l’anatomo-pathologie (NDLR : l’étude des tissus et des cellules), ainsi que d’autres données de santé", explique Franck Lethimonnier, le directeur de l'institut de Technologies pour la Santé de l’Inserm.
Croiser toutes ces données de natures différentes permet de déceler plus facilement la présence de certains facteurs jamais observés auparavant. Yves Levy, le président de l’Inserm, cite l’exemple de la démence de patients jeunes, qui restait sans explication. Après avoir traité entre 3 et 5 millions de données, l’impact de l’alcool a pu être démontré sur l’arrivée précoce de cette maladie. "Des découvertes qui peuvent parfois se faire en deux semaines", précise Gilles Wainrib.
Croiser des données hétérogènes
Mais si tout semble simple à première vue, le défi majeur pour Owkin a été de pouvoir traiter toutes ces données en même temps. Elles émanent de bases de données différentes, comme celle de la Caisse nationale d’assurance maladie (CNAM), des instituts de santé ou des hôpitaux, aux caractéristiques très hétérogènes. "Nous avions la possibilité d’assurer l’interopérabilité de cette data en créant des canaux capables de rassembler toutes ces informations différentes. Mais nous avons préféré contourner cette difficulté de façon plus intelligente, explique Yves Lévy. Au lieu de tout rassembler puis de poser des questions directes à cette base de données, qui confirmerait ou infirmerait une hypothèse, nous avons créé des outils qui génèrent eux même des hypothèses solides."
"Partage, souveraineté, et éthique : voici l'esprit, dans la lignée du rapport Villani, qui prévaut à la collaboration nouée entre l'Inserm et Owkin, pour accroître les connaissances pour la recherche en santé". #InsermEtOwkinIntelligenceArtificielle pic.twitter.com/s87ONU6bLt
— Inserm (@Inserm) 4 avril 2018
L’Inserm et Owkin assurent tous deux que les données de patients sont sécurisées et qu’elles ne pourront pas être utilisées à d’autres fins que celle de la recherche. "Nous utilisons la technique de l’apprentissage fédéré, qui permet de protéger toute cette data. Ici, dans nos locaux, nous ne stockons aucune donnée de patients. L’apprentissage fédéré permet de faire voyager l’algorithme de centre en centre sans avoir à agréger des données de façon centralisée", étaye Gilles Wainrib. Une bonne nouvelle, au vu du Règlement général sur le protection des données (RGPD), qui entrera en vigueur le 25 mai.