Synthèse des conférences de DataJob Santé 2019
DataJob, le salon de recrutement des métiers de la data, ouvrait ses portes aux professionnels et acteurs de l’Intelligence Artificielle appliquée à la santé le 24 juin dernier, à la Maison de la Chimie. Quantmetry était au rendez-vous du cycle de conférences pour recueillir le témoignage de ses différents intervenants.
Témoignage du Professeur Michel Pinget, fondateur du CEED et diabétologue
Que la recherche en médecine a évolué entre le début de la carrière du professeur et aujourd’hui ! Autrefois théâtre de l’expression d’un chercheur dont l’exceptionnalité rencontrait la fortune pour aboutir aux découvertes les plus décisives (le Professeur Pinget citant en exemple l’expérience de 1889 menée par Minkowski et von Mering ayant permis d’établir le rôle du pancréas dans la genèse du diabète sucré), la recherche médicale a vu l’avènement d’une ère davantage technologique au cours de laquelle l’industrie pharmaceutique a produit la plupart des avancées majeures (la synthèse de l’insuline humaine, par exemple). Le crépuscule de celle-ci semble toutefois annoncé : face à l’incapacité à découvrir de nouvelles molécules, la maîtrise des données (mêlée aux connaissances des scientifiques de la médecine) apparaît comme la plus à propos pour interpréter les signaux qui permettent à l’Homme de soigner ses malades.
Les cas des maladies chroniques, comme le diabète sont particulièrement prégnants. Rappelant les 4P les caractérisant (Préemption, Prédiction, Personnalisation, Participation), le Professeur Pinget estime que les Data Scientists sont les candidats tout désignés pour assister les médecins dans le suivi des patients diabétiques. En effet, les médecins ayant pour rôle d’accompagner lesdits patients plutôt que de les soigner, la maîtrise de leurs données (personnelles, médicales) revêt alors un enjeu tout autre.
Gare cependant aux solutions qui ne s’astreindraient pas à répondre à des besoins médicaux clairement définis. Rappelant des exemples de dérives sanitaires provoquées par l’industrie pharmaceutique, le Professeur souligne combien consulter les médecins et chercheurs, référents et experts scientifiques, est capital pour qu’un Data Scientist mène un projet médico-data à bien, conservant toujours pour objectif la seule résolution de la problématique médicale, et en évitant de rechercher la prouesse technique ou technologique superflue, pouvant s’avérer nocive.
MOON : Transformer le suivi du diabète grâce à l’intelligence artificielle
Jean-Vianney Massin, co-fondateur de MOON et le Docteur Anne-Hélène Spizzo, CEED
MOON est la startup Anova qui fait le lien entre les mondes de la santé et de la tech, en proposant une application dont le but est de faciliter par un recours à l’Intelligence Artificielle le suivi des patients diabétiques par leurs médecins.
Les fondateurs de MOON ont pour conviction que face à la nécessité d’individualiser l’accompagnement des diabétiques, l’Intelligence Artificielle, la centralisation des données et la communication entre les patients et les équipes médicales sont les trois piliers qui soutiennent le même édifice.
Un patient pourra renseigner quotidiennement son application avec les données pertinentes pour le suivi de son état. Les équipes médicales en télésurveillance lui prescriront alors de manière plus adaptée des recommandations en se fondant sur les informations communiquées par le patient. L’application fera ainsi le lien entre le patient et les médecins, constituant un dossier médical enrichi et accessibles à toute personne habilitée. Un patient mieux suivi est susceptible d’être moins souvent hospitalisé ou, le cas échéant, l’est moins longtemps.
Jean-Vianney Massin et le Docteur Anne-Hélène Spizzo
Table ronde Data Privacy
Nesrine Benyahia, CEO de DrData & Hélène Guimiot-Bréaud, chef du service Santé de la CNIL & Hervé Fortin, DPO de Servier
Le Règlement Générale de la Protection des Données (RGPD) est le premier texte à proposer une définition d’une donnée de santé. À ce titre on comprend mieux le flou qui peut régner autour du concept légal. Demeure néanmoins la certitude que l’utilisation des données de santé doivent se faire en respectant des règles qui sont quant à elles strictes et clairement posées.
Les intervenants de cet échange ont la certitude que le RGPD n’est pas un frein pour le progrès technologique en Europe. En rien il n’a pour but d’empêcher l’innovation mais plutôt d’éviter toute dérive et d’assurer que la vie privée des individus soit respectée. La réglementation impose en effet que les données retenues ne permettent pas de reconnaître de manière discriminante l’individu qui en est le propriétaire. Bien qu’apparente parade, les méthodes de hashing, de pseudonymisation ou encore de perturbation des données ne sont pas toujours efficacement mises en place. C’est pourquoi la Commission Nationale de l’Informatique et des Libertés (CNIL) recommande l’emploi de données agrégées à une maille géographique suffisamment large (IRIS, commune, carreaux par exemple pour les statistiques INSEE …) ou de données appauvries. Notons que le niveau de risque à la violation de la vie privée peut être évalué par un outil d’analyse d’impacts librement diffusé.
En somme, l’ensemble des acteurs Data doivent avoir conscience des limites imposées par la RGPD. Un véritable serment d’Hippocrate du Data Scientist est ainsi à suivre afin d’éviter toute dérive.
Radiomique : pièges et promesses. Applications au cancer pulmonaire. Utiliser les données pour progresser dans la recherche
Professeur Alain Livartowski, directeur des data de l’ensemble hospitalier de l’Institut Curie
L’imagerie médicale est l’un des premiers ressorts du diagnostic de tumeurs malignes. Avec quelques 50.000 nouveaux cas de cancer pulmonaire identifiés chaque année en France, on imagine l’imposante quantité de scanners et de radiographies qui passent entre les mains des médecins et qui sont soumis à leur expertise.
Les besoins de certitudes qui découlent des activités des professionnels de la santé interdisant toute défaillance, et au vu des récents progrès constatés dans l’analyse d’images, l’idée d’appliquer des solutions d’Intelligence Artificielle à l’imagerie médicale fait sens. Bien plus que de permettre d’identifier les cas de présence de tumeurs dans l’organisme, l’IA se trouverait être une alliée décisive dans la classification des tumeurs malignes et dans leur propension à hyperprogresser ou à régresser à la mise en place d’un protocole thérapeutique.
Certaines études s’attachant à évaluer l’aptitude de l’IA à aider les médecins dans leurs diagnostics (voire à les dépasser) établissent des résultats encourageants (AUC égal à 0,8 pour des modèles entraînés sur les données du National Lung Screening Trial, qui comportent plusieurs milliers de radiographies). L’IA parvient en outre désormais à identifier les différences entre les radionécroses et les cas d’hyperprogression avec une AUC égale à 0,84.
Toutefois, malgré ces quelques résultats qui poussent à l’optimisme, d’après le Professeur Livartowski de nombreux défis persistent. Il faut notamment prendre garde à l’hétérogénéité des données (un malade d’aujourd’hui n’est pas absolument comparable à un patient d’il y a quelques décennies). Par ailleurs, il faut avoir pour ambition de généraliser les outils de décision pour que ceux-ci ne dépendent pas d’un contexte.
Table ronde Médecine et IA
Isabelle Adenot, Haute Autorité de la Santé & Professeur Carole Matelin, Les hôpitaux de Strasbourg & Emmanuel Bilbault, fondateur de Posos & François-Xavier Rousselot, Aptus Health
Une certitude anime l’ensemble des intervenants de cette édition de Data Job Santé : l’exploitation des données va révolutionner le monde de la santé. De la mise en évidence de facteurs expliquant la déclaration d’une pathologie au regroupement de la riche littérature scientifique par des méthodes de NLP, nombreuses sont les applications implémentées ou envisageables par l’Intelligence Artificielle.
Les professionnels de la santé ont toute confiance en l’applicabilité des méthodes data aux problématiques médicales. Ils sont sûrs de l’efficacité, tant sur les aspects de rapidité dans l’exécution que sur la précision des outils assistant la prise de décision en propre, que peut procurer l’Intelligence Artificielle à la prise de décision dans les métiers de la santé. Autre impact positif attendu, l’ouverture d’esprit et des schémas de pensées : les Data Scientists appréhenderont assurément les problématiques de la santé avec un regard nouveau et différent de celui des experts du secteur. L’arrivée de ces nouveaux acteurs risque de profondément changer la mentalité des médecins. Seulement, selon François-Xavier Rousselot, il faut prendre garde à l’adéquation entre la suractivité des Data Scientists et la précaution prise dans le rythme des processus médicaux.
Pourvu que les Data Scientists fassent preuve d’éthique, consultent l’avis des experts de la santé pour traiter les données et concevoir les modèles qui en découlent et conservent un esprit ouvert, les fruits de l’entente entre l’Intelligence Artificielle et le monde de la médecine révolutionneront les paradigmes de la santé.
Comment l’IA est utilisée pour le diagnostic d’arythmies cardiaques ?
Christophe Gardella, Data Scientist chez Cardiologs
Pour identifier les causes des arythmies cardiaques les médecins recourent majoritairement à l’imagerie médicale et aux électrocardiogrammes. Si la première solution est efficace et plus clairement interprétable par un médecin que la seconde, elle est également bien plus coûteuse. Cardiologs, startup fondée en 2014, propose une solution à base de réseaux de neurones permettant l’analyse des enregistrements de la fréquence cardiaque d’un patient portant un holter.
Les holters permettent l’enregistrement de signaux cardiaques sur de très vastes plages temporelles et l’étude des motifs anormaux de ceux-ci permet de délimiter les arythmies cardiaques et d’en identifier la cause.
La solution est déployée sur Docker (avec une orchestration Kubernetes) et l’intégralité des modèles sont codés en Python, pour son extrême agilité. Les calculs se font dans un Cloud, de sorte qu’ils ne durent que 5 minutes, alors qu’ils pouvaient atteindre 3 heures en dehors du Cloud.
La présentation de Christophe Gardella s’est poursuivie avec une démonstration des fonctionnalités de l’outil développé par Cardiologs. Il consiste en un dashboard dynamique en Angular sur lequel le médecin peut appliquer des filtres pour isoler des pans de l’électrocardiogramme analysé et localiser les anomalies qu’il comporte.
Conclusion
L’édition 2019 de DataJob Santé a proposé un panorama riche du secteur et porté son lot de messages cardinaux pour les Data Scientists y travaillant. Tous les intervenants ont la certitude que la maîtrise des données médicales et de santé dans les limites définies par le cadre légal permettront d’aboutir à une révolution des méthodes médicales, à condition qu’experts Data et professionnels de la Santé œuvrent ensemble, dans le respect des règles éthiques.
Stand de AZmed à DataJob Santé 2019
AZmed développe des solutions s’appuyant sur du Deep Learning pour repérer les fractures et autres anomalies sur des radiographies médicales
Stand de Quantmetry à DataJob Santé 2019
Ressources
Expérience de Minkowski
Anova
Serment d’Hippocrate du Data Scientist
Outil analyse d’impacts CNIL
https://www.cnil.fr/fr/outil-pia-telechargez-et-installez-le-logiciel-de-la-cnil
Cardiologs