Les systèmes d’information apprenants pour une aide à la

24
1 Symposium Les systèmes d’information apprenants pour une aide à la décision de confiance en santé 30 Novembre 2021 Avec le soutien de En partenariat avec

Transcript of Les systèmes d’information apprenants pour une aide à la

Page 1: Les systèmes d’information apprenants pour une aide à la

1

Symposium

Les systèmes d’information apprenants pour une aide à la décision de confiance en santé

30 Novembre 2021

Avec le soutien de

En partenariat avec

Page 2: Les systèmes d’information apprenants pour une aide à la

2

Comité scientifique

M. Jocelyn DutilCHU de Grenoble Alpes / CRIDirecteur du pôle Prospective, Recherche, Innovation et Communication, Directeur délégué des pôles Cancer et Maladies du sang, Recherche et Santé publique.

Pr. Daniel PagonisCHU de Grenoble Alpes / AIMPraticien Hospitalier au Pôle Santé Publique, Trésorier de l’AIM.

Pr. Anita BurgunParis-Descartes / HEGP / AIMProfesseur Médecin spécialiste en biostatistique médicale Santé Publique - Paris-Descartes / HEGP.

Pr. Marc CuggiaCHU de Rennes / AIMProfesseur d’informatique médicale (PUPH, MD, PhD) à l’Université de Rennes 1. Co-pilote de la mission de préfiguration du Health data hub. Responsable de l’Unité Fouille de données au CHU de Rennes. Co-Coordinateur du réseau des centres de données cliniques du Grand Ouest.

Pr. Alexandre Moreau-GaudryCHU de Grenoble AlpesPU-PH, membre du laboratoire TIMC-IMAG, membre de l’équipe GMCAO (Gestes Médico-chirurgicaux Assistés par Ordinateur), coordinateur du CIC-IT (Centre d’Investigation Clinique - Innovation Technologique) de Grenoble.

Pr. Fleur MouginUniversité de Bordeaux / AIMProfesseur d'informatique à l’Université de Bordeaux, Responsable du M2 SITIS - ISPED.

Pr. Brigitte SéroussiAP-HP / AIMProfesseur d’informatique biomédicale à la Sorbonne Université, Praticien hospitalier en santé publique à l’APHP

Pr. Pascal StacciniCHU de Nice / AIMPrésident de l’AIM, Responsable du Département d’Information et d’Informatique Médicale du CHU de Nice et du Groupement Hospitalier de Territoire Alpes-Maritimes.

Dr. Rosy TsopraUniversité de Paris / HEGP / AIMAssistant Hospitalo-Universitaire - Médecin spécialisé en informatique médicale / Intelligence Artificielle / Santé Numérique (MD, PhD) - Université de Paris / HEGP.

Présidence du comité scientifique

Membres du comité scientifique

Les systèmes d’information apprenants pour une aide à la décision de confiance en santé

Les établissements de santé stockent et traitent de plus en plus de données cliniques qui constituent un réservoir extrêmement riche pour la compréhension scientifique du corps humain et des maladies. Les suivis des patients à domicile (HAD), les données des objets connectés (montre, capteur de glucose, GPS, balance, …), les données liées à la navigation sur Internet, ainsi que les données environnementales (climat, pollution, …) viennent enrichir ce réservoir de Big Data.

Exploiter ces données modifie la prestation de santé au quotidien en personnalisant la prise en charge du patient et en développant des outils d’aide à la décision lié à de l’Intelligence Artificielle (IA). L’objectif n’est pas de remplacer le médecin par une machine, mais de l’accompagner dans son analyse et son interprétation des données recueillies, pour optimiser le bon diagnostic et suggérer, si besoin, des examens complémentaires.

Du patient à la donnée, de la donnée massive au modèle prédictif, implémenté et évalué, pour une aide à la décision de confiance en santé. Chaque étape est clef et comporte de nombreux enjeux auxquels il est indispensable de répondre pour développer des outils opérationnels, performants et de confiance pour une meilleure prise en charge du patient.

Cette journée s’est donnée pour mission d’être à la fois riche et pragmatique pour délivrer nombre de concepts et messages sur les systèmes d’informations de santé.

Ont été abordées les thématiques suivantes :

• L’interopérabilité et l’intégration des données médicalesde santé

• L’extraction des connaissances et de modèles prédictifspour l’aide à la décision

• L’évaluation et la mesure d’impact des systèmes d’aideà la décision

Page 3: Les systèmes d’information apprenants pour une aide à la

3

IntroductionLes systèmes d’information apprenants : un défi pour nos établissements de santé » - Pr Marc Cuggia & Pr Alexandre Moreau-Gaudry

Un CHU en prenant en charge des patients et en délivrant des soins, collecte chaque jour de très nombreuses données de santé. L’objectif est qu’à partir de ces données, de nouvelles connaissances soient pro-duites, et donnent lieu à des outils d’aide à la décision, utilisées au lit du patient, bouclant la boucle : du patient au patient.

Depuis quelques années, la mise en place du dossier médical per-sonnel informatisé (DMPI) a permis de collecter de plus en plus de données patients. Ce processus s’est accéléré avec la création d’entre-pôts de données de santé (EDS) dans de nombreux établissements qui permettent une utilisation à plus large échelle. Ces EDS contiennent des informations pour la recherche et l’innovation en santé.

L’utilisation de l’Intelligence Artificielle (IA) permet, par la suite, de dé-velopper des dispositifs médicaux performants et adaptés (systèmes apprenants) pour une aide à la prise de décision à l’échelle individuelle et collective.

DM Logiciel

K2P

D2K

P2DKnowledge to Practice

Data to Knowledge

Découverte de nouvelles connaissancesConnaissances Données de Recherche

Patientsto Data

Outilsd’aide à lADècision

Système de Santé

Prise en Charge

Réutilisation des données de soinDPI

Donnés orientées recherche

EDS

Page 4: Les systèmes d’information apprenants pour une aide à la

4

Pour boucler la boucle :Pour boucler la boucle : 3 étapes où questions et enjeux sont d’actualité.

Patient to Data » : la collecte de données patients. Une étape clef. De nombreuses questions doivent être impérativement abor-dées pour développer des systèmes performants : qualité des données, leur source, leur sécurité, … (?) Quel est le périmètre à prendre en compte (pays ? hôpital ? Internet ? données de villes ? systèmes numériques en santé ?) Se pose également la question des moyens, et des cadres nécessaires pour inté-grer l’ensemble de ces sources, des environnements médicaux. Mais, aussi des questions d’éthiques, de sécurité et de réglementation.

1.

2. Data to Knowledge » : l’extraction des connaissances.Quel est l’objectif : améliorer les soins, piloter un établissement, faire de la recherche ? Quels sont les outils à développer ? Existent-ils déjà ou faut-il les inventer ? Disposons-nous de l’ensemble des moyens, des expertises néces-saires pour mettre en œuvre ces outils ? Sont-elles toutes dans nos structures ou environnements locaux (au sein des hôpitaux, des universités, R&D des in-dustriels). Quels sont les cadres à mettre en œuvre pour faciliter ces collabora-tions ? Existent-ils ? Faut-il les renforcer, les développer ?

Page 5: Les systèmes d’information apprenants pour une aide à la

5

Knowledge to Practice » : le transfert de ces connaissances dans des outils d’aide à la décision.Une fois la connaissance récupérée, comment l’utiliser au quotidien ? Comment implémenter la fermeture de la boucle ? Par quels moyens ? Comment qualifier ces nouveaux outils innovants ? Ce qui fait référence à des enjeux techniques, d’évaluations d’usages, médico économiques. Quelles sont les méthodes d’éva-luation ? Un des grands enjeux est aussi de diffuser ces nouvelles technologies : quel est donc le rôle des industriels, des académiques, des organisations en san-té ? Comment travailler ensemble ?

Ces nouvelles approches vont entraîner des changements dans les systèmes de santé. Cela pose évidemment la question de comment accompagner le chan-gement des organisations dans l’approche de ces nouveaux systèmes appre-nants.

Pour chacune de ces 3 étapes, la multidisciplinarité des équipes et la confronta-tion avec la réalité des données et des outils développés est fondamentale. C’est un défi majeur de crédibilité et de confiance en ces nouveaux systèmes. Aux Etats-Unis, la FDA a lancé des travaux pour cadrer l’évaluation de ces dispositifs, qui doivent être évalués comme tout autre dispositif médical, ou traitement.

3.

Page 6: Les systèmes d’information apprenants pour une aide à la

6

Il existe aujourd’hui un écosystème de la donnée. Il y a les données pri-maires de soin produites par les CHU, celles produites en ville (mais en-core très peu accessibles ou inexistantes), celles produites par le patient lui-même (medical devices – cf. capteur de glucose), et enfin toutes les données environnementales, voire plus largement avec Internet (ré-seaux sociaux, google, ...) qui viennent compléter ces données de santé.

La richesse des données vient de leur quantité, de leurs sources mul-tiples et de leur croisement qui étaient initialement non connectées. L’enjeu est donc de collecter toutes ces données et de les croiser, en respectant des conditions de sécurité, de qualité, de méthodologie, d’éthique et d’analyse rigoureuse. Il y a un enjeu fort pour l’interopéra-bilité, sans jamais oublier l’objectif final : l’amélioration de la prise en charge du patient.

L’interopérabilité est définie par la capacité de deux systèmes, ou plus, à échanger une information de santé, à la comprendre et à l’utiliser une fois reçue.

La référence dans le domaine de l’interopérabilité est une publication annuelle de ONC (Office of the National Coordinator for Health Informa-tion Technology) : The Interoperability Standards Advisory (ISA), qui est une compilation des Bonnes Pratiques en termes de standards. Elle couvre l’environnement pour connaître les standards émergents, leur niveau de maturité, ainsi que les tendances.

Axe 1. « Patient to data »Axe 1. « Patient to data » Intéropérabilité et intégration des données médicales de santé - Pr. Fleur Mougin & Pr. Pascal StacciniPrésentation des concepts clés : interopérabilité et intégration des données médicales de santé Dr. Olivier Bodenreider (NIH MARYLAND USA)

Page 7: Les systèmes d’information apprenants pour une aide à la

7

L’interopérabilité peut être écrite sous la forme d’une équation simple : I = T + M où « I » est l’interopérabilité en santé, « T » les terminologies (= contenu), et « M » les modèles d’informations (= contenant). « T » et « M » doivent être standardisés pour que le message transite correctement tout au long de la chaîne d’information.

Les Terminologies (=contenu).En santé, il y a un grand nombre d’informations, de des-criptions et donc de terminologies (500 pour la biologie). En fonction de ce qui est étudié, une terminologie spéci-fique sera utilisée. Mais, certaines sont plus importantes que d’autres :

- SNOMED CT, terminologies biomédicales(www.snomed.org/)

- LOINC, terminologies pour les analyses élémen-taires de biologie (loinc.org/)

- RxNorm, terminologies du médicament(www.nlm.nih.gov/research/umls/rxnorm/)

Il y a également des terminologies qui ont un rôle administratif (International Classification of Diseases – Clinical Modification (ICD10-CM) pour le rembour-sement, Current Procedural Terminology (CPT) pour lanomenclature d’actes).

Les Modèles d’information (=contenant).Il peut s’agir d’un message simple, ou d’un Clinical Data Warehouse, qui consiste à stocker l’information clinique, puis à l’agréger (données cohérentes et communes aux diverses sources).

Exemples :

- OMOP (Observational Medical OutcomesPartnership), utilisé pour la structure des entrepôtsde données,

- I2b2 (Informatics for integrating biology and the bed-side), utilisé pour les projets de recherche,

- PCORnet (National Patient-Centered Clinical Re-search Network), utilisé pour la recherche clinique

- Sentinel (Food & Drug Administration), pour la sécu-rité des médicaments.

La formule relativement simple au départ I = T + M se complexifie, car il existe une interopérabilité parmi les terminologies, tout comme il en existe une parmi les modèles d’informations. Il y a également une association entre les Terminologies et les modèles d’informations.

Il est important de garder à l’esprit la finalité de ce que l’on souhaite faire avec l’information. Si l’objectif est d’analyser des données à large échelle : la valeur ajoutée est dans l’agrégation de ces données. Au contraire, si l’objectif est de transmettre la nature exacte de la don-née, et qu’aucune perte même partielle n’est possible, la valeur ajoutée est dans la donnée agrégée.

Cas d’usage #1 - Qualité des données : lubie ou néces-sité ? - Dr. Bastien Rance (HEGP - APHP)

La qualité concerne l’ensemble de la science de la don-née. C’est un sujet complexe multi-dimensions extrême-ment important pour le développement d’outils perfor-mants. (Saez et al. 2021)

La première question est de savoir si les données néces-saires sont toutes présentes ; certaines sont peut-être cachées et/ou manquantes. Connaître leur origine, les confronter à la réalité aident également à savoir si elles sont exactes et cohérentes au contexte.

Se poser la question de la stabilité de l’information, en particulier dans le temps est judicieuse. Lors de la pan-démie COVID-19, la population hospitalisée a été mo-difiée, c’est un critère à prendre en compte. De même au fil du temps, des valeurs physiologiques (comme le cholestérol) peuvent évoluer au sein d’une même popu-lation. Enfin, un changement de logiciels, d’appareils de mesure, peut avoir également avoir un impact.

Page 8: Les systèmes d’information apprenants pour une aide à la

8

Quelle est la fiabilité des données ? Une étude a mis en évidence que sur 650 000 documents de patients atteints d’un cancer, 9 600 zones avaient été dupliquées (copier/coller) mais avec une erreur de date.

Les données sont-elles représentatives ? La créatinine est élevée chez la femme enceinte, et peut être différente en fonction des origines ethniques et raciales. La définition de la valeur normale est donc ici très importante.

Retenons qu’il n’y a pas de conséquence clinique le jour J pour le patient, car la/les données de santé existent pour la bonne prise en charge thérapeutique. C’est au niveau de la méta-analyse que la qualité de l’information aura un impact. D’où l’importance pour les entrepôts de don-nées d’adopter de Bonnes Pratiques.

Cas d’usage #2 - Représentation des données patients dans une vision longitudinale : mise en œuvre du mo-dèle de données OMOP au CHU de Lille - Dr. Antoine Lamer (CHU Lille)

Le modèle OMOP a été mis en œuvre au CHU de Lille pour répondre à une observation des cliniciens qui souhaitaient mieux comprendre le parcours patient après le bloc opératoire. La finalité était de mieux orien-ter certains patients à la sortie de la salle de réveil, afin d’optimiser leur prise en charge.

OMOP est un modèle gratuit, en Open Source, et in-dépendant des éditeurs et des pays. Pour le projet, la structure a été standardisée, le vocabulaire spécifique à l’étude a été défini, puis ajusté avec le vocabulaire inter-national. Quarante nouveaux codes (comme hypoten-sion, tachycardie, bradycardie, ...) ont été ajoutés.

L’étude des flux de patients (soins conventionnels, soins intensifs, passage non programmé en unité de réani-mation, décès en unité de soins conventionnels, décès, ...) a permis de quantifier ces flux, et de mieux les com-prendre. La prochaine étape sera de « remonter » au bloc opératoire pour identifier des marqueurs de risques éventuels, et ainsi mieux orienter les patients.

Cette question de flux de patients est également im-portante pour d’autres pathologies. En utilisant le mo-dèle OMOP, le parcours patient a pu être standardisé.

Cas d’usage #3 - Intégration de données multi-sources : consortium 4CE - Dr. Bertrand Moal (CHU de Bordeaux)

Consortium 4CE pour Consortium for Clinical Charac-terization of COVID-19 by Electronics Health Records (EHR). Ce consortium a été initié en mars 2020 par le Department of Biomedical Informatics de Harvard Medical School pour générer des connaissances, grâce aux don-nées de soins courants, afin d’informer les médecins, les épidémiologistes et le Grand Public sur le COVID-19.

Ce consortium réunit une communauté internationale de 100 membres (médecins, biostatisticiens, informati-ciens, data scientists …) répartis dans 8 pays (Etats-Unis, Europe, Brésil, Inde). Il travaille sur les données de plus de 350 000 patients dans 342 hôpitaux, dont les hôpi-taux de l’AP-HP et le CHU de Bordeaux. Il n’y a pas de financement spécifique à ce jour.

Une architecture concernant les soins courants dans les hôpitaux a été développée, avec pour objectif de collecter des données individuelles de soins courants pour des analyses consolidées sans jamais qu’il y ait de partage de données individuelles. La 1ère étape a consisté sur chaque site, en une collecte et une structuration des données individuelles, ayant une syntaxe et une sé-mantique communes. Le Consortium 4CE propose des scripts pour formater ces données dans un cadre ; ils se sont concentrés sur les données démographiques, d’hospitalisation - décès, de diagnostic (CIM 10/9), d’actes, de biologie (LOINC) et de traitement (ATC). Des contrôles qualité sur ces données ont été effectués.

Toujours sur site, a eu lieu la phase d’agrégation de ces données individuelles. 4CE a créé un environnement docker afin qu’une analyse faite dans un centre puisse être dupliquée dans un autre centre, facilitant ainsi le partage des analyses.

Enfin, une fois que l’analyse des données agrégées a été faite, on les a centralisées.

Ce consortium 4CE a permis de développer des outils très agiles, puissants et rapides, avec une approche ef-ficace : en très peu de temps de nombreuses données individuelles ont pu être collectées, agrégées, pour être analysées puis partagées. A ce jour, 8 papiers ont été publiés (le 1er article a été soumis 4 semaines seulement

Page 9: Les systèmes d’information apprenants pour une aide à la

9

après la création du consortium et contenait des données agrégées de patients), et 13 manuscrits ont été soumis ou sont en cours de soumission. Notons aussi que les 1ers auteurs viennent de 4 pays différents.

Le CHU de Bordeaux a également été leader sur une analyse de données (Acute respi-ratory distress syndrome after SARS-CoV-2 infection on young adult population : interna-tional observational study based on electronic health records through the 4CE consortium) - thèse de médecine du Dr. Bertrand Moal (orateur). Une rapidité dans la mise enplace (de l’idée au papier : 6 mois) ; l’étude a porté sur 240 hôpitaux aux Etats Unis, et40 hôpitaux en Europe, soit 1000 patients à travers le monde. Si l’étude s’était passéeexclusivement au CHU de Bordeaux, il n’y aurait eu que 25 patients (cf. critères d’in-clusion).

Le consortium 4CE travaille sur plusieurs autres projets sur la pandémie du COVID-19 (sévérité de la maladie, COVID longs, analyse des différentes vagues), mais aussi, et ce grâce à la reproductibilité de l’outil, sur des populations sous représentées (pédia-trie, adolescence et jeunes adultes) et des populations spécifiques (Neurologie, SDRA, Insuffisance rénale aigüe …). Les prochaines étapes seront d’inclure d’autres sites en France, et de développer 4CE pour d’autres pathologies. Cette approche fédérée per-met de limiter les aspects règlementaires, et de faciliter la participation au consortium.

Les ressources sont publiques et accessibles :

https://covidclinical.net/

https://github.com/covidclinical

Page 10: Les systèmes d’information apprenants pour une aide à la

10

Table ronde – Enjeux et problématiques liés à l’utilisa-tion secondaire des données hospitalières - Dr. Vian-ney Jouhet (CHU de Bordeaux), Pr. Stefan Darmoni (CHU de Rouen), Mme Lise Marin (Dedalus) et Pr Alexandre Mo-reau-Gaudry (CHUGA)

Il y a une nécessité de mettre en commun les données de santé afin d’avoir une vue transversale pour une meil-leure prise en charge du patient.

Les données peuvent être intégrées via une approche fé-dérée qui s’appuie sur une structure opérationnelle exis-tant dans un / d’autres centres (OMOP et 4CE). Ce type d’approche est très acceptable par les institutions : il est ainsi plus simple de convaincre en interne de l’intérêt de l’outil. Un autre type d’intégration consiste en une ap-proche centralisée où toutes les données sont intégrées dans un entrepôt de données. On dispose alors d’un maximum d’information et une vision plus intégrative de la prise en charge du patient. Mais, qu’en est-il de la qualité des données ? D’autant plus quand ces dernières viennent de plusieurs établissements. Cette mise en qualité sur des projets spécifiques pour des jeux de don-nées spécifiques, doit être faite par les établissements. Cette vision intégratrice peut procurer une crainte pour la communauté des établissements, et être plus compli-quée à mettre en place.

Toutefois, il y a un continuum entre ces 2 approches, qui ne s’opposent pas totalement. La question doit être po-sée : centralisation des données ou fédération ? Peut-on parler de centralisation au niveau d’un territoire ? Et de fédération entre les territoires au niveau national ? Peut-on imaginer un modèle national : France OMOP ?

Quel que soit le type d’intégration, la question de la qualité des données est toujours primordiale : d’où vient-elle ? Comment la donnée a été produite ? Dans quel contexte ? Comment a-t-elle été transformée pour obtenir une qualité suffisante d’exploitation correcte et partagée ?

A noter, que les fournisseurs de données sont très sou-vent des industriels. Au CHU de Rouen, par exemple, on n’en compte pas moins de 20 différents. Les collabora-tions pour récupérer ces données sont assez variables, ce qui peut être un frein au projet. Une vision nationale de coopération avec les industriels pourrait faciliter le travail. Un autre point à souligner est la stabilité de la donnée dans le temps à la suite d’un changement de logiciels, ou d’industriels.

Un travail collaboratif (équipes des CHU, industriels) associé à une expertise en local sont absolument né-cessaires (data scientists, cliniciens) pour la qualité et la cohérence des données, socle de la confiance pour l’outil développé. Il serait judicieux que les professionnels de santé, pendant la formation des internes, soient formés aux entrepôts de données.

Les paysages académiques et industriels vont devoir évo-luer face à l’arrivée massive de nouvelles données, telles que les données sur le long terme (cf. COVID long), les données patients de la médecine de ville, les données patients à domicile (patient reporting outcomes), les don-nées des objets connectés, les données issues d’Internet, les données environnementales, etc.… Aujourd’hui, les applications collectent beaucoup plus de données que les CHU. Peuvent-elles être ouvertes ? Va-t-on leur de-mander de l’interopérabilité ? Le Pr David Darmon, à Nice, a lancé l’initiative de créer un entrepôt de données de médecine de ville.

Il peut être aussi intéressant de se demander si on peut avoir une approche prospective avec des données « lega-cy » comme OMOP et 4CE ? Imaginer de nouvelles réu-tilisations auxquelles nous ne pensons pas aujourd’hui.

C’est un domaine encore en phase de maturation, et soulignons que de nombreux établissements n’y sont pas encore parvenus. Ces projets, représentent, en effet, des coûts financiers, de temps et de personnes pour les CHU. Face à l’avalanche de données et de cas d’usages la mise en place peut être compliquée. Une collaboration entre établissements peut aider.

Page 11: Les systèmes d’information apprenants pour une aide à la

11

Conférence « les systèmes d’information apprenants » - Pr. Charles Friedman - Univer-sité du MICHIGAN (USA)Pour définir un système d’information apprenant (Learning Health System – LHS) arrêtons-nous sur chaque mot. L’apprentissage (Learning) fait référence à la capacité d’amélioration continue par la collecte et l’analyse de données, la création de nouvelles connais-sances et l’application de ces connaissances pour influencer la pratique. La santé (Health) est l’objectif final d’un bénéfice universellement reconnu pour l’humanité. Un système (System) a des composants agissant à l’unisson pour atteindre des objectifs qui ne peuvent être atteints par aucun sous-ensemble de composants.

Ainsi, en intégrant ces termes, les systèmes de san-té deviennent des systèmes de santé apprenants lorsqu’ils acquièrent la capacité de s’étudier et de s’améliorer continuellement, régulièrement et effi-cacement. Les caractéristiques, les évènements et le contexte sont capturés en tant que données. A partir de ces données, de la connaissance est extraite. Cette nouvelle connaissance est disponible pour aider à la décision.

De nouvelles données collectées et de nouvelles connaissances acquises à chaque étape, viennent en-richir, à leur tour, ce cercle vertueux. Un système d’in-formation apprenant exécute donc des cycles d’amé-lioration. Ces cycles tournent simultanément, chacun sous l’égide d’une communauté et travaillent pour un objectif commun. Afin de favoriser la production en routine et de faire des économies d’échelle, tous ces cycles vont être supportés par une même struc-ture (infrastructure sociotechnique) : cette plateforme va convertir les collections de cycles en systèmes d’apprentissage évolutifs. Une infrastructure favorise la constance, la fiabilité, la polyvalence, l’accessibilité,

Page 12: Les systèmes d’information apprenants pour une aide à la

12

et l’extensibilité. De plus, si elle est ouverte et interconnectée, elle favorise l’évolutivité. De nombreuses infrastructures ou-vertes existent déjà (OHDSI, i2b2, PopMedNet, TRANSDoRm, Knwoledge Grid …), mais il est important d’en obtenir plus.

Les systèmes de santé apprenants peuvent exister à n’importe quel niveau d’échelle : celle d’une organisation, de plusieurs organisations au sein d’une région géographique ou juridic-

Data to KnowlegdePerformaance

P2D:P2D:

D2K:D2KData to Knowlegat oK n

:Data to Knowlegda to K

K2P:K2PKnowledge todge toKKnowledgPf

P

er

f

ormance

toDt

Pf t

D2K:2K::K:D2K22KData KnowDD2D2D2ta too Kno

K2P:K2K2K2P2P2PoowledP:P:PP ge todg

aerformPe aP:P:PP: ancea

P2D:P2D:P2D:DataDataP2D:P

erf

orma

nce to

D

at

a

D2K:Data to Knowlegde

K2P:Knowledge toPerformance

P2D:Performance to

Data

Organize, Start, Maintain, Support Learning

Communities

Manuals, “Canned” Methods

Published Instruments

Adopted Standards

Agreements Templates

Technical Platforms

“Canned: Methods

Adopted Standards

Technical Platforms

Implementation Methods

Capture, Identify and Measure Performance and

Performance Changes

Represent Health Information as

Computable Data

Provide and Govern Access to and Use of

Data

Share and Analyze Data Into New Knowledge

Make Knowledge Computable and Sharable

Generate and Deliver Knowledge-Derived Advice to

Applicable Users

Enable and Promote Performance Changes

5

6

7

8

1

2

3

4

tionnelle identifiée, d’un réseau d’organisations, d’une nation entière, de groupes de nations ou encore dans le monde en-tier. Dans la mesure où les infrastructures soutenant l’appren-tissage continu sont compatibles entre des systèmes distincts, il est possible de former des systèmes à des niveaux d’échelle supérieurs grâce à la composition de systèmes de niveaux inférieurs.

External Evidence

Analyze Data

Assemble Data

Capture Preactice as Data

Health Problemof Interest

D2K:Data to Knowlegde

K2P:Knowledge toPerformance

P2D:Performance to

Data

DesignIntervention

Take Action

Formation of Learning

Community

Interpret Results

Page 13: Les systèmes d’information apprenants pour une aide à la

13

Axe 2. « Data to knowledge » :Axe 2. « Data to knowledge » : Extraction de connaissances à partir des données massives en santé et modèles prédictifs - Responsables scientifiques : Pr. Anita Burgun et Pr. Marc CuggiaIntroduction – Présentation des concepts clés : les différentes techniques d’apprentissage «Machine Learning » à appliquer aux données de santé - Pr. Antoine Neuraz (Université de Paris)

Le Machine Learning, « apprentissage automatique » en français, est une méthode d’analyse des données qui automatise la création de modèles analytiques et favorise les données prédictives. De nombreux usages en santé du Machine Learning impactent la pratique des professionnels de santé, les établissements hospitaliers ou l’industrie pharmaceutique.

Comme on l’a vu précédemment, tout au long de la vie d’un patient, de nombreuses données de santé sont produites (codes diagnostic, pres-criptions, actes, examens biologiques, comptes rendus, objets connec-tés …). Pour être utilisées dans les Machine Learning, ces données de santé doivent être préparées. Cette transformation va impliquer un certain nombre de choix méthodologiques, qui peuvent avoir un impact sur la qualité des modèles que l’on va produire. On devra choisir les variables à utiliser, la temporalité, définir un certain nombre de dérivés comme des phénotypes, et gérer les données manquantes.

Page 14: Les systèmes d’information apprenants pour une aide à la

14

Il existe différentes approches d’apprentissage qui va-rient selon le type et le volume des données.

• Apprentissage supervisé. C’est un système qui four-nit à la fois les données en entrée et les donnéesattendues en sortie. Les données en entrée et ensortie sont étiquetées en vue de leur classification,afin d’établir une base d’apprentissage pour le traite-ment ultérieur des données.Par exemple, le modèle va être entraîné à repérer lespatients « malades » ou « non malades ». Ainsi, unefois qu’on a des nouveaux patients, on peut les clas-ser en « malade » ou « non malade ». Ce modèlepeut être entraîné sur une séquence temporelle, etessayer de prédire ce qui va se passer par la suite.

• Apprentissage non supervisé. Il n’y a pas d’informa-tion sur les cas et les contrôles ; tout ce dont on dis-pose est la description des patients. L’algorithme uti-lise des données non étiquetées : les réponses quel’on veut trouver ne sont pas présentes dans les don-nées fournies. On attend donc de la machine qu’ellecrée elle-même les réponses grâce à différentes ana-lyses et au classement des données. La 1ère étape vadonc être de s’entrainer à disposer les patients dansl’espace et grouper les patients qui se ressemblentdans cet espace, puis former des groupes. Une foisles données organisées, s’il y a un nouveau patient, ilest classé dans un des groupes.

• Apprentissage par renforcement. Cette méthode deMachine Learning, de plus en plus utilisée, consisteà laisser les ordinateurs apprendre de leurs expé-riences grâce à un système de récompense ou depénalité en fonction des actions effectuées. Il y a unenvironnement et un agent qui agit sur ce premier,et reçoit une récompense ou non. L’action envoyéeva modifier l’état de l’environnement, un avis demodification de l’environnement va être envoyéeà l’agent. Ainsi, en faisant tourner cette boucle desmillions de fois, l’agent va apprendre une politiqued’action.

Une fois développé, entraîné, évalué, le modèle peut passer en production à plus grande échelle, en veillant à toujours effectuer une évaluation prospective (type essai clinique) et un monitoring de ses performances au fil des mois.

Cas d’usage #1 - Projet Improved : IA pour le diagnostic du cancer de la vessie - Dr. Guillaume Bouzille (CHU de Rennes)

Le cancer de la vessie est un problème de santé pu-blique : 13 000 cas/an et 5 000 morts/an (France, 2017). C’est un cancer fréquent : l’enjeu est donc de le diagnos-tiquer le plus tôt possible. La cytologie urinaire a un pouvoir de détection de 80% des cancers avancés, mais seulement de 20% pour les cancers les plus précoces ; ce qui a un impact sur la survie des patients.

L’objectif du projet Improved (projet financé par la région Bretagne) est de développer une solution de diagnostic précoce du cancer de la vessie en intégrant des algo-rithmes d’Intelligence Artificielle à partir d’images et des données médicales massives (cf. facteurs de risques liés à ce cancer). Ces deux sources de données sont complé-mentaires.

• Les données d’imageries sont issues d’un essaiclinique (439 patients) ayant utilisé la solution detraitement VisioCyt® développée par la sociétéVitaDx.

• Les données médicales massives, quant à elles,proviennent de données de vie réelle (clinico-bio-logiques) de 4828 patients, les données sontstockées dans l’EDS du CHU de Rennes eHop(comptes rendus hospitaliers, consultations, radio-logies, questionnaires médicaux, dossiers urgence,dossiers infirmier, PMSI, données de laboratoires,prescription/administration, …).

L’association de ces deux sources, a permis de dévelop-per un modèle combiné. L’apprentissage supervisé a été utilisé pour discriminer « patient malade » de « patient non malade ». Le modèle combiné discriminait un peu

Page 15: Les systèmes d’information apprenants pour une aide à la

15

plus les patients malades par rapport à l’analyse des images seules. Ce projet souligne l’importance de la qualité des données collectées, et ce, même pour les in-formations les plus fines (fumeur, diabète, profession à risques…).

De nombreuses perspectives s’ouvrent tant le dossier patient est riche en informations : il faut enclencher un cycle vertueux pour collecter plus de données, et de bonne qualité, et ainsi améliorer le modèle. Ce projet monte aussi l’importance d’un travail collaboratif entre CHU et industriels.

Cas d’usage #2 - Intelligence artificielle et réutilisation de données de santé pour détecter les effets indési-rables du médicament : un chemin cahoteux, de nom-breuses leçons apprises - Pr. Emmanuel Chazard (CHU de Lille)

L’objectif du projet était de réutiliser les données de san-té des séjours hospitaliers (PMSI, résultats d’analyses de biologie médicale, médicaments administrés, …) pour détecter les effets indésirables du médicament en déve-loppant un système d’aide à la décision auto-apprenant (CDSS - Clinical Decision Support System).

La première leçon de ce cas d’usage a concerné la qualité de la donnée, si importante pour l’interopérabilité. De nombreuses données ont été, certes, collectées, mais leur identification n’a pas toujours été simple. Les unités étaient parfois fausses ou manquantes. La terminologie utilisée n’était pas toujours consensuelle (exemple pour le potassium qui selon LOINC s’écrit « 6298-4 », mais va être mentionné sous « K+ », « potassium sang »,

« kaliémie », « K1 », …). Et, contrairement aux études cliniques où tout est protocolisé, des données pouvaient manquer (exemple : absence de glycémie mentionnée qui pouvait être interprétée, ou non, par « il n’y a pas de problème »).

Parfois, la vraie information était implicite, et pouvait être cachée derrière un ensemble de données. Dans ce cas-là, il faut créer les variables qui transcrivent directe-ment ou indirectement cette information. Et là seule-ment les méthodes statistiques pourront fonctionner.

Un autre point important a été de chercher les variables discriminantes en fonction du sujet du projet, et de dis-créditer certaines variables. L’âge, par exemple, qui peut selon les cas, ne peut pas être un critère : en vieillissant, le risque d’être hospitalisé et de mourir s’accroît...

Enfin, association n’équivaut pas à causalité (cf. associa-tion insuline et hyperglycémie, l’hyperglycémie permet d’identifier les diabétiques, seuls à utiliser de l’insuline).

Rappelons un point très important déjà mentionné : bien que ces points cités affectent l’utilisation et l’intero-pérabilité des données, il n’y a aucune conséquence sur la prise en charge du patient le Jour J. Les professionnels de santé connaissent les ordres de grandeur, les abrévia-tions, le contexte, le cas clinique du patient.

La deuxième leçon de ce projet fut l’importance d’une approche contextualisée pour éviter l’over-alerting. Le risque n’est en effet pas le même partout : dans les uni-tés de soins où la probabilité empirique est supérieure à un seuil, une alerte automatique doit être envoyée à chaque fois. Exemple de l’association de AVK & IPP qui entraîne un risque hémorragique ; une alerte est

Page 16: Les systèmes d’information apprenants pour une aide à la

16

envoyée pour les unités de soins où la probabilité empi-rique est supérieure à 10%. Cette alerte peut être aussi être très utile pour aider un médecin fatigué, et/ou qui ne connait pas cette association de médicament.

La qualité de la donnée et le contexte sont clefs. Un al-gorithme ne peut être évalué que dans un contexte par-ticulier et pour une utilisation donnée.

Cas d’usage #3 - Utilisation des données pour amélio-rer la qualité et la sécurité des soins en prévenant les évènements indésirables - Pr Jean-Luc Bosson (CHUGA) & Mme Ursula von Schenck (Elsevier)

Le projet DEMETER a eu pour objectif de développer un modèle de Deep Learning pour évaluer la sécurité des soins au CHU de Grenoble Alpes (CHUGA). Il s’agit d’une étude rétrospective menée par le CHUGA et Else-vier, qui s’est appuyé sur PREDIMED, l’EDS du CHUGA.

L’étude fut multi-sources : les données individuelles (de-identifiées) enregistrées lors des 48 premières heures d’hospitalisation au CHUGA, entre 2016 et 2018 ont été collectées. A ces données ont été ajoutées des données sociodémographiques (INSEE). L’étude fut aussi multi-cibles : tous les événements indésirables pou-vant survenir lors d’une hospitalisation ont été pris en compte.

Cette étude a permis de mettre en évidence les princi-paux évènements indésirables survenant lors des pre-mières heures d’hospitalisation.

Table ronde - Enjeux, problématiques, leviers et freins pour un établissement de santé - M. Hector Countouris (APHP), M. Allan Rodriguez (VitaDX) et Pr. Jean-Luc Bosson (CHUGA)

Le premier point pour accéder à toutes ces données, c’est qu’il faut en connaitre l’existence. D’où l’importance de communiquer sur les EDS.

Le second point très important est la qualité des don-nées. Sans elle, l’utilisation optimale de la donnée et son interopérabilité ne sont pas possibles. L’historique et l’acquisition des données font également partie des points clefs.

Pour traiter efficacement ces données massives de santé, il est primordial d’avoir une équipe experte aux compétences complémentaires. Au sein de cette équipe pluridisciplinaire, on va ainsi trouver le professionnel de santé (qui a sa problématique), l’ingénieur réseau Big Data, le Data Manager (qui va rendre utilisables les données), le Data Scientist (qui va les exploiter), le statis-ticien (qui va accompagner ce dernier), l’épidémiologiste et enfin des profils plus transversaux pour la gestion de projet. Toutes ces compétences sont au carrefour entre cliniciens et patients, car il faut collecter les données, les nettoyer, les analyser, les interpréter toujours dans une approche clinique. Notons qu’il ne faut pas oublier de prendre en compte le facteur Humain, dans l’acceptabili-té de ces outils.

Il est donc très important de recruter du personnel qua-lifié, de le former et de le maintenir dans le temps. Au sein de l’équipe, mais aussi individuellement, il faut une compréhension du monde de la santé, de ses enjeux, ainsi que des aspects informatiques et des modèles. D’où l’importance de la formation des internes aux ma-thématiques, à l’informatique, aux statistiques d’une part et celle des ingénieurs Big Data au monde de la santé d’autre part. Par exemple, les Data Scientists doivent savoir adapter de façon opportuniste le sujet d’étude si besoin, et traduire le problème médical en des termes compréhensibles et acceptables pour les informaticiens et statisticiens.

Malgré tout, il subsiste un « côté » artisanat scientifique qui a un impact sur l’extraction de caractéristiques et la transformation des données. Il n’y a pas une méthodo-logie unifiée pour le faire. Garder aussi à l’esprit que dans certains cas, il faut savoir discréditer les Machines Learning qui restent des « boîtes noires » pour les-quelles on ne peut pas expliciter la prédiction. En effet,

Page 17: Les systèmes d’information apprenants pour une aide à la

17

tous ces projets ne peuvent pas se faire sans qu’il y ait une réflexion de l’Homme sur ce que propose l’IA (cf. confrontation à la réalité), sur les facteurs humains et or-ganisationnels. Cet outil d’aide à la décision doit s’inté-grer impérativement dans le flux de travail, être accepté par le patient et être économiquement efficace. Soigner les gens, connaitre et respecter la manière dont les per-sonnes travaillent est plus important que de construire un modèle. Il y a finalement plus d’enjeux humains que techniques. Un travail collaboratif et en réseau pour par-tager les bonnes pratiques, tout comme les échecs, mu-tualiser les expertises et les synergies sont nécessaires.

Retenons qu’un bon logiciel est un logiciel utilisé, et préalablement testé. La preuve de concept permet d’en-gager le projet, de travailler sur des données plus impor-tantes, et d’avancer sur le diagnostic et le dépistage (cf. Projet Improved).

Les prochaines étapes seraient de consolider les EDS (nettoyage, qualité) et d’élargir le spectre des données. Des projets sont en cours : aux données médicales ex-trahospitalières ont été ajoutées des données géogra-phiques (pollution - air Parif ). Deux mondes qui ne se connaissaient pas jusqu’alors, mais qui sont complémen-taires pour apporter une plus-value à la donnée de santé. Cependant, il y a un grand défi pour le rapprochement des données : alors que la donnée médicale est stable, structurée, stockée à un endroit précis, la donnée géo-graphique ne l’est pas (cf. stabilité dans le temps : très peu de données d’il y a 20 ans – 30 ans dans l’étude des cancers, par exemple). Il est donc compliqué, à ce jour, de faire des études rétrospectives très longues.

Page 18: Les systèmes d’information apprenants pour une aide à la

18

Axe 3. « Knowledge to practice»Axe 3. « Knowledge to practice» Implémentation, évaluation en vraie vie et mesure d’impact - Pr. Brigitte Séroussi (AP-HP), Dr. Rosy Tsopra (AP-HP) et Alexandre Pr. Moreau-Gaudry (CHUGA)Introduction - Présentation des concepts clés : connaissances d’expert, acquises sur les données, implémentation « au lit du patient », difficulté d’évaluer systèmes dans la vraie vie et explicabilité - Pr. Brigitte Séroussi (AP-HP)

Définition de l’Intelligence Artificielle de Marvin Lee Minsky en 1956 :

« La construction de programmes informatiques qui s’adonnent à des tâches qui sont, pour l’instant, accomplies de façon plus satisfaisante par des êtres humains, car elles demandent des processus mentaux de haut niveau tels que : l’apprentissage perceptuel, l’organisation de la mémoire et le raisonnement critique. »

Les systèmes d’aide à la décision médicale (SADM) dès lors qu’ils ont une dimension d’expertise sont de l’Intelligence Artificielle (IA). Les ou-tils informatiques mettent en œuvre des algorithmes qui permettent l’analyse automatique des caractéristiques d’un patient afin de produire des propositions personnalisées de prise en charge diagnostique, thé-rapeutique, ou de suivi. Aujourd’hui, les SADM ont fait la preuve de leur potentiel à améliorer les décisions médicales à toutes les étapes du parcours de soins.

Il existe deux types d’IA.

• Une Intelligence Artificielle logico-symbolique qui se base sur desconnaissances articulées de façon à reproduire le raisonnementd’un expert humain engagé dans sa démarche décisionnelle (in-férences). Pour une aide au diagnostic, la règle est « SI conditionALORS action ».

Page 19: Les systèmes d’information apprenants pour une aide à la

19

• Une Intelligence Artificielle numérique qui se basealors sur un apprentissage à partir de données ; plusces données sont nombreuses et variées : mieuxc’est ! L’apprentissage est soit supervisé, non super-visé, ou par renforcement (notion de récompense oude pénalité). Pour cette approche numérique, il n’y apas d’explication. Exemple de neurones numériquesentraînés dans le cadre d’un apprentissage supervisépour le diagnostic de cancer du sein (cf. analyse demammographies). Des réseaux neuronaux convo-lutionnels (CNN) existent également, et permettentd’augmenter la performance des systèmes dansl’analyse de données.

Aujourd’hui, l’accès aux données massives fait que l’IA numérique prédomine. Il existe, toutefois, une tension entre explicabilité (approche logico-symbolique) et per-formance (approche numérique) : plus l’IA est explicable moins elle va être performante. Et vice-versa. A noter, également, un problème de subjectivité des bases de connaissances construites par les experts, qui sont adap-tées au lieu où elles ont été développées. L’objectif est donc de travailler avec ces deux approches complémen-taires : Evidence Base Medicine (EBM) et avis d’experts aux grades élevés.

Un exemple de prise en charge thérapeutique : Watson développé par IBM et entraîné sur des cas résolus de patientes (prises en charge au Memorial Sloan Kette-ring Cancer Center, New York, USA). Watson utilise des techniques de compréhension du langage naturel et une puissance de calcul considérable pour analyser en temps réel toute la littérature publiée et les infor-mations disponibles sur Internet afin de proposer une liste de traitement tenant compte des préférences de la patiente. Autre exemple de prise en charge thérapeu-tique : PREDICT, qui calcule la probabilité de survie à certaines échéances pour le cancer du sein, ou DESIREE, projet européen dont l’objectif est de développer un écosystème logiciel permettant la gestion collaborative et multidisciplinaire des réunions de concertation pluri-disciplinaires (RCP) pour la prise en charge des patientes atteintes d’un cancer du sein non métastatique.

« Do not fear the machines. Work with them ».

G. Kasparov

Si la performance de IA est X. Celle de l’Homme est Y. Z est plus élevée que la somme de X+Y. L’IA permet d’aug-menter la performance de l’Homme, mais ne doit pas le remplacer.

XY

Do not fear intelligent machines. Work with them!

Z ≥ (X, Y)+

Cas d’usage #1 - Aide à la décision à partir des connais-sances et des données (apprentissage automatique et réseaux de neurones) – exemple de l’aide au suivi de grossesse par échographie (Smart Ultrasound in Obste-trics and Gynecology - SUOG)

Dr Ferdinand Dhombres (Hôpital Trousseau - Sorbonne Université) - Travail avec le consortium SUOG (Smart Ultrasound in Obstetrics & Gynecology)

En Europe, on compte 5 millions de naissances/an. Chaque année, on dénombre près de 5000 cas de gros-sesse mal placée au début de la grossesse et 130 000 cas d’anomalies fœtales (rares). Un retard, ou une erreur de diagnostic, a un impact fort tant sur la santé de la pa-

Page 20: Les systèmes d’information apprenants pour une aide à la

20

tiente, de sa famille mais aussi d’un point de vue socié-tale. Aujourd’hui, la règle est que s’il y a un problème, on procède à une échographie de dépistage. Mais, l’accès et l’offre de soins sont limités et ne permettent pas de tou-jours répondre de façon satisfaisante aux besoins.

La règle en échographie obstétricale est de ne rien ou-blier en routine de dépistage et en routine de diagnostic (images, structures), et d’avoir une expertise du normal et du pathologique. Tout cela doit être effectué dans le laps de temps très court du rendez-vous.

L’objectif du projet est de construire un assistant intel-ligent qui embarque une IA mixte (logico-symbolique et numérique) afin d’avoir une assistance en temps réel pendant l’examen, telle la « voix de l’expert » qui souf-flerait des conseils. L’IA numérique analyse les images, et est entrainée pour reconnaitre un certain nombre de structures. Quant à l’IA logique-symbolique, elle génère le raisonnement de l’expert pendant l’échographie. Elle se base sur les documents de référence, des collections d’images des pathologies fœtales validées par des ex-perts, et de l’ontologie.

Lors de l’acquisition d’une nouvelle image par l’écho-graphe, le premier objectif de l’assistant SUOG est la reconnaissance des vues échographiques (par application directe au filtrage des signes par vue). Puis, vient alors l’identification des images similaires dans la collection de référence (via les annotations d’image - apprentissage par similarité). Ainsi, en cours d’examen, l’échographe peut comparer ses clichés aux images similaires validées par des experts, réaliser d’autres clichés suggérés et émettre des premières hypothèses diagnostiques (pro-nostiques).

Comme tout système, il est important de le valider. Une enquête d’opinion internationale ainsi qu’une étude du besoin ont été faites. Sur un panel de 17 utilisateurs Fr/UK, le système a reçu un taux d’acceptabilité de 100% et l’algorithme d’IA logique a été validé. En simulateur échographique, une amélioration de 23% de la qualité d’image et de 20% de confiance dans les comptes ren-dus d’échographie ont été observés. Enfin, concernant les cas rapportés, ils ont été validés : 100% pour les né-phropathies fœtales (33 cas) et 97% pour les maladies osseuses constitutionnelles (198 cas).

La boucle est bouclée ! L’Intelligence Artificielle va pou-voir aider l’échographe qui ne serait pas expert sur toutes les anomalies. Notons que même un expert, ne peut pas tout savoir : il existe des cas très rares avec des malfor-mations peu connues. Ce système peut être aussi très utile pour un échographe isolé afin de l’aider, l’orienter (cf. nouveau cliché, échographie de contrôle), le réassu-rer, ...

Mais aujourd’hui le fœtus est le parent pauvre de l’onto-logie, il existe très peu de données. L’objectif pour 2023, est donc d’enrichir la base de connaissances échogra-phiques et d’embarquer un assistant intelligent SUOG dans les appareils d’échographie.

https://www.suog.org/

Cas d’usages #2 - Aide à la décision à partir des don-nées - exemple du calcul personnalisé du risque de cancer du sein - Mme Valérie Hélin (Prédilife)

1 femme sur 8 développera un cancer du sein au cours de sa vie. Malgré d’importants progrès, sur les 59 000 nouveaux cas/an en France, il y a 12 000 décès/an. Le taux de survie à 5 ans est de 90%, si le cancer est détecté au stade précoce. Un diagnostic précoce est très impor-tant. Par ailleurs, le risque du cancer du sein est différent pour chaque femme, en fonction de son histoire person-nelle et familiale. D’où l’intérêt également de la person-nalisation du dépistage. En France, le dépistage organisé s’adresse aux femmes entre 50 et 74 ans ; alors que 20% des cancers du sein sont développés entre 40 et 50 ans.

La solution MammoRisk® s’adresse à cette cible de femmes (40-50 ans), et a pour objectif de détecter les 80% de femmes qui vont développer un cancer du sein, alors qu’elles n’avaient pas de risques connus, tels que les mutations génétiques (BRAC1 / BRAC 2) (5% des cas de cancer du sein) ou des antécédents familiaux (5 % des cas de cancer du sein).

La méthode utilisée est la « méthode des voisins », une approche basée sur des algorithmes de Machine Lear-ning, qui vise à « comparer » la femme à ses voisines (mêmes caractéristiques : âge, antécédents familiaux, ...). Cette méthode brevetée peut s’adapter à toutes les

Page 21: Les systèmes d’information apprenants pour une aide à la

21

bases de données en intégrant des paramètres cliniques (âge, poids, antécédents) d’imagerie médicale ou de génétique. Pour développer et valider le modèle Mam-moRisk®, un travail sur la cohorte Inserm E3M (100 000 femmes) et sur la base de données américaines du Breast Cancer Screening Consortium (1 M de femme) a été fait.

MamoRisk® intègre les 3 piliers du risque du cancer du sein : la densité mammaire (rapport tissu fibro-glandu-laire sur le tissu graisseux), les données cliniques (âge, antécédents familiaux, antécédents de biopsie) et le score polygénique (PRS) effectué avec un test salivaire. Ce score provient de l’analyse des bases de données du Breast Cancer Consortium, qui a permis d’identifier des variations du génome associé à un sur-risque de mala-dies.

En pratique, pour les femmes de plus de 40 ans qui souhaitent utiliser cette solution, il leur est proposé une mammographie, un test PRS, un prélèvement salivaire (frottis jugal) et elles doivent répondre à un question-naire (données cliniques). L’analyse combinée de ces données donne un « risque de développer un cancer du sein à 5 ans » ; le risque moyen en fonction de l’âge est également donné pour que la femme comprenne mieux. En accord avec la patiente, un programme personnalisé de prévention (alimentation, traitement hormonaux, activité physique et consommation d’alcool) et de dépis-tage est mis en place.

Le test coûte environ 200€, en plus de la consultation et la mammographie. Pour plus d’informations www.predi-life.com

Cas d’usage #3 - Implémentation des outils d’aide à la décision au lit des patients - M. Mobin Yasini (Dedalus) et Mme Alice Mogenet (Elsevier)

De nombreux guides de Bonnes Pratiques existent et elles sont détaillées (entres autres) dans les publications d’Elsevier. Mais ce travail scientifique n’est pas transposé en contenu utilisable dans les mains du praticien au lit du patient. C’est pourquoi, en 2019, la société Dedalus a créé CKP (Clinical Knowledge Portal) pour faciliter le partage des connaissances médicales, des recomman-dations et des bonnes pratiques cliniques, via un espace collaboratif de communautés de professionnels.

Pour chaque contexte clinique, un questionnaire DPI est proposé par CKP qui structure les réponses en s›ap-puyant sur plusieurs terminologies ; l’interopérabilité est donc possible. Un cas d’usage clinique (CuC) peut être caractérisé selon sept axes différents : symptômes, maladie, comorbidité, stade de la maladie, professionnel de santé impliqué, contexte de son travail, temporalité. Le CKP permet dans un second temps de relier le CuC à trois groupes d’informations : les concepts cliniques à recueillir, l’ensemble des concepts cliniques à présenter au professionnel de santé lors de la prise en charge, et l’ensemble des actions recommandées (prescription, traitements, soins, ect…).

CKP est donc un outil opérationnel, qui en regroupant des connaissances validées et/ou certifiées, permet une prise en charge du patient de façon collaborative.

Page 22: Les systèmes d’information apprenants pour une aide à la

22

Table ronde - Enjeux, explicabilité de l’Intelligence Ar-tificielle, considérations éthiques, évaluation des sys-tèmes et responsabilité de la décision - Pr. Raja Chatila (Sorbonne Université & CNPEN), Mme Corinne Collignon (HAS), Pr. Isabelle Bloch (Sorbonne Université), M. Patrick Scheidt (Elsevier), M. Mobin Yasini (Dedalus)

L’Intelligence Artificielle est bâtie sur une démarche d’éthique et de confiance. En effet, on utilise un système que si on a confiance en lui.

Le système ALTAI (The Assessment List on Trustworthy Arti-ficial Intelligence) est un outil pour évaluer l’éthique d’une solution numérique. Les questions sont organisées selon sept exigences (contrôle, robustesse, gouvernance de données, transparence, sureté des données, explicabilité ...), sans rien dévoiler du système à évaluer. Ainsi, cet autotest permet au concepteur de se poser toutes les bonnes questions, et de s’apercevoir, le cas échéant, de points bloquants selon le cadre législatif (Europe).

L’IA joue un rôle dans tous les domaines en santé (do-

maine thérapeutique, dépistage, imagerie médicale …). Le niveau de performance et de confiance est capital pour les utilisateurs. Les biais sont des éléments de dé-fiance qui demandent de l’attention. Il y a les biais de données, mais aussi des biais cognitifs : faire appel à un tel système est déjà un biais (l’utilisateur va faire trop, ou pas assez, faire confiance au système, à l’algorithme).

En France, l’évaluation de la mise en place d’un système apprenant se fait avec le prisme d’une prise en charge, d’un remboursement futur. C’est pourquoi, l’HAS a mis en place une grille d’évalua-tion descriptive, comme tout autre dispo-sitif médical.

Page 23: Les systèmes d’information apprenants pour une aide à la

23

Synthèse & conclusionMme Laurence Jay-Passot Déléguée générale du Groupement des Hôpitaux Universitaires du Grand Ouest (HUGO) · GCS HUGO (Hôpitaux Universitaires du Grand Ouest)

La qualité de la donnée est primordiale, elle assure l’interopérabilité, la fiabilité des calculs, la pertinence des algorithmes, et la confiance dans les usages et dans les outils d’aide à la décision développés. L’objectif final doit toujours rester une meilleure prise en charge du patient. Le facteur Humain est aussi très important au niveau des professionnels de santé. Ces systèmes développés doivent s’intégrer dans le Work Flow et ne remplacent en aucun cas le médecin : leur objectif est de l’accom-pagner dans son analyse et son interprétation des données de santé recueillies, pour optimiser le bon diagnostic.

Sur le terrain, une équipe experte et multidisciplinaire (de la clinique au traitement des données) est nécessaire, et doit toujours œuvrer dans l’objectif du cas clinique. La formation initiale et continue des interve-nants est à renforcer, tout comme le travail collaboratif, et ce à tous les niveaux (équipe projet, établissement, industriels, académiques, natio-nal, international, ...). L’écosystème des CHU (soins-enseignement-re-cherche) est au cœur du potentiel des données de santé aujourd’hui…

Différents projets, nous montrent qu’il est possible de boucler la boucle du soin patient au soin patient. Mais, ces enjeux de données de santé sont étroitement liés à l’évolution de notre système de santé.

Page 24: Les systèmes d’information apprenants pour une aide à la

24

Remerciements à tous les intervenants

Avec le soutien de

M Guillaume ReynaudDedalus

Directeur des relations publiques et du business développement

M Patrick ScheidtElsevier

Director Clinical Solutions France, DACH and Eastern Europe

Dr Ursula von SchenckElsevier

Medical Officer

Dr Mobin YasiniDedalus

Responsable de Clinical Knowledge Portal chez le groupe Dedalus

Mme Laurence Jay-PassotHUGO

Déléguée générale du GCS HUGO ( Hôpitaux Universitaires du Grand Ouest)

Dr Vianney JouhetCHU de Bordeaux

Praticien Hospitalier – Médecin de Santé Publique spécialisé en informatique médicale

Dr Antoine LamerCHU de Lille

Maitre de conférence à Université de Lille, Data Scientist au CHU Lille

Dr Lise MarinDedalus

Consultant médical pour le Clinical Knowledge Portal de Dedalus

Dr Bertrand MoalCHU de Bordeaux

Docteur au CHU de Bordeaux et co-fondateur de Deski

Pr Antoine NeurazHEGP

Professeur adjoint en informatique biomédicale

Dr Bastien RanceUniversité Paris Descartes / HEGP

Maître de conférences des Universités - Praticien Hospitalier

M Allan RodriguezVitadx

Directeur Général de VitaDX International SA

Pr Raja ChatilaSorbonne Université

Professeur émérite, Institut des Systèmes Intelligents et de Robotique, Sorbonne Université

Pr Emmanuel ChazardCHU de Lille

PU-PH en informatique médicale, biostatistique et technologies de communication, Université de Lille, CHU de Lille

Mme Corinne CollignonHAS

Cheffe de service Mission Numérique en Santé à la Haute autorité de santé

M Hector CountourisHEGP

Datamanager à l’APHP et plus spécifiquement pour la plateforme de recherche translationnelle du CARPEM au sein de l’Hôpital européen Georges Pompidou (HEGP)

Pr Stéfan DarmoniCHU de Rouen / LIMICS / INSERM U1142

Professeur de santé publique (santé numérique) à la faculté de médecine de Rouen ; +

Dr Ferdinand DhombresAP-HP

MD, PhDSorbonne Université / Hôpital Trousseau / INSERM U1142 LIMICS

Pr Charles FriedmanUniversity of Michigan

Josiah Macy Jr. Professor of Medical Education, Chair of the Department of Learning Health Sciences, Medical School, Professor of Information and Public Health and Editor-in-Chief of “Learning Health Systems”

Dr Valérie HélinPrédilife

Directrice des affaires scientifiques et médicales, Predilife

Pr Isabelle BlochSorbonne Université / Télécom Paris

Professeure à Sorbonne Université, professeure associée à Télécom Paris

Dr Olivier BodenreiderNIH MARYLAND USA

Senior Scientist and Acting director of the Lister Hill National Center for Biomedical Communications at the U.S. National Library of Medicine

Dr Guillaume BouzilléCHU de Rennes

Médecin en informatique médicale au CHU de Rennes

Pr Jean-Luc BossonCHU de Grenoble - Alpes / Pôle Santé Publique

Professeur Informatique Médicale, Responsable du Pôle Santé publique du CHU Grenoble - Alpes. Chercheur au laboratoire TIMC (Université Grenoble Alpes CNRS)