Post on 16-Oct-2021
Zurich Research Laboratory
21 Juillet 2005 | Systèmes d’information et décisions en santé www.ibm.com
L'intégration des données , le data mining (fouille de données) et le support à la décision
André ElisseeffIBM Research Lab - Zurich
2
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Plan
Source de données : du texte écrit au “lab on a chip”
Accès aux données : intégration et fédération
Data Mining : exemple des systèmes experts et des systèmes a base de règles
Vers de nouvelles techniques statistiques
3
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
L’information médicale évolue
L’information disponible sur un patient est très heterogene:
Les nouvelles technologies engendrent de plus en plus d’information (but : aller vers une médecine “ciblée/individuelle”) :
– Mobile health (suivi médical a distance)– Lab on a chip (acquisition d’information individuelle)– Smart implantable device (récupérer l’information alors que le patient
suit une activité normale)
Image Sériestemporelles
Protein/Geneexpressions DNA Test lab Notes
cliniques
Interactionmédecin
4
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Mobile health – suivi du patient à distance
injection registration
inhalationregistration
peakflow
body weight
activity
heart rate
blood pressure
auscultation
tablet dispensingECG monitor
glucose
5
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Lab-on-a-chip
Collaboration entre le CEA-Leti avec ST MicroelectronicsSystème d’analyse « Point of Care »
Utilise pour la détection de pathogènes (PCR)Volume de l’échantillon entre 2-8 µlTemps total requis ~1min Apprentissage facile pour les techniciens
6
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Smart implantable devices – PillCamTM de GivenLa capsule PillCam™ SB Endoscope est naturellement avalée afin d’être utilisée dans le conduit gastro-intestinal. Les contractions naturelles font avancer la capsule PillCam™ SB doucement et sans douleurs dans le conduit gastro-intestinal, transmettant des images en couleurs au cours de son cheminement. La procédure est ambulatoire et permet au patient de continuer à vivre normalement pendant l’examen endoscopique.
20 min
8 hours
7
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Comment gérer l’information?Stockage : demande croissance
Sécurisation : données anonymes ou contrôle d’accès doit être instauréÉchanges de données complexes : standardisation des donnéesAccès aux données : comment répondre a la requête suivante ?“Quels protocoles ont été utilisés pour des tumeurs similaires à celle de mon patient et qui concernent des patients du même groupe d’age et avec le même polymorphisme X dans leurs gènes?"
0
5000
10000
15000
20000
25000
30000
2003 2004 2005 2006 2007
TByt
es(W
W)
8
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Plan
Source de données : du texte écrit au “lab on a chip”
Accès aux données : intégration et fédération
Data Mining : exemple des systèmes experts et des systèmes a base de règles
Vers de nouvelles techniques statistiques
9
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Intégration : processus de combinaison de l’information. Pour intégrer ensemble les données médicales, on utilise une technique de fédération : regroupement de différentes entités chacune gardant sa propre organisation.
Integration et Federation
Données rigides,Nombreux formats, dont textes écrits a
la main
fatherID Mother ID Gender AGE2 3 1 454 1 1 34
forme canoniquee.g.
HL7's Clinical Document
Architecture XML
listes, bio-sequences,
tableaux
Données cliniques et biomédicales
GATTACGATTAC
Données semi-structurées:
collections d’objets
but in practice,right now
10
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Secured Health and Medical Access NetworkSHAMAN
• Les données sont annotées et traduite dans un format XML
• Ces données XML sont indexées (données structurées et texte écrits) en utilisant un système spécialisé pour les documents XML
• Une interface est alors construite afin d’accéder de façon sécurisée aux données électroniques des patients. Ces dernières sont rassemblées dans un unique document.
• Le format actuel des documents XML utilise le standard HL7
11
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Intégration des données médicales - SHAMAN
SHAMAN-IMRIntegrated Medical Records
DiscoveryL
ink
HôpitalProactive Clinical-Genomics Repository
Index XML de données médicales standardisées
Web Services: • Transforme & indexe• Récupère des données structurées et non structurées
1
2
DiscoveryLink (outil de fédération des données) regroupent ensemble des données de différentes sources médicales.IMR traduit les données cliniques dans un standard bio-médicale(xml), e.g. HL7, BSML, MAGE-ML
Autres hôpitaux
Sources de données
génomiques
Système d’analyse
, data mining,
etc.
Système d’information de l’hôpital
1 2 3
3
Système d’information clinique
Systèmes annexes (e.g., Lab)
Server de terminologie
Outils statistiques et/ou d’aide a la décision utilisent les données.
12
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Exemple : Mayo Clinic
IBM et la clinique Mayo ont développé une collaboration pour réaliser une vision commune de “l’information-based medicine”. Ils ont construit une infrastructure pour intégrer l’information génomique clinique contenant des données démographiques, diagnostiques, physiologiques et génomiques dont la sécurité atteint les niveaux établis par la HIPAA sur la confidentialité des données patients.
Software •IBM WebSphere® Application Server •IBM DB2® Universal Database™ - Enterprise Server Edition
Serveurs•IBM eServer™ pSeries® 650 •IBM eServer pSeries 690 •IBM TotalStorage® Enterprise Storage Server®
Services•IBM Healthcare and Life Sciences •IBM Systems Group
13
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Plan
Source de données : du texte écrit au “lab on a chip”
Accès aux données : intégration et fédération
Data Mining : exemple des systèmes experts et des systèmes a base de règles
Vers de nouvelles techniques statistiques
14
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Data (Health) mining est utilisé pour…
Diagnosis
Prognosis
Traitement (médecine personnalisée)
Suivi de patient
Recherche et enseignement en médecine
Recherche Pharmaceutique
Épidémiologies et programmes de vigilance
Etc…
15
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Exemples de systèmes d’aide à la décision1968 : système de diagnostic des douleurs abdominales a l’hôpital de Leeds, UK (Prof. Tim de Dombal)
Années 1970’s: système expert a base de regles MYCIN, USA (Prof. Edward H. Shortliffe)
Années 1980’s: base de connaissance médicale. INTERNIST-I, Quick MedicalReference, USA (Dr. Pople and Dr. Myers) – grande influence sur DxPlain.
Années 1990’s: réseaux bayesiens Iliad, USA (Dr. Homer R. Warner)
Autres systèmes: boites noires (arbres de décisions), systèmes d’aide a l’analyse de radiographies, etc.
Motivation des systèmes experts: 1) fournir une consultation médicale lorsque le spécialiste n’est pas disponible (urgences, environnement militaire) 2) comprendre comment le diagnostique est dérive pour améliorer l’enseignement.
Pour plus d’infos : www.openclinical.org
16
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Difficulté de construire un système à base de règles Une règle simple du système MYCIN
Si:Le site de la culture est la gorge
L’identité de l’organisme est streptococcusALORS:
Il y a une indication forte (.8) que le sous type de l’organisme ne soit pas group D.
“Feigenbaum bottleneck” : difficulté de traduire une connaissance ou une décision sous forme de règles.Nombre moyen de règles écrits dans un système expert par des spécialistes est 2-7 par jour.MYCIN contient plus de 600 règles juste pour le diagnostique et le traitement bactériologique. INTERNIST (Pople et al.) a de l’ordre de 100,000 règlesLes règles peuvent être créées automatiquement mais il est nécessaire d’effectuer un “nettoyage” (rule curation).
17
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Barrières à l’utilisation de systèmes informatises
Systèmes expert sont difficiles a maintenir (par exemple: explosion du nombre de règles, difficile de corriger une règle, etc.)
Performances sont-elles meilleures avec un ordinateur?
Rentrer des connaissances « incertaines » est difficile a effectuer
18
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Le language de l’incertitude
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Probable
Likely
Unlikely
High probability
Low probability
Bryant G.D., Norman, G.R. “Expressions of probability: Words and numbers”.New England Journal of Medicine, 302:411.
19
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Acceptation des outils d’aide à la décision“Do physicians value decision support? A look at the effect of decisionsupport systems on physician opinion” S. Dreiseitl, M. Binder, AI in Medicine, 2005.
“Les résultats indiquent que les médecins sont susceptible d’accepter les recommandations d’un système d’aide à la décision médicale”
“Effects of computerized clinical decision support systems on practitionerperformance and patient outcomes” A.X. Garg et al., JAMA, 2005.
“Plusieurs systèmes d’aide à la décision médicale améliore les performances du praticien. Jusqu’ à aujourd’hui, les conséquences sur l’amélioration des soins au patient sont sous étudiées et, lorsqu’elles sont analyses, sont contradictoires.”
“Role of computerized physician order entry systems in facilitatingmedication errors”, R. Koppel et al., JAMA, 2005
“Dans cette étude, nous avons observé qu’un système CPOE augmente le risque d’erreurs médicales”.
20
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Plan
Source de données : du texte écrit au “lab on a chip”
Accès aux données : intégration et fédération
Data Mining : exemple des systèmes experts et des systèmes a base de règles
Vers de nouvelles techniques statistiques
21
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Défis statistiques
Hétérogénéité des données
Information temporelles
Modèles explicatifs
Nouvelles techniques sont nécessaires…
22
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Exemple :
Arbre de décision simple : (age, sex, glucose level, …, disease_yes, disease_no)
Comment utiliser cette approche lorsque le problème est plus compliqué?
(age, sex, glucose level, …, date1)
(age, sex, glucose level, …, date2)
(age, sex, glucose level, …, date3)
Sex=M?
yesNo
Age>=60?
tem
ps
Sortie à prédire/expliquer
23
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Calculs de similaritésDe nombreuses techniques de prédictions et d’analyses statistiques peuvent se formuler en utilisant uniquement des mesures de similarités : il n’est pas nécessaire de représenter les objets, il suffit de savoir calculer leur distance entre eux.
Exemple: comment comparer ces deux séquences?ACCTTGACCACG…ATTGAACG…
Utiliser des méthodes d’alignement (type SW, BLAST ou autres) et calculer le score de similarité.ACCTTGACCACG…A - -TTGA - - ACG…
Ces méthodes de calculs existent pour presque tous les types de données:Texte, graphes, vecteurs, images, séries temporelles, etc.
0.75
24
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Hétérogénéité des données Lorsque différents types de données sont disponibles pour un même objet, il est toujours possible de calculer des similarités combinées:
Similarité image S1
S2
S3
Similarité séquence ADN
Similarité série temporelle
Objet 1 Objet 2Similarité totale : S1+S2+S3
25
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Modèles explicatifsGénéraliser l’arbre de décision pour des données complexes :
Exemple (fictionnel) de problèmes:
Patients ont rempli un questionnaire contenant une série d’information sur leur mode de vie, leur façon de manger, etc.
En plus de ce questionnaire, le médecin dispose de nombreuses informations sur le patient (historique médical avec plusieurs biomarkers suivis dans le temps)
Si un nouveau patient remplit le même questionnaire, quel est son profil médical?
Dans la construction de l’arbre de décision, on choisit la décision qui fournit des noeuds les plus compacts possible (au sens de la similarité).
26
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
Résumé
données Intégration Analyse des données Utilisation des systèmes
Hétérogènes
Diverses sources
Anciens systèmes
Quantité croissante
Personnalisation
Complexité croissante
Techniques temporelles
Modèles explicatifs
Utilisation des similarités
Temps de calcul?
Fédération
XML
Indexation
Utilisation non courante
Effets non déterminés
Influence dans certains cas les décisions des médecins
Mise en place difficile
Technologie développée Technologie en développement
27
Zurich Research Laboratory
Intégration, data mining et aide à la décision médicale © 2002 IBM Corporation
ConclusionDévelopper un système d’aide a la décision et l’intégrer dans les opérations d’un hôpital?
"In short, rather than framing the problem as 'not developing the systemsright,' these failures demonstrate 'not developing the right systems' due to widespread but misleading theories about both technology and clinicalwork. […] This implies that any IT acquisition or implementation trajectoryshould, first and foremost, be an organizational change trajectory." Robert L. Wears and Marc Berg, M.A., JAMA 2005.