Le projet DataMed de l’ANSM
Transcript of Le projet DataMed de l’ANSM
Le projet DataMed de lrsquoANSMValorisation de la donneacutee autour des meacutedicaments au sein de lrsquoAgence nationale de seacutecuriteacute des meacutedicaments et des produits de santeacute
-
Meet up SNDS 1024 juin 2021
Joeumllle Chong - Designer de services Entrepreneure drsquoInteacuterecirct Geacuteneacuteral ANSMLine Rahal - Data Scientist Entrepreneure drsquoInteacuterecirct Geacuteneacuteral ANSMTim Vlaar - Data Scientist HDH
Agenda
Preacutesentation des parties prenantes et du projetJoeumllle Chong amp Line Rahal
Sujet 1 Concevoir la strateacutegie Data par le DesignJoeumllle Chong
Sujet 2 Exploiter les donneacutees de lANSM du nettoyage et chaicircnage agrave la data visualisationLine Rahal amp Tim Vlaar
2
Joeumllle Chong Designer de services
Entrepreneure drsquoInteacuterecirct Geacuteneacuteral
Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de
santeacute
Line RahalData Scientist
Entrepreneure drsquoInteacuterecirct Geacuteneacuteral
Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de
santeacute
Tim VlaarData Scientist
Epideacutemiologiste
Health Data hub
Les intervenants
3
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
et le projet DataMed
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations
GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique
ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees
5
Lrsquoorganisation du projet
12819810 mois
De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute
128171 128293 3 profils
Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique
1281311283781 sujet HDH x ANSM
Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH
6
Deux institutions de santeacute
7
LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie
Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients
Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute
Le deacutefi DataMed
8
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Agenda
Preacutesentation des parties prenantes et du projetJoeumllle Chong amp Line Rahal
Sujet 1 Concevoir la strateacutegie Data par le DesignJoeumllle Chong
Sujet 2 Exploiter les donneacutees de lANSM du nettoyage et chaicircnage agrave la data visualisationLine Rahal amp Tim Vlaar
2
Joeumllle Chong Designer de services
Entrepreneure drsquoInteacuterecirct Geacuteneacuteral
Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de
santeacute
Line RahalData Scientist
Entrepreneure drsquoInteacuterecirct Geacuteneacuteral
Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de
santeacute
Tim VlaarData Scientist
Epideacutemiologiste
Health Data hub
Les intervenants
3
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
et le projet DataMed
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations
GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique
ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees
5
Lrsquoorganisation du projet
12819810 mois
De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute
128171 128293 3 profils
Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique
1281311283781 sujet HDH x ANSM
Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH
6
Deux institutions de santeacute
7
LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie
Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients
Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute
Le deacutefi DataMed
8
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Joeumllle Chong Designer de services
Entrepreneure drsquoInteacuterecirct Geacuteneacuteral
Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de
santeacute
Line RahalData Scientist
Entrepreneure drsquoInteacuterecirct Geacuteneacuteral
Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de
santeacute
Tim VlaarData Scientist
Epideacutemiologiste
Health Data hub
Les intervenants
3
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
et le projet DataMed
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations
GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique
ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees
5
Lrsquoorganisation du projet
12819810 mois
De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute
128171 128293 3 profils
Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique
1281311283781 sujet HDH x ANSM
Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH
6
Deux institutions de santeacute
7
LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie
Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients
Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute
Le deacutefi DataMed
8
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
et le projet DataMed
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations
GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique
ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees
5
Lrsquoorganisation du projet
12819810 mois
De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute
128171 128293 3 profils
Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique
1281311283781 sujet HDH x ANSM
Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH
6
Deux institutions de santeacute
7
LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie
Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients
Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute
Le deacutefi DataMed
8
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral
OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations
GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique
ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees
5
Lrsquoorganisation du projet
12819810 mois
De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute
128171 128293 3 profils
Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique
1281311283781 sujet HDH x ANSM
Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH
6
Deux institutions de santeacute
7
LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie
Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients
Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute
Le deacutefi DataMed
8
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Lrsquoorganisation du projet
12819810 mois
De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute
128171 128293 3 profils
Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique
1281311283781 sujet HDH x ANSM
Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH
6
Deux institutions de santeacute
7
LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie
Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients
Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute
Le deacutefi DataMed
8
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Deux institutions de santeacute
7
LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie
Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients
Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute
Le deacutefi DataMed
8
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute
Le deacutefi DataMed
8
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
La probleacutematique
Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament
Quoi
Pour qui
Pourquoi
9
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
2 axes de travail
1 Strateacutegique
Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office
2 Opeacuterationnel
Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments
10
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
La solution
DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM
11
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Sujet 1
Concevoir la strateacutegie Data par le Design
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Crsquoest quoi le design pour vous
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Deacutefinition de lrsquoAlliance Franccedilaise des Designers
14
ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Le design agrave la croiseacutee des regards
15
Meacutetier
Usager Technique
DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Un processus creacuteatif et iteacuteratif
16
Immersion Ideacuteation Impleacutementation
Empathie avec les usagers et les agents
Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique
Co-creacuteation avec des eacutequipes pluridisciplinaires
Mateacuterialisation des ideacutees Prototype
Test des concepts Deacuteveloppement du produit Ameacutelioration continue
Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Et concregravetement
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Quelques chiffres
18
Immersion Ideacuteation Impleacutementation
27Entretiens drsquoimmersion avec des agents
11Agents pour identifier les cibles des donneacutees de lrsquoANSM
10Agents et directeurs pour la strateacutegie de positionnement
6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament
10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament
3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees
6Grands projets drsquoanalyse de donneacutees reacutealiseacutes
7Bases de donneacutees exploiteacutees
257Fichiers des EDL nettoyeacutes
1Structure de base de donneacutees automatiseacutee
20Tests utilisateurs de la plateforme pour 4 iteacuterations
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Entretiens ateliers et reacuteflexions
19
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Reacuteflexions entretiens canvas strateacutegiques
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Enseignements de la phase drsquoimmersion
20
Un immense potentiel en donneacutees de santeacute
Une mission de santeacute publique au coeur de lrsquoagence
Des compeacutetences meacutetier en interne
Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)
Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation
Un manque de reacutefeacuterentiels
Des chantiers drsquoeacutevolution techniques agrave preacutevoir
Un travail drsquoacculturation des agents
Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Les cibles
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Preacutecision des cibles des donneacutees de lrsquoAgence
22
Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet
Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Expeacuterience map du patient chronique
23
Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Les cibles primaires et secondaires
24
Les patientsGrand public citoyen malade chronique aidant associations de patients
Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches
Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients
Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions
Les meacutediasJournalistes leaders drsquoopinion
Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions
Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches
Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques
Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat
Les exploitants tiercesStartups eacutediteurs de logiciels
Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits
Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants
986328 986316 129464128295
Cibles primaires Cibles secondaires
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Les cibles de notre plateforme
25
Les patientsGrand public citoyen malade chronique aidant associations de patients
Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux
Les meacutediasJournalistes leaders drsquoopinion
129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics
Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes
Les exploitants tiercesStartups eacutediteurs de logiciels
986328 986316 129464128295
rarr Savoir agrave qui on srsquoadresse
rarr Savoir qui recruter pour les tests et ateliers
rarr Adapter le ton et le contenu en conseacutequence
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Le positionnement strateacutegique
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Orientation du produitservice
27
Donneacutees riches et complexes
Grand public
Pro de santeacute
Agents de lrsquoANSM
Patients
Meilleur usage du meacutedicament
Retour drsquoinformation+
Alimentation de donneacutees uniformes
Data OfficeProjets innovants
autour de lrsquoouverture lrsquoexploitation la
valorisation de la donneacutee
Retour drsquoexpeacuterience+
Sentiment de confiance+
Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo
Bouche agrave oreilleCommunication
externe
Recrutement drsquoexperts en
projets digitaux et donneacutee
Ressources externes
Ressources internes
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Deacutefinition du positionnement dans lrsquoagence
28
Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)
Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence
Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Deacutefinition du positionnement dans lrsquoagence
29
datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament
Sous reacuteserve drsquoaccord par la CNIL et autres autorisations
Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Deacutefinition du positionnement dans lrsquoagence
30
dataansmsantefr
ansmsantefr
Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial
La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees
Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM
datagouvfr
La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
La plateforme dataansm
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Eacutevolution du prototype
32
Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur
Version 1 Version 2 Version 3
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Choix graphiques illustrations
33
Photos et illustrations sur le site de ansmsantefr
Ton institutionnel scientifique eacuteditorial
Illustrations semi reacutealistes graphiques et pictogrammes pas de photos
Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Ameacutelioration continue gracircce aux tests usagers
34
ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo
ndash Pascale aidante de patient
ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo
ndash Trystan meacutedecin geacuteneacuteraliste
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Des points drsquoeacutetapes cleacute pour validation interne
35
Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs
Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Une collaboration eacutetroite datadesigndev
36
Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final
De la donneacutee brute agrave la data visualisation
Ameacutelioration continue suite aux tests
Recensement des tacircches par corps de meacutetier design data dev
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Des questions avant le sujet suivant
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Sujet 2
Exploiter les donneacutees de lANSM du nettoyage et chaicircnage
agrave la data visualisation
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Centraliser des donneacutees eacuteparses et varieacutees
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
DataMed une plateforme agrave plusieurs briques
40
Sujets de pharmacovigilance
Base de Donneacutees Publique du Meacutedicament
Outil drsquoinfoRmation des Effets Indeacutesirables
Erreurs meacutedicamenteuses
Meacutesusage
Sujet de lrsquoinspection
Ruptures de stock
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
DataMed une plateforme agrave plusieurs briques
41
BDPM
DataMed
Base de donneacutees publique des meacutedicaments
Base nationale de pharmacovigilance (BNPV)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)
Meacutesusage Base nationale de pharmacovigilance (BNPV)
Ruptures de stock Base des ruptures de stock (2014 - 2021)
TrustMed (depuis Mai 2021)
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Constat des donneacutees en entreacutee
42
129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents
Sources diffeacuterentes
128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078
127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet
- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases
facilement
rarr Comment relier ces donneacutees entre elles
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
La BDPM Base pivot entre les donneacutees
43
httpsbase-donnees-publiquemedicamentsgouvfr
Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code
substance) - et leurs liaisons
Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour
Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour
128138
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Structurer les donneacutees autour des speacutecialiteacutes et substances actives
44
Produit (code Produit)Doliprane (code Produit = 019621)
3
Substance active (code Substance)
Paracetamol (code Substance = 02202)
4
Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)
1
Speacutecialiteacute (code CIS)Doliprane 1000 mg
comprimeacute (code CIS = 60234100)
2
Un meacutedicament peut contenir plusieurs substances actives
+ Autres codifications UCD ATC
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Structure de la BDPM
45
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Une barre de recherche unique
46
Recherche par speacutecialiteacute
Recherche par substance active
Table speacutecialiteacute
Table substance
Table speacutecialiteacute-substance
Patients traiteacutes
Erreurs meacutedicamenteuses
Ruptures de stock
Patients traiteacutes
Effets indeacutesirables
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees
47
Effets indeacutesirables
Ruptures de stock
Patients traiteacutes
127775BDPM127775
anneacutee code_substance cas
2014 02202 3000
anneacutee id_rupture cip13
2021 21RS01199 3400932320189
cip13 cis
3400932320189 63368332
anneacutee cis patients
2014 63368332 3 000 000
127775BDPM127775code_substance cis
02202 63368332
Ex Doliprane 500 mg comprimeacute
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Cas concret de traitement au sein de la brique ORDEI
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments
49
128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH
Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020
Inteacutegreacute a posteriori dans DataMed
128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments
129680DeacutefisStandardisation de nomenclatures de meacutedicaments
Deacutevelopper une interface visuelle intelligibile
A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Imbrication dans DataMed
50
Base nationale de pharmacovigilance (BNPV)
Open Medic (remplaceacute agrave terme par donneacutees SNDS)
ORDEI (Effets indeacutesirables)
Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)
DataMed
Base de donneacutees publique des meacutedicaments (BDPM)
Bases de donneacutees intermeacutediaires par code
Substance
Partie preacutesenteacutee
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Donneacutees extraites et utiliseacutees de la BNPV
51
BNPVBase nationale de pharmacovigilance
4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs
3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee
~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018
rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Donneacutees extraites et utiliseacutees de CODEX
52
CODEXReacutefeacuterentiel des autorisations des meacutedicaments
9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005
4Bases de travail constitueacutees agrave partir des extractions
Noms codages et correspondances des speacutecialiteacutes produits et substances
Historique des noms des speacutecialiteacutes et produits
Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)
Variants des noms des substances
gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Nettoyer et structurer la BNPV par code Substance
53
cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE
02202 PARACETAMOL 02202
02202 ACETAMINOPHENOL 61186
02202 ACETAMINOPHENE 61187
Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI
CODEX CODEX
BNPV
Variants des noms des substances
Table de transcodage
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Nettoyer et structurer la BNPV par code Substance
54
cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600
Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI
CODEX
CODEX
BNPV
Historique des noms des ProduitsTable de
transcodage
323316 BORLUX 329727 CEFUROXIME ZENTIVA
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Nettoyer et structurer la BNPV par code Substance
55
cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution
pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236
ADRIBLASTINE 50
ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion
en flacon64661854
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525
Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute
ADRIBLASTINE 50 mg poudre pour
solution injectable en flacon
Scores de similariteacute distance
CODEX
CODEX
BNPV
Table de transcodage
Noms codages et correspondances des speacutecialiteacutes produits et substances
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres
56
Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein
Comment ccedila fonctionne concregravetement
Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux
Le score de Damerau- Levenshtein est de 6
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
ADRIBLASTINE 50 mg poudre pour solution
pour perfusion
A G A A T T C A G T T AB G G A T C G A
A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A
httpsslideplayercomslide9932396
ADRIBLASTINE 50 mg25 ml solution injectable
pour perfusion en flacon
ADRIBLASTINE 50 mg poudre pour solution injectable en flacon
OSA = 074OSA = 053
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Flux de traitement de donneacutees
57
BNPV
98
Speacutecialiteacutes(40)
Produits(42)
Substances(18)
96 99 98
CODEX CODEX CODEX
1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018
Chaicircnage par algorithmes de
deacutecision et traitement textuel
Nettoyage des donneacutees 2 des
observations retireacutees
Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute
parmi 3 nomenclatures
4 des observations pour lesquelles la speacutecialiteacute nrsquoa
pas pu ecirctre retrouveacutee dans CODEX
1 des observations pour lesquelles le produit nrsquoa
pas pu ecirctre retrouveacute dans CODEX
2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans
CODEX
Code substance
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Preacutesentation de lrsquooutil Dash
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
dash
59
OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators
Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning
httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
dash
60
Bons points
128154 html wrappeacute dans du python
128007 prototypage ultra rapide
985089 learning curve assez rapide
128171 connaissances en JS pas neacutecessaires
128106 grosse communauteacute worlds largest open-source community
128640 deacuteploiement tregraves simple
Mauvais points
129327 typing pas terrible
129512 typescript non supporteacute pour le deacuteveloppement des composants
128163 assez vite trop drsquoappels au serveur
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Deacutemo
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Conclusion
Bilan et perspectives
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Le projet DataMed un MVP
MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec
But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin
63
1 Provides ldquojust enough featuresrdquo
2 Satisfies ldquoearly usersrdquo
3 Enables feedback for future development
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Alimentation de la base de donneacutees
64
128064Aujourdrsquohui
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel
128302Demain
1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant
2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Perspectives
65
Recruter984987 1 dev full-stack
Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee
Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament
984812 la grossesse
129658 les essais cliniques
127759 la cartographie des sites de fabrication
128302 et bien drsquoautres
Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Merci
Joeumllle Chong - joellechongansmsantefr
Line Rahal - linerahalansmsantefr
Tim Vlaar - timvlaarhealth-data-hubfr
66
Des questions
Des questions