Le projet DataMed de l’ANSM

67
Le projet DataMed de l’ANSM Valorisation de la donnée autour des médicaments au sein de l’Agence nationale de sécurité des médicaments et des produits de santé - Meet up SNDS #10 24 juin 2021 Joëlle Chong - Designer de services, Entrepreneure d’Intérêt Général @ANSM Line Rahal - Data Scientist, Entrepreneure d’Intérêt Général @ANSM Tim Vlaar - Data Scientist @HDH

Transcript of Le projet DataMed de l’ANSM

Page 1: Le projet DataMed de l’ANSM

Le projet DataMed de lrsquoANSMValorisation de la donneacutee autour des meacutedicaments au sein de lrsquoAgence nationale de seacutecuriteacute des meacutedicaments et des produits de santeacute

-

Meet up SNDS 1024 juin 2021

Joeumllle Chong - Designer de services Entrepreneure drsquoInteacuterecirct Geacuteneacuteral ANSMLine Rahal - Data Scientist Entrepreneure drsquoInteacuterecirct Geacuteneacuteral ANSMTim Vlaar - Data Scientist HDH

Agenda

Preacutesentation des parties prenantes et du projetJoeumllle Chong amp Line Rahal

Sujet 1 Concevoir la strateacutegie Data par le DesignJoeumllle Chong

Sujet 2 Exploiter les donneacutees de lANSM du nettoyage et chaicircnage agrave la data visualisationLine Rahal amp Tim Vlaar

2

Joeumllle Chong Designer de services

Entrepreneure drsquoInteacuterecirct Geacuteneacuteral

Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de

santeacute

Line RahalData Scientist

Entrepreneure drsquoInteacuterecirct Geacuteneacuteral

Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de

santeacute

Tim VlaarData Scientist

Epideacutemiologiste

Health Data hub

Les intervenants

3

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

et le projet DataMed

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations

GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique

ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees

5

Lrsquoorganisation du projet

12819810 mois

De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute

128171 128293 3 profils

Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique

1281311283781 sujet HDH x ANSM

Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH

6

Deux institutions de santeacute

7

LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie

Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients

Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute

Le deacutefi DataMed

8

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 2: Le projet DataMed de l’ANSM

Agenda

Preacutesentation des parties prenantes et du projetJoeumllle Chong amp Line Rahal

Sujet 1 Concevoir la strateacutegie Data par le DesignJoeumllle Chong

Sujet 2 Exploiter les donneacutees de lANSM du nettoyage et chaicircnage agrave la data visualisationLine Rahal amp Tim Vlaar

2

Joeumllle Chong Designer de services

Entrepreneure drsquoInteacuterecirct Geacuteneacuteral

Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de

santeacute

Line RahalData Scientist

Entrepreneure drsquoInteacuterecirct Geacuteneacuteral

Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de

santeacute

Tim VlaarData Scientist

Epideacutemiologiste

Health Data hub

Les intervenants

3

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

et le projet DataMed

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations

GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique

ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees

5

Lrsquoorganisation du projet

12819810 mois

De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute

128171 128293 3 profils

Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique

1281311283781 sujet HDH x ANSM

Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH

6

Deux institutions de santeacute

7

LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie

Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients

Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute

Le deacutefi DataMed

8

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 3: Le projet DataMed de l’ANSM

Joeumllle Chong Designer de services

Entrepreneure drsquoInteacuterecirct Geacuteneacuteral

Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de

santeacute

Line RahalData Scientist

Entrepreneure drsquoInteacuterecirct Geacuteneacuteral

Agence Nationale de Seacutecuriteacute du Meacutedicament et des produits de

santeacute

Tim VlaarData Scientist

Epideacutemiologiste

Health Data hub

Les intervenants

3

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

et le projet DataMed

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations

GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique

ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees

5

Lrsquoorganisation du projet

12819810 mois

De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute

128171 128293 3 profils

Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique

1281311283781 sujet HDH x ANSM

Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH

6

Deux institutions de santeacute

7

LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie

Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients

Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute

Le deacutefi DataMed

8

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 4: Le projet DataMed de l’ANSM

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

et le projet DataMed

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations

GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique

ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees

5

Lrsquoorganisation du projet

12819810 mois

De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute

128171 128293 3 profils

Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique

1281311283781 sujet HDH x ANSM

Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH

6

Deux institutions de santeacute

7

LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie

Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients

Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute

Le deacutefi DataMed

8

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 5: Le projet DataMed de l’ANSM

Le programme Entrepreneurs drsquoInteacuterecirct Geacuteneacuteral

OrigineLancement en 2016 afin drsquoacceacuteleacuterer la transformation numeacuterique des administrations

GouvernancePilotage par la mission Etalab au sein de la direction interministeacuterielle du numeacuterique (DINUM) et du Ministegravere de la Transformation et de la Fonction Publique

ObjectifOuverture de lrsquoadministration agrave des data scientists designers deacuteveloppeurs recruteacutes pour relever des deacutefis dameacutelioration du service public agrave laide du numeacuterique et des donneacutees

5

Lrsquoorganisation du projet

12819810 mois

De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute

128171 128293 3 profils

Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique

1281311283781 sujet HDH x ANSM

Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH

6

Deux institutions de santeacute

7

LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie

Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients

Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute

Le deacutefi DataMed

8

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 6: Le projet DataMed de l’ANSM

Lrsquoorganisation du projet

12819810 mois

De septembre 2020 agrave juin 2021 les eacutequipes pluridisciplinaires integravegrent les administrations et reacutepondent au deacutefi avec une reacutealisation majeure agrave la cleacute

128171 128293 3 profils

Designer Data scientist et Deacuteveloppeur ont joint leurs compeacutetences sur un mecircme projet pour concilier le besoin usager et la technique

1281311283781 sujet HDH x ANSM

Le projet ORDEI Outil drsquoinformation des effets indeacutesirables est porteacute par lrsquoANSM et accompagneacute par le HDH

6

Deux institutions de santeacute

7

LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie

Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients

Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute

Le deacutefi DataMed

8

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 7: Le projet DataMed de l’ANSM

Deux institutions de santeacute

7

LrsquoANSM est lrsquoacteur public qui permet au nom de lrsquoEacutetat lrsquoaccegraves aux produits de santeacute en France et qui assure leur seacutecuriteacute tout au long de leur cycle de vie

Le HDH est un groupement drsquointeacuterecirct public qui garantit lrsquoaccegraves aiseacute et unifieacute transparent et seacutecuriseacute aux donneacutees de santeacute pour ameacuteliorer la qualiteacute des soins et lrsquoaccompagnement des patients

Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute

Le deacutefi DataMed

8

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 8: Le projet DataMed de l’ANSM

Accompagner lrsquoAgence dans son ouverture par la valorisation de ses donneacutees aupregraves du grand public et des professionnels de santeacute

Le deacutefi DataMed

8

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 9: Le projet DataMed de l’ANSM

La probleacutematique

Comment pourrait-on rendre accessible et transparente la donneacutee autour du meacutedicamentaupregraves du grand public et des professionnels de santeacute afin drsquoameacuteliorer lrsquoutilisation du meacutedicament

Quoi

Pour qui

Pourquoi

9

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 10: Le projet DataMed de l’ANSM

2 axes de travail

1 Strateacutegique

Aider agrave affiner la strateacutegie drsquoouverture des donneacutees de lrsquoANSM agrave travers la creacuteation drsquoun Data Office

2 Opeacuterationnel

Deacutevelopper les outils pour lui permettre de partager ses donneacutees et drsquoinnover afin drsquoameacuteliorer lrsquoinformation du public sur les meacutedicaments

10

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 11: Le projet DataMed de l’ANSM

La solution

DataMed est un outil agrave destination du grand public et des professionnels de santeacute Il agregravege en un seul espace accessible depuis le site de lrsquoANSM plusieurs types de donneacutees dont des donneacutees exclusives agrave lrsquoANSM

11

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 12: Le projet DataMed de l’ANSM

Sujet 1

Concevoir la strateacutegie Data par le Design

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 13: Le projet DataMed de l’ANSM

Crsquoest quoi le design pour vous

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 14: Le projet DataMed de l’ANSM

Deacutefinition de lrsquoAlliance Franccedilaise des Designers

14

ldquoLe design est un processus intellectuel creacuteatif pluridisciplinaire et humaniste dont le but est de traiter et drsquoapporter des solutions aux probleacutematiques de tous les jours petites et grandes lieacutees aux enjeux eacuteconomiques sociaux et environnementauxrdquo

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 15: Le projet DataMed de l’ANSM

Le design agrave la croiseacutee des regards

15

Meacutetier

Usager Technique

DesignIdentifier les usages les besoins et les freins tant du cocircteacute des agents que des usagers tout en conciliant la faisabiliteacute technique

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 16: Le projet DataMed de l’ANSM

Un processus creacuteatif et iteacuteratif

16

Immersion Ideacuteation Impleacutementation

Empathie avec les usagers et les agents

Analyse du marcheacute Analyse de lrsquoorganisation interne Raffinage de la probleacutematique

Co-creacuteation avec des eacutequipes pluridisciplinaires

Mateacuterialisation des ideacutees Prototype

Test des concepts Deacuteveloppement du produit Ameacutelioration continue

Empathie Deacutefinition Ideacuteation Prototype Test Deacuteveloppement

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 17: Le projet DataMed de l’ANSM

Et concregravetement

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 18: Le projet DataMed de l’ANSM

Quelques chiffres

18

Immersion Ideacuteation Impleacutementation

27Entretiens drsquoimmersion avec des agents

11Agents pour identifier les cibles des donneacutees de lrsquoANSM

10Agents et directeurs pour la strateacutegie de positionnement

6Patients chroniques solliciteacutes pour deacutefinir leur expeacuterience autour du meacutedicament

10Meacutedecins geacuteneacuteralistes solliciteacutes pour connaicirctre leurs besoins et usages du meacutedicament

3Versions de maquettes de plateforme pour lrsquoouverture des donneacutees

6Grands projets drsquoanalyse de donneacutees reacutealiseacutes

7Bases de donneacutees exploiteacutees

257Fichiers des EDL nettoyeacutes

1Structure de base de donneacutees automatiseacutee

20Tests utilisateurs de la plateforme pour 4 iteacuterations

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 19: Le projet DataMed de l’ANSM

Entretiens ateliers et reacuteflexions

19

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Reacuteflexions entretiens canvas strateacutegiques

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 20: Le projet DataMed de l’ANSM

Enseignements de la phase drsquoimmersion

20

Un immense potentiel en donneacutees de santeacute

Une mission de santeacute publique au coeur de lrsquoagence

Des compeacutetences meacutetier en interne

Un deacutesir drsquoouverture (Contrat drsquoObjectifs et de Performance Scheacutema Directeur des Systegravemes dInformation et de la Donneacutee projet EIG)

Des donneacutees agrave destination drsquoarchivage et pas drsquoexploitation

Un manque de reacutefeacuterentiels

Des chantiers drsquoeacutevolution techniques agrave preacutevoir

Un travail drsquoacculturation des agents

Suite aux entretiens avec les agents les EIG ont pu dresser un eacutetat des lieux des donneacutees et des besoins internes et deacutebuter les preacuteconisations et activiteacutes pour la suite du deacutefi Voici un extrait des enseignements majeurs de la phase drsquoimmersion lrsquoANSM et la data

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 21: Le projet DataMed de l’ANSM

Les cibles

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 22: Le projet DataMed de l’ANSM

Preacutecision des cibles des donneacutees de lrsquoAgence

22

Plusieurs ateliers ont drsquoabord eacuteteacute meneacutes en interne pour recenser les cibles et leurs besoins agrave propos des donneacutees du meacutedicament Des patients et des meacutedecins ont par la suite eacuteteacute solliciteacutes pour approfondir nos connaissances sur le sujet

Ateliers de co-creacuteation en ligne avec des agents des patients et des meacutedecins

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 23: Le projet DataMed de l’ANSM

Expeacuterience map du patient chronique

23

Une expeacuterience map est un outil de design pour cartographier lrsquoexpeacuterience globale drsquoun usager - le patient chronique dans notre cas - et connaicirctre son quotidien ses freins et ses besoins autour du meacutedicament

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 24: Le projet DataMed de l’ANSM

Les cibles primaires et secondaires

24

Les patientsGrand public citoyen malade chronique aidant associations de patients

Ce qursquoils recherchentDes informations sur leurs traitements ou ceux de leurs proches

Leurs speacutecificiteacutesUne confiance agrave bacirctir aideacutes par le travail de drsquoinformation et de transparence de lrsquoANSM

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Ce qursquoils recherchentDe lrsquoinformation pour ameacuteliorer les traitements de leurs patients

Leurs speacutecificiteacutesPeu de temps disponible et deacutejagrave beaucoup drsquooutils Voudraient ecirctre plus impliqueacutes dans les deacutecisions

Les meacutediasJournalistes leaders drsquoopinion

Ce qursquoils recherchentDe lrsquoinformation agrave rendre publique pour reacutepondre aux questions

Leurs speacutecificiteacutesBesoin de pouvoir acceacuteder agrave des donneacutees veacuterifieacutees et de reacutefeacuterence agrave partager aux publics

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Ce qursquoils recherchentDe la donneacutee neutre (brute ) exploitable pour leurs recherches

Leurs speacutecificiteacutesUne bonne connaissance meacutedicale et des compeacutetences techniques pour analyser les donneacutees

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Ce qursquoils recherchentDonner de lrsquoinformation fiable et analyseacutee aux citoyens Faire passer des directives mettre en place des politiques

Leurs speacutecificiteacutesCe sont des organismes drsquoeacutetat

Les exploitants tiercesStartups eacutediteurs de logiciels

Ce qursquoils recherchentDes donneacutees exploitables pour deacutevelopper leurs produits

Leurs speacutecificiteacutesLeurs inteacuterecircts sont speacutecifiques et impliquent de deacutevelopper un produit rentable Ils disposent de moyens importants

986328 986316 129464128295

Cibles primaires Cibles secondaires

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 25: Le projet DataMed de l’ANSM

Les cibles de notre plateforme

25

Les patientsGrand public citoyen malade chronique aidant associations de patients

Les pros de santeacuteMeacutedecins prescripteurs pharmaciens hospitaliers parameacutedicaux

Les meacutediasJournalistes leaders drsquoopinion

129298 986315 986325Les chercheursScientifiques enseignants experts laboratoires publics

Les institutionsHAS ANSES Ministegraveres Institutions europeacuteennes

Les exploitants tiercesStartups eacutediteurs de logiciels

986328 986316 129464128295

rarr Savoir agrave qui on srsquoadresse

rarr Savoir qui recruter pour les tests et ateliers

rarr Adapter le ton et le contenu en conseacutequence

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 26: Le projet DataMed de l’ANSM

Le positionnement strateacutegique

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 27: Le projet DataMed de l’ANSM

Orientation du produitservice

27

Donneacutees riches et complexes

Grand public

Pro de santeacute

Agents de lrsquoANSM

Patients

Meilleur usage du meacutedicament

Retour drsquoinformation+

Alimentation de donneacutees uniformes

Data OfficeProjets innovants

autour de lrsquoouverture lrsquoexploitation la

valorisation de la donneacutee

Retour drsquoexpeacuterience+

Sentiment de confiance+

Placer lrsquoANSM comme reacutefeacuterent en source drsquoinfo

Bouche agrave oreilleCommunication

externe

Recrutement drsquoexperts en

projets digitaux et donneacutee

Ressources externes

Ressources internes

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 28: Le projet DataMed de l’ANSM

Deacutefinition du positionnement dans lrsquoagence

28

Le projet DataMed est la premiegravere initiative drsquointeacutegration drsquoune eacutequipe experte en tech dans lrsquoAgence du Meacutedicament Les EIGs ont oeuvreacute dans lrsquoaccompagnement agrave la creacuteation drsquoun Data Office pour que lrsquoAgence puisse peacuterenniser les projets drsquoexploitation de leurs donneacutees avec des eacutequipes deacutedieacutees (identification des profils et recrutement)

Ateliers de positionnement strateacutegique avec les directions meacutetiers de lrsquoAgence

Scheacutema de reacuteflexion sur la gouvernance des produits numeacuteriques de lrsquoAgence

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 29: Le projet DataMed de l’ANSM

Deacutefinition du positionnement dans lrsquoagence

29

datamedansmsantefrLrsquoANSM ouvre toutes ses donneacutees et non uniquement celles lieacutees au meacutedicament

Sous reacuteserve drsquoaccord par la CNIL et autres autorisations

Adosseacutee agrave la nouvelle version preacutevue en Mars du site internet de lrsquoANSM la plateforme sera sponsoriseacutee et produite par lrsquoANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 30: Le projet DataMed de l’ANSM

Deacutefinition du positionnement dans lrsquoagence

30

dataansmsantefr

ansmsantefr

Le site de lrsquoANSM vise agrave devenir le site de reacutefeacuterence du meacutedicament avec un contenu eacuteditorial

La plateforme drsquoouverture des donneacutees de lrsquoANSM reacutepond agrave des objectifs de transparence et drsquoexploration de ses donneacutees

Elle sera dans un sous-domaine pour avoir une identiteacute propre agrave la donneacutee de lrsquoANSM

datagouvfr

La plateforme datagouvfr est une initiative de lrsquoeacutetat qui vise agrave cataloguer et reacutefeacuterencer les donneacutees ouvertes au public LrsquoANSM pourra y partager ses donneacutees libres de droit

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 31: Le projet DataMed de l’ANSM

La plateforme dataansm

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 32: Le projet DataMed de l’ANSM

Eacutevolution du prototype

32

Les premiers concepts ont eacuteteacute mateacuterialiseacutes sous forme de prototype interactif afin drsquoecirctre testeacutes rapidement Le maquettage rapide et avec un minimum de fonctionnaliteacutes a eacuteteacute choisi pour deacutebuter tout en pensant agrave une inteacutegration dans un ensemble plus fourni dans le futur

Version 1 Version 2 Version 3

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 33: Le projet DataMed de l’ANSM

Choix graphiques illustrations

33

Photos et illustrations sur le site de ansmsantefr

Ton institutionnel scientifique eacuteditorial

Illustrations semi reacutealistes graphiques et pictogrammes pas de photos

Ton institutionnel mateacuterialisation de lrsquoabstrait (donneacutees) au concret (data visualisation)

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 34: Le projet DataMed de l’ANSM

Ameacutelioration continue gracircce aux tests usagers

34

ldquoQuand je clique sur Effets indeacutesirables je mrsquoattends agrave voir que les effets indeacutesirables (et pas ecirctre renvoyeacutee sur une autre page) rdquo

ndash Pascale aidante de patient

ldquoCrsquoest inteacuteressant de pouvoir voir les grands profils drsquoeffets indeacutesirables deacuteclareacutes ainsi () crsquoest un vrai problegraveme les effets indeacutesirables dans les notices de meacutedicament tregraves lourdes et des tons gris et on a des lignes et des lignes drsquoinfos crsquoest pas toujours agreacuteable agrave lirerdquo

ndash Trystan meacutedecin geacuteneacuteraliste

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 35: Le projet DataMed de l’ANSM

Des points drsquoeacutetapes cleacute pour validation interne

35

Webinar en interne pour preacutesenter le projet aux agents et les solliciter pour ecirctre testeurs

Preacutesentation de DataMed agrave la nouvelle Directrice Geacuteneacuterale de lrsquoANSM en deacutecembre 2020

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 36: Le projet DataMed de l’ANSM

Une collaboration eacutetroite datadesigndev

36

Lrsquoeacutequipe a travailleacute de maniegravere collaborative et iteacuterative Elle a choisi le prototypage rapide pour des tests sur les donneacutees reacuteelles pour ecirctre au plus proche du concept final

De la donneacutee brute agrave la data visualisation

Ameacutelioration continue suite aux tests

Recensement des tacircches par corps de meacutetier design data dev

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 37: Le projet DataMed de l’ANSM

Des questions avant le sujet suivant

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 38: Le projet DataMed de l’ANSM

Sujet 2

Exploiter les donneacutees de lANSM du nettoyage et chaicircnage

agrave la data visualisation

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 39: Le projet DataMed de l’ANSM

Centraliser des donneacutees eacuteparses et varieacutees

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 40: Le projet DataMed de l’ANSM

DataMed une plateforme agrave plusieurs briques

40

Sujets de pharmacovigilance

Base de Donneacutees Publique du Meacutedicament

Outil drsquoinfoRmation des Effets Indeacutesirables

Erreurs meacutedicamenteuses

Meacutesusage

Sujet de lrsquoinspection

Ruptures de stock

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 41: Le projet DataMed de l’ANSM

DataMed une plateforme agrave plusieurs briques

41

BDPM

DataMed

Base de donneacutees publique des meacutedicaments

Base nationale de pharmacovigilance (BNPV)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)ORDEI (Effets indeacutesirables)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

Erreurs meacutedicamenteuses Base nationale de pharmacovigilance (BNPV)

Meacutesusage Base nationale de pharmacovigilance (BNPV)

Ruptures de stock Base des ruptures de stock (2014 - 2021)

TrustMed (depuis Mai 2021)

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 42: Le projet DataMed de l’ANSM

Constat des donneacutees en entreacutee

42

129513Diffeacuterentes bases de donneacuteesFormats diffeacuterents

Sources diffeacuterentes

128584Qualiteacute des donneacutees heacuteteacuterogegravenesDonneacutees structureacutees 128077Eacutecrites agrave la main donneacutees manquantes = ldquodirty datardquo 128078

127774Reacutefeacuterentiel pas systeacutematiqueLrsquoutilisation drsquoun reacutefeacuterentiel commun permet

- drsquoagreacuteger les donneacutees- de relier diffeacuterentes bases

facilement

rarr Comment relier ces donneacutees entre elles

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 43: Le projet DataMed de l’ANSM

La BDPM Base pivot entre les donneacutees

43

httpsbase-donnees-publiquemedicamentsgouvfr

Contenant la liste des - speacutecialiteacutes (par code cis)- preacutesentations (par code cip13)- substances actives (par code

substance) - et leurs liaisons

Lrsquoutilisation de la BDPM a eacuteteacute la solution choisie pour servir de reacutefeacuterentiel car elle est officielle fiable et souvent mise agrave jour

Base ANSM HAS CNAM Reacuteguliegraverement mise agrave jour

128138

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 44: Le projet DataMed de l’ANSM

Structurer les donneacutees autour des speacutecialiteacutes et substances actives

44

Produit (code Produit)Doliprane (code Produit = 019621)

3

Substance active (code Substance)

Paracetamol (code Substance = 02202)

4

Preacutesentation (code CIP)Doliprane 1000 mg comprimeacute boicircte de 8 comprimeacutes (code CIP = 3400935955838)

1

Speacutecialiteacute (code CIS)Doliprane 1000 mg

comprimeacute (code CIS = 60234100)

2

Un meacutedicament peut contenir plusieurs substances actives

+ Autres codifications UCD ATC

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 45: Le projet DataMed de l’ANSM

Structure de la BDPM

45

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 46: Le projet DataMed de l’ANSM

Une barre de recherche unique

46

Recherche par speacutecialiteacute

Recherche par substance active

Table speacutecialiteacute

Table substance

Table speacutecialiteacute-substance

Patients traiteacutes

Erreurs meacutedicamenteuses

Ruptures de stock

Patients traiteacutes

Effets indeacutesirables

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 47: Le projet DataMed de l’ANSM

Diffeacuterentes nomenclatures des meacutedicaments utiliseacutees

47

Effets indeacutesirables

Ruptures de stock

Patients traiteacutes

127775BDPM127775

anneacutee code_substance cas

2014 02202 3000

anneacutee id_rupture cip13

2021 21RS01199 3400932320189

cip13 cis

3400932320189 63368332

anneacutee cis patients

2014 63368332 3 000 000

127775BDPM127775code_substance cis

02202 63368332

Ex Doliprane 500 mg comprimeacute

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 48: Le projet DataMed de l’ANSM

Cas concret de traitement au sein de la brique ORDEI

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 49: Le projet DataMed de l’ANSM

ORDEI un Outil drsquoinfoRmation Des Effets Indeacutesirables des meacutedicaments

49

128640Projet pilote accompagneacute par le Health Data HubProjet porteacute par lrsquoANSM laureacuteat du premier AAP du HDH

Mise agrave disposition drsquoun data scientist agrave mi-temps depuis juillet 2020

Inteacutegreacute a posteriori dans DataMed

128293 ObjectifDeacutevelopper un outil agrave destination du grand public permettant de restituer automatiquement des indicateurs sur les deacuteclarations des effets indeacutesirables (EI) des meacutedicaments

129680DeacutefisStandardisation de nomenclatures de meacutedicaments

Deacutevelopper une interface visuelle intelligibile

A terme utiliser le SNDS pour approximer le niveau drsquoutilisation des meacutedicaments

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 50: Le projet DataMed de l’ANSM

Imbrication dans DataMed

50

Base nationale de pharmacovigilance (BNPV)

Open Medic (remplaceacute agrave terme par donneacutees SNDS)

ORDEI (Effets indeacutesirables)

Reacutefeacuterentiel des autorisations des meacutedicaments (CODEX)

DataMed

Base de donneacutees publique des meacutedicaments (BDPM)

Bases de donneacutees intermeacutediaires par code

Substance

Partie preacutesenteacutee

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 51: Le projet DataMed de l’ANSM

Donneacutees extraites et utiliseacutees de la BNPV

51

BNPVBase nationale de pharmacovigilance

4Tables utiliseacutees cas-patients meacutedicaments effets notificateurs

3Niveaux de granulariteacute des meacutedicaments speacutecialiteacute produit ou substance noms agrave saisie semi-standardiseacutee

~ 400 000Cas drsquoeffets indeacutesirables deacuteclareacutes et recenseacutes dans la BNPV sur la peacuteriode 2009-2018

rarr Passer de noms de meacutedicaments en texte quasi-libre agrave des codes substance

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 52: Le projet DataMed de l’ANSM

Donneacutees extraites et utiliseacutees de CODEX

52

CODEXReacutefeacuterentiel des autorisations des meacutedicaments

9Tables extraites pour les meacutedicaments avec un arrecirct de commercialisation apregraves 2005

4Bases de travail constitueacutees agrave partir des extractions

Noms codages et correspondances des speacutecialiteacutes produits et substances

Historique des noms des speacutecialiteacutes et produits

Table de transcodage des meacutedicaments CODEX (CIP CIS code Substance)

Variants des noms des substances

gt 30 000Noms actuels et anciens de speacutecialiteacutes recenseacutes dans lrsquoextraction

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 53: Le projet DataMed de l’ANSM

Nettoyer et structurer la BNPV par code Substance

53

cas 1 Substance Aceacutetaminophegravene cas 1 Substance PARACETAMOL 02202ACETAMINOPHENE

02202 PARACETAMOL 02202

02202 ACETAMINOPHENOL 61186

02202 ACETAMINOPHENE 61187

Exemple 1 Un variant de nom de substance est renseigneacute pour le cas drsquoEI

CODEX CODEX

BNPV

Variants des noms des substances

Table de transcodage

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 54: Le projet DataMed de l’ANSM

Nettoyer et structurer la BNPV par code Substance

54

cas 2 Produit BORLUX cas 2 Substance CEFUROXIME AXETIL 79600

Exemple 2 Un ancien nom de produit est renseigneacute pour le cas drsquoEI

CODEX

CODEX

BNPV

Historique des noms des ProduitsTable de

transcodage

323316 BORLUX 329727 CEFUROXIME ZENTIVA

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 55: Le projet DataMed de l’ANSM

Nettoyer et structurer la BNPV par code Substance

55

cas 3 SpeacutecialiteacuteADRIBLASTINE 50 mg poudre pour solution

pour perfusion cas 3 Substance DOXORUBICINE (CHLORHYDRATE DE) 03236

ADRIBLASTINE 50

ADRIBLASTINE 50 mg25 ml solution injectable pour perfusion

en flacon64661854

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon 64367525

Exemple 3 Le nom de la speacutecialiteacute renseigneacute pour le cas drsquoEI ne correspond pas en tout point agrave celui dans CODEX et il y a ambiguiumlteacute

ADRIBLASTINE 50 mg poudre pour

solution injectable en flacon

Scores de similariteacute distance

CODEX

CODEX

BNPV

Table de transcodage

Noms codages et correspondances des speacutecialiteacutes produits et substances

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 56: Le projet DataMed de l’ANSM

Eacutevaluer la similariteacute entre deux chaicircnes de caractegraveres

56

Utilisation de la meacutethode Optimal String Alignement (OSA) reposant sur la distance Damerau-Levenshtein

Comment ccedila fonctionne concregravetement

Jrsquoai deux chaicircnes de caractegraveres A et B Quel est le nombre de correspondances maximal que je peux obtenir sur les caractegraveres de A et B sachant que jrsquoai le droit drsquoajouter autant de ldquotrousrdquo dans les chaicircnes de caractegraveres que je veux

Le score de Damerau- Levenshtein est de 6

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

ADRIBLASTINE 50 mg poudre pour solution

pour perfusion

A G A A T T C A G T T AB G G A T C G A

A G _ A A T T C A G T T AB G G _ A _ T C _ G _ _ A

httpsslideplayercomslide9932396

ADRIBLASTINE 50 mg25 ml solution injectable

pour perfusion en flacon

ADRIBLASTINE 50 mg poudre pour solution injectable en flacon

OSA = 074OSA = 053

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 57: Le projet DataMed de l’ANSM

Flux de traitement de donneacutees

57

BNPV

98

Speacutecialiteacutes(40)

Produits(42)

Substances(18)

96 99 98

CODEX CODEX CODEX

1 041 960 observations (cas x meacutedicament) sur la peacuteriode 2009-2018

Chaicircnage par algorithmes de

deacutecision et traitement textuel

Nettoyage des donneacutees 2 des

observations retireacutees

Les meacutedicaments sont renseigneacutes sous un nom semi-standardiseacute

parmi 3 nomenclatures

4 des observations pour lesquelles la speacutecialiteacute nrsquoa

pas pu ecirctre retrouveacutee dans CODEX

1 des observations pour lesquelles le produit nrsquoa

pas pu ecirctre retrouveacute dans CODEX

2 des observations pour lesquelles la substance nrsquoa pas pu ecirctre retrouveacutee dans

CODEX

Code substance

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 58: Le projet DataMed de l’ANSM

Preacutesentation de lrsquooutil Dash

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 59: Le projet DataMed de l’ANSM

dash

59

OverviewDash apps give a point-amp-click interface to models written in Python R and Julia - vastly expanding the notion of whats possible in a traditional dashboard With Dash apps data scientists and engineers put complex Python analytics in the hands of business decision makers and operators

Machine LearningPresque tous les exemples suivants sont des interfaces permettant dinteragir avec des modegraveles de machine-learning

httpsdash-galleryplotlyhostdash-gan-editorhttpsdash-galleryplotlyhostself-drivinghttpsdash-galleryplotlyhostnamed-entity-recognitionhttpsdash-galleryplotlyhostdash-canvas-ocrhttpsdash-galleryplotlyhostdash-alignment-charthttpsdash-galleryplotlyhostword2vec-enterprise

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 60: Le projet DataMed de l’ANSM

dash

60

Bons points

128154 html wrappeacute dans du python

128007 prototypage ultra rapide

985089 learning curve assez rapide

128171 connaissances en JS pas neacutecessaires

128106 grosse communauteacute worlds largest open-source community

128640 deacuteploiement tregraves simple

Mauvais points

129327 typing pas terrible

129512 typescript non supporteacute pour le deacuteveloppement des composants

128163 assez vite trop drsquoappels au serveur

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 61: Le projet DataMed de l’ANSM

Deacutemo

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 62: Le projet DataMed de l’ANSM

Conclusion

Bilan et perspectives

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 63: Le projet DataMed de l’ANSM

Le projet DataMed un MVP

MVP = Minimal Viable Product httpsmediumcomagileactorsthe-minimum-viable-product-explained-8f1187ca7cec

But designer et deacutevelopper le minimum pour tester rapidement lrsquoappeacutetence le besoin

63

1 Provides ldquojust enough featuresrdquo

2 Satisfies ldquoearly usersrdquo

3 Enables feedback for future development

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 64: Le projet DataMed de l’ANSM

Alimentation de la base de donneacutees

64

128064Aujourdrsquohui

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockOn nous envoie des extracts sous format Excel

128302Demain

1 BDPMOn reacutecupegravere les donneacutees sur le site web correspondant

2 ORDEIErreurs meacutedicamenteusesRuptures de stockMise en place de serveurs sftp permettant aux agents de mettre agrave jour reacuteguliegraverement les donneacutees

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 65: Le projet DataMed de l’ANSM

Perspectives

65

Recruter984987 1 dev full-stack

Nrsquoheacutesitez pas agrave nous contacter si vous ecirctes inteacuteresseacutee

Ajouter les nouvelles ldquobriquesrdquo128138 le bon usage du meacutedicament

984812 la grossesse

129658 les essais cliniques

127759 la cartographie des sites de fabrication

128302 et bien drsquoautres

Continuer agrave tester et modifier la plateforme127955 On modifie on teste on modifie on teste on modifie on teste

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 66: Le projet DataMed de l’ANSM

Merci

Joeumllle Chong - joellechongansmsantefr

Line Rahal - linerahalansmsantefr

Tim Vlaar - timvlaarhealth-data-hubfr

66

Des questions

Page 67: Le projet DataMed de l’ANSM

Des questions