TLM n°103 Entretien avec Arslan Mazouni : pour que l'open data serve le système de santé

2
e n t r e t i e n S TLM 103 AVR-MAI-JUIN 2016 7 « MONITORER » EN TEMPS RÉEL LES PATIENTS, PRÉVENIR LES INCIDENTS MÉDICAUX, PASSER D’UNE ÉTIOLOGIE GÉNÉRIQUE À UNE ÉTIOLOGIE PERSONNALISÉE : CE SONT LÀ QUELQUES-UNS DES SERVICES QUE POURRAIT RENDRE À NOTRE SYSTÈME DE SANTÉ L’OPEN DATA, S’IL EST UTILISÉ À BON ESCIENT. C’EST CE QUE PENSE ARSLAN MAZOUNI, DATA SCIENTIST, EXPERT EN MODÉLISATION MATHÉMATIQUE, CONCEPTEUR ET FOURNISSEUR D’ALGORITHMES DANS LE DOMAINE DE LA E-SANTÉ ET DU RISK BASED MONITORING TLM : L’open data est l’un des dévelop- pements du big data. Pourriez-vous dé- finir l’un et l’autre termes ? Comment s’articulent-ils ? Arslan Mazouni : « Big data » est une forme de vulgarisation pour signifier la ca- pacité à traiter d’énormes masses de don- nées issues de sources hétérogènes résul- tant de la digitalisation de notre monde. Il s’agit, d’une part, des données structurées générées par les institutions ou les entre- prises. Nécessaires à leur fonctionnement elles sont stockées dans leurs bases de don- nées privées. C’est, d’autre part, des don- nées non structurées issues de nos cour- riels, blogs, interventions dans les médias sociaux et bientôt même de la transcription automatique de nos paroles. Ces données peuvent être soit publiques soit privées. Enfin, au croisement de ces deux types de gisements de données, on trouve l’internet des objets, c’est-à-dire l’extension d’Inter- net à des choses et à des lieux du monde physique, extension rendue possible par la montée en puissance des machines en ré- seaux, des capteurs centralisés, des traceurs d’activités et, souvent à notre insu, de nos téléphones portables. La frontière floue publique/privée de ces données est en grande partie au cœur des enjeux actuels. Cette inflation des data nous offre non seu- lement la possibilité de tracer chacun de nos processus en flux de données, mais aussi de constituer des gisements de don- nées chaque fois assez gros pour que la pos- sibilité d’y trouver des réponses à nombre de nos questions soit à la portée d’une ana- lyse par croisement du gisement ou d’au- tres gisements. L’open data peut être iden- tifié comme l’une des sources alimentant le big data. Ce que l’on entend traditionnelle- ment par « open data » c’est en premier lieu les données publiques collectées par un service public à des fins d’analyse par trans- formation et agrégation. Historiquement les États ont été les premiers collecteurs des données de leurs citoyens. L’arbitrage reste continuellement à faire entre des maximalistes qui voudraient que toute donnée collectée par des pouvoirs publics revienne au public et des minimalistes qui définiraient le caractère régalien de la puissance publique comme le monopole même et sans partage sur les données pu- bliques. À mon sens, il y a dans cet arbi- trage un enjeu d’approfondissement de la démocratie par la diffusion de la culture de la preuve par la science et les mathé- matiques pour soutenir ou invalider toute argumentation qui risquerait d’avoir un impact fort sur nos vies publiques ou pri- vées. D’ailleurs cet enjeu de transpa- rence, doublée de la conscience aiguë de la valeur intrinsèque ou extrinsèque des données, au-delà la puissance publique, intéresse de plus en plus les acteurs pri- vés. Du fait que nous nous interrogeons sur ce que nous consommons, ce que nous mangeons, comment nous sommes soignés, les entreprises devront donner de plus en plus de gages de confiance par la diffusion publique de leurs données. TLM : Qu’est-ce qui a rendu possible l’émergence du big data ? Arslan Mazouni : Il y a le développement et l’effondrement des prix des dispositifs de collecte, des infrastructures de stockage des données et la puissance des calculs qui e n t r e t i e n S « PLUS NOTRE ACCÈS AUX DONNÉES SERA LARGE… » Pour que l’Open data serve le système de santé… g L’ « open data » ce sont les données publiques collectées par un service public à des fins d’analyse. L’arbitrage reste à faire entre des maximalistes qui voudraient que toute donnée collectée par des pouvoirs publics revienne au public et des minimalistes qui définiraient le caractère régalien de la puissance publique comme le monopole même et sans partage sur les données publiques. g Arslan Mazouni : « Dessiner les contours d’une médecine personnalisée et permettre d’affiner les politiques de santé publique »

Transcript of TLM n°103 Entretien avec Arslan Mazouni : pour que l'open data serve le système de santé

e n t r e t i e n S

TLM N° 103 AVR-MAI-JUIN 2016 7

« MONITORER » EN TEMPS RÉEL LES PATIENTS, PRÉVENIR LES INCIDENTSMÉDICAUX, PASSER D’UNE ÉTIOLOGIEGÉNÉRIQUE À UNE ÉTIOLOGIEPERSONNALISÉE : CE SONT LÀQUELQUES-UNS DES SERVICES QUEPOURRAIT RENDRE À NOTRE SYSTÈMEDE SANTÉ L’OPEN DATA, S’IL EST UTILISÉÀ BON ESCIENT. C’EST CE QUE PENSEARSLAN MAZOUNI, DATA SCIENTIST,EXPERT EN MODÉLISATIONMATHÉMATIQUE, CONCEPTEUR ET FOURNISSEUR D’ALGORITHMES DANSLE DOMAINE DE LA E-SANTÉ ET DU RISK BASED MONITORING

TLM : L’open data est l’un des dévelop-pements du big data. Pourriez-vous dé-finir l’un et l’autre termes ? Comments’articulent-ils ?Arslan Mazouni : « Big data » est uneforme de vulgarisation pour signifier la ca-pacité à traiter d’énormes masses de don-nées issues de sources hétérogènes résul-tant de la digitalisation de notre monde. Ils’agit, d’une part, des données structuréesgénérées par les institutions ou les entre-prises. Nécessaires à leur fonctionnementelles sont stockées dans leurs bases de don-nées privées. C’est, d’autre part, des don-nées non structurées issues de nos cour-riels, blogs, interventions dans les médiassociaux et bientôt même de la transcriptionautomatique de nos paroles. Ces donnéespeuvent être soit publiques soit privées.Enfin, au croisement de ces deux types degisements de données, on trouve l’internetdes objets, c’est-à-dire l’extension d’Inter-net à des choses et à des lieux du mondephysique, extension rendue possible par lamontée en puissance des machines en ré-seaux, des capteurs centralisés, des traceursd’activités et, souvent à notre insu, de nostéléphones portables. La frontière flouepublique/privée de ces données est engrande partie au cœur des enjeux actuels.

Cette inflation des data nous offre non seu-lement la possibilité de tracer chacun denos processus en flux de données, maisaussi de constituer des gisements de don-nées chaque fois assez gros pour que la pos-sibilité d’y trouver des réponses à nombrede nos questions soit à la portée d’une ana-lyse par croisement du gisement ou d’au-tres gisements. L’open data peut être iden-tifié comme l’une des sources alimentant lebig data. Ce que l’on entend traditionnelle-ment par « open data » c’est en premier lieules données publiques collectées par unservice public à des fins d’analyse par trans-formation et agrégation. Historiquementles États ont été les premiers collecteursdes données de leurs citoyens. L’arbitragereste continuellement à faire entre desmaximalistes qui voudraient que toutedonnée collectée par des pouvoirs publicsrevienne au public et des minimalistes quidéfiniraient le caractère régalien de lapuissance publique comme le monopolemême et sans partage sur les données pu-bliques. À mon sens, il y a dans cet arbi-trage un enjeu d’approfondissement de ladémocratie par la diffusion de la culturede la preuve par la science et les mathé-matiques pour soutenir ou invalider touteargumentation qui risquerait d’avoir unimpact fort sur nos vies publiques ou pri-vées. D’ailleurs cet enjeu de transpa-rence, doublée de la conscience aiguë dela valeur intrinsèque ou extrinsèque desdonnées, au-delà la puissance publique,intéresse de plus en plus les acteurs pri-vés. Du fait que nous nous interrogeonssur ce que nous consommons, ce quenous mangeons, comment nous sommessoignés, les entreprises devront donner deplus en plus de gages de confiance par ladiffusion publique de leurs données.TLM : Qu’est-ce qui a rendu possiblel’émergence du big data ? Arslan Mazouni : Il y a le développementet l’effondrement des prix des dispositifs decollecte, des infrastructures de stockagedes données et la puissance des calculs qui

e n t r e t i e n S

« PLUS NOTRE ACCÈS AUX DONNÉES SERA LARGE… »

Pour que l’Open dataserve le système de santé…

gL’«open data» ce sont les

données publiques collectées

par un service public à des fins

d’analyse. L’arbitrage reste à

faire entre des maximalistes qui

voudraient que toute donnée

collectée par des pouvoirs

publics revienne au public et des

minimalistes qui définiraient le

caractère régalien de la

puissance publique comme le

monopole même et sans partage

sur les données publiques.

g

Arslan Mazouni : « Dessiner les contours d’une médecine personnalisée et permettred’affiner les politiques de santé publique »

e n t r e t i e n S

TLM N° 103 AVR-MAI-JUIN 2016

met à notre portée, presque en temps réel,la restitution d’algorithmes de plus en pluscomplexes. Il y a ensuite le formidable suc-cès du modèle économique de Google dontle cœur de métier est la data et l’analytics :Google se rémunère par ce qu’il connaît denous quand nous sommes dans l’illusion deconsommer gratuitement son service. Celalui permet en retour de monnayer en asso-ciant au plus près, selon ses algorithmes, lebon annonceur à son bon consommateur. TLM : Quelles sont les perspectivesqu’ouvre le big data en médecine ? Et àquelles conditions ?Arslan Mazouni: D’abord la « monitorisa-tion » à distance des patients quasiment entemps réel et ainsi notre capacité à préve-nir les incidents médicaux, à améliorerl’adhérence à la prescription et enfin àconstituer des bases de connaissance longi-tudinale sur les pathologies. Ce qui nouspermettra de passer d’une étiologie médi-cale générique à une étiologie personnali-sée et multifactorielle. Ensuite la person-nalisation des thérapies résultant du croi-sement entre nos comportements et la gé-nomique : de quels facteurs de risquessommes-nous porteurs et quelle inflexionapporter à nos comportements pour ré-duire ces risques ? Les données et leuranalyse nous rendent capables de répondreà cette question non seulement ponctuel-lement, mais aussi dynamiquement tout aulong de notre vie connectée. Cela dessine,d’une part, les contours d’une médecinepersonnalisée et permettra, d’autre part,d’affiner les politiques de santé publique.Enfin, la réduction des coûts et des délaisdans la recherche clinique. Le coût moyend’un essai clinique réussi, c’est-à-dired’une molécule approuvée par les autoritésde régulation, selon des chiffres de 2013est de près de 2,5 milliards de dollars pourun délai de mise sur le marché de 8 ans enmoyenne. Il faut ajouter à cela que seuleune molécule sur 10 complètera la phase3 et sera approuvée. L’anticipation dusuccès et surtout de l’échec d’une molé-cule en cours de développement devientdonc cruciale, dans cet univers de l’incer-titude, pour l’optimisation du développe-ment du médicament. Or notre capacité àanticiper ces échecs est proportionnelle ànotre niveau d’information a priori. Plusnotre accès aux données sera grand, meil-leur et plus puissante sera notre facultéanalytique à cerner ces incertitudes.

TLM : Le big data inaugure-t-il une èrede médecine sans médecins ?Arslan Mazouni : Il faut d’abord préciserqu’en soi la donnée est muette ; elle prendsa valeur grâce à son interprétation, c’est-à-dire la capacité de l’expert à lui donnerdu sens et même ce sens devra être sou-mis en dernier ressort à un consensusscientifique. S’agissant de la médecine,seul l’expert, à savoir le médecin, est pres-cripteur, il reste maître de sa décision. Ilfaut se défaire d’une espèce de vision ma-gique qui ferait des algorithmes lesconcurrents des médecins. Il n’y a d’algo-rithme que sous supervision. Même le do-maine le plus avancé de l’algorithmiqueactuelle, le machine learning, n’est rendupossible qu’initialisé et basé sur la capturedu savoir de l’humain expert doublé pardes méthodes de simulations aléatoires

dont le tri reste et demeurera au bout ducompte sous la décision de l’expert, lemédecin. A ce jour aucune machine n’estcapable de générer son propre code etcela reste encore du domaine d’une loin-taine utopie.Comme le rappelait un mathématicien enguise de boutade, on devra se méfier vrai-ment du machine learning le jour où laGoogle-car, au lieu de nous conduire versnotre lieu de travail un matin, nous emmè-nera à la plage de sa propre initiative, c’està dire par « auto-programmation ». Le li-bre arbitre et la décision restent et de-meureront la compétence exclusive dumédecin. Rappelons les fondamentaux : lebig data et l’analytique s’inscrivent dans larécupération de l’information afin de fia-biliser au mieux les diagnostics ; d’autrepart, c’est là l’apport nouveau, il offre uneformidable contribution à la symétrie del’information et à l’aide à la décision.TLM : Quel est le modèle économiquedu big data en médecine ?Arslan Mazouni : Le marché est enpleine structuration et en cours de matu-ration avec la coexistence des colosses(Google/Alphabet, IBM-Watson, Appleavec les applications mobiles). On peutdistinguer trois segments : les capteurs dedonnées médicales, les centralisateursdes données et les analyseurs. La sensibi-lité liée à la nature intime de la donnéemédicale devrait inciter la puissance pu-blique à la vigilance quant à la constitu-tion de monopole dans ces trois domaineset surtout dans la fusion monopolistiquede ces trois domaines. TLM: L’open data ne met-il pas en dan-ger le prérequis de l’anonymisation desdonnées ?Arslan Mazouni : Pour un Data Scientistce n’est pas l’accès à un nom ou à unepersonne physique qui importe mais lesbonnes agrégations des données à trouverpour en dégager tout le spectre des règlesdynamiques de comportements. Par ail-leurs et au niveau légal, l’exigence de tra-çabilité dans le domaine de la recherchemédicale qu’imposent les autorités de ré-gulation devrait d’une part élargir le do-maine du consentement éclairé auprèsdes patients et d’autre part mettre enplace des tiers de confiance dont la déon-tologie serait au-dessus de tout soupçon.

Propos recueillis par Dominique Noël & Bernard Maruani

74

gAu niveau légal,

l’exigence de traçabilité dans

le domaine de la recherche

médicale qu’imposent

les autorités de régulation

devrait, d’une part,

élargir le domaine

du consentement éclairé

auprès des patients

et, d’autre part,

mettre en place des tiers

de confiance

dont la déontologie serait

au-dessus de tout soupçon.

g