Bases de données – Outils de gestion
Transcript of Bases de données – Outils de gestion
Bases de données – Outils de gestion
Mise en place d’outils pour gérer, stocker et utiliser les informations d’une
recherche biomédicale
Document réalisé par L. QUINQUISUnité d’épidémiologie et de biostatistique (Pr Coste) - Hôpital Cochin
11/03/2010
Qu’est ce qu’une base de données?
Ensemble d’informations avec un objectif commun (descriptif, analytique…)
Ensemble structuré et organisé
Différents supports (papier, fichier informatique, e-crf)
But d’une base de donnée
Récolter des données dans un but spécifique:
Suivie médicale du patient (antécédents, traitements administrés, symptômes observés,…)Etude clinique : analyse d’une population pour améliorer le traitement ou le diagnostique d’une maladie, d’un protocole
Stocker des informations pour faciliter l’exploitation (ajout, suppression, recherche,…)
Résultat: décrire les données
Place de la base de donnée dans la recherche médicale
Schéma général d’une étude
Élaboration du projet de recherche
Recueil des données / datamanagement
Analyse descriptive / inférentielle
Interprétation / Rapport / Article
Notions fondamentales
SGBD = ensemble de programme pour gérer et accéder à une base de donnée
Fonctionnement (client/serveur)
SGBD: Système de gestion des bases de données
Client Serveur
Requête
Analyse
Résultat
Notions fondamentales
Indépendance physiqueIndépendance logiqueAccès rapide aux donnéesNon redondance des donnéesAdministration centralisée des donnéesCohérence des donnéesPartage des donnéesSécurité
Objectifs SGBD
Notions fondamentales
Postgresql: Apple, Fujitsu, Skype
MySQL: SGBD le plus utilisé dans le monde
OracleMicrosoft SQLIBM DB2Sybase
SGBD utilisés
Libre
Langage informatique de type requêteLDD: langage de définition de donnée
Ex: CREATE TABLE table1 (colonne1 INTEGER, colonne2 INTEGER,
colonne3 DATE, colonne4 DATE);
LMD: langage de manipulation de donnéeEx: SELECT name, service
FROM employeesWHERE statut='stagiaire'ORDER BY name;
LCD: langage de contrôle
SQL: Structured Query Language
Notions fondamentales
Outil pratique (e-CRF): exemple en recherche clinique
Toute étude clinique est organisée autour d’un protocole
Définition du contexteObjectifs médicaux et scientifiquesMéthodologie (critères inclusions, données recueillies, calendrier, méthodes statistiques,…)Considérations éthiques et légalesFinancement
Outil pratique (e-CRF): exemple en recherche clinique
1ère étape = retranscription du protocole pour être utilisable par un SGBD
Phase 1: Conception
Modèle entité/association
Entité: objet ou élément caractérisé par son unicité
Association: Lien entre plusieurs entités
N° de dossier
Nom
Prénom
Patient Traitement
Nom traitement
N° flacon
Dose
Recevoir
Date administration
Outil pratique (e-CRF): exemple en recherche clinique
Ce modèle entité/association doit être pensé selon les besoins de l’investigateur et les données nécessaires à l’analyse (description patient, CJP, EIG,…)
Adapté au protocole de l’étude
Premier pas vers la conception d’un masque de saisie
Phase 1: Conception
Outil pratique (e-CRF): exemple en recherche clinique
Créer un cahier électronique pour stocker les données et en faciliter la gestion
Baser sur la formalisation du protocole
Interactif pour faciliter la saisie des informations
Indiquant tous les paramètres nécessaires pour répondre aux problématiques posées
Phase 2: Masque de saisie
Outil pratique (e-CRF): exemple en recherche clinique
Identifiant patient
Outil pratique (e-CRF): exemple en recherche clinique
Outil pratique (e-CRF): exemple en recherche clinique
Eléments indispensables dans un e-CRFDescription du patient (n° inclusion, bras randomisation, sexe, âge,…)Visites & résultat clinique (CJP) EIGBordereau sortie d’étude
Outil pratique (e-CRF): exemple en recherche clinique
Mise en ligne du e-CRF final (ex: Cleanweb)Structure du e-CRF:
Module → Formulaire → Variable
Phase 3: Saisie, cohérence
Module
Formulaire
Variable
Outil pratique (e-CRF): exemple en recherche clinique
Interaction data-manager et biostatisticien Extraction finale
Nomming des variablesFormat des variables (numérique, qualitative, date,…)Codage des variables
Oui/non = coder 1/0Homme/Femme = 1/2
Phase 4: Extraction et analyse
Résumé
Pubmeb: base de données bibliographiques
PUBMED = moteur de recherche bibliographique gratuit:
BiologieMédecine scientifique
19 millions de citations depuis 1950 dans 5000 revues biomédicalesInterface donnant accès à la BDD Medline
CitationsRésumés d’articles scientifiquesTextes complets
Pubmeb: base de données bibliographiques
Lien: http://www.ncbi.nlm.nih.gov/pubmed/
Pubmeb: base de données bibliographiques
MeSH (Medical Subject Headings): système de nomenclature pour indexer les articles (ex: classification de Dewey)
Bibliothèque nationale de médecineDéfinir une stratégie de recherche
19 catégories (anatomie, maladie, psychiatrie,…)Sous catégorie maladie (animale, cardiovasculaire,…)Exemple: Diagnostique des différents stades de la fibrose du foie par des méthodes non invasives :
Maladie Système digestif Maladie du foie
Cirrhose du foie
Pubmeb: base de données bibliographiques
Saisie du sujet principal de la recherche
Pubmeb: base de données bibliographiques
Arborescence MeSH
(ex.: fibrose foie)
Pubmeb: base de données bibliographiques
Pubmeb: base de données bibliographiques
Pubmeb: base de données bibliographiques
Pubmeb: base de données bibliographiques
Pubmeb: base de données bibliographiques
Fin
Si vous souhaitez en savoir ++++ :
Base de donnée et langage SQL:
Livre: Bases de données de la modélisation au SQLhttp://laurent-audibert.developpez.com/Cours-BD/html/index.html
SGBD:
Postgresql: http://www.postgresql.org/Mysql: http://www.mysql.fr/Oracle: http://www.oracle.com
Pubmed: http://www.ncbi.nlm.nih.gov/pubmed/
Merci de votre attention
Avez vous des questions?