Analyse Retrospective Des DonnéEs De Biopuces

15
Analyse rétrospective de données de biopuces Etudiants Pierre MARGUERITE Isabelle PHILIP Etude de l’expression des gènes du tissu placentaire dans les grossesses diabétiques avec macrosomies par la technique des « Microarrays ». Tuteurs Pierre-Marie DANZE Arnaud SCHLOESING DESS Bioinformatique – Lille Plate-forme de génomique fonctionnelle Projet Bioinformatique

Transcript of Analyse Retrospective Des DonnéEs De Biopuces

Page 1: Analyse Retrospective Des DonnéEs De Biopuces

Analyse rétrospective de données de biopuces

Etudiants Pierre MARGUERITE Isabelle PHILIP

Etude de l’expression des gènes du tissu placentaire dans les grossesses diabétiques avec macrosomies par la technique des

« Microarrays ».

Tuteurs Pierre-Marie DANZE

Arnaud SCHLOESING DESS Bioinformatique – Lille

Plate-forme de génomique fonctionnelle   

Projet Bioinformatique

Page 2: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

2

Le projet bioinformatique

I. Les données de biopuces 1. Etude initiale 2. Analyse initiale

II. L’analyse rétrospective1. Différentes étapes2. Perspectives et recommandations

Page 3: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

3

Etude initiale: présentation

•Gènes marqueurs d’une « grossesse macrosomique »

•Etude de transcriptome de tissus placentaires

•3 profils - 2 patientes • sans diabète - grossesse normale - témoins T1 et T2• diabète type 1 - macrosomie foetale - DM1 et DM2• diabète type 1 - sans macrosomie foetale - DSM1 et

DSM2

Page 4: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

4

Etude : les biopuces

•5 lames

•1920 gènes

•3 dépôts (spots) identiques par gène - Triplicate

Page 5: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

5

Analyse initiale

•Normalisation Lowess

•2 approches différentes•Comparaison intra/inter profil

•Ebauche d’analyse par classification

Page 6: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

6

Analyse rétrospectiveDifférentes étapes

I. Normalisation

II. Sélection par un seuil d’expression sur lames DM

III. Confrontation des profils de patientes

IV. Classification

V. Dernière sélection : gènes candidats ?

Page 7: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

7

Logiciel Jaguar

Logiciel MIDASLowess

Par bloc

Bruit de fond

Flags

Triplicates

Données normalisées

Normalisation

1920 gènes

50-60 %

100%

X 5

Page 8: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

8

Normalisation : qualité des spots

• Spots écartés en fonction des flags

• Trop peu de signal (Cy3 et Cy5)• Biopuces non dédiées • -> 23% des spots

• Forme du spot non conforme (Cy3 ou Cy5)• 30% des spots

Page 9: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

9

Sélection par un seuil d’expression sur lames

DM

•Rôle du seuil d’expression S• Ratio d’expression R = Log2(Cy5/Cy3) • - S < R < + S

•Quelle valeur de seuil ?DM1 DM2

S = 0,5 |Cy5| = 1,414 *|Cy3| 237 – 12 % 389 – 20%

S = 1 |Cy5| = 2 *|Cy3| 41 - 2% 55 – 3%

Page 10: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

10

Confrontation des profils de patientes

T2

DM

DSM

T2 DM DSM

S = 0,5 => 58 gènes

S = 1 => 6 gènes

Confrontation - Profils d’expression des gènes

Rejet Rejet

4 confrontations différentes

Page 11: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

11

Classification

• Classification hiérarchique non adaptée

• K-means• Différentes distances• Recherche du nombre de centres

• Sélection visuelle des clusters• Liste de 63 gènes

nécessité d’une dernière sélection

Page 12: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

12

Dernière sélection : gènes candidats ?

•Gènes répondant à 2 critèresSeuil d’expression de 1 entre DM et T2Seuil d’expression de 1 entre DM et DSM

•AF055033

•NM_000457

•NM_003840

•NM_014517

•NM_001344

•NM_007218

•AK025844

•U80232

•D26067

•NM_013403

• Aucun gène identifié par l’analyse initiale

Page 13: Analyse Retrospective Des DonnéEs De Biopuces

SynthèseNotre approche

1 2

Normalisation

Outils

Méthode

Finesse Local

Flags Oui

Bruit de fond Oui

Correction

Flags

Calcul médiane triplicate Oui

Suppre° pts +- 15% médiane

Oui

Triplicate Moyenne géométrique

Ratio d’intensité

Analyse

Seuil d'expression 0,5 1

Comparaison intra groupe Oui Non Non

Comparaison inter groupe

Résultat 14 gènes 2 à 10 gènes

Moyenne arithmétique

Log2 (moy. Cy5 / moy.Cy3)

Oui

Non

Midas

Lowess

Global

Non

Analyse initiale

Non

Suppression manuelle

Non

? ?

Page 14: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

14

Perspectives et recommandations

• Impact du logiciel de lecture• Options de normalisation

• Traiter les spots rejetés / forme ?

• Choix du seuil d’expression

=> Etude avec biopuces de référence

• Multiples options faire des choix

• Nécessité d’un certain recul• Intention protocole, design, démarche

Page 15: Analyse Retrospective Des DonnéEs De Biopuces

16 avril 2004 DESS BIOINFORMATIQUE Pierre MARGUERITE - Isabelle PHILIP

15

Bilan

•Apport technique • Biopuce• Normalisation• Classification

•Dialogue enrichissant avec les biologistes