Transcriptome et immunologie Philippe Kastner. Transcriptome Ensemble des ARN messagers exprimées...

Post on 03-Apr-2015

108 views 1 download

Transcript of Transcriptome et immunologie Philippe Kastner. Transcriptome Ensemble des ARN messagers exprimées...

Transcriptome et immunologie

Philippe Kastner

Transcriptome

Ensemble des ARN messagers exprimées par un système biologique donné

Le transcriptome est une mesure de l’état biologique du système

Méthode d’analyse: puces à ADN (microarray)

ADN accroché à un support= ADN CIBLE

Gène 1 Gène 2Gène 2

****

*

Gène 1Hybridation avec les ARN des

cellules à étudier= SONDE

FLUORESCENTE

Dans les cellules étudiées :ARN 1 (produit par le Gène 1) présentARN 2 (produit par le Gène 2) absent

Méthode d’analyse de l’expression des gènes basée sur le principe de l’hybridation moléculaire

Hybridation entre 2 molécules d’ADN complémentaires

Double hélice

ADN dénaturé

Le principe des puces à ADN : l’hybridation moléculaire

Qu’est-ce qu’un microarray ou une puce à ADN (DNA

chip) ?• C’est un matériau (généralement du verre, du plastique, autre) sur

lequel on a fixé un très grand nombre d’acides nucléiques différents de manière covalente = ADN CIBLE

• Les différents acides nucléiques (= ADN CIBLE ) sont bien ordonnés sur le support (on sait précisément où se trouve chaque gène)

> « microarray » = microréseau

• L’ARN ou l’ADN extrait des cellules ou tissus à analyser est rendu fluorescent ( = SONDE FLUORESCENTE ) et est hybridé sur cette cible

• Les hybrides formés par complémentarité des bases (ADN CIBLE / SONDE FLUORESCENTE) sont repérés par mesure de la fluorescence

• Plus la fluorescence est intense, plus un ARN est abondant

ANALYSES QUANTITATIVES

Deux grand types de puces à ADN

Affymetrix Puces sur lame

Photolithographie

Affymetrix

Dépôt avec un robotou synthèse directeFait maison ou achetable

Mode de Fabrication

Qui les fabrique ?

Les puces à ADN Affymetrix

GeneChip® Probe Array

GeneChip® Probe Arrays

11µm

Each probe cell or feature containsmillions of copies of a specificoligonucleotide probe

Image of Hybridized Probe Array

Over 1 million different probes complementary to geneticinformation of interest

Single stranded, fluorescentlylabeled DNA target

Oligonucleotide probe

* **

**

1.28cm

GeneChip Probe Array Hybridized Probe Cell

chips/wafer

Probe Tiling StrategyGene Expression

(25-mer)

Affymetrix Experimental System

Fragmentheat, Mg2+

Washing & Staining

Scanning

Hybridization

Biotin-labeled cRNA transcript

Total RNA

In vitro transcription(Biotin-UTP, Biotin-CTP)

Biotin - labeled cRNA fragments

Cells,tissues

B B B BB B

B

B

B

B

B

B

AAAA5’ TTTT-T7

Reverse Transcription(oligodT linked to the sequence of the promoter of the RNA polymerase T7)

AAAA-T7TTTT-T7

Synthesis of the second strand of cDNA

Streptavidin-Phycoerythrin

1 puce

1 image

Mesures obtenues par puces affy

Average difference Σ (PM-MM) / N

Absolute call (Present/Absent)Défini par le nombre de paires PM/MM ou PM>MM

Autres méthodes de calcul des valeurs d’expression possibles

Les puces sur lame

2 types de puces

-Dépôt de micro-gouttes avec un robot- densité jusqu’à 30 000 sptots par lame- artisanale (variabilité)

- Synthèse directe- densité jusqu’à 106 spots par lame- Puces commerciales (Agilent, Nimblegen, Applied)

Puce artisanale spottée Puce commerciale Agilent

5  ’

Reverse Transcription : oligodT + dUTP-Cy3

TTTTTTTTAAAAAAAA

RNA degradation

AAAAAAAA mRNA

TTTTTTTT ss cDNA

Cells A

Reverse Transcription : oligodT + dUTP-Cy5

RNA degradation

AAAAAAAA mRNA

TTTTTTTT ss cDNA

TTTTTTTTAAAAAAAA

Cells B

Direct labeling

Hybridization

Scanning

microarray

Cy3+Cy5 probe

Scanarray 4000 (Perkin Elmer)

Cy3 and Cy5 images overlayed

Fluorescent labelling, Hybridization and Scanning

Comment concevoir une expérience de microarrays ?

But: déterminer les variations biologiques entre différents échantillons.

Mais il faut distinguer celles-ci des variations

liées à la technologie, ou à celles liées à la variabililé intrinsèque des échantillons

Thomas Hudson, Montreal Genome Center

Intensité croissante

6 échantillons: A1, A2, A3, B1, B2, B3

Microarray comprenant 20 000 gènes

échelle d’expression: 1- 10000

Mesures pour un gène X

A1 A2 A3 B1 B2 B3

25 30 35 55 50 66

Test t: p = 0,01

Pour combien de gènes une telle valeur peut-elle être obtenue par hasard ? (« false discovery rate », ou FDR)

Différences d’expression réelles ou artéfactuelle ?

Comparaison Nombre de gènes différentiels

(Changement > 2x, p <0,01)

(A1, A2, A3) vs (B1, B2, B3) 300

(A1, B2, A3) vs (B1, A2, B3) 150

(A1, B2, B3) vs (B1, A2, A3) 200

(A1, A2, B1) vs (B2, B3, A3) 100

Estimation du nombre de gènes différentiels « réels »

La moitié des gènes différentiels est artéfactuelle !

Solutions: multiplier les réplicats

augmenter la stringence des critères de sélection.

Number of replicates Type of sample

Cell lines

Mouse cells

Mouse organs

Human cells

Human tumors

Interested by Big changes

2 2-3 3-4 5-6 >30

Small changes

4-5 5-6 10 10-15 >60

variabilité

Combien de réplicats sont-ils nécessaires pour une expérience réussie ?

Deux grands types de méthodes de « clustering »

A. Méthodes hiérarchique: génération d’un dendogramme (arbre) qui relie tous les gènes ou échantillons entre eux.

B. Méthodes par partitionnement, qui divise les gènes en K classes ayant des profils similaires (K défini par l’utilisateur)

- K-means

- Self-organizing maps (SOM)

- analyse par composantes principales (PCA)

Regroupement en fonction de profils d’expression

similaires

1. Gènes

Évolution temporelle de l’expression des gènes dans des fibroblastes humains stimulés par du sérum (Pat Brown, 1997)

Visualisation d’une chorégraphie de l’expression génique dans le temps.

700 gènes

Different cell lines to be compared

Genes belonging to one cluster

Fold Changes

1-2-4-6 +6+4+2

Regroupement en fonction de profils d’expression similaires

2. échantillons

– N expériences

– chaque gène est considéré comme un vecteur dans un espace de dimension N (coordonnées = valeurs d’expression dans chaque expérience)

– Partitionnement des gènes en K classes optimisées selon des critères de proximité des gènes dans l’espace vectoriel

Méthodes par partitionnement

(K-means, Fuzzy C-means, Self organizing maps)

Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes)

Ikaros

TelJak2 Tal-Lmo1

bcat

Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes)

B-catenin ICN1 Ikaros TelJak2 Tal-Lmo1

Visualisation des clusters FCM (4208 genes)

Applications des microarrays

1. Expression différentielle

Question: pourquoi B est-il différent de A ?

(KO vs WT; effet d’un traitement; sain vs malade, etc …)

Comparaison de A et B 200 gènes différentiels !!

Et ensuite ??? ….

Exemple d'application 1:

Fonction du facteur de transcription AIRE dans les cellules épithéliales du thymus

(Science 298, 1395-1401, 2002)

Problème: comment les lymphocytes T potentiellement autoréactifs contre des antigènes tissu-spécifiques sont-ils éliminés dans le thymus ? (tolérance centrale)

Cellules épithéliales médullaires: expression "ectopique" de nombreux transcrits tissu-spécifique. Rôle dans la délétion clonale des lymphocytes T autoréactifs ?

Aire: facteur de transcription muté dans le syndrome autoimmun poly-endocrine de type I. Autoimmunité contre de nombreux tissus

1. Fabrication d'un modèle de souris déficient pour Aire

autoanticorps contre de nombreux tissus périphériques (rétine, glande salivaire, thyroide, etc..)

2. L'expression de Aire est restreinte au cellules épithéliales du thymus

3. Comparaison du transcriptome des cellules épithéliales thymiques de souris normales et mutantes

Comparaison du transcriptome des cellules épithéliales thymiques contrôle et déficientes pour AIRE

diminution de l'expression de la plupart des gènes différentiels comparaison globale

La plupart des gènes différentiels sont des gènes spécifiques d'un tissu

Exemple 2: Lymphomes thymiques chez des souris mutantes pour le gène Ikaros

Recherche de la voie moléculaire impliquée dans le développement de ces tumeurs par une analyse du transcriptome.

6 IkL/L tumors

4 Tel-Jak2 tumors

5 non tumoral thymocytes

Genes specifically deregulated in IkL/L tumors ?

Conception expérimentale

Hes1

Notch1Deltex 1

pT

Notch upregulation is associated with tumors lacking Ikaros

IkL/L tumors

IkL/L tumor

TelJak2 tumors

Notch pathway signature

Applications des microarrays

2. Transcriptome comme mesure phénotypique d’un système biologique

Concept: Profil apparenté de l’expression des gènes implique une similitude d’état biologique

Application principale: classification des tumeurs

Signature transcriptomique

Ensemble de gènes caractéristiques d’un état biologique donné- Type cellulaire (ex: signature des pDCs)- stimulation d’une voie moléculaire

Exemple 3: analyse de la signature de cellules dendritiques plasmacytoïdes

Liu et al, Nature Immunol, 2004

TLR7

(RNA)

TLR9

(DNA)

Virus

sensors pDCIFN

Plasma cell differentiation

Th1 polarisation

NK cell cytotoxicity

CD8+ T cell cytotoxicity

Other roles:

- Tolerogenic function (induce T-reg activity)

- secretion of other signaling molecules (IL12, chemokines)

Plasmacytoid DCs: innate viral sensors stimulating adative immune responses

Differentiation into APC

Comment les pDCs se développent-elles ?

Des lignages de pDC séparés myéloïdes et lymphoîdes ?

- Des pDCs peuvent être produites à parftir de précurseurs « myéloïdes » ou « lymphoïdes »

- Les pDcs expriment certains gènes lymphoïdes (pTa, lambda5, Rag, SpiB)

Les pDCs sont-elles apparentées aux DC conventionnelles ?

Non: identification d’un progéniteur commun monocytes/cDC qui ne possède pas de potentiel pDC

Oui: Les souris dénuées du régulateur IRF8 sont dépourvues de pDCs et de cDCs

Quels signaux/facteurs sont requis pour la différenciation des pDC ?

Une vue génomique des cellules dendritiques

1. Assemblage de profils d’expression génique pour la plupart des types cellulaires immunitaires (macrophages, neutrophiles, lymphocytes B, T, NK, pDCs, cDCs)

2. Pour l’homme et la souris

3. Clustering pour visualiser les distances entre lignage

4. Identification de programmes d’expression géniques conservés

Robbins et al, 2008

Hierarchical clustering Principal component analysis (PCA)

(Projection on first 2 dimensions)

1. SOURIS

Similitude des profils transcriptomiques des DC

2. HOMME

Publicly available datasets on Affymetrix U133 v2

Similitude des profils transcriptomiques des DC

Pan-DC genes

pDC specific genes (500 genes)

Conventional DC genes

Signature des DC de souris

(Fuzzy C-means clustering)

Signatures des DC humaines

pDC genes

Pan DC genes

Conventional DC genes

B cells T cells pDCs cDCs

Ebf1 Camk4 Epha2 Arhgap22

Cd19 4430004N04Rik Pacsin1 Btbd4

Klhl14 Trat1 Zfp521 Slamf8

Bank1 CxCr6 Sh3bgr 9130211l03Rik

Pax5 Tnfrsf25 Tex2 Nav1

Blr1 Ccdc64 Runx2 Ct2a

Ralgps2 Plcg1 Atp13a2 Avpi1

CD79b Lat Maged1 Spint1

Gènes les plus fortement associés à des types de cellules spécifiques

Rouge: connu pour être spécifique de ces lignages

Conclusion des études transcriptomiques

Proximité des programmes géniques des pDC et cDC

Programme conservés entre l’homme et la souris

Les gènes spécifiques des DCs sont largement inconnus

Nature Immunology, October 7th, 2007

Homologies entre les sous-types de cellules dendritiques chez l’homme et la souris

Autres applications du compendium

Classification de nouvelles populations cellulaires

Les cellules IkDC sont-elles des cellules dendritiques ?

Interferon-producing killer dendritic cells (IkDC):

- Capables de produire de l’IFNa/b

- expriment certains marqueurs des DCs

- propriétés cytotoxiques

suggéré comme étant un sous-type de pDC

Les IkDC sont un sous-type de cellules NK, et ne sont pas apparentées aux DC!

human

mouse

Les DCs dérivées des monocytes in vitro sont distinctes des DCs résidentes

Exemple 4: Absence de cellules dendritiques plasmacytoïdes (pDC) chez les mutants IkL/L

B220

120G8

Spleen LN Blood

0.21 0.08 0.04

0.01 0.01 0.0

WT

IkL/L

B220

120G8

Spleen LN Blood

0.21 0.08 0.04

0.01 0.01 0.0

WT

IkL/L

Les pDC sont-elles bloquées dans leur différenciation dans la moelle osseuse ?

120G8

B22

0

WT

B22

0

120G8

IkL/L

Gated on CD11c+ cells41.4

120G8

B22

0

WT

B22

0

120G8

IkL/L

Gated on CD11c+ cells

120G8

B22

0

WT

B22

0

120G8

IkL/L

Gated on CD11c+ cells41.4

Présence d’une population exprimant un marqueur des pDC, 120G8, mais pas B220

Analyse du transcriptome (Affymetrix: 45000 gènes)

Comparaison à divers types cellulaires hématopoïétiques

La population 120G8+ mutante appartient-elle au lignage des pDC ?

Les pDC IkL/L possèdent la signature pDC

Dérégulation (surexpression) d’un grand nombre de gènes

Sous-signature commune avec les DC conventionnelles

Surexpression de la plupart des gènes dérégulés

Applications des microarrays

3. Data mining

Recherche d’informations « cachées » dans les données de transcriptome

Confrontation des données:

- à d’autres sets de données transcriptomiques

- aux données de séquence et d’organisation des génomes

- aux données de fonctions des gènes

J. Exp. Med. 197, 711-723 (2003)

Exemple 4: signatures transcriptomiques dans le lupus (maladie auto-immune)

Signatures « interféron » et « granulopoièse » chez les patients atteints de lupus

Rôle de l’interféron dans la pathologie du lupus

Différenciation anormale des granulocytes dans le sang des patients lupiques

Analyse transcriptomique hypothèses

-Etude des réponses immunitaires de l’hôte après infection par des souches d’influenza de pathogénicité différente chez la souris

-Analyse du transcriptome des cellules du poumon après 1, 3 et 5 jours d’infection.

Exemple 5 (Nature 2006)

Souche de la pandémie 1918: réaction beaucoup plus importante de l’hôte, conduisant à la destruction de tissu

Conclusion

Transcriptome: outil puissant pour: 1. Obtenir une vision d’ensemble d’un système biologique (classification des échantillons)

2. Effectuer une analyse sans à priori (identification de voies moléculaires et gènes potentiellement importants)

hypothèses