Post on 03-Apr-2015
Transcriptome et immunologie
Philippe Kastner
Transcriptome
Ensemble des ARN messagers exprimées par un système biologique donné
Le transcriptome est une mesure de l’état biologique du système
Méthode d’analyse: puces à ADN (microarray)
ADN accroché à un support= ADN CIBLE
Gène 1 Gène 2Gène 2
****
*
Gène 1Hybridation avec les ARN des
cellules à étudier= SONDE
FLUORESCENTE
Dans les cellules étudiées :ARN 1 (produit par le Gène 1) présentARN 2 (produit par le Gène 2) absent
Méthode d’analyse de l’expression des gènes basée sur le principe de l’hybridation moléculaire
Hybridation entre 2 molécules d’ADN complémentaires
Double hélice
ADN dénaturé
Le principe des puces à ADN : l’hybridation moléculaire
Qu’est-ce qu’un microarray ou une puce à ADN (DNA
chip) ?• C’est un matériau (généralement du verre, du plastique, autre) sur
lequel on a fixé un très grand nombre d’acides nucléiques différents de manière covalente = ADN CIBLE
• Les différents acides nucléiques (= ADN CIBLE ) sont bien ordonnés sur le support (on sait précisément où se trouve chaque gène)
> « microarray » = microréseau
• L’ARN ou l’ADN extrait des cellules ou tissus à analyser est rendu fluorescent ( = SONDE FLUORESCENTE ) et est hybridé sur cette cible
• Les hybrides formés par complémentarité des bases (ADN CIBLE / SONDE FLUORESCENTE) sont repérés par mesure de la fluorescence
• Plus la fluorescence est intense, plus un ARN est abondant
ANALYSES QUANTITATIVES
Deux grand types de puces à ADN
Affymetrix Puces sur lame
Photolithographie
Affymetrix
Dépôt avec un robotou synthèse directeFait maison ou achetable
Mode de Fabrication
Qui les fabrique ?
Les puces à ADN Affymetrix
GeneChip® Probe Array
GeneChip® Probe Arrays
11µm
Each probe cell or feature containsmillions of copies of a specificoligonucleotide probe
Image of Hybridized Probe Array
Over 1 million different probes complementary to geneticinformation of interest
Single stranded, fluorescentlylabeled DNA target
Oligonucleotide probe
* **
**
1.28cm
GeneChip Probe Array Hybridized Probe Cell
chips/wafer
Probe Tiling StrategyGene Expression
(25-mer)
Affymetrix Experimental System
Fragmentheat, Mg2+
Washing & Staining
Scanning
Hybridization
Biotin-labeled cRNA transcript
Total RNA
In vitro transcription(Biotin-UTP, Biotin-CTP)
Biotin - labeled cRNA fragments
Cells,tissues
B B B BB B
B
B
B
B
B
B
AAAA5’ TTTT-T7
Reverse Transcription(oligodT linked to the sequence of the promoter of the RNA polymerase T7)
AAAA-T7TTTT-T7
Synthesis of the second strand of cDNA
Streptavidin-Phycoerythrin
1 puce
1 image
Mesures obtenues par puces affy
Average difference Σ (PM-MM) / N
Absolute call (Present/Absent)Défini par le nombre de paires PM/MM ou PM>MM
Autres méthodes de calcul des valeurs d’expression possibles
Les puces sur lame
2 types de puces
-Dépôt de micro-gouttes avec un robot- densité jusqu’à 30 000 sptots par lame- artisanale (variabilité)
- Synthèse directe- densité jusqu’à 106 spots par lame- Puces commerciales (Agilent, Nimblegen, Applied)
Puce artisanale spottée Puce commerciale Agilent
5 ’
Reverse Transcription : oligodT + dUTP-Cy3
TTTTTTTTAAAAAAAA
RNA degradation
AAAAAAAA mRNA
TTTTTTTT ss cDNA
Cells A
Reverse Transcription : oligodT + dUTP-Cy5
RNA degradation
AAAAAAAA mRNA
TTTTTTTT ss cDNA
TTTTTTTTAAAAAAAA
Cells B
Direct labeling
Hybridization
Scanning
microarray
Cy3+Cy5 probe
Scanarray 4000 (Perkin Elmer)
Cy3 and Cy5 images overlayed
Fluorescent labelling, Hybridization and Scanning
Comment concevoir une expérience de microarrays ?
But: déterminer les variations biologiques entre différents échantillons.
Mais il faut distinguer celles-ci des variations
liées à la technologie, ou à celles liées à la variabililé intrinsèque des échantillons
Thomas Hudson, Montreal Genome Center
Intensité croissante
6 échantillons: A1, A2, A3, B1, B2, B3
Microarray comprenant 20 000 gènes
échelle d’expression: 1- 10000
Mesures pour un gène X
A1 A2 A3 B1 B2 B3
25 30 35 55 50 66
Test t: p = 0,01
Pour combien de gènes une telle valeur peut-elle être obtenue par hasard ? (« false discovery rate », ou FDR)
Différences d’expression réelles ou artéfactuelle ?
Comparaison Nombre de gènes différentiels
(Changement > 2x, p <0,01)
(A1, A2, A3) vs (B1, B2, B3) 300
(A1, B2, A3) vs (B1, A2, B3) 150
(A1, B2, B3) vs (B1, A2, A3) 200
(A1, A2, B1) vs (B2, B3, A3) 100
Estimation du nombre de gènes différentiels « réels »
La moitié des gènes différentiels est artéfactuelle !
Solutions: multiplier les réplicats
augmenter la stringence des critères de sélection.
Number of replicates Type of sample
Cell lines
Mouse cells
Mouse organs
Human cells
Human tumors
Interested by Big changes
2 2-3 3-4 5-6 >30
Small changes
4-5 5-6 10 10-15 >60
variabilité
Combien de réplicats sont-ils nécessaires pour une expérience réussie ?
Deux grands types de méthodes de « clustering »
A. Méthodes hiérarchique: génération d’un dendogramme (arbre) qui relie tous les gènes ou échantillons entre eux.
B. Méthodes par partitionnement, qui divise les gènes en K classes ayant des profils similaires (K défini par l’utilisateur)
- K-means
- Self-organizing maps (SOM)
- analyse par composantes principales (PCA)
Regroupement en fonction de profils d’expression
similaires
1. Gènes
Évolution temporelle de l’expression des gènes dans des fibroblastes humains stimulés par du sérum (Pat Brown, 1997)
Visualisation d’une chorégraphie de l’expression génique dans le temps.
700 gènes
Different cell lines to be compared
Genes belonging to one cluster
Fold Changes
1-2-4-6 +6+4+2
Regroupement en fonction de profils d’expression similaires
2. échantillons
– N expériences
– chaque gène est considéré comme un vecteur dans un espace de dimension N (coordonnées = valeurs d’expression dans chaque expérience)
– Partitionnement des gènes en K classes optimisées selon des critères de proximité des gènes dans l’espace vectoriel
Méthodes par partitionnement
(K-means, Fuzzy C-means, Self organizing maps)
Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes)
Ikaros
TelJak2 Tal-Lmo1
bcat
Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes)
B-catenin ICN1 Ikaros TelJak2 Tal-Lmo1
Visualisation des clusters FCM (4208 genes)
Applications des microarrays
1. Expression différentielle
Question: pourquoi B est-il différent de A ?
(KO vs WT; effet d’un traitement; sain vs malade, etc …)
Comparaison de A et B 200 gènes différentiels !!
Et ensuite ??? ….
Exemple d'application 1:
Fonction du facteur de transcription AIRE dans les cellules épithéliales du thymus
(Science 298, 1395-1401, 2002)
Problème: comment les lymphocytes T potentiellement autoréactifs contre des antigènes tissu-spécifiques sont-ils éliminés dans le thymus ? (tolérance centrale)
Cellules épithéliales médullaires: expression "ectopique" de nombreux transcrits tissu-spécifique. Rôle dans la délétion clonale des lymphocytes T autoréactifs ?
Aire: facteur de transcription muté dans le syndrome autoimmun poly-endocrine de type I. Autoimmunité contre de nombreux tissus
1. Fabrication d'un modèle de souris déficient pour Aire
autoanticorps contre de nombreux tissus périphériques (rétine, glande salivaire, thyroide, etc..)
2. L'expression de Aire est restreinte au cellules épithéliales du thymus
3. Comparaison du transcriptome des cellules épithéliales thymiques de souris normales et mutantes
Comparaison du transcriptome des cellules épithéliales thymiques contrôle et déficientes pour AIRE
diminution de l'expression de la plupart des gènes différentiels comparaison globale
La plupart des gènes différentiels sont des gènes spécifiques d'un tissu
Exemple 2: Lymphomes thymiques chez des souris mutantes pour le gène Ikaros
Recherche de la voie moléculaire impliquée dans le développement de ces tumeurs par une analyse du transcriptome.
6 IkL/L tumors
4 Tel-Jak2 tumors
5 non tumoral thymocytes
Genes specifically deregulated in IkL/L tumors ?
Conception expérimentale
Hes1
Notch1Deltex 1
pT
Notch upregulation is associated with tumors lacking Ikaros
IkL/L tumors
IkL/L tumor
TelJak2 tumors
Notch pathway signature
Applications des microarrays
2. Transcriptome comme mesure phénotypique d’un système biologique
Concept: Profil apparenté de l’expression des gènes implique une similitude d’état biologique
Application principale: classification des tumeurs
Signature transcriptomique
Ensemble de gènes caractéristiques d’un état biologique donné- Type cellulaire (ex: signature des pDCs)- stimulation d’une voie moléculaire
Exemple 3: analyse de la signature de cellules dendritiques plasmacytoïdes
Liu et al, Nature Immunol, 2004
TLR7
(RNA)
TLR9
(DNA)
Virus
sensors pDCIFN
Plasma cell differentiation
Th1 polarisation
NK cell cytotoxicity
CD8+ T cell cytotoxicity
Other roles:
- Tolerogenic function (induce T-reg activity)
- secretion of other signaling molecules (IL12, chemokines)
Plasmacytoid DCs: innate viral sensors stimulating adative immune responses
Differentiation into APC
Comment les pDCs se développent-elles ?
Des lignages de pDC séparés myéloïdes et lymphoîdes ?
- Des pDCs peuvent être produites à parftir de précurseurs « myéloïdes » ou « lymphoïdes »
- Les pDcs expriment certains gènes lymphoïdes (pTa, lambda5, Rag, SpiB)
Les pDCs sont-elles apparentées aux DC conventionnelles ?
Non: identification d’un progéniteur commun monocytes/cDC qui ne possède pas de potentiel pDC
Oui: Les souris dénuées du régulateur IRF8 sont dépourvues de pDCs et de cDCs
Quels signaux/facteurs sont requis pour la différenciation des pDC ?
Une vue génomique des cellules dendritiques
1. Assemblage de profils d’expression génique pour la plupart des types cellulaires immunitaires (macrophages, neutrophiles, lymphocytes B, T, NK, pDCs, cDCs)
2. Pour l’homme et la souris
3. Clustering pour visualiser les distances entre lignage
4. Identification de programmes d’expression géniques conservés
Robbins et al, 2008
Hierarchical clustering Principal component analysis (PCA)
(Projection on first 2 dimensions)
1. SOURIS
Similitude des profils transcriptomiques des DC
2. HOMME
Publicly available datasets on Affymetrix U133 v2
Similitude des profils transcriptomiques des DC
Pan-DC genes
pDC specific genes (500 genes)
Conventional DC genes
Signature des DC de souris
(Fuzzy C-means clustering)
Signatures des DC humaines
pDC genes
Pan DC genes
Conventional DC genes
B cells T cells pDCs cDCs
Ebf1 Camk4 Epha2 Arhgap22
Cd19 4430004N04Rik Pacsin1 Btbd4
Klhl14 Trat1 Zfp521 Slamf8
Bank1 CxCr6 Sh3bgr 9130211l03Rik
Pax5 Tnfrsf25 Tex2 Nav1
Blr1 Ccdc64 Runx2 Ct2a
Ralgps2 Plcg1 Atp13a2 Avpi1
CD79b Lat Maged1 Spint1
Gènes les plus fortement associés à des types de cellules spécifiques
Rouge: connu pour être spécifique de ces lignages
Conclusion des études transcriptomiques
Proximité des programmes géniques des pDC et cDC
Programme conservés entre l’homme et la souris
Les gènes spécifiques des DCs sont largement inconnus
Nature Immunology, October 7th, 2007
Homologies entre les sous-types de cellules dendritiques chez l’homme et la souris
Autres applications du compendium
Classification de nouvelles populations cellulaires
Les cellules IkDC sont-elles des cellules dendritiques ?
Interferon-producing killer dendritic cells (IkDC):
- Capables de produire de l’IFNa/b
- expriment certains marqueurs des DCs
- propriétés cytotoxiques
suggéré comme étant un sous-type de pDC
Les IkDC sont un sous-type de cellules NK, et ne sont pas apparentées aux DC!
human
mouse
Les DCs dérivées des monocytes in vitro sont distinctes des DCs résidentes
Exemple 4: Absence de cellules dendritiques plasmacytoïdes (pDC) chez les mutants IkL/L
B220
120G8
Spleen LN Blood
0.21 0.08 0.04
0.01 0.01 0.0
WT
IkL/L
B220
120G8
Spleen LN Blood
0.21 0.08 0.04
0.01 0.01 0.0
WT
IkL/L
Les pDC sont-elles bloquées dans leur différenciation dans la moelle osseuse ?
120G8
B22
0
WT
B22
0
120G8
IkL/L
Gated on CD11c+ cells41.4
120G8
B22
0
WT
B22
0
120G8
IkL/L
Gated on CD11c+ cells
120G8
B22
0
WT
B22
0
120G8
IkL/L
Gated on CD11c+ cells41.4
Présence d’une population exprimant un marqueur des pDC, 120G8, mais pas B220
Analyse du transcriptome (Affymetrix: 45000 gènes)
Comparaison à divers types cellulaires hématopoïétiques
La population 120G8+ mutante appartient-elle au lignage des pDC ?
Les pDC IkL/L possèdent la signature pDC
Dérégulation (surexpression) d’un grand nombre de gènes
Sous-signature commune avec les DC conventionnelles
Surexpression de la plupart des gènes dérégulés
Applications des microarrays
3. Data mining
Recherche d’informations « cachées » dans les données de transcriptome
Confrontation des données:
- à d’autres sets de données transcriptomiques
- aux données de séquence et d’organisation des génomes
- aux données de fonctions des gènes
J. Exp. Med. 197, 711-723 (2003)
Exemple 4: signatures transcriptomiques dans le lupus (maladie auto-immune)
Signatures « interféron » et « granulopoièse » chez les patients atteints de lupus
Rôle de l’interféron dans la pathologie du lupus
Différenciation anormale des granulocytes dans le sang des patients lupiques
Analyse transcriptomique hypothèses
-Etude des réponses immunitaires de l’hôte après infection par des souches d’influenza de pathogénicité différente chez la souris
-Analyse du transcriptome des cellules du poumon après 1, 3 et 5 jours d’infection.
Exemple 5 (Nature 2006)
Souche de la pandémie 1918: réaction beaucoup plus importante de l’hôte, conduisant à la destruction de tissu
Conclusion
Transcriptome: outil puissant pour: 1. Obtenir une vision d’ensemble d’un système biologique (classification des échantillons)
2. Effectuer une analyse sans à priori (identification de voies moléculaires et gènes potentiellement importants)
hypothèses