Post on 07-Jan-2016
description
Journées AReNA, Strasbourg,18-20 Avril 2005
Problèmes liés à l’identification de gènes Problèmes liés à l’identification de gènes bactériens exprimant des ARN non traduitsbactériens exprimant des ARN non traduits
en protéines en protéines
UPRES JE 2311, Inserm Espri Biochimie
pharmaceutique
bacteria
Que sont les petits ARN bactériens régulateurs?
Adaptation to sudden changes
Bacterial physiology
TDNADNA
ProteinProteinss
RNARNAss
Virulence
Regulatory RNAsRegulatory RNAs
STOP
Comment ces ARN bactériens régulent-ils ?
Stratégie
Analyse globale de l’expression d’ARN bactériens
Sélection
Fonction
Structure
Ligands
Modèles
Gram negative: Escherichia coliGram negative: Escherichia coliLaboratory and pathogenic strainsLaboratory and pathogenic strains
Gram positive: Staphylococcus aureusGram positive: Staphylococcus aureusPathogenic strainsPathogenic strains
La conservation de séquences entre RIG issues de séquences de génomes bactériens
apparentés suppose l’existence d’un gène.
La majorité des gènes exprimant des ARNrég bactériens sont situés dans les RIG.
Hypothèses
Extraction des régions inter-géniques
ATGATG StopStop ATGATG StopStop
ORF 1 ORF 2Pr Tr Pr Tr
R.I.G.R.I.G.
R.I.G. vraiR.I.G. vraiGène 1 Gène 2
Extraction des RIG
Elimination des RIG < 120 ntsElimination de 40 nts en 5’ & 3’ des RIG
( Banque de RIG )
K12 : 3517 RIG
K12 : 1558 RIG
Recherche de conservationsRecherche de conservations
Banque de génomes completsBanque de R.I.G.
FastaFasta
Sans Homologies R.E.P. Homologies limitées à E.
coliRIG conservées
Crible
K12 : 100 RIG K12 : 130 RIG K12 : 766 RIG K12 : 562 RIG
Alignements multiples
Sélection des Sélection des candidatscandidats
Terminateursrho-indépendents
G+C%
Recherche de structures d’ARN
RIG conservéesAnnotations du génome
(PBS, IS, RR)
Candidats
TTTTTTTTT
TTGACA -35
TATAAT -1014 à 20 nt
Promoteurs
Bioinformatics, 2003, 19:1707-1709
Exemple d’identification d’un ARN bactérien chez E. coli
ISI accessible à: http://www.biochpharma.univ-rennes1.fr/
Application au génome d’ E. coli
Génome Génome E. coliE. coli K12 K12
Séquence RIG (3517 RIG)
RIG > 120 nts (1558 RIG)
Extraction des RIG
Suppression des RIG <120 nts
Recherche de conservations parmi 60 génomes bactériens séquencés
RIG conservées (692 RIG)
200 RIG200 RIG
Séquence ORF
RIG <120 nts (1959 RIG)
RIG non conservées (866 RIG)
RIG avec REP (130 RIG)
Recherche de signatures de gèneRecherche d’îlots riches en G+C
Élimination des RIG avec REP
2. Selection 2. Selection 1. Analyse globale
3. Function3. Function4. Structure4. Structure5. Ligands5. Ligands
Microarrays
Pb pour détecter les unités de transcription.
Une conservation de séquence est-elle due à l’existence d’un cadre ouvert de
lecture ou d’un gène exprimant un ARNnc?
Il semble exister des microARN bactériens (NAR 2005, 33:1040-50). Plus une unité de
transcription est courte, plus la prédiction est délicate.
Intégration, dans les outils de prédiction,
des appariements non W-C.
Répertorier les mécanismes antisens régulant l’expression d’ARNm afin d’établir les redondances, servant
d’outils prédictifs