Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base...
-
Upload
yvon-berger -
Category
Documents
-
view
104 -
download
0
Transcript of Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base...
Méthodes et usages de l’analyse de la modularité
des protéines
1. Le programme MKDOM
2. La base ProDom de familles de domaines protéiques
3. Méthodologie de prédiction du métabolisme (PRIAM)
o0359_Synsp
BAT_HALHA
Orf1_Tn1721
TlpA_Ecoli
NIFL_AZOVI
NIFL_KLEPN
NifL_KPASy
NifL_Entag
Elk_Drome
CIKE_DROME
Erg_Human
Eag_mouse
Eag_rat
Plkin_pea
Plkin_ice
Plkin_spinach
PASPAS
PAS
PASPASPASPAS
PAS
PASPAS
PASPASPAS
PASPAS
PAS
sensor kinase
voltage gated K+ channel
S/T kinase
Modularité des protéines à domaine PAS
1. Le programme MKDOM
Durée d’exécution de MKDOMsur l’ensemble des séquences
Version Date n j n2/j x 1e10
2001.2 Mai 2001 339763 31 2.69
2001.3 Sept 2001 373869 46 3.29
2002.1 Mai 2002 481952 64 2.76
Améliorer l’algorithme
• Algorithme quadratique/nb de séquences
• n double tous les 18 mois
• Pcalcul double tous les 18 moisLe temps de calcul double tous les 18 mois
Parallélisation ?
• Paralléliser la boucle principale ?– N requêtes simultanées– Vérification a posteriori de leur compatibilité
• Procéder en deux phases ? – PSI-BLAST tout contre tout– Puis mimer MKDOM
• Changer d’algorithme ?
Le programme ADDA
Heger & Holm, 2003J. Mol. Biol. 328, 749-767
Exemple d’utilisation de MKDOM:
Analyse de la famille des cyclases de Rhizobium
Engendrer une matrice de score position-spécifique (PSSM) pour le domaine catalytique
Recherche exhaustive dans les génomes de S. meliloti et M. loti
Analyse en domaines utilisant MKDOM Visualisation par XDOM Classification des cyclases
CyaF : SM:7 ML:4, Cterm-domain = TPR
SM:4 ML:2
CyaG : SM:3 ML:1
CyaD : SM:3 ML:0
CyaH : SM:1 ML:2
CyaE : SM:2 ML:0, Nterm-domain = TM
CyaB, Nterm domain = SignalP and TM
CyaC, Nterm domain = TM
CyaJ, Cterm domain = TM
CyaA
LuxR
GerE
FixJ
OmpR
SpoOA
NtrC
NifA
2. La base ProDom de familles de domaines protéiques
www.toulouse.inra.fr/prodom.html
Intégration des données protéiques
Base dedomaines protéiques
Séquences Structures de domaines
Données biochimiques
(n,n) (1,n)
(1,n)
Structures de protéines
(1,n)(1,n)
Collaboration européenneProjet InterProcoordonné par l’EBI
Domain motif
Links to other representations of the family
Links to other databases
3. Prédiction du métabolisme
Le projet PRIAM
Profils pour l’Identification Automatique du Métabolisme
Clotilde RENARD-CLAUDEL
Collaboration Claude CHEVALET
a) Construction d’un ensemble de matrices de profil représentatif à partir de la base ENZYME
b) Prédiction des voies métaboliques
Détection de segments homologues dans chaque collection
Sélection d’un ensemble minimum recouvrant
Construction de matrices de profil
Construction des matrices de profilreprésentatives
1502 collections enzymatiques (base ENZYME)
Utilisation de MKDOM
Collections contenant des multi-enzymes
AKH également aspartokinase
Ex: Homosérine déshydrogénase
Collections hétérogènes
- Enzymes non homologuesEx: Glucose déshydrogénase
- Enzymes oligomériquesEx: NO réductase
NORB_PSEAE
NORC_PSEAE
DHGA_ACICA et DHGB_ACICA
Génération automatique de règles
Cribler l’ensemble des gènes d’un organisme avec les profils de PRIAM
On obtient pour chaque protéine les meilleurs profils non complètement chevauchants
Application des règles spécifiques à chaque EC Visualisation des résultats sur les cartes de KEGG
Prédiction de voies métaboliques
http://genopole.toulouse.inra.fr/bioinfo/priam/
Visualisation des voies métaboliques
L’équipe ProDom
Jérome GOUZYEmmanuel COURCELLEFlorence SERVANT Yoann BEAUSSECatherine BRUSébastien CARREREDaniel KAHNFlorence CORPET
Collaborations
INRA ToulouseClotilde CLAUDEL-RENARDClaude CHEVALET
IBCP, Lyon Gilbert DELEAGE
Christophe GEOURJONEBI, Hinxton
Rolf APWEILERIRISA, Rennes
Dominique LAVENIERSoutien financier
- Programme Bio-Informatique Inter-Organismes- Génopole- Union Européenne (InterPro)