Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base...

23
Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie de prédiction du métabolisme (PRIAM)

Transcript of Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base...

Page 1: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Méthodes et usages de l’analyse de la modularité

des protéines

1. Le programme MKDOM

2. La base ProDom de familles de domaines protéiques 

3. Méthodologie de prédiction du métabolisme (PRIAM)

Page 2: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

o0359_Synsp

BAT_HALHA

Orf1_Tn1721

TlpA_Ecoli

NIFL_AZOVI

NIFL_KLEPN

NifL_KPASy

NifL_Entag

Elk_Drome

CIKE_DROME

Erg_Human

Eag_mouse

Eag_rat

Plkin_pea

Plkin_ice

Plkin_spinach

PASPAS

PAS

PASPASPASPAS

PAS

PASPAS

PASPASPAS

PASPAS

PAS

sensor kinase

voltage gated K+ channel

S/T kinase

Modularité des protéines à domaine PAS

Page 3: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

1. Le programme MKDOM

Page 4: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Durée d’exécution de MKDOMsur l’ensemble des séquences

Version Date n j n2/j x 1e10

2001.2 Mai 2001 339763 31 2.69

2001.3 Sept 2001 373869 46 3.29

2002.1 Mai 2002 481952 64 2.76

Page 5: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Améliorer l’algorithme

• Algorithme quadratique/nb de séquences

• n double tous les 18 mois

• Pcalcul double tous les 18 moisLe temps de calcul double tous les 18 mois

Page 6: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Parallélisation ?

• Paralléliser la boucle principale ?– N requêtes simultanées– Vérification a posteriori de leur compatibilité

• Procéder en deux phases ? – PSI-BLAST tout contre tout– Puis mimer MKDOM

• Changer d’algorithme ?

Page 7: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Le programme ADDA

Heger & Holm, 2003J. Mol. Biol. 328, 749-767

Page 8: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Exemple d’utilisation de MKDOM:

Analyse de la famille des cyclases de Rhizobium

Engendrer une matrice de score position-spécifique (PSSM) pour le domaine catalytique

Recherche exhaustive dans les génomes de S. meliloti et M. loti

Analyse en domaines utilisant MKDOM Visualisation par XDOM Classification des cyclases

Page 9: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

CyaF : SM:7 ML:4, Cterm-domain = TPR

SM:4 ML:2

CyaG : SM:3 ML:1

CyaD : SM:3 ML:0

CyaH : SM:1 ML:2

CyaE : SM:2 ML:0, Nterm-domain = TM

CyaB, Nterm domain = SignalP and TM

CyaC, Nterm domain = TM

CyaJ, Cterm domain = TM

CyaA

Page 10: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

LuxR

GerE

FixJ

OmpR

SpoOA

NtrC

NifA

2. La base ProDom de familles de domaines protéiques

www.toulouse.inra.fr/prodom.html

Page 11: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Intégration des données protéiques

Base dedomaines protéiques

Séquences Structures de domaines

Données biochimiques

(n,n) (1,n)

(1,n)

Structures de protéines

(1,n)(1,n)

Collaboration européenneProjet InterProcoordonné par l’EBI

Page 12: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Domain motif

Links to other representations of the family

Links to other databases

Page 13: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.
Page 14: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.
Page 15: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.
Page 16: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

3. Prédiction du métabolisme

Le projet PRIAM

Profils pour l’Identification Automatique du Métabolisme

Clotilde RENARD-CLAUDEL

Collaboration Claude CHEVALET

a) Construction d’un ensemble de matrices de profil représentatif à partir de la base ENZYME

b) Prédiction des voies métaboliques

Page 17: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Détection de segments homologues dans chaque collection

Sélection d’un ensemble minimum recouvrant

Construction de matrices de profil

Construction des matrices de profilreprésentatives

1502 collections enzymatiques (base ENZYME)

Page 18: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Utilisation de MKDOM

Page 19: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Collections contenant des multi-enzymes

AKH également aspartokinase

Ex: Homosérine déshydrogénase

Page 20: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Collections hétérogènes

- Enzymes non homologuesEx: Glucose déshydrogénase

- Enzymes oligomériquesEx: NO réductase

NORB_PSEAE

NORC_PSEAE

DHGA_ACICA et DHGB_ACICA

Génération automatique de règles

Page 21: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Cribler l’ensemble des gènes d’un organisme avec les profils de PRIAM

On obtient pour chaque protéine les meilleurs profils non complètement chevauchants

Application des règles spécifiques à chaque EC Visualisation des résultats sur les cartes de KEGG

Prédiction de voies métaboliques

http://genopole.toulouse.inra.fr/bioinfo/priam/

Page 22: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

Visualisation des voies métaboliques

Page 23: Méthodes et usages de l’analyse de la modularité des protéines 1. Le programme MKDOM 2. La base ProDom de familles de domaines protéiques 3. Méthodologie.

L’équipe ProDom

Jérome GOUZYEmmanuel COURCELLEFlorence SERVANT Yoann BEAUSSECatherine BRUSébastien CARREREDaniel KAHNFlorence CORPET

Collaborations

INRA ToulouseClotilde CLAUDEL-RENARDClaude CHEVALET

IBCP, Lyon Gilbert DELEAGE

Christophe GEOURJONEBI, Hinxton

Rolf APWEILERIRISA, Rennes

Dominique LAVENIERSoutien financier

- Programme Bio-Informatique Inter-Organismes- Génopole- Union Européenne (InterPro)