Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et...

71
Bioinformatique Bioinformatique ABI-1001 ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions

Transcript of Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et...

Page 1: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

BioinformatiqueBioinformatiqueABI-1001ABI-1001

BioinformatiqueBioinformatiqueABI-1001ABI-1001

2ème Partie:

La Biologie StructuraleCours #2

Domaines, classification et prédictions

2ème Partie:

La Biologie StructuraleCours #2

Domaines, classification et prédictions

Page 2: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Domaines: définitionDomaines: définitionDomaines: définitionDomaines: définition

• Les domaines peuvent être définis de différentes façons:

• Les domaines peuvent être définis de différentes façons:

Séquence: hérédité de (sous)séquences.Séquence: hérédité de (sous)séquences.

Fonction: modules fonctionnels protéiques.Fonction: modules fonctionnels protéiques.

Structure: unité de repliement ou contacts atomiques.Structure: unité de repliement ou contacts atomiques.

• Fragment de structure capable de se replier ou d’adopter une conformation indépendamment du reste de la structure.

• Fragment de structure capable de se replier ou d’adopter une conformation indépendamment du reste de la structure.

Page 3: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Domaines: définitionDomaines: définitionDomaines: définitionDomaines: définition

• Domaine:Biologie structurale Région d’une prot. qui possède son propre cœur

hydrophobe et qui est structurellement indépendant du reste de la prot. généralement colinéaire en séquence.

Biochimie/Génétique Fragments minimale d’un gène capable d’effectuer une

fonction donnée.

• Module: domaines similaires se retrouvant dans plusieurs prot. (ex. Immunoglobine, SH2)

• Domaine:Biologie structurale Région d’une prot. qui possède son propre cœur

hydrophobe et qui est structurellement indépendant du reste de la prot. généralement colinéaire en séquence.

Biochimie/Génétique Fragments minimale d’un gène capable d’effectuer une

fonction donnée.

• Module: domaines similaires se retrouvant dans plusieurs prot. (ex. Immunoglobine, SH2)

Page 4: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Domaines: évolution…Domaines: évolution…Domaines: évolution…Domaines: évolution…NNNN

NNNN

NNNN

NNNN

NNNN

NNNNNNNN NNNN

NNNN

NNNN

Do

ma

ine

s a

nce

stra

ux

Do

ma

ine

s a

nce

stra

ux

re p

ré-b

iotiq

ue)

(ère

pré

-bio

tiqu

e)D

om

ain

es

an

cest

rau

xD

om

ain

es

an

cest

rau

x (

ère

pré

-bio

tiqu

e)(è

re p

ré-b

iotiq

ue)

Hétéro-dimèresHétéro-dimèresHétéro-dimèresHétéro-dimères Fusion de gènesFusion de gènesFusion de gènesFusion de gènes

Sélection: intermédiaires ancestrauxSélection: intermédiaires ancestrauxSélection: intermédiaires ancestrauxSélection: intermédiaires ancestraux Protéines multi-domainesProtéines multi-domainesProtéines multi-domainesProtéines multi-domaines

Page 5: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• Les domaines sont omniprésents dans les protéines: La plupart des grosses

protéines sont composées d’unités semi-indépendantes:

• Modularité.• Efficacité de repliement.• Ségrégation

fonctionnelle.

• Les domaines sont omniprésents dans les protéines: La plupart des grosses

protéines sont composées d’unités semi-indépendantes:

• Modularité.• Efficacité de repliement.• Ségrégation

fonctionnelle.

D-Amino Acid OxidaseD-Amino Acid OxidaseD-Amino Acid OxidaseD-Amino Acid Oxidase

FAD/NAD(P)-binding domainFAD/NAD(P)-binding domainFAD/NAD(P)-binding domainFAD/NAD(P)-binding domain

HYDROXYBENZOATE HYDROXYBENZOATE HYDROXYLASE: 1PHHHYDROXYLASE: 1PHH

Page 6: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• > 60% des protéines ne sont constituées que d’un seul domaine.

• Environ 70% des protéines multi-domaines n’ont pas plus de 2 domaines.

• Il existe une relation linéaire entre la taille des protéines (en acides aminés) et le nombre de domaine qu’elles possèdent.

• > 60% des protéines ne sont constituées que d’un seul domaine.

• Environ 70% des protéines multi-domaines n’ont pas plus de 2 domaines.

• Il existe une relation linéaire entre la taille des protéines (en acides aminés) et le nombre de domaine qu’elles possèdent.

N=787N=787N=787N=787

Jones S et al. (1998) Protein Science 7:233Jones S et al. (1998) Protein Science 7:233

Page 7: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• La grosseur moyenne des domaines se situe environ à ~ 100 résidus.

• Approximativement 70% des domaines sont continus en séquence.

• La grosseur moyenne des domaines se situe environ à ~ 100 résidus.

• Approximativement 70% des domaines sont continus en séquence.

N=787N=787N=787N=787

Jones S et al. (1998) Protein Science 7:233Jones S et al. (1998) Protein Science 7:233

Page 8: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• Quel est l’importance d’identifier ces domaines:

L’évolution s’effectue au niveau de la séquence mais sélectionne des fonctions.

L’identification des domaines dans une structure peut révéler des unités fonctionnelles qui ont évoluées indépendamment. L’alignement et la recherche de séquence en fonction des domaines est beaucoup plus spécifique.

Les domaines sont les unités fondamentales de l’analyse de la structure des protéines.

• Quel est l’importance d’identifier ces domaines:

L’évolution s’effectue au niveau de la séquence mais sélectionne des fonctions.

L’identification des domaines dans une structure peut révéler des unités fonctionnelles qui ont évoluées indépendamment. L’alignement et la recherche de séquence en fonction des domaines est beaucoup plus spécifique.

Les domaines sont les unités fondamentales de l’analyse de la structure des protéines.

Page 9: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• Concept: interactions atomiques à l’intérieur d’un domaine sont plus nombreuses qu’entre domaines. La quête: groupes de

résidus avec le max. de contact entre résidus mais avec un min. de contact avec d’autres groupes de résidus.

Problème: parfois ces groupes appartiennent à des segments non-contiguës discontinuité ⇒séquentielle du domaine.

• Concept: interactions atomiques à l’intérieur d’un domaine sont plus nombreuses qu’entre domaines. La quête: groupes de

résidus avec le max. de contact entre résidus mais avec un min. de contact avec d’autres groupes de résidus.

Problème: parfois ces groupes appartiennent à des segments non-contiguës discontinuité ⇒séquentielle du domaine.

D1D1D1D1 D2D2D2D2

D1D1D1D1 D2D2D2D2

NNNN

CCCC

NNNN

CCCC

D1D1D1D1 D2D2D2D2

NNNN

CCCC

D1D1D1D1 D2D2D2D2

Page 10: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• L’identification des domaines est en fait un problème d’optimisation.

• Plusieurs méthodes ou algorithmes:

STRUDL DomainParser PUU DETECTIVE DOMAK

• L’identification des domaines est en fait un problème d’optimisation.

• Plusieurs méthodes ou algorithmes:

STRUDL DomainParser PUU DETECTIVE DOMAK

Jones S et al. (1998) Protein Science 7:233Jones S et al. (1998) Protein Science 7:233

Page 11: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• Comment peut-on évaluer l’efficacité d’une méthode?

Teste la méthode avec un groupe de protéines dont les domaines sont connus (experts) avec et/ou d’autres méthodes.

• Comment peut-on évaluer l’efficacité d’une méthode?

Teste la méthode avec un groupe de protéines dont les domaines sont connus (experts) avec et/ou d’autres méthodes.

Jones S et al. (1998) Protein Science 7:233Jones S et al. (1998) Protein Science 7:233

Page 12: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• La méthode la plus efficace reste tout de même l’identification manuelle.

Mise à jour difficile vue le nombre croissant de structures.

• La méthode la plus efficace reste tout de même l’identification manuelle.

Mise à jour difficile vue le nombre croissant de structures.

Jones S et al. (1998) Protein Science 7:233Jones S et al. (1998) Protein Science 7:233

Page 13: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Identification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structurauxIdentification des domaines structuraux

• CATH CATH http://www.biochem.ucl.ac.uk/bsm/cath/

• SCOP SCOP

• http://scop.berkeley.edu/

• 3Dee 3Dee http://www.compbio.dundee.ac.uk/3Dee/

Page 14: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Classification?Classification?Classification?Classification?

• La structure d’une protéine peut nous renseigner sur ses fonctions et son passé évolutif.

Nécessite la connaissance de la structure et de sa relation avec les autres protéines.

• Requiert un savoir générale du repliement de la protéine et des informations détaillées sur la structure de beaucoup de protéines.

• D’un point de vue évolutif, la structure est beaucoup mieux conservé que la séquence.

• La structure d’une protéine peut nous renseigner sur ses fonctions et son passé évolutif.

Nécessite la connaissance de la structure et de sa relation avec les autres protéines.

• Requiert un savoir générale du repliement de la protéine et des informations détaillées sur la structure de beaucoup de protéines.

• D’un point de vue évolutif, la structure est beaucoup mieux conservé que la séquence.

Page 15: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

??? Le repliement évolutif ?????? Le repliement évolutif ?????? Le repliement évolutif ?????? Le repliement évolutif ???

• Protéines divergentes du point de vue séquence, retiennent l’architecture et la topologie de leur repliement ancestrale.

• Les prot. peuvent avoir plus d’un repliement énergétiquement stable. pression sélective = contraintes fonctionnelles.

• Les similarités structurales entre prot. sans parenté s’explique souvent par la convergence d’un repliement stable plutôt que par la divergence d’un ancêtre commun. évolution parallèle.

• Évolution nécessite la subsistance fonctionnel des prot. existantes sinon…R.I.P.

• Protéines divergentes du point de vue séquence, retiennent l’architecture et la topologie de leur repliement ancestrale.

• Les prot. peuvent avoir plus d’un repliement énergétiquement stable. pression sélective = contraintes fonctionnelles.

• Les similarités structurales entre prot. sans parenté s’explique souvent par la convergence d’un repliement stable plutôt que par la divergence d’un ancêtre commun. évolution parallèle.

• Évolution nécessite la subsistance fonctionnel des prot. existantes sinon…R.I.P.

Page 16: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

SStructural tructural CClassification lassification OOf f PProteinsroteinsSStructural tructural CClassification lassification OOf f PProteinsroteins

• Organisation hiérarchique des prot. selon leur structure et leur origine évolutive.

Procure un réductionnisme qui facilite les comparaisons structurales.

Inspection/comparaison automatique et visuel

• L’unité principale de catégorisation son les domaines; ceux-ci étant l’unité évolutive, fonctionnelle et structurale des prot.

• Organisation hiérarchique des prot. selon leur structure et leur origine évolutive.

Procure un réductionnisme qui facilite les comparaisons structurales.

Inspection/comparaison automatique et visuel

• L’unité principale de catégorisation son les domaines; ceux-ci étant l’unité évolutive, fonctionnelle et structurale des prot.

Page 17: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

SStructural tructural CClassification lassification OOf f PProteinsroteinsSStructural tructural CClassification lassification OOf f PProteinsroteins

• Niveaux hiérarchiques de SCOP:

Class: dérive du contenu en structure secondaire.

Fold: provient de la topologie, l’arrangement et l’orientation des éléments de structures secondaires. (968)

• Similarités structurales proviennent des propriétés physico-chimique ≠ évolution

Superfamilly: regroupent les prot. Avec peu d’identité de séquence mais dont la structure et la fonction sont relié. (~1300)

• Origine évolutive commune probable

Familly: Structure et fonction similaire ainsi que > 30% d’identité de séquence (~2300)

• Origine évolutive certaine

• Niveaux hiérarchiques de SCOP:

Class: dérive du contenu en structure secondaire.

Fold: provient de la topologie, l’arrangement et l’orientation des éléments de structures secondaires. (968)

• Similarités structurales proviennent des propriétés physico-chimique ≠ évolution

Superfamilly: regroupent les prot. Avec peu d’identité de séquence mais dont la structure et la fonction sont relié. (~1300)

• Origine évolutive commune probable

Familly: Structure et fonction similaire ainsi que > 30% d’identité de séquence (~2300)

• Origine évolutive certaine

Page 18: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

SStructural tructural CClassification lassification OOf f PProteinsroteinsSStructural tructural CClassification lassification OOf f PProteinsroteins

SCOP 1.65 ClassesSCOP 1.65 Classes

Août 2003 (Août 2003 (20619 PDB Entries/54745 Domains)20619 PDB Entries/54745 Domains)

All All All All Others Others ProteinsProteins All All // All All ++

179179 126126 308308 121121 234234

• Multi-domainMulti-domain• Membrane and Membrane and

cell surfacecell surface• Small proteinsSmall proteins

• Coiled coilCoiled coil• Low resolutionLow resolution

• PeptidesPeptides• Designed Designed

proteinsproteins

Page 19: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

SStructural tructural CClassification lassification OOf f PProteinsroteinsSStructural tructural CClassification lassification OOf f PProteinsroteins

Page 20: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

SStructural tructural CClassification lassification OOf f PProteinsroteinsSStructural tructural CClassification lassification OOf f PProteinsroteins

Ex. 1GTMEx. 1GTMEx. 1GTMEx. 1GTM

Page 21: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

SStructural tructural CClassification lassification OOf f PProteinsroteinsSStructural tructural CClassification lassification OOf f PProteinsroteins

2 domaines en tout2 domaines en tout2 domaines en tout2 domaines en tout

Relié à l’activité catalytiqueRelié à l’activité catalytiqueRelié à l’activité catalytiqueRelié à l’activité catalytique

RasmolRasmolRasmolRasmolChimeChimeChimeChime Liens externesLiens externesLiens externesLiens externes

3 chaînes dans le fichiers 3 chaînes dans le fichiers pdb dont le domaine inclus pdb dont le domaine inclus

les a.a. de 181 à 419les a.a. de 181 à 419

3 chaînes dans le fichiers 3 chaînes dans le fichiers pdb dont le domaine inclus pdb dont le domaine inclus

les a.a. de 181 à 419les a.a. de 181 à 419

Page 22: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

SStructural tructural CClassification lassification OOf f PProteinsroteinsSStructural tructural CClassification lassification OOf f PProteinsroteins

Swiss-PDBviewerSwiss-PDBviewerSwiss-PDBviewerSwiss-PDBviewer

Pour connaître le Pour connaître le second domainesecond domainePour connaître le Pour connaître le second domainesecond domaine

Page 23: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CClassification, lassification, AArchitecture, rchitecture, TTopologyopology andand

HHomologyomology

CClassification, lassification, AArchitecture, rchitecture, TTopologyopology andand

HHomologyomology

• Classification semi-automatique: Selon des protocoles et algorithmes (PUU, DETECTIVE et

DOMAK).

Valider manuellement en cas d’ambiguïté.

• Ne considère que les structures résolu à une résolution de 3 Å ou moins.

• Les prot. multi-domaines sont subdivisées selon leur domaines constitutifs de manières automatique.

• Classification semi-automatique: Selon des protocoles et algorithmes (PUU, DETECTIVE et

DOMAK).

Valider manuellement en cas d’ambiguïté.

• Ne considère que les structures résolu à une résolution de 3 Å ou moins.

• Les prot. multi-domaines sont subdivisées selon leur domaines constitutifs de manières automatique.

Page 24: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CClassification, lassification, AArchitecture, rchitecture, TTopologyopology andand

HHomologyomology

CClassification, lassification, AArchitecture, rchitecture, TTopologyopology andand

HHomologyomology

• Quatre niveaux majeurs de classification: Class: déterminer automatiquement par la composition

en structures secondaires. Architecture: déterminer manuellement selon

l’orientation des éléments de structures secondaires sans toutefois tenir compte de la connectivité.

Topology: classer automatiquement en famille de conformation (fold family) selon la forme globale et la connectivité des éléments structuraux.

Homology(superfamille): regroupe les domaines de prot. ayant un ancêtre commun (homologue).

• Sequence families: regroupe à l’intérieur de superfamilles les homologues selon leur identité de séquence

• Quatre niveaux majeurs de classification: Class: déterminer automatiquement par la composition

en structures secondaires. Architecture: déterminer manuellement selon

l’orientation des éléments de structures secondaires sans toutefois tenir compte de la connectivité.

Topology: classer automatiquement en famille de conformation (fold family) selon la forme globale et la connectivité des éléments structuraux.

Homology(superfamille): regroupe les domaines de prot. ayant un ancêtre commun (homologue).

• Sequence families: regroupe à l’intérieur de superfamilles les homologues selon leur identité de séquence

Page 25: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CClassification, lassification, AArchitecture, rchitecture, TTopologyopology andand

HHomologyomology

CClassification, lassification, AArchitecture, rchitecture, TTopologyopology andand

HHomologyomology

• 4 Classes: Mainly Mainly Mixed & Few secondary structures

• 37 Architectures

• 813 Topologies

• 1467 Homologues

• 4 Classes: Mainly Mainly Mixed & Few secondary structures

• 37 Architectures

• 813 Topologies

• 1467 Homologues

MainlyMainly MainlyMainly MainlyMainly MainlyMainly

Mixed & Mixed & Few secondary Few secondary structuresstructures

Few secondary Few secondary structuresstructures

Page 26: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CClassification, lassification, AArchitecture, rchitecture, TTopologyopology andand

HHomologyomology

CClassification, lassification, AArchitecture, rchitecture, TTopologyopology andand

HHomologyomology

• Le site de CATH contient d’autres ressources utiles: SSAP server: comparaison

structurale de 2 prot. et alignement structurale

GRATH server: recherche de topologie pour une structure donnée.

DHS: dictionnaire des homologues.

Gene3D: Base de données d’identification de gène structuraux pré-calculés à travers 120 génomes.

IMPALA: Comparaison de séq. avec une base de données PSI-BLAST.

• Le site de CATH contient d’autres ressources utiles: SSAP server: comparaison

structurale de 2 prot. et alignement structurale

GRATH server: recherche de topologie pour une structure donnée.

DHS: dictionnaire des homologues.

Gene3D: Base de données d’identification de gène structuraux pré-calculés à travers 120 génomes.

IMPALA: Comparaison de séq. avec une base de données PSI-BLAST.

http://www.biochem.ucl.ac.uk/bsm/cath/

Page 27: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CCAATTHH, exemple…1GTM, exemple…1GTMCCAATTHH, exemple…1GTM, exemple…1GTM

2 2 domaines/domaines/

chaîneschaînes

2 2 domaines/domaines/

chaîneschaînes

Page 28: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CCAATTHH, exemple…1GTM, exemple…1GTMCCAATTHH, exemple…1GTM, exemple…1GTM

Généralement Généralement relié à l’activitérelié à l’activitéGénéralement Généralement relié à l’activitérelié à l’activité

Page 29: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CCAATTHH, exemple…1GTM, exemple…1GTMCCAATTHH, exemple…1GTM, exemple…1GTM

Page 30: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CClassification, lassification, AArchitecturerchitecture, , TTopologyopology andand

HHomologyomology

CClassification, lassification, AArchitecturerchitecture, , TTopologyopology andand

HHomologyomology

• Il semblerait que les prot. peuvent adopter environ 1000/5000 conformations différentes. (on est loin de 20300

pour une protéine moyenne: nombre qui soit dit en passant est plus grand

que le nombre d’atome dans l’univers)

• À ce jour on connaît au moins un représentant de chacune de ces conformations.

• Environ une dizaine de topologies contiennent plus de la moitié de toutes les prot.

• Il semblerait que les prot. peuvent adopter environ 1000/5000 conformations différentes. (on est loin de 20300

pour une protéine moyenne: nombre qui soit dit en passant est plus grand

que le nombre d’atome dans l’univers)

• À ce jour on connaît au moins un représentant de chacune de ces conformations.

• Environ une dizaine de topologies contiennent plus de la moitié de toutes les prot.

Page 31: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Comparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structure

• Importance de la comparaison et l’alignement:

Classification: assignation de classe de repliement et éventuellement création de bibliothèques de configuration.

Fonction: identification de la fonction d’une prot. inconnu en comparant avec la structure de prot. connue.

Prédiction: évaluation de la qualité d’un modèle avec les structures connues.

Évolution: permet de révéler des relations évolutives non identifiable par l’alignement de séquence seulement.

• Importance de la comparaison et l’alignement:

Classification: assignation de classe de repliement et éventuellement création de bibliothèques de configuration.

Fonction: identification de la fonction d’une prot. inconnu en comparant avec la structure de prot. connue.

Prédiction: évaluation de la qualité d’un modèle avec les structures connues.

Évolution: permet de révéler des relations évolutives non identifiable par l’alignement de séquence seulement.

Page 32: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Comparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structure

• Alignement ≠ Superposition

L’alignement c’est l’identification de résidus qui possèdent un même arrangement spatiale (3D).

La superposition nécessite au préalable l’alignement de résidus pour pouvoir superposer le reste de la structure…un genre de nœud de transformation géométrique.

• Alignement ≠ Superposition

L’alignement c’est l’identification de résidus qui possèdent un même arrangement spatiale (3D).

La superposition nécessite au préalable l’alignement de résidus pour pouvoir superposer le reste de la structure…un genre de nœud de transformation géométrique.

Chaîne AChaîne AChaîne AChaîne A Chaîne BChaîne BChaîne BChaîne B

alignementalignementalignementalignementsuperpositionsuperpositionsuperpositionsuperposition

Page 33: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Comparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structure

• Comment mesure-t-on l’erreur de superposition?

RMSD: root mean square deviation.

• Comment mesure-t-on l’erreur de superposition?

RMSD: root mean square deviation.

Atome aAtome a

Coordonnée (xCoordonnée (xaa, ,

yyaa, z, zaa))

Atome aAtome a

Coordonnée (xCoordonnée (xaa, ,

yyaa, z, zaa))

Atome bAtome b

Coordonnée Coordonnée (x(xbb, y, ybb, z, zbb))

Atome bAtome b

Coordonnée Coordonnée (x(xbb, y, ybb, z, zbb))

RMSD = {(x – x )2+(y – y )2+(z – z )2 }RMSD = {(x – x )2+(y – y )2+(z – z )2 }ii

NNOù N= nombre d’atomes comparésOù N= nombre d’atomes comparésOù N= nombre d’atomes comparésOù N= nombre d’atomes comparés

aaii bbii aaii bbii aaii bbii

Page 34: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Comparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structure

• 0.0-0.5 Å Identique.⇒• <1.5 Å Très similaire.⇒• < 5.0 Å Modérément bon.⇒• 5.0-7.0 Å Relié structurellement.⇒• > 7.0 Å Relation incertaine.⇒• > 12.0 Å Aucunement relié.⇒

• 0.0-0.5 Å Identique.⇒• <1.5 Å Très similaire.⇒• < 5.0 Å Modérément bon.⇒• 5.0-7.0 Å Relié structurellement.⇒• > 7.0 Å Relation incertaine.⇒• > 12.0 Å Aucunement relié.⇒

Page 35: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Comparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structureComparaison et Alignement de structure

NomNom DescriptionDescription URL et ressources WEBURL et ressources WEB

CECE CCombinatorial ombinatorial EExtension of the xtension of the Optimum PathOptimum Path

http://cl.sdsc.edu/ce.htmlhttp://cl.sdsc.edu/ce.html

DALIDALI DDistance Matrix istance Matrix AliAlignementgnement http://www.ebi.ac.uk/dali/http://www.ebi.ac.uk/dali/

HOMSTRADHOMSTRAD HomHomologous ologous StrStructure ucture AAlignement lignement DDatabaseatabase

http://www-cryst.bioc.cam.ac.uk/http://www-cryst.bioc.cam.ac.uk/~homstrad/~homstrad/

SARF2SARF2 SSpatial patial ArArrangement of rangement of Backbone Backbone FFragmentsragments

http://123d.ncifcrf.gov/sarf2.htmlhttp://123d.ncifcrf.gov/sarf2.html

SSAPSSAP SSequential equential SStructure tructure AAlignement lignement PProgramrogram

http://www.biochem.ucl.ac.uk/cgi-http://www.biochem.ucl.ac.uk/cgi-bin/cath/GetSsapRasmol.plbin/cath/GetSsapRasmol.pl

VASTVAST VVector ector AAlignement lignement SSearch earch TToolool http://www.ncbi.nlm.nih.gov/http://www.ncbi.nlm.nih.gov/Structure/VAST/vast.shtmlStructure/VAST/vast.shtml

Page 36: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

Page 37: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

Votre requête: utilisez le code pdb et précisez la chaîne avec << : >> (ex. 1A3G:A…fichier Votre requête: utilisez le code pdb et précisez la chaîne avec << : >> (ex. 1A3G:A…fichier 1A3G chaîne A. Si il n’y pas de chaînes à spécifier, la notation est 1A3G:_ )1A3G chaîne A. Si il n’y pas de chaînes à spécifier, la notation est 1A3G:_ )Votre requête: utilisez le code pdb et précisez la chaîne avec << : >> (ex. 1A3G:A…fichier Votre requête: utilisez le code pdb et précisez la chaîne avec << : >> (ex. 1A3G:A…fichier 1A3G chaîne A. Si il n’y pas de chaînes à spécifier, la notation est 1A3G:_ )1A3G chaîne A. Si il n’y pas de chaînes à spécifier, la notation est 1A3G:_ )

Importance statistique Importance statistique p/r à un alignement p/r à un alignement avec une structure avec une structure aléatoire. aléatoire. (conformation (conformation similaire: > similaire: > 3.5)3.5)

Importance statistique Importance statistique p/r à un alignement p/r à un alignement avec une structure avec une structure aléatoire. aléatoire. (conformation (conformation similaire: > similaire: > 3.5)3.5)

% de différence de % de différence de longueur en a.a entre longueur en a.a entre les structures alignéesles structures alignées

% de différence de % de différence de longueur en a.a entre longueur en a.a entre les structures alignéesles structures alignées

% de GAPs permis % de GAPs permis dans l’alignement des dans l’alignement des structures.structures.

% de GAPs permis % de GAPs permis dans l’alignement des dans l’alignement des structures.structures.

Page 38: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

Faites vos Faites vos sélections!sélections!Faites vos Faites vos sélections!sélections!

Page 39: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

Lignes pointillées = GapLignes pointillées = Gap

Lettrages pâles (très pâles…) Lettrages pâles (très pâles…) = résidus non-alignés= résidus non-alignés

Lignes pointillées = GapLignes pointillées = Gap

Lettrages pâles (très pâles…) Lettrages pâles (très pâles…) = résidus non-alignés= résidus non-alignés

RMSDRMSDRMSDRMSD % d’identité% d’identité% d’identité% d’identité

# de # de résidus résidus alignésalignés

# de # de résidus résidus alignésalignés

Z-ScoreZ-ScoreZ-ScoreZ-Score

Page 40: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

Souris Souris

bouton droitbouton droit

Souris Souris

bouton droitbouton droit

Nécessite l’installation du plug-in Nécessite l’installation du plug-in Chime/ protein explorerChime/ protein explorer

Nécessite l’installation du plug-in Nécessite l’installation du plug-in Chime/ protein explorerChime/ protein explorer

Le fichiers sera en format .txt Le fichiers sera en format .txt mais reconnu par Rasmol et mais reconnu par Rasmol et

Swiss PDBviewer…Swiss PDBviewer…

Le fichiers sera en format .txt Le fichiers sera en format .txt mais reconnu par Rasmol et mais reconnu par Rasmol et

Swiss PDBviewer…Swiss PDBviewer…

Page 41: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

RMSD =RMSD = 0.5 0.5RMSD =RMSD = 0.5 0.5 Seq. Id. =Seq. Id. = 100.0 100.0Seq. Id. =Seq. Id. = 100.0 100.0

# résidus # résidus alignés =alignés = 274 274# résidus # résidus alignés =alignés = 274 274 Z-score =Z-score = 7.5 7.5Z-score =Z-score = 7.5 7.5

1A3G:A1A3G:A1A3G:A1A3G:A

1I1M:C1I1M:C1I1M:C1I1M:C

Page 42: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

RMSD =RMSD = 1.4 1.4RMSD =RMSD = 1.4 1.4 Seq. Id. =Seq. Id. = 27.3 27.3Seq. Id. =Seq. Id. = 27.3 27.3

# résidus # résidus alignés =alignés = 275 275# résidus # résidus alignés =alignés = 275 275 Z-score =Z-score = 7.5 7.5Z-score =Z-score = 7.5 7.5

1A3G:A1A3G:A1A3G:A1A3G:A

2DAB:B2DAB:B2DAB:B2DAB:B

Page 43: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

RMSD =RMSD = 2.0 2.0RMSD =RMSD = 2.0 2.0 Seq. Id. =Seq. Id. = 20.5 20.5Seq. Id. =Seq. Id. = 20.5 20.5

# résidus # résidus alignés =alignés = 260 260# résidus # résidus alignés =alignés = 260 260 Z-score =Z-score = 7.2 7.2Z-score =Z-score = 7.2 7.2

1A3G:A1A3G:A1A3G:A1A3G:A

1ET0:A1ET0:A1ET0:A1ET0:A

Page 44: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

RMSD =RMSD = 5.2 5.2RMSD =RMSD = 5.2 5.2 Seq. Id. =Seq. Id. = 5.2 5.2Seq. Id. =Seq. Id. = 5.2 5.2

# résidus # résidus alignés =alignés = 77 77# résidus # résidus alignés =alignés = 77 77 Z-score =Z-score = 3.9 3.9Z-score =Z-score = 3.9 3.9

1A3G:A1A3G:A1A3G:A1A3G:A

1I6H:E1I6H:E1I6H:E1I6H:E

Page 45: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

RMSD =RMSD = 6.0 6.0RMSD =RMSD = 6.0 6.0 Seq. Id. =Seq. Id. = 2.3 2.3Seq. Id. =Seq. Id. = 2.3 2.3

# résidus # résidus alignés =alignés = 83 83# résidus # résidus alignés =alignés = 83 83 Z-score =Z-score = 3.9 3.9Z-score =Z-score = 3.9 3.9

1A3G:A1A3G:A1A3G:A1A3G:A

1B76:B1B76:B1B76:B1B76:B

Page 46: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

RMSD =RMSD = 8.6 8.6RMSD =RMSD = 8.6 8.6 Seq. Id. =Seq. Id. = 10.3 10.3Seq. Id. =Seq. Id. = 10.3 10.3

# résidus # résidus alignés =alignés = 107 107# résidus # résidus alignés =alignés = 107 107 Z-score =Z-score = 3.7 3.7Z-score =Z-score = 3.7 3.7

1A3G:A1A3G:A1A3G:A1A3G:A

1B76:B1B76:B1B76:B1B76:B

Page 47: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

CE exemple…CE exemple…CE exemple…CE exemple…

Page 48: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

VAST exemple…VAST exemple…VAST exemple…VAST exemple…

Page 49: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

VAST exemple…VAST exemple…VAST exemple…VAST exemple…

Faites vos Faites vos sélections!sélections!Faites vos Faites vos sélections!sélections!

Page 50: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

VAST exemple…VAST exemple…VAST exemple…VAST exemple…

À À télécharger télécharger

au préalable!au préalable!

À À télécharger télécharger

au préalable!au préalable!

Page 51: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

VAST exemple…VAST exemple…VAST exemple…VAST exemple…

Page 52: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction de structures (Prédiction en 1D )Prédiction de structures (Prédiction en 1D )Prédiction de structures (Prédiction en 1D )Prédiction de structures (Prédiction en 1D )

• Prédiction de structures secondaires Principe générale: AAs ont une certaine propension à

former des structures secondaires (Chou & Fasman).

• Prédiction d’accessibilité du solvant Principe générale: AAs ont une certaine hydrophobicité

face au solvant (Richards, Connolly).

• Prédiction d’hélices trans-membranaires Principe générale: hélices TM sont apolaire et de 12-

35 résidus. Distribution asymétrique des AAs de part et d’autre de la membrane.

• Prédiction de structures secondaires Principe générale: AAs ont une certaine propension à

former des structures secondaires (Chou & Fasman).

• Prédiction d’accessibilité du solvant Principe générale: AAs ont une certaine hydrophobicité

face au solvant (Richards, Connolly).

• Prédiction d’hélices trans-membranaires Principe générale: hélices TM sont apolaire et de 12-

35 résidus. Distribution asymétrique des AAs de part et d’autre de la membrane.

Page 53: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction de structures secondairesPrédiction de structures secondairesPrédiction de structures secondairesPrédiction de structures secondaires

Page 54: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction de structures secondairesPrédiction de structures secondairesPrédiction de structures secondairesPrédiction de structures secondaires

• Méthodes de première génération: 50-60% de précision Statistique: propension individuelle de chaque aa à former des

structures secondaires. • Chou & Fasman• GOR (Garnier, Osguthorpe & Robson)

• Seconde génération: freinées ~ 60% de précision Nearest neighbor: Propension de segment d’aa adjacents ⇒

considère l’environnement local des aa.• Levin & Garnier

• Problème: 1) Information locale ~ 65% structures secondaires 2) Longueur des structures prédites ~ ½ structures réelles 3) Faible niveau de prédiction des structures (struc. non-

locales)

• Méthodes de première génération: 50-60% de précision Statistique: propension individuelle de chaque aa à former des

structures secondaires. • Chou & Fasman• GOR (Garnier, Osguthorpe & Robson)

• Seconde génération: freinées ~ 60% de précision Nearest neighbor: Propension de segment d’aa adjacents ⇒

considère l’environnement local des aa.• Levin & Garnier

• Problème: 1) Information locale ~ 65% structures secondaires 2) Longueur des structures prédites ~ ½ structures réelles 3) Faible niveau de prédiction des structures (struc. non-

locales)

Page 55: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction de structures secondairesPrédiction de structures secondairesPrédiction de structures secondairesPrédiction de structures secondaires

• Méthodes évolutives:Méthodes évolutives: > 70% > 70% la différence ponctuelle des résidus extraite à partir d’une famille la différence ponctuelle des résidus extraite à partir d’une famille

de prot. alignées est hautement indicatif de détails structuraux de prot. alignées est hautement indicatif de détails structuraux spécifiques.spécifiques.

• Le profil d’alignement de N résidus consécutif contient Le profil d’alignement de N résidus consécutif contient l’information non-locale puisque la sélection naturelle c’est l’information non-locale puisque la sélection naturelle c’est produite sur des objets 3D.produite sur des objets 3D.

• PredictProtein-PHD (72%)PredictProtein-PHD (72%) http://cubic.bioc.columbia.edu/pp/http://cubic.bioc.columbia.edu/pp/

• Jpred (73-75%)Jpred (73-75%) http://www.compbio.dundee.ac.uk/~www-jpred/http://www.compbio.dundee.ac.uk/~www-jpred/

• PSIpred (77%)PSIpred (77%) http://bioinf.cs.ucl.ac.uk/psipred/http://bioinf.cs.ucl.ac.uk/psipred/

• Meta-ServerMeta-Server http://bioinfo.pl/meta/http://bioinfo.pl/meta/

• Méthodes évolutives:Méthodes évolutives: > 70% > 70% la différence ponctuelle des résidus extraite à partir d’une famille la différence ponctuelle des résidus extraite à partir d’une famille

de prot. alignées est hautement indicatif de détails structuraux de prot. alignées est hautement indicatif de détails structuraux spécifiques.spécifiques.

• Le profil d’alignement de N résidus consécutif contient Le profil d’alignement de N résidus consécutif contient l’information non-locale puisque la sélection naturelle c’est l’information non-locale puisque la sélection naturelle c’est produite sur des objets 3D.produite sur des objets 3D.

• PredictProtein-PHD (72%)PredictProtein-PHD (72%) http://cubic.bioc.columbia.edu/pp/http://cubic.bioc.columbia.edu/pp/

• Jpred (73-75%)Jpred (73-75%) http://www.compbio.dundee.ac.uk/~www-jpred/http://www.compbio.dundee.ac.uk/~www-jpred/

• PSIpred (77%)PSIpred (77%) http://bioinf.cs.ucl.ac.uk/psipred/http://bioinf.cs.ucl.ac.uk/psipred/

• Meta-ServerMeta-Server http://bioinfo.pl/meta/http://bioinfo.pl/meta/

Page 56: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.

• Principe générale: AAs ont une certaine hydrophobicité face au solvant (Richards, Connolly).

• Principe générale: AAs ont une certaine hydrophobicité face au solvant (Richards, Connolly).

Page 57: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.

Page 58: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.Prédiction d’accessibilité du solvant.

• Concept: en connaissant les éléments de structures secondaires, on peut tenter de prédire la structure tertiaire en testant différents arrangements spatiales.

Un aa hydrophobe aura tendance à être caché à l’intérieur tandis qu’un aa hydrophile sera plutôt exposé.

L’accessibilité au solvant d’une prot. est conservée en tout point à l’intérieur d’une famille de séquence.

• La plupart des serveurs de prédiction de structures secondaires nous donnes cette prédiction.

• Concept: en connaissant les éléments de structures secondaires, on peut tenter de prédire la structure tertiaire en testant différents arrangements spatiales.

Un aa hydrophobe aura tendance à être caché à l’intérieur tandis qu’un aa hydrophile sera plutôt exposé.

L’accessibilité au solvant d’une prot. est conservée en tout point à l’intérieur d’une famille de séquence.

• La plupart des serveurs de prédiction de structures secondaires nous donnes cette prédiction.

Page 59: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Exemple… Exemple… PredictProtein-PHD PredictProtein-PHD Exemple… Exemple… PredictProtein-PHD PredictProtein-PHD

Soumettre à Soumettre à plusieurs plusieurs serveurs en 1 serveurs en 1 seul étapeseul étape

Soumettre à Soumettre à plusieurs plusieurs serveurs en 1 serveurs en 1 seul étapeseul étape

Page 60: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Exemple… Exemple… PredictProtein-PHDPredictProtein-PHDExemple… Exemple… PredictProtein-PHDPredictProtein-PHD

Page 61: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Exemple… Exemple… PredictProtein-PHDPredictProtein-PHDExemple… Exemple… PredictProtein-PHDPredictProtein-PHD

Page 62: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Exemple… Exemple… PredictProtein-PHDPredictProtein-PHDExemple… Exemple… PredictProtein-PHDPredictProtein-PHD

Page 63: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Exemple… Exemple… PredictProtein-PHDPredictProtein-PHDExemple… Exemple… PredictProtein-PHDPredictProtein-PHD

Selon PDB:Selon PDB:Selon PDB:Selon PDB:

HHHHHHHH HHHHHHHHHHH

EEE EEE

H=Hélice, E= Feuillet, C= Boucle/tourH=Hélice, E= Feuillet, C= Boucle/tourH=Hélice, E= Feuillet, C= Boucle/tourH=Hélice, E= Feuillet, C= Boucle/tour

Page 64: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Exemple… Exemple… PredictProtein-PHDPredictProtein-PHDExemple… Exemple… PredictProtein-PHDPredictProtein-PHD

ConsensusConsensusConsensusConsensus

Accessibilité Accessibilité au solvantau solvant

Accessibilité Accessibilité au solvantau solvant

JPredJPredJPredJPred

HHHHHHHHH HHHHHHHHHHHH EEE EEE HHHHHHHHHHH

Selon Selon PDB:PDB:Selon Selon PDB:PDB:

Page 65: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction d’hélices transmembranairesPrédiction d’hélices transmembranairesPrédiction d’hélices transmembranairesPrédiction d’hélices transmembranaires

• La structure des prot. trans-membranaires est difficile à obtenir expérimentalement (X-ray, RMN).

Les méthodes de prédictions sont d’autant plus importantes.

• Simplifié par les contraintes membranaires: revient à un problème 2D.

• La structure des prot. trans-membranaires est difficile à obtenir expérimentalement (X-ray, RMN).

Les méthodes de prédictions sont d’autant plus importantes.

• Simplifié par les contraintes membranaires: revient à un problème 2D.

Page 66: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction d’hélices transmembranairesPrédiction d’hélices transmembranairesPrédiction d’hélices transmembranairesPrédiction d’hélices transmembranaires

Page 67: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction d’hélices transmembranairesPrédiction d’hélices transmembranairesPrédiction d’hélices transmembranairesPrédiction d’hélices transmembranaires

• Concept: 1) Hélices TM sont apolaire et typiquement de 12-35 résidus de

long. 2) Régions globulaires (RGs) entre hélices sont généralement

plus court que 60 résidus. 3) Les TMH possèdent une distribution spécifiques des aa

chargés positivement (positive-inside rule de R et K). 4) Les longues RGs (>60 résidus) diffèrent en composition des

RGs sujettes à la règle inside/outside.

• Méthodes variées: Échelle d’hydrophobicité, moment hydrophobe, distribution

spécifiques des aa dans les TMH.

• Faible distinction entre prot. membranaires et prot. globulaires.

• Concept: 1) Hélices TM sont apolaire et typiquement de 12-35 résidus de

long. 2) Régions globulaires (RGs) entre hélices sont généralement

plus court que 60 résidus. 3) Les TMH possèdent une distribution spécifiques des aa

chargés positivement (positive-inside rule de R et K). 4) Les longues RGs (>60 résidus) diffèrent en composition des

RGs sujettes à la règle inside/outside.

• Méthodes variées: Échelle d’hydrophobicité, moment hydrophobe, distribution

spécifiques des aa dans les TMH.

• Faible distinction entre prot. membranaires et prot. globulaires.

Page 68: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Prédiction d’hélices transmembranairesPrédiction d’hélices transmembranairesPrédiction d’hélices transmembranairesPrédiction d’hélices transmembranaires

• La précision est augmentée lorsqu’on utilise un modèle évolutif basé sur l’homologie de séquence de prot. membranaires apparentées.

TopPred• http://bioweb.pasteur.fr/seqanal/interfaces/toppred.html

MEMSAT• http://bioinf.cs.ucl.ac.uk/psiform.html

TMHMM• http://www.cbs.dtu.dk/services/TMHMM-2.0/

• La précision est augmentée lorsqu’on utilise un modèle évolutif basé sur l’homologie de séquence de prot. membranaires apparentées.

TopPred• http://bioweb.pasteur.fr/seqanal/interfaces/toppred.html

MEMSAT• http://bioinf.cs.ucl.ac.uk/psiform.html

TMHMM• http://www.cbs.dtu.dk/services/TMHMM-2.0/

Page 69: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Exemple: TMHMMExemple: TMHMMExemple: TMHMMExemple: TMHMM

Page 70: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Exemple: TMHMMExemple: TMHMMExemple: TMHMMExemple: TMHMM

Extracellulaire (outside)Extracellulaire (outside)Extracellulaire (outside)Extracellulaire (outside)

Cytoplasmique (inside)Cytoplasmique (inside)Cytoplasmique (inside)Cytoplasmique (inside)

Page 71: Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Un p’tit exemple de convergenceUn p’tit exemple de convergenceUn p’tit exemple de convergenceUn p’tit exemple de convergence

• Colicine A (1COL:A): Protéine de surface des cellules/membranes. Domaine membranaire de translocation des toxines. (E. Coli).

• C-Phycocianine (1CPC:A): Pigment de l’appareil photosynthétique.(Cyanobactérie).

• Rmsd = 3.2Å

• Z-Score = 5.5

• Sequence identity = 13.9%

• Aligned/gap positions = 115/16

• Colicine A (1COL:A): Protéine de surface des cellules/membranes. Domaine membranaire de translocation des toxines. (E. Coli).

• C-Phycocianine (1CPC:A): Pigment de l’appareil photosynthétique.(Cyanobactérie).

• Rmsd = 3.2Å

• Z-Score = 5.5

• Sequence identity = 13.9%

• Aligned/gap positions = 115/16