[email protected] Institut Suisse de Bioinformatique Groupe Swiss-Prot

44
[email protected] Institut Suisse de Bioinformatique Groupe Swiss-Prot novembre 2006

description

La biologie change. [email protected] Institut Suisse de Bioinformatique Groupe Swiss-Prot novembre 2006. Un des changements important. Nouvelles technologies: -> arrivée de données biologiques en ‘masse’ -> utilisation de l’informatique - PowerPoint PPT Presentation

Transcript of [email protected] Institut Suisse de Bioinformatique Groupe Swiss-Prot

Page 1: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

[email protected] Institut Suisse de Bioinformatique

Groupe Swiss-Protnovembre 2006

Page 2: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Un des changements important

Nouvelles technologies:-> arrivée de données biologiques en ‘masse’

-> utilisation de l’informatique pour le stockage et l’analyse de données biologiques.

Rôle important joué par la ‘bioinformatique’

Page 3: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

La bioinformatique, c’est quoi ?

L’utilisation de l’informatique pour l’analyse de données biologiques.

Page 4: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Bioinformatique • Surtout:

– Biologie + Informatique– Biochimie + Informatique

• Mais aussi…– Médecine + Informatique– Pharmacie + Informatique– Chimie + Informatique– Mathématique + Informatique– Statistique + Informatique

• C’est un domaine pluridisciplinaire!

Page 5: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Bioinformatique • Surtout:

– Biologie + Informatique– Biochimie + Informatique

Pourquoi faire ?

Page 6: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Acquérir puis stocker les informations biologiques sous la forme d’encyclopédies appelées bases de données;

Encyclopédies informatisées

Page 7: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Exemples de données ‘biologiques’ qui ne peuvent plus être gérées sans l’aide de l’informatique:

- Séquences: ADN (génomes), ARN, protéines - Structures 3D: ADN, ARN, protéines, sucres…- Classification des espèces - Voies métaboliques- Expression des gènes (microarrays)- Spectrométrie de masse- Publications scientifiques…

Beaucoup de ‘omics’, mais… !

Page 8: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot
Page 9: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Acquérir puis stocker les informations biologiques sous la forme d’encyclopédies appelées bases de données;Développer des programmes de prédiction et d’analyse en utilisant les informations contenues dans les bases de données;

Analyser/Interpréter/Prédire: utiliser ces programmes pour analyser de ‘nouvelles’ données biologiques et prédire in silico par exemple la fonction potentielle d’une protéine;

Page 10: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Conclucion d’une analyse in silico d’une protéine inconnue

Poids moléculaire: 126 kD;Fonction: ATPase potentielle;Localisation subcellulaire: Membrane plasmique.Transmembranaire (~10 hélices); N terminal: intracellulaire; C terminal: intracellulairePTM: Phosphorylée

Ça me semble bio-logique …

mais reste à le prouver !

Page 11: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Acquérir puis stocker les informations biologiques sous la forme d’encyclopédies appelées bases de données;

Visualiser: développer des programmes pour visualiser la structure en trois dimensions des protéines et de l’ADN, pour shématiser des voies métaboliques ou des arbres phylogénétiques.

Développer des programmes de prédiction et d’analyse en utilisant les informations contenues dans les bases de données;

Analyser/Interpréter/Prédire: utiliser ces programmes pour analyser de ‘nouvelles’ données biologiques et prédire in silico par exemple la fonction potentielle d’une protéine;

Page 12: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Exemple d’un dendrogramme obtenu à partir d’un résultat de CLUSTALW à l’aide du programme « phylodendron »  

Dendogramme

Le Dodo et le poulet ont un ancêtre commun !

Le Mammouth et l’éléphant ont un ancêtre

commun !

Arbre obtenu avec le cytochrome B(phylophilo)

Page 13: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

HIV: exemple d’application de la HIV: exemple d’application de la bioinformatiquebioinformatique

• 1984: identification du virus;

Page 14: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

HIV: exemple d’application de la HIV: exemple d’application de la bioinformatiquebioinformatique

• 1984: identification du virus;• 1985: séquençage du génome de HIV-1 ; (4 laboratoires dont Montagnier/France et Gallo (USA) (??))

Page 15: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

HIV: exemple d’application de la HIV: exemple d’application de la bioinformatiquebioinformatique

• 1984: identification du virus;• 1985: séquençage du génome de HIV-1 ; (4 laboratoires dont Montagnier/France et Gallo (USA) (??))• 1985-1989: caractérisation des protéines;• 1989: structure X-ray de la protéase;

Page 16: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

HIV: exemple d’application de la HIV: exemple d’application de la bioinformatiquebioinformatique

• 1984: identification du virus;• 1985: séquençage du génome de HIV-1 ; (4 laboratoires dont Montagnier/France et Gallo (USA) (??))• 1985-1989: caractérisation des protéines;• 1989: structure X-ray de la protéase;• 1990: premiers inhibiteurs modélisés à partir de la

structure 3D de la protéase

Page 17: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

HIV: exemple d’application de la HIV: exemple d’application de la bioinformatiquebioinformatique

• 1984: identification du virus;• 1985: séquençage du génome de HIV-1 ; (4 laboratoires dont Montagnier/France et Gallo (USA) (??))• 1985-1989: caractérisation des protéines;• 1989: structure X-ray de la protéase;• 1990: premiers inhibiteurs modélisés à partir de la

structure 3D de la protéase

• Novembre 1995: premier médicament (Invirase) approuvé par la FDA (trithérapie).

Page 18: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Structure 3D de la protease de HIV

Page 19: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Structure 3D de la protease de HIV +

inhibiteur

Page 20: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Quelques remarques

1. Il n’existe pas une “banque centrale” qui contient toutes les infos: il est toujours nécessaire de grapiller les infos dans différentes banques.

Page 21: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Quelques remarques

1. Il n’existe pas une “banque centrale” qui contient toutes les infos: il est toujours nécessaire de grapiller les infos dans différentes banques.

2. Les données s'accroissent quotidiennement (il y a en moyenne un nouveau génome séquencé toutes les semaines) et sont continuellement remises à jour: le résultats de vos requêtes peut donc être différent d'un jour à l'autre (contenu, liens ou “look”) !

Page 22: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

3. Beaucoup de chercheurs travaillent sur le même sujet ->-> un gène, plusieurs séquences ->-> redondance.

Ces séquences peuvent être différentes (erreurs de séquençage ou mutations, longueurs variables).

Page 23: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

3. Beaucoup de chercheurs travaillent sur le même sujet ->-> un gène, plusieurs séquences ->-> redondance.

Ces séquences peuvent être différentes (erreurs de séquençage ou mutations, longueurs variables).

4. Importance du numéro d’accession: identificateur d’une information biologique (1 séquence, 1 spot sur un gel, 1 structure 3D…)

Page 24: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

3. Beaucoup de chercheurs travaillent sur le même sujet ->-> un gène, plusieurs séquences ->-> redondance.

Ces séquences peuvent être différentes (erreurs de séquençage ou mutations, longueurs variables).

4. Importance du numéro d’accession: identificateur d’une information biologique (1 séquence, 1 spot sur un gel, 1 structure 3D…)

5. Les banques de données sont liées entre elles (“links”, cross-références ->-> réseau). Ces liens ne sont pas toujours bidirectionnels !

Page 25: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

3. Beaucoup de chercheurs travaillent sur le même sujet ->-> un gène, plusieurs séquences ->-> redondance.

Ces séquences peuvent être différentes (erreurs de séquençage ou mutations, longueurs variables).

4. Importance du numéro d’accession: identificateur d’une information biologique (1 séquence, 1 spot sur un gel, 1 structure 3D…)

5. Les banques de données sont liées entre elles (“links”, cross-références ->-> réseau). Ces liens ne sont pas toujours bidirectionnels !

6. Les banques de données contiennent des erreurs !

Page 26: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Conclusions

Extraordinaire potentiel de la bioinformatique…mais ne elle ne remplace(ra) pas les expériences «wet lab»

génomiques, protéomiques et autres, ni l’esprit critique humain (contexte bio-logique) !

La bioinfo fournit des outils performants aux biologistes…

Les données expérimentales des biologistes permettentd’améliorer les programmes bioinformatiques (prédiction)…

Page 27: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot
Page 28: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot
Page 29: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

‘Génomique’

Mise en place des techniques d’analyse de l’expression des gènes

Mise à la disposition des chercheurs d’une plateforme ‘génomique’

Patrick Descombes

Biomedical Proteomics Research Group (BPRG)

Plateforme Génomique

Frontiers in Genetics

Centre Médical Universitaire (CMU)

Page 30: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Jean-Charles Sanchez

Biomedical Proteomics Research Group (BPRG)

Department of Structural Biology and Bioinformatics

Centre Médical Universitaire (CMU)

Pionnier de la ‘protéomique’ (depuis 1989)

Mise en place des techniques d’analyse des protéines

Mise à la disposition des chercheurs d’une plateforme ‘protéomique’

Recherche de biomarqueurs (AVC et diabète)

Page 31: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Pionnier de la ‘bioinformatique’

Programmes d’analyse in silico des protéines

Créateur de la banque de données Swiss-Prot

Intéressé par l’’exobiologie’

Amos Bairoch

Groupe Swiss-Prot

Centre Médical Universitaire (CMU)

Page 32: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot
Page 33: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Bioinformatique - application 1:acquisition de données

• Exemples: lecture d’images de gels 2D, spectrométrie de masse (MS), séquençage ADN...

• Détection de signaux ou d’images• Absence de contexte biologique.

Page 34: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Séquençage d’ADNInformatique instrumentale

Programme pour analyser les données

d’un séquenceur ADN

Exemple: pregap4 de Rodger Staden https://sourceforge.net/projects/staden.

Page 35: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Bioinformatique - application 2: Analyse de séquences ADN

• Détection des régions codantes;• Recherche de similarité (BLAST)• Analyse des sites de restriction (enzymes);• Traduction ADN en protéine;• Détection de séquences « répétées » comme les

microsatellites, minisatellites, Alu repeats, etc.;• Détection de régions ADN importantes non-codantes

comme les signaux de transcription (promoteur), origines de la réplication, etc.;

• Détection de séquences de tARN et autres types de ARN (exemples: rARN, uARN, tmARN).

Page 36: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Une séquence ADN de C.elegans)(~25’000 bp)

Page 37: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Schéma récapitulatif

3 ’5 ’

Genebuilder prédiction

ADN génomiqueexons 1 4

Splicing / Epissage « in silico »

mARN mature1 2 3 4

2 3

108310031305

14061452

16611914

19972 31 4

Page 38: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Des cas moins idéaux…

Ex: Chromosome 21

Page 39: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Bioinformatique- application 3:analyse de la séquence primaire des

protéines• Caractérisation physicochimique• Prédiction de la localisation subcellulaire (“signal

séquences”, “transit peptides”);• Recherche de régions transmembranaires;• Recherche des régions fonctionnelles (domaines

conservés)• Recherche de sites de modifications post-

traductionelles (PTM). • Recherche de régions antigéniques;• Recherche de régions dont la composition est

biaisée (“low complexity sequences”);

Page 40: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

• Mettre en relation 2 séquences en comparant les acides aminés à chaque position et en tenant compte de leur probabilité de mutation au cours de l’évolution;

Bioinformatique - application 4:comparaison de séquences

MY-TAIL--ORIS-RICH-#x #### x#x# ####MONTAILLEURESTRICHE

(algorithme pour comparer des chants d’oiseaux)

Page 41: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

by Sebastian Böcker

Page 42: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Bioinformatique - application 5:phylogénétique

• Reconstruction de l’évolution des espèces;

• Reconstruction de l’évolution moléculaire des familles de protéines;• Reconstruction de l’évolution des chemins métaboliques.

Page 43: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Bioinformatique - application 6analyse de la structure secondaire &

modélisation des protéines

Séquence d’une protéine

Structure d’une protéine

?MSTNNYQTLSQNKADRMGPGGSRRPRNSQHATASTPSASSCKEQQKDVEHEFDIIAYKTTFWRTFFFYALSFGTCGIFRLFLHWFPKRLIQFRGKRCSVENADLVLVVDNHNRYDICNVYYRNKSGTDHTVVANTDGNLAELDELRWFKYRKLQYTWIDGEWSTPSRAYSHVTPENLASSAPTTGLKADDVALRRTYFGPNVMPVKLSPFYELVYKEVLSPFYIFQAISVTVWYIDDYVWYAALIIVMSLYSVIMTLRQTRSQQRRLQSMVVEHDEVQVIRENGRVLTLDSSEIVPGDVLVIPPQGCMMYCDAVLLNGTCIVNESMLTGESIPITKSAISDDGHEKIFSIDKHGKNIIFNGTKVLQTKYYKGQNVKALVIRTAYSTTKGQLIRAIMYPKPADFKFFRELMKFIGVLAIVAFFGFMYTSFILFYRGSSIGKIIIRALDLVTIVVPPALPAVMGIGIFYAQRRLRQKSIYCISPTTINTCGAIDVVCFDKTGTLTEDGLDFYALRVVNDAKIGDNIVQIAANDSCQNVVRAIATCHTLSKINNELHGDPLDVIMFEQTGYSLEEDDSESHESIESIQPILIRPPKDSSLPDC

Page 44: Marie-Claude.Blatter@isb-sib.ch  Institut Suisse de Bioinformatique  Groupe Swiss-Prot

Avant …

Après …