Bioinformatique Emploi du temps, groupes de TP, .Historique et domaines d'application liés à la

download Bioinformatique Emploi du temps, groupes de TP, .Historique et domaines d'application liés à la

of 36

  • date post

    10-Sep-2018
  • Category

    Documents

  • view

    213
  • download

    0

Embed Size (px)

Transcript of Bioinformatique Emploi du temps, groupes de TP, .Historique et domaines d'application liés à la

  • Bioinformatique

    Emploi du temps, groupes de TP, supports de cours et de TP disponibles sur http://silico.biotoul.fr sur la page Enseignement

    Contrle continu : 30% Contrle terminal : 70%

    Objectifs pdagogiques : Apperu de quelques domaines d'application de la bioinformatique

    traitement d'image : mesures phnotypiques gestion des donnes statistiques : corrlation phnotype - gnotype banques de donnes et sites Web publiques modlisation de systmes biologiques et simulations

    Intervenants Roland Barriot Maxime Bonhomme Franck Delavoie Gwennaele Fichant Elodie Gaulin Florie Gosseau Silvia Kocanova

  • Dfinition

    Qu'est-ce que la bioinformatique ? Plusieurs rponses :

    pas de l'informatique bio traitement de l'information biologique un domaine spcialis de la biologie un domaine de recherche multidiscpilinaire : biologie, sant,

    mathmatique, informatique, physique, thique

    Une dfinition : traitement des informations biologiques par des mthodes informatiques et/ou mathmatiques.

    Les donnes et connaissances biologiques posent de nouveaux dfis spcifiques pour leur gestion, reprsentation, et leur analyse/traitement

    2

  • Historique et domaines d'application lis la bioinformatique1970 Apparition du terme bioinformatique

    Disponibilit de squences de gnes (et du 1er gnome complet en 1977, bactriophage phi X174)Comparaison de squences

    1980 Alignement de squences et recherche de squences similairesAnalyse phylogntiquePrdiction de fonctionBanques de donnes

    1990 Dbuts de la gnomique et gnomique comparative ; analyse du contenu d'un gnomeDbuts des analyses globales de l'expression des gnes et des protinesFamille de gnes, de protines, de domainesPrdiction de la structure 3D des protines

    2000 Gnralisation des approches globalesTraitement de graphes : interactions protine-protine, rseau de rgulation de l'expression des gnes, rseau mtaboliquesApprentissage automatique (data mining)Fouille de texte (text mining)Biologie des systmes : modlisation de systmes biologiquesIntgration de donnes htrognes, visualisationMdecine personnaliseNGS/Squenage trs haut dbitTraitement d'images lies la microscopie

    2010 Ethique, confidentialit des donnesModlisation d'une cellule, d'un organisme, d'une population, d'un cosystmeBiologie de synthse

    3

  • (Quelques) donnes et connaissances disponibles 4

    Cellule eucaryote

    NoyauCytoplasme

    gnetranscription

    traduction

    ARNm

    chromosome

    ADNprotine

    complexe protique

    gnome

    transcriptome

    protome

    interactome

    gaattcggccattcacatagcctctacctccccctgccagtcggctgggacaactcgggcaaacccagctgagcttgagcg...

    GATACAT GCTATGT

    AGA CTA

    MTGLAEEWWFDSGRAAARDWKKFTQALESRFTAMNMEEDWSNLQCGPNSYETRFRAARHHL...

    mtabolome

    mtabolisme rgulation

  • Donnes omics

    Gnome squence(s) nuclique(s) de lensemble

    des chromosomes dun organisme ensemble des gnes dun organisme

    Transcriptome ensemble des ARNm ou transcrits

    prsents dans une cellule ou une population de cellules dans des conditions donnes

    Protome ensemble des protines prsentes dans une cellule ou une population de

    cellules dans des conditions donnes Interactome

    ensemble des intractions molculaires pouvant survenir in vivo ensemble des intractions molculaires dans des conditions donnes ensemble des intractions au sein dun organisme : molculaires, physiques,

    gntiques, fonctionnelles, Mtabolome

    ensemble des mtabolites prsents dans une cellule ou une population de cellules dans des conditions donnes

    Exome, lipidome, phnome, rgulome, scrtome,

    5

    source : Wikipedia

  • Squences disponibles : quelques chiffres 6

    June 2016

  • Des squences et aprs ?

    Annotation rgions codantes, rgions rgulatrice, prdiction fonctionnelle

    Reconstruction du rseau mtabolique Analyse des relations gnotype/phnotype Analyses volutives Conception de puces dexpression Identification de protine Prdiction de structure

    7

  • Assemblage dun gnome 8

    ADN GnomiqueSonication

    Shotgun

    Sous-clonage et Squenage

    Contigs

    Assemblage 1

    Squence complte

    Assemblage 2

    mat

    rie

    l bio

    logi

    que

    donn

    es

  • Lanalyse manuelle dune squence peut savrer laborieuse 9

    TCCTGGCCTACATGTTCTTTGGCAAAGGATCTTCAAAATCAACGGCTCCCGGTGCGGCGATCATCCATTTCTTCGGAGGGATTCACGAGATTTACTTCCCGTACATTCTGATGAAACCTGGCCCTGATTCTCGCAGCCATTGCCGGCGGAGCAAGCGGACTCTTAACATTACGATCTTTAATGCCGGACTTGTCGCGGCAGCGTCACCGGGAAGCATTATCGCATTGATGGCAATGACGCCAAGAGGAGGCTATTTCGGCGTATTGGCGGGTGTATTGGTCGCTGCAGCTGTATCGTTCATCGTTTCAGCAGTGATCCTGAAATCCTCTAAAGCTAGTGAAGAAGACCTGGCTGCCGCAACAGAAAAAATGCAGTCCATGAAGGGGAAGAAAAGCCAAGCAGCAGCTGCTTTAGAGGCGGAACAAGCCAAAGCAGAGAAGCGTCTGAGCTGTCTCCTGAAAGCGCGAACAAAATTATCTTTTCGTGTGATCCGGGATGGGATCAAGTGCCATGGGGGCATCCATCTTAAGAAACAAAGTGAAAAAGCGGAGCTTGACATCAGTGTGACCAACACGGCCATTAACAATCTGCCAAGCGATGCGGATATTGTCATCACCCACAAAGATTTAACAGACCGCGCGAAAGCAAAGCTGCCGAACGCGACGCACATATCAGTGGATAACTTCTTAAACAGCCCGAAATACGACGAGCTGATTGAAAAGCTGAAAAGTAATCTTATAGAAAGAGAGTATTGTCATGCAAGTACTCGCAAAGGAAACATTAAACTCAATCAAACGGTATCATCAAAAGAAGAGGCTATCAAATTGGCAGGCCAGACGCTGATTGACAACGGCTACGTGACAGAGGATTACATTAGCAAAATGTTTGACCGTGAAGAAACGTCTTCTACGTTTATGGGGAATTTCATTGCCATTCCACACGGCACAGAAGAAGCGAAAAGCGAGGTGCTTCACTCAGGAATTTCAATCATACAGATTCCAGAGGGCGTTGAGTACGGAGAAGGCAACACGGCAAAAGTGGTATTCGGCATTGCGGGTAAAAATAATGAGCATTTAGACATTTTGTCTAACATCGCCATTATCTGTTCAGAAGAAGAAACATTGAACGCCTGATCTCCGCTAAAGCGAAGAAGATTTGATCGCCATTTCAACGAGGTGAACTGACATGATCGCCTTACATTTCGGTGCGGGAAATATCGGGAGAGGATTTATCGGCGCGCTGCTTCACCACTCCGGCTATGATGTGGTGTTTGCGGATGTGAACGAAACGATGGTCAGCCTCCTCAATGAAAAAAAAGAATACACAGTGGAACTGGCGGAAGAGGGACGTTCATCGGAGATCATTGGCCCGGTGAGCGCTATTAACAGCGGCAGTCAGACCGAGGAGCTGTACCGGCTGATGAATGAGGCGGCGCTCATCACAACAGCTGTCGGCCCGAATGTCCTGAAGCTGATTGCCCCGTCTATCGCAGAAGGTTTAAGACGAAGAAATACTGCAAACACACTGAATATCATTGCCTGCGAAAATATGATTGGCGGAAGCAGCTTCTTAAAGAAAGAAATATACAGCCATTTAACGGAAGCAGAGCAGAAATCCGTCAGTGAAACGTTAGGTTTTCCGAATTCTGCCGTTGACCGGATCGTCCCGATTCAGCATCATGAAGACCCGCTGAAAGTATCGGTTGAACCATTTTTCGAATGGGTCATTGATGAATCAGGCTTTAAAGGGAAAACACCAGTCATAAACGGCGCACTGTTTGTTGATGATTTAACGCCGTACATCGAACGGAAGCTGTTTACGGTCAATACCGGACACGCGGTCACAGCGTATGTCGGCTATCAGCGCGGACTCAAAACGGTCAAAGAAGCAATTGATCATCCGGAAATCCGCCGTGTTGTTCATTCGGCGCTGCTTGAAACTGGTGACTATCTCGTCAAATCGTATGGCTTTAAGCAAACTGAACACGAACAATATATTAAAAATCAGCGGTCGCTTTTAAAATCCTTTCATTTCGGACGATGTGACCCGCGTAGCGAGGTCACCTCTCAGAAAACTGGGAGAAAATGTAGACTTGTAGGCCCGGCAAAGAAAATAAAAGAACCGAATGCACTGGCTGAAGGAATTGCCGCAGCACTGCGCTTCGATTTCACCGGTGACCCTGAAGCGGTTGAACTGCAAGCGCTGATCGAAGAAAAGGATACAGCGGCGTACTTCAAGAGGTGTGCGGCATTCAGTCCCATGAACCGTTGCACGCCATCATTTTAAAGAAACTTAATCAATAACCGACCACCCGTGACACAATGTCACGGGCTTTTTACTATCTCGCAATCTAGTATAATAGAAAGCGCTTACGATAACAGGGGAAGGAGAATGACGATGAAACAATTTGAGATTGCGGCAATACCGGGAGACGGAGTAGGAAAGAGGTTGTAGCGGCTGCTGAGAAAGTGCTTCATACAGCGGCTGAGGTACACGGAGGTTTGTCATTCTCATTCACAGCTTTTCCATGGAGCTGTGATTATTACTTGGAGCACGGCAAAAATGATGCCCGAAGATGGAATACATACGCTTACTCAATTTGAAGCAGTTTTTGGGAGCTGTCGGAAATCCGAAGCTGGTTCCCGATCATATATCGTTATGGGGCTGCTGCTGAAATCCGGAGGGAGCTTGAGCTTTCCATTAATATGAGACCCGCCAAACAAATGGCAGGCATTACGTCGCCGCTTCTGCATCCAAATGATTTTTGACTTCGTGGTGATTCGCGAGAACAGTGAAGGTGAATACAGTGAAGTTGTCGGGCGCATTCACAGAGGCGATGATGAAATCGCCATCCAGAATGCCGTGTTTACGAGAAAAGCGACAGAACGTGTCATGCGCTTTGCCTTCGAATT

  • Annotation dun gnome 10

    Identification des gnes codant pour : les ARNr les ARNt les protines

    Identification des units de traduction

    Identification des units de transcription (promoteur et terminateur)

    Pour les gnes codant pour les protines, prdiction fonctionnelle par recherche de similarit de squences (Blast) et classification en grandes classes fonctionnelles (ex: biosynthse des acides amins, mtabolisme nergtique.)

  • Structure secondaire canonique dune squence dARNt 11

    bras amino-acyl

    bras D

    boucle D

    bras anticodon

    boucle anticodon

    boucle variable

    bras T-Y-C

    boucle T-Y-C

  • Gnome de Mycoplasma genitalium 12

    Distribution des units de traduction et classification fonctionnelle

  • Stockage des squences : Banques de squences 13

    ID Q8DPI7_STRR6 PRELIMINARY; PRT; 286 AA.AC Q8DPI7;DT 01-MAR-2003, integrated into UniProtKB/TrEMBL.DT 01-MAR-2003, sequence version 1.DT 02-MAY-2006, entry version 10.DE DNA processing Smf protein.GN Name=smf; OrderedLocusNames=spr1144;OS Streptococcus pneumoniae (strain ATCC BAA-255 / R6).OC Bacteria; Firmicutes; Lactobacillales; Streptococcaceae;OC Streptococcus.OX NCBI_TaxID=171101;RN [1]RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA].RX MEDLINE=21429245; PubMed=11544234;RX DOI=10.1128/JB.183.19.5709-5717.2001;RA Hoskins J., Alborn W.E. Jr., Arnold J., Blaszczak L.C., Burgett S.,RA DeHoff B.S., Estrem S.T., Fritz L., Fu D.-J., Fuller W., Geringer C.,RA Gilmour R., Glass J.S., Khoja H., Kraft A.R., Lagace R.E.,RA LeBlanc D.J., Lee L.N., Lefkowitz E.J., Lu J., Matsushima P.,RA McAhren S.M., McHenney M., McLeaster K., Mundy C.W., Nicas T.I.,RA Norris F.H., O'Gara M., Peery R.B., Robertson G.T., Rockey P.,RA Sun P.-M., Winkler M.E., Yang Y., Young-Bellido M., Zhao G.,RA Zook C.A., Baltz R.H., Jaskunas S.R., Rosteck P.R. Jr., Skatrud P.L.,RA Glass J.I.;RT "Genome of the bacterium Streptococcus pneumoniae strain R6.";RL J. Bacteriol. 183:5709-5717(2001).CC -----------------------------------------------------------------------CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/termsCC Distributed under the Creative Commons Attribution-NoDerivs LicenseCC -----------------------------------------------------------------------DR EMBL; AE008487; AAK99947.1; -; Genomic_DNA.DR PIR; A95147; A95147.DR PIR; G98014; G98014.DR GenomeReviews; AE007317_GR; spr1144.DR BioCyc; SPNE1313:SPR1144-MONOMER; -.DR GO;