Bioinformatique Emploi du temps, groupes de TP, .Historique et domaines d'application liés à la
date post
10-Sep-2018Category
Documents
view
213download
0
Embed Size (px)
Transcript of Bioinformatique Emploi du temps, groupes de TP, .Historique et domaines d'application liés à la
Bioinformatique
Emploi du temps, groupes de TP, supports de cours et de TP disponibles sur http://silico.biotoul.fr sur la page Enseignement
Contrle continu : 30% Contrle terminal : 70%
Objectifs pdagogiques : Apperu de quelques domaines d'application de la bioinformatique
traitement d'image : mesures phnotypiques gestion des donnes statistiques : corrlation phnotype - gnotype banques de donnes et sites Web publiques modlisation de systmes biologiques et simulations
Intervenants Roland Barriot Maxime Bonhomme Franck Delavoie Gwennaele Fichant Elodie Gaulin Florie Gosseau Silvia Kocanova
Dfinition
Qu'est-ce que la bioinformatique ? Plusieurs rponses :
pas de l'informatique bio traitement de l'information biologique un domaine spcialis de la biologie un domaine de recherche multidiscpilinaire : biologie, sant,
mathmatique, informatique, physique, thique
Une dfinition : traitement des informations biologiques par des mthodes informatiques et/ou mathmatiques.
Les donnes et connaissances biologiques posent de nouveaux dfis spcifiques pour leur gestion, reprsentation, et leur analyse/traitement
2
Historique et domaines d'application lis la bioinformatique1970 Apparition du terme bioinformatique
Disponibilit de squences de gnes (et du 1er gnome complet en 1977, bactriophage phi X174)Comparaison de squences
1980 Alignement de squences et recherche de squences similairesAnalyse phylogntiquePrdiction de fonctionBanques de donnes
1990 Dbuts de la gnomique et gnomique comparative ; analyse du contenu d'un gnomeDbuts des analyses globales de l'expression des gnes et des protinesFamille de gnes, de protines, de domainesPrdiction de la structure 3D des protines
2000 Gnralisation des approches globalesTraitement de graphes : interactions protine-protine, rseau de rgulation de l'expression des gnes, rseau mtaboliquesApprentissage automatique (data mining)Fouille de texte (text mining)Biologie des systmes : modlisation de systmes biologiquesIntgration de donnes htrognes, visualisationMdecine personnaliseNGS/Squenage trs haut dbitTraitement d'images lies la microscopie
2010 Ethique, confidentialit des donnesModlisation d'une cellule, d'un organisme, d'une population, d'un cosystmeBiologie de synthse
3
(Quelques) donnes et connaissances disponibles 4
Cellule eucaryote
NoyauCytoplasme
gnetranscription
traduction
ARNm
chromosome
ADNprotine
complexe protique
gnome
transcriptome
protome
interactome
gaattcggccattcacatagcctctacctccccctgccagtcggctgggacaactcgggcaaacccagctgagcttgagcg...
GATACAT GCTATGT
AGA CTA
MTGLAEEWWFDSGRAAARDWKKFTQALESRFTAMNMEEDWSNLQCGPNSYETRFRAARHHL...
mtabolome
mtabolisme rgulation
Donnes omics
Gnome squence(s) nuclique(s) de lensemble
des chromosomes dun organisme ensemble des gnes dun organisme
Transcriptome ensemble des ARNm ou transcrits
prsents dans une cellule ou une population de cellules dans des conditions donnes
Protome ensemble des protines prsentes dans une cellule ou une population de
cellules dans des conditions donnes Interactome
ensemble des intractions molculaires pouvant survenir in vivo ensemble des intractions molculaires dans des conditions donnes ensemble des intractions au sein dun organisme : molculaires, physiques,
gntiques, fonctionnelles, Mtabolome
ensemble des mtabolites prsents dans une cellule ou une population de cellules dans des conditions donnes
Exome, lipidome, phnome, rgulome, scrtome,
5
source : Wikipedia
Squences disponibles : quelques chiffres 6
June 2016
Des squences et aprs ?
Annotation rgions codantes, rgions rgulatrice, prdiction fonctionnelle
Reconstruction du rseau mtabolique Analyse des relations gnotype/phnotype Analyses volutives Conception de puces dexpression Identification de protine Prdiction de structure
7
Assemblage dun gnome 8
ADN GnomiqueSonication
Shotgun
Sous-clonage et Squenage
Contigs
Assemblage 1
Squence complte
Assemblage 2
mat
rie
l bio
logi
que
donn
es
Lanalyse manuelle dune squence peut savrer laborieuse 9
TCCTGGCCTACATGTTCTTTGGCAAAGGATCTTCAAAATCAACGGCTCCCGGTGCGGCGATCATCCATTTCTTCGGAGGGATTCACGAGATTTACTTCCCGTACATTCTGATGAAACCTGGCCCTGATTCTCGCAGCCATTGCCGGCGGAGCAAGCGGACTCTTAACATTACGATCTTTAATGCCGGACTTGTCGCGGCAGCGTCACCGGGAAGCATTATCGCATTGATGGCAATGACGCCAAGAGGAGGCTATTTCGGCGTATTGGCGGGTGTATTGGTCGCTGCAGCTGTATCGTTCATCGTTTCAGCAGTGATCCTGAAATCCTCTAAAGCTAGTGAAGAAGACCTGGCTGCCGCAACAGAAAAAATGCAGTCCATGAAGGGGAAGAAAAGCCAAGCAGCAGCTGCTTTAGAGGCGGAACAAGCCAAAGCAGAGAAGCGTCTGAGCTGTCTCCTGAAAGCGCGAACAAAATTATCTTTTCGTGTGATCCGGGATGGGATCAAGTGCCATGGGGGCATCCATCTTAAGAAACAAAGTGAAAAAGCGGAGCTTGACATCAGTGTGACCAACACGGCCATTAACAATCTGCCAAGCGATGCGGATATTGTCATCACCCACAAAGATTTAACAGACCGCGCGAAAGCAAAGCTGCCGAACGCGACGCACATATCAGTGGATAACTTCTTAAACAGCCCGAAATACGACGAGCTGATTGAAAAGCTGAAAAGTAATCTTATAGAAAGAGAGTATTGTCATGCAAGTACTCGCAAAGGAAACATTAAACTCAATCAAACGGTATCATCAAAAGAAGAGGCTATCAAATTGGCAGGCCAGACGCTGATTGACAACGGCTACGTGACAGAGGATTACATTAGCAAAATGTTTGACCGTGAAGAAACGTCTTCTACGTTTATGGGGAATTTCATTGCCATTCCACACGGCACAGAAGAAGCGAAAAGCGAGGTGCTTCACTCAGGAATTTCAATCATACAGATTCCAGAGGGCGTTGAGTACGGAGAAGGCAACACGGCAAAAGTGGTATTCGGCATTGCGGGTAAAAATAATGAGCATTTAGACATTTTGTCTAACATCGCCATTATCTGTTCAGAAGAAGAAACATTGAACGCCTGATCTCCGCTAAAGCGAAGAAGATTTGATCGCCATTTCAACGAGGTGAACTGACATGATCGCCTTACATTTCGGTGCGGGAAATATCGGGAGAGGATTTATCGGCGCGCTGCTTCACCACTCCGGCTATGATGTGGTGTTTGCGGATGTGAACGAAACGATGGTCAGCCTCCTCAATGAAAAAAAAGAATACACAGTGGAACTGGCGGAAGAGGGACGTTCATCGGAGATCATTGGCCCGGTGAGCGCTATTAACAGCGGCAGTCAGACCGAGGAGCTGTACCGGCTGATGAATGAGGCGGCGCTCATCACAACAGCTGTCGGCCCGAATGTCCTGAAGCTGATTGCCCCGTCTATCGCAGAAGGTTTAAGACGAAGAAATACTGCAAACACACTGAATATCATTGCCTGCGAAAATATGATTGGCGGAAGCAGCTTCTTAAAGAAAGAAATATACAGCCATTTAACGGAAGCAGAGCAGAAATCCGTCAGTGAAACGTTAGGTTTTCCGAATTCTGCCGTTGACCGGATCGTCCCGATTCAGCATCATGAAGACCCGCTGAAAGTATCGGTTGAACCATTTTTCGAATGGGTCATTGATGAATCAGGCTTTAAAGGGAAAACACCAGTCATAAACGGCGCACTGTTTGTTGATGATTTAACGCCGTACATCGAACGGAAGCTGTTTACGGTCAATACCGGACACGCGGTCACAGCGTATGTCGGCTATCAGCGCGGACTCAAAACGGTCAAAGAAGCAATTGATCATCCGGAAATCCGCCGTGTTGTTCATTCGGCGCTGCTTGAAACTGGTGACTATCTCGTCAAATCGTATGGCTTTAAGCAAACTGAACACGAACAATATATTAAAAATCAGCGGTCGCTTTTAAAATCCTTTCATTTCGGACGATGTGACCCGCGTAGCGAGGTCACCTCTCAGAAAACTGGGAGAAAATGTAGACTTGTAGGCCCGGCAAAGAAAATAAAAGAACCGAATGCACTGGCTGAAGGAATTGCCGCAGCACTGCGCTTCGATTTCACCGGTGACCCTGAAGCGGTTGAACTGCAAGCGCTGATCGAAGAAAAGGATACAGCGGCGTACTTCAAGAGGTGTGCGGCATTCAGTCCCATGAACCGTTGCACGCCATCATTTTAAAGAAACTTAATCAATAACCGACCACCCGTGACACAATGTCACGGGCTTTTTACTATCTCGCAATCTAGTATAATAGAAAGCGCTTACGATAACAGGGGAAGGAGAATGACGATGAAACAATTTGAGATTGCGGCAATACCGGGAGACGGAGTAGGAAAGAGGTTGTAGCGGCTGCTGAGAAAGTGCTTCATACAGCGGCTGAGGTACACGGAGGTTTGTCATTCTCATTCACAGCTTTTCCATGGAGCTGTGATTATTACTTGGAGCACGGCAAAAATGATGCCCGAAGATGGAATACATACGCTTACTCAATTTGAAGCAGTTTTTGGGAGCTGTCGGAAATCCGAAGCTGGTTCCCGATCATATATCGTTATGGGGCTGCTGCTGAAATCCGGAGGGAGCTTGAGCTTTCCATTAATATGAGACCCGCCAAACAAATGGCAGGCATTACGTCGCCGCTTCTGCATCCAAATGATTTTTGACTTCGTGGTGATTCGCGAGAACAGTGAAGGTGAATACAGTGAAGTTGTCGGGCGCATTCACAGAGGCGATGATGAAATCGCCATCCAGAATGCCGTGTTTACGAGAAAAGCGACAGAACGTGTCATGCGCTTTGCCTTCGAATT
Annotation dun gnome 10
Identification des gnes codant pour : les ARNr les ARNt les protines
Identification des units de traduction
Identification des units de transcription (promoteur et terminateur)
Pour les gnes codant pour les protines, prdiction fonctionnelle par recherche de similarit de squences (Blast) et classification en grandes classes fonctionnelles (ex: biosynthse des acides amins, mtabolisme nergtique.)
Structure secondaire canonique dune squence dARNt 11
bras amino-acyl
bras D
boucle D
bras anticodon
boucle anticodon
boucle variable
bras T-Y-C
boucle T-Y-C
Gnome de Mycoplasma genitalium 12
Distribution des units de traduction et classification fonctionnelle
Stockage des squences : Banques de squences 13
ID Q8DPI7_STRR6 PRELIMINARY; PRT; 286 AA.AC Q8DPI7;DT 01-MAR-2003, integrated into UniProtKB/TrEMBL.DT 01-MAR-2003, sequence version 1.DT 02-MAY-2006, entry version 10.DE DNA processing Smf protein.GN Name=smf; OrderedLocusNames=spr1144;OS Streptococcus pneumoniae (strain ATCC BAA-255 / R6).OC Bacteria; Firmicutes; Lactobacillales; Streptococcaceae;OC Streptococcus.OX NCBI_TaxID=171101;RN [1]RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA].RX MEDLINE=21429245; PubMed=11544234;RX DOI=10.1128/JB.183.19.5709-5717.2001;RA Hoskins J., Alborn W.E. Jr., Arnold J., Blaszczak L.C., Burgett S.,RA DeHoff B.S., Estrem S.T., Fritz L., Fu D.-J., Fuller W., Geringer C.,RA Gilmour R., Glass J.S., Khoja H., Kraft A.R., Lagace R.E.,RA LeBlanc D.J., Lee L.N., Lefkowitz E.J., Lu J., Matsushima P.,RA McAhren S.M., McHenney M., McLeaster K., Mundy C.W., Nicas T.I.,RA Norris F.H., O'Gara M., Peery R.B., Robertson G.T., Rockey P.,RA Sun P.-M., Winkler M.E., Yang Y., Young-Bellido M., Zhao G.,RA Zook C.A., Baltz R.H., Jaskunas S.R., Rosteck P.R. Jr., Skatrud P.L.,RA Glass J.I.;RT "Genome of the bacterium Streptococcus pneumoniae strain R6.";RL J. Bacteriol. 183:5709-5717(2001).CC -----------------------------------------------------------------------CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/termsCC Distributed under the Creative Commons Attribution-NoDerivs LicenseCC -----------------------------------------------------------------------DR EMBL; AE008487; AAK99947.1; -; Genomic_DNA.DR PIR; A95147; A95147.DR PIR; G98014; G98014.DR GenomeReviews; AE007317_GR; spr1144.DR BioCyc; SPNE1313:SPR1144-MONOMER; -.DR GO;