BIOS – [email protected] – 2009.11.25 Mise en œuvre Projet RosEST...

12
BIOS – [email protected] – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination Mohammed Bendahmane, ENS Lyon Jerome Gouzy, LIPM

Transcript of BIOS – [email protected] – 2009.11.25 Mise en œuvre Projet RosEST...

Page 1: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

Mise en œuvreProjet RosEST

DéveloppementsSebastien Carrere, LIPM

Thibaut Hourlier, LIPM

CoordinationMohammed Bendahmane, ENS Lyon

Jerome Gouzy, LIPM

Page 2: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

CalendrierCalendrier

► 18/05/2009 : Mail de Fabrice contacté par M. Bendahmane18/05/2009 : Mail de Fabrice contacté par M. Bendahmane

► 16/07/2009 : Réunion à Toulouse MB, JG, SC16/07/2009 : Réunion à Toulouse MB, JG, SC Présentation du projet BIOS et portail Tournesol (JG,SC)Présentation du projet BIOS et portail Tournesol (JG,SC) Présentation du projet RosEST (MB)Présentation du projet RosEST (MB)

► 27/08/2009 : Fin clustering + Mapping Solexa (JG) 27/08/2009 : Fin clustering + Mapping Solexa (JG)

► 09/09/2009 : Première version du portail R.chinensis09/09/2009 : Première version du portail R.chinensis

► 02/10/2009 : Livraison du portail + BIOS-ROSA02/10/2009 : Livraison du portail + BIOS-ROSA

Page 3: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

BIOS / RNA-seqBIOS / RNA-seq► DonnéesDonnées

Pas de génome de référencePas de génome de référence Très peu de données au NCBITrès peu de données au NCBI

• 1banque EST 1794 ESTs1banque EST 1794 ESTs

• 11 mRNA11 mRNA 1 librairie 454 1 librairie 454 13 librairies Solexa13 librairies Solexa

► AnalysesAnalyses

Assemblage des données Solexa avec edenaAssemblage des données Solexa avec edena Merging des clusters edena avec les 454 + GenBankMerging des clusters edena avec les 454 + GenBank

→ → CompendiumCompendium Clustering TGICL → UniGeneClustering TGICL → UniGene Prediction de peptides FRAMEDPPrediction de peptides FRAMEDP Mapping Solexa sur les UniGene (max: 3MM; best)Mapping Solexa sur les UniGene (max: 3MM; best)

Page 4: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

► RésultatsRésultats

198 132 clusters198 132 clusters Filtre 2 membres + consensus > 100nt → 81 967 contigsFiltre 2 membres + consensus > 100nt → 81 967 contigs 67 284 codent pour un peptide au moins67 284 codent pour un peptide au moins Mapping Solexa sur les 81.967 contigs:Mapping Solexa sur les 81.967 contigs:

• 41% des reads sont mappées41% des reads sont mappées• 55.952 contigs ont au moins 1 lecture Solexa55.952 contigs ont au moins 1 lecture Solexa• 31.715 contigs ont au moins 10 lectures Solexa31.715 contigs ont au moins 10 lectures Solexa• 11.994 contigs ont au moins 50 lectures Solexa11.994 contigs ont au moins 50 lectures Solexa

BIOS / RNA-seqBIOS / RNA-seq

Page 5: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

PortailPortail► Nécessité d'accéder aux annotations fonctionnellesNécessité d'accéder aux annotations fonctionnelles► Approche gène candidatApproche gène candidat

► Pas/peu de ressources existantesPas/peu de ressources existantes

GDR GDR

Page 6: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

Portail - analysesPortail - analyses► ClustersClusters

FrameDPFrameDP Blastn vs. contigs R.chinensis Blastn vs. contigs R.chinensis Blastx vs. TAIR9Blastx vs. TAIR9 Blastx « PubMed » Blastx « PubMed » Blastx vs. Swiss-ProtBlastx vs. Swiss-Prot

► PeptidesPeptides

Analyse en domaines InterProAnalyse en domaines InterPro• annotation automatique, termes GO associésannotation automatique, termes GO associés

Blastp vs. peptides R.chinensis (familles multigeniques Blastp vs. peptides R.chinensis (familles multigeniques potentielles) potentielles)

Blastp vs. TAIR9Blastp vs. TAIR9 Blastp « PubMed » Blastp « PubMed » Blastp vs. Swiss-ProtBlastp vs. Swiss-Prot

Page 7: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

Portail - renduPortail - rendu

Page 8: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

Page 9: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

Portail – outilsPortail – outils

Page 10: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

IntégrationIntégration► Portail → BIOSPortail → BIOS

Page 11: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

IntégrationIntégration► BIOS → PortailBIOS → Portail

Page 12: BIOS – Sebastien.Carrere@toulouse.inra.fr – 2009.11.25 Mise en œuvre Projet RosEST Développements Sebastien Carrere, LIPM Thibaut Hourlier, LIPM Coordination.

BIOS – [email protected] – 2009.11.25

BilanBilan

• Sur 3 mois on peut contruire une solution relativement complète Sur 3 mois on peut contruire une solution relativement complète lorsque la quantité de données n’est pas gigantesque.lorsque la quantité de données n’est pas gigantesque.

• pour le moment pas vraiment de feedback utilisateur, on avait pour le moment pas vraiment de feedback utilisateur, on avait prévu de faire une formation en octobre mais pas eu le tempsprévu de faire une formation en octobre mais pas eu le temps

• Les portails “annotation fonctionnelle” sont indispensables pour Les portails “annotation fonctionnelle” sont indispensables pour exploiter les données.exploiter les données.– Ils sont généralement sites spécifiques (chacun a plus ou moins le sien)Ils sont généralement sites spécifiques (chacun a plus ou moins le sien)

– ils doivent être couplés à BIOS (authentification croisée)ils doivent être couplés à BIOS (authentification croisée)

Next step: automatisation de la génération du portail pour pouvoir proposer Next step: automatisation de la génération du portail pour pouvoir proposer une solution complète (a discuter si c’est dans ou hors du scope de BIOS)une solution complète (a discuter si c’est dans ou hors du scope de BIOS)