Interrogation des banques de séquences sur différents...

Post on 30-May-2020

0 views 0 download

Transcript of Interrogation des banques de séquences sur différents...

Interrogation des banques de séquences sur différents serveurs

• EBI SRS : DKFZ

•NCBI Entrez

• ACNUC - WWW-Query

• UCSC

• EnSembl

• ENCODE

Serveurs Généralistes SRS, Entrez, ACNUC

http://srs.ebi.ac.uk → À la retraite :-)

Déplacés ou inactifs!!

le plus complet...

Principes (SRS)

4 niveaux de requêtes : sélection des champs (par défaut l'ensemble des champs

indexés)

• Liens entre les niveaux : AND (par défaut) OR et BUTNOT

• Extension des mots par * (défaut) . (case wildcard *)

• Utilisation des opérateurs logiques : & (et) , | (ou) , ! (but not) dans

un champ

• Opérations plus complexes dans un champ:

(critere1* | critere2*) & ( critere3 ! critere4)

En général les requêtes doivent se faire sur des mots simples

(éventuellement liés par des opérateurs logiques) : "globin & mouse" et

non "globin mouse"

Seuls les champs organismes sont composés : homo sapiens (et non homo

& sapiens)

Certains champs sont numériques : SeqLength, avec bornes max et min

(1000:50000)

• Output fields: Sélection des champs à

visualiser dans la liste résultante

• Display list: Affichage des réponses sous

forme de liste (par défaut) ou de tableau

• Sequence Format: Sélection des formats de

séquences

• Info: Liste et description du champ “Alltext“ ou

du champ sélectionné

Options de sortie communément disponibles

Plutôt qu’un long discours → http://www.dkfz.de/srs/

Travaux Pratiques - Utilisation du système SRS

Q1: Cherchez dans la banque EMBL le mot clef “prion”. Combien de séquences

obtient-on? Étudiez brièvement le contenu d’une fiche EMBL en cliquant sur son

numéro d’accession.

Q2: Cherchez dans la banque EMBL le mot clef “prion” mais uniquement chez

l’homme.

Q3: Réalisez la requête ennoncée en Q2 mais cette fois sur la section

SWISSPROT. Combien de séquences obtient-on? Qu’apprend-on en lisant la

fiche SWISSPROT P04156?

http://www.dkfz.de/srs

http://www.dkfz.de/srs

Liste sélectionnée :Affichage sous forme de tableau

Affichage de la liste résultante :un clic sur une ligne de

la liste visualise le document associé

Naviguer de base en base

Sélection des banques pour établir des liens avec une vue particulière (ici la liste seule des identifieurs)

Par défaut : recherche de liens vers les banques cibles

L'opération réverse (non symétrique) permet de sélectionner les entrées dans les banques cibles qui ont comme liens

l'ensemble source)

Historique des “Queries” : Results

Q5 > SwissProt

construction d'équation permettant l'obtention de cibles :

Q5 & Q6

Q5>SwissProt > PDB

SwissProt >PDB ....

http://www.ebi.ac.uk/services/dna-rna

https://www.ebi.ac.uk/ena

https://www.ebi.ac.uk/ena/data/view/BN000065

https://www.ebi.ac.uk/tools/dbfetch

https://www.ncbi.nlm.nih.gov/

Plutôt qu’un long discours → https://www.ncbi.nlm.nih.gov/

Travaux Pratiques - Utilisation du système ENTREZ

Q1: Cherchez les séquences protéiques de prions chez l’homme. Combien de

séquences distinctes obtient-on?

Q2: Comment expliquer la différence avec la recherche SWISSPROT sur le

système SRS?

Q3: Comment faire des requêtes complètes avec ENTREZ (opérateurs logiques,

contraintes de champs…)?

Interrogation de Protéines : le Prion

Séquences sous brevet

Accès à des outils de comparaison - BLAST

Recherche dans la section “Gene”

Contexte Génomique

Pour aller plus loin - Les liens vers les autres ressources...

http://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=announcement

Repository NGS sequencing

http://doua.prabi.fr/search

ACNUC - WWW-Query

Banques généralistes + banques locales

(HoVerGen, HoBacGen, HoGenome,

Phever…)

Bases de données d’expression ArrayExpress, GEO

http://www.ebi.ac.uk/arrayexpress/

http://www.ncbi.nlm.nih.gov/geo/

Serveurs orientés protéines Expasy, Uniprot, Prosite, PFAM

http://www.expasy.org

http://www.uniport.org

http://www.uniport.org

http://pfam.xfam.org/

Autres serveurs UCSC Genome Browser, Ensembl, Encode

https://genome.ucsc.edu

https://genome.ucsc.edu

http://www.ensembl.org

https://www.encodeproject.org/

https://www.encodeproject.org/biosamples/ENCBS220III/

EnCODE Statistiques

Homo sapiens - Statistiques

RNAseq Humain

Workflows d’analyses et données

Workflows d’analyses et données