AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

39
AMDA AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr Vincent Génot, C. Jacquey, E. Budnik, R. Hitier, M. Bouchemit, M. Gangloff, E. Pallier

description

AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr Vincent Génot, C. Jacquey, E. Budnik, R. Hitier, M. Bouchemit, M. Gangloff, E. Pallier. Evolution du CDPP. Créé en 1998 par l’INSU et le CNES Missions : - PowerPoint PPT Presentation

Transcript of AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Page 1: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

AMDAAMDA

Automated Multi Dataset Analysis

un outil du CDPPcdpp-amda.cesr.fr

Vincent Génot, C. Jacquey, E. Budnik, R. Hitier, M. Bouchemit, M. Gangloff, E. Pallier

Page 2: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Evolution du CDPP

Créé en 1998 par l’INSU et le CNES

Missions:- Archivage à long terme des données obtenues par des expériences à partcipation française- Valorisation des données, SVA (Services à Valeur Ajoutée)- Projets d’interopérabilité, Observatoires Virtuels

Juin 2005 >: extension des objectifs, accrétion E. Budnik et C. Jacquey- Mise à disposition de données “fraiches” (THEMIS, CLUSTER,..)- Mise à disposition à des données complémentaires- Développement d’outils en ligne génériques et automatisés- Animation et accueil scientifique autour de ses services

présentation K. Bocchialini

Page 3: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Plan de l’exposé

- motivation, génèse, objectifs du projet

- le coeur d’AMDA : paramètres et tables d’événements

- vers une insertion dans l’OV : connexion à des bases extérieures

- la science avec AMDA

Page 4: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Motivation / génèse du projet

- Initialement pensé pour valoriser les données du CDPP

- Une première phase : réutilisation de l’existant, test d’intégration

- Idée de l’espace de travail qui centralise toute la production de l’utilisateur

- Construit autour d’une base + outil de visualisation développé pour la mission magnétosphérique CLUSTER (DD-Cluster, interface web)

Développement :

- Principalement 2 développeurs “dans les murs” (IDL, C, Fortran, javascript)- 1ère version en quelques mois-Amélioration constante du prototype en relation avec les avis du Comité des Utilisateurs (CU) du CDPP

-Nouvelles fonctionnalités-Intégration de standards (SPASE)-Ouverture vers les VO

Page 5: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Spécificités / contraintes de la discipline

1/+ Les données archivées sont des scalaires, des vecteurs, des tenseurs, des spectres, ... ordonnés par le temps

- Il n’existe pas un format de données standard adopté par tous

2/+ Il existe une multitude de bases de données spécialisées

-Le travail scientifique requiert une confrontation des résultats de plusieurs instruments simultanément : études multi-échelles, en météorologie spatiale, héliophysique, planétologie comparée

Nécessité d’un outil intégré (gain de temps et d’énergie)

Nécessité d’un moyen de communiquer l’information (entre utilisateurs et entre bases)

Page 6: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

End products : - simple browse- data download- generate and export time tables (and catalogues)- perform statistics- extract sub-databases

AMDA : Objectives

Ease manipulation of data from heterogeneous origins

PlotCombineSearch

MissionInstrument

Model

LocalRemote

User owned

Page 7: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

1/ Activité

2/ Données

3/ Période temporelle

Débuter avec AMDA

4/ Transformations

Page 8: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Le paramètre :

Un paramètre est une série temporelle :- champ magnétique ou électrique- moment particule- indice- ...- une combinaison

valide sur un intervalle de temps

à une résolution temporelle donnée

utilisé pour :- la représentation visuelle- la recherche conditionnelle- le téléchargement, ...

17/11/199431/12/2005Sampling 4s

L’organisation en fichiers dans l’archiveest cachéée à l’utilisateur

Page 9: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Contruction d’un paramètre 1/2

clics

Résolution temporelle

Nom du paramètre

Description

Page 10: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

nouveau paramètre dans l’espace de travail

Le nouveau paramètre est maintenant un élément virtuel de la base de données. Il sera calculé à la volée seulement quand il sera demandé pour un

tracé, une recherche conditionnelle, un téléchargement

Des paramètres de- différentes missions- différents instruments- avec différentes résolutionpeuvent être combinés

Contruction d’un paramètre 2/2

Base locale

Espace utilisateur

Page 11: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Les tables d’événements 1/2

-Les tables d’événements (time tables, event lists) sont une collection de temps quand quelque chose se passe ou d’intervalles quand une condition est vérifiée

-Elles sont produites et gérées “manuellement” par les scientifiques pour leur usage propre ou celui d’une communauté restreinte

-AMDA augmente les potentialités de ce vecteur d’information en offrant un outil générique pour créer, gérer et communiquer ces objets

Les tables d’événements peuvent être utilisées pour :- extraire une sous base de données,- exécuter des traitement massifs ou interactifs,- créer des catalogues,- servir de référence à la communauté

Page 12: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Créer une table d’événements : 1- Recherche conditionelle

Editer une condition avec des opérateurs/fonctions mathématiques

clicsT/T// > 1

Definir un intervallede temps

ou utiliser une autre table d’événements

Page 13: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Exemple: recherche des événements de courants de queue “encerclés” par CLUSTER

Test:• X1< -10 Re • BX1 * BX2 * BX3 * BX4 > 0• min([BX1 BX2 BX3 BX4]) < 0• max([BX1 BX2 BX3 BX4]) > 0

• position : dans la queue magnétosphérique• 2 satellites sont au dessus de la couche de courant et 2 autres en dessous

champmagnétique

champmagnétique

X coordinate

cf exposé de C. Jacquey

Page 14: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Créer une table d’événements : 2- Inspection visuelle

Les intervalles intéressants sont sélectionnés par clics et ajoutés à la table d’événements

Page 15: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

The time table may be editedin the user workspace

Page 16: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Tables may be exported in

VOTable format

Time Table format

Page 17: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

VOTable latest release: Version 1.1 - August 11, 2004

VO standard and as such supported by IVOA

VOTable is designed as a flexible storage and exchange format for tabular data, with particular emphasis on astronomical tables.

Page 18: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Complex tables (catalogues) may be produced with:- multiple time tags- associated parameters : average, max, min- localisation information- user supplied classification indices

Extension des tables d’événement : catalogue

Page 19: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Temps début Temps fin P1 : <Bmag>

P2 : <N> P3 : <user_param>

P4 :

User_class

P5 : temps

2008-01-29T

08:30:30

2008-01-29T

08:40:30

6. 12. 44. 2 2008-01-29T08:32:30

2008-01-29T

09:30:30

2008-01-29T

10:30:30

7. 10. 45. 1 2008-01-29T10:05:30

… … … … … … …

++

++

+++

+

+

++

+

++

+

+

++

+++

+P2

P1

P3

P1

++

+ + ++++

+++

Table d’événements Paramètres statistiques, classification, temps

Visualisation graphique :

Extension des tables d’événement : catalogue

Page 20: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Tables d’événements 2/2

- La description complète d’une table d’événements peut être compliquée-sources de données : origine, résolution, modes, ...-critères de sélection : mathématiques / visuels-paramétrage des méthodes utilisées (filtre temporel, modèles)-...

+ Les tables d’événements peuvent être un vecteur d’échanges entre centres de données et entre utilisateurs

- collaboration entre l’archive CLUSTER (CAA), CDPP et QSAS, CL- 1ère réunion : 25 et 26 février 2008- définition : time format (ISO), table format (VOTable)- mise en place d’outils de gestion des tables d’événements :

- union, intersection, extension, shift, upload- réflexion sur les catalogues

Page 21: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Service 1

Service 2

Magnetospheric data

Service 3

Solararchive

IonosphereThermosphere

archive

CDAWebCDPP CAAHR

archive 2

Time table- -- -- -

AMDA

What were the input conditions ?

What are the consequences ?

Time table circulation in a multi-archive environment

applying delay

QSAS

Page 22: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Commande de données directe à l’archive CLUSTER (CAA)

CAA : à terme, archive de toutes les données haute résolution de CLUSTER

Page 23: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Connexion à des bases externes

1. Lorsqu’une base est connectée à AMDA toutes les données de la base peuvent être visibles dans AMDA (FTP, WebService)

2. L’utilisateur définit le groupe de paramètres de la base externe qu’il veut analyser (Interface de construction d’arbre)

3. A la volée, les paramètres sont directement intégrés dans AMDA afin d’être manipulés comme des paramètres de la base locale

L’utilisateur peut se construire facilement sa base de données personnelle à partir de bases existantes

base 1

base 2base utilisateur

Page 24: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Interface de construction de l’arbre de données extérieures

Base externe Arbre des données choisies par l’utilisateur

- mise à jour quotidienne des données disponibles sur les bases distantes- pas de notion de fichier pour l’utilisateur- AMDA peut fonctionner sans base locale

intégration dans les Observatoires Virtuels

Page 25: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Arbre de données extérieures

Base locale

Extrait de la base externeLes paramètres sont disponibles pour des tracés, la recherche conditionnelle, ... à la volée, ce qui implique :-le téléchargement des données (par bloc de 3j min)-la transformation de format-la création du paramètre AMDA

Page 26: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Bases accessibles à travers AMDA

Actuellement :

- CDAWeb (multi-missions)- MAPSKP (Cassini: MAG/CAPS/RPWS/TRAJ, démonstrateur Europlanet)

Prochainement :

- Themis (base miroir au CESR)- Cluster Active Archive (CAA)- SKR (Cassini: RPWS/HFR)- Venus Express (champ magnétique)

Page 27: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Baselocale

AMDA

Système

Constructeur de param

ètres

CDAWeb

CDPP

MAPSKP

Connexion à des bases externes

Connecteur standardisé = méthodes de requête (SOAP) + description des données (SPASE, IVOA)

Connecteur « maison » others

Page 28: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Production scientifique avec AMDAAnalyses statistiques multi-missions

• Principe d’utilisation-Définition d’un critère sélectif sur les données

-Critère mathématique-Critère visuel

-Création de table d’événements-Itération avec combinaison possible de critères

-Extraction des données et travail hors-ligne

• Exemples-Multi-mission study of plasma sheet conditions minutes before substorm onsets (Jacquey et al.)-The active plasma sheet: definition of 'events' and statistical analysis (Louarn et al.)-Statistical study of Alfvénic fluctuations in the Earth magnetosheath (Alexandrova et al.)-Statistical study of mirror mode fluctuations in the Earth magnetosheath (Génot et al.)

• Collaborations- Visites scientifiques au CDPP- Organisation d’ateliers : - Themis (novembre 2007)

- magnétogaine (courant 2008)

Page 29: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Statistics of mirror mode events in the Earth’s magnetosheath

F=1

F=0

F=0

F=1

Relative number ofmirror mode events

Total number of 5 minmagnetosheath crossings

magnetopause

shock

Génot et al. 2008

Page 30: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Statistical study of Alfvénic fluctuations in the Earth magnetosheath

O. Alexandrova(1), E. Budnik(2), V. Génot(2),

C. Lacombe(1), C. Jacquey(2), I. Dandouras(2), E. Lucek(3)

(1)LESIA/CNRS, Observatoire de Paris, France

(2)CESR/CNRS, Toulouse, France (3)Imperial College, London, UK

EGU General AssemblyVienna, Austria, 15-20 April 2007

Condition = AB>1

magnetopause

shock

Page 31: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

... other ways to make science with AMDA

1/ Multi-mission study of plasma sheet conditions minutes before substorm onsets (Jacquey et al.) : - 25 years of data : ISEE, IMP, IRM, POLAR, GEOTAIL, WIND, ACE, CLUSTER- combined approach:

-automatic search = mathematical description of the temporal change in the AL index-semi automatic = visual inspection to classify cases in different catalogues

2/ The active plasma sheet: definition of 'events' and statistical analysis (Louarn et al., 2006, ICS8)- define conditions : a lower threshold for the low frequency magnetic fluctuations and a minimal duration for each events- produce time tables accordingly- download a wide (resampled) dataset and work offline

Page 32: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Actions dans le cadre de Europlanet / FP6

Registry :

-Description SPASE of several planetary plasma data (MAPSKP, VEX, MEX)-Building a registry-Building a search engine-Goals: demonstration and experimentation (standard versus user requirements, SPASE extensions, …)

Démonstrateur scientifique:

-Based on AMDA-Using distant data (MAPSKP, VEX-MAG, HST) and local data-High level tools and functionalities-Goals: demonstration and experimentation

Page 33: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

AMDA est un outil au service de la communauté

vos commentaires, critiques et contributions sont les bienvenus ... ... et même nécessaires !

- [email protected] forum (lien “feedback” à partir de l’interface web)- twiki (contributions aux nouvelles fonctionnalités par ex.)- contact avec le CU (présidé par J.L. Pinçon)

permet de définir les priorités de développement scientifique en accord avec le CU en interne, permet de définir les évolutions d’architecture nécessaire

Démonstration d’AMDA à la session poster

- Si le réseau fonctionne- Si tout le monde n’est pas connecté en même temps !

cdpp-amda.cesr.fr

Page 34: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

...

Page 35: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Application du démonstrateur sur le cas scientifique“Solar wind / saturn magnetosphere interaction and auroras”

Prototype de ‘Registry’Recherche de la localisation de la resource

(MAPSKP, HST aurora, VEX, ACE)

Access, extraction of the targeted data (distant or local)

Integrated analysis

user

MAPSKP

Base locale

VEX-MAGGraz

HST

Request

AMDA/Planéto

Page 36: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

AMDA-NG

AMDA “refactoring”ModularisationDocumentationFiabilisationFonctionnement “universel” (indépendent de la plate-forme, de l‘OS, du navigateur, …)

Mise en place de nouvelles fonctions Fonctions temporelles Time-Table Manager Fonctions physiques…

Développement des capacités d’interopérabilité d’AMDA SPASE-based connector IVOA-based connector Time-Table exchange

Page 37: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Architecture d’AMDA

Page 38: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

Contexte national

- Mission du CDPP : valoriser les données de missions satellites françaises ou à participation française dans le domaine de la physique des plasmas

- Pour dynamiser l’utilisation du centre : nécessité de dépasser le cadre de la “simple” archive

développement d’un outil au service de la communauté

Contexte international

- Les observatoires virtuels en physique spatiale sont balbutiants

- Implication du CDPP dès l’origine dans la mise au point de standard (modèle de données SPASE)

- Implication dans Europlanet

“On peut se mettre dans la course”

Page 39: AMDA Automated Multi Dataset Analysis un outil du CDPP cdpp-amda.cesr.fr

http://vspo.gsfc.nasa.gov/websearch/dispatcher

An example of registry for space physics: VSPO