Compétences AMU dans les Grandes Masses de Données · • Pôles de Recherche Interdisciplinaires...
Transcript of Compétences AMU dans les Grandes Masses de Données · • Pôles de Recherche Interdisciplinaires...
CompétencesAMUdansles
GrandesMassesdeDonnéesAnimation«BigData»desPolesdeRecherche
interdisciplinairesetintersectorielsdel’AMU
Journée:"SquareKilometerArray":desdéfis
EnergétiqueetBigDatahorsducommun
LAM16Mai2018
(C.Diaconu)
16/05/18 1
«BigScientificData»• Larechercheest«digitale»
– Augmentationdramatiquedelaquantité/complexitédesdonnées
TelescopeCollectingArea
BC72
E691
E665
E791E831
NA48
ALEPH
RHIC
JLAB
ATLAS/CMS
LHC2012
Babar
H1
BELLECDFD0
LHCPhase1
LHCPhase2
10
100
1000
10000
100000
1000000
10000000
100000000
1E+09
1E+10
1980 1990 2000 2010 2020 2030
C.Diaconu 2
TravailauseindePREDON
HighEnergyPhysics
Data[Mb]
Communauté«BigData»AMU
3
Démarrageen2014del’Animation«BigData»AMUsouslacoupedesPR2I
~30contactpersonnesdansleslaboratoriesAMU
«GreyBookBigDataAMU»
Réponsesausondagesurles
prioritédeslaboratoiresdans
l’utilisationdesdonnéesmassives
CompétencesetcomplémentaritéAMU
16/05/18 4
QuantitéComplexitéDiversitéTraitementAccèsRe-utilisationPréservation 0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
Quantité/
Infrastructure
Complexité
Diversité
TraitementAccès
Re-utilisation
Préservation
CPPM
LAM
IMBE
Astrophysique-LAM/CeSAM:Gestiondemassesdedonnéesetdedonnéesdistribuées
(ObservatoireVirtuel)
CalculpourleLHCCERNEPDepartment-R&Donexperimentaltechnologies–Workshop,
G.Stewart,A.Salzburger(CERN)https://indico.cern.ch/event/696066/
ApprentissageautomatiquePhysiquedesparticulesauLHC
Apprentissageprofondpourlarecherchedephénomènesphysiquesnouveauxàpartirdesdonnéesmassivescollectéesparl’expérienceATLASauGrandCollisionneurdeHadrons(LHC)auCERN.(sujetdethèse–CPPM-LIS)
GénétiqueRecherchedemaladiesraresProfesseurChristopheBEROUD
LaboratoiredeGénétiqueMoléculaire
HôpitalTIMONEEnfants
MédecineMethodologiepouridentifierdesstructuresdanslesbigdataReynieretal.
Compétences
Dirac
ProjectM3AMUfundedbyCPER/FEDER/CD13• HPC(mésocentre)andHTC(grille)inonecenter,storageclosetothecomputingnodes
• DIRACinterware:cloudcomputing,extensiontoGPU
CCIAM:CentredeCalculIntensifd’AixMarseilleUMS(encoursd’installation)• MiseenœuvreduprojetM3AMU
• Participationàlapolitiqued’établissementenmatièredecalculintensif
• Mutualisationdesressources
DataCenterRégionalAMU:labellisationencours
Infrastructuresmutualiséesàl’AMU
Unenvironnementlocal
- MEETUP
- https://www.meetup.com/fr-FR/Machine-learning-Aix-Marseille/
- https://www.meetup.com/fr-FR/MongoDB-Aix-Marseille/
etuneparticipationnationale
• Recherche
– ProjetsMASTODONS
– ResearchinBigData
• http://www.cnrs.fr/mi/spip.php?article985&lang=fr
– PEPSAstro-Informatique(http://www.cnrs.fr/mi/IMG/pdf/astro-info2018_tableau_web.pdf)
– BIGSKYEARTH:EuropeanCOSTProgram(EuropeanCooperationinScienceandTechnology)
- BigDataErainskyandEarthObservationhttp://bigskyearth.eu/
– CenterforAstrostatistics(PennState)http://astrostatistics.psu.edu/
16/05/18 7
Participationauxorganisations
structurantes
• COSMOSTAT(J.L.Starck)
• http://www.cosmostat.org/
• MADICS(http://www.madics.fr/)
• MassesdeDonnées,InformationsetConnaissancesenSciences
• Formations:
– http://www.madics.fr/reseaux/formation/liste-des-masters-du-domaine/
• ARQUADS:ActiondeRecherchesurlaQualitédesDonnées
Scientifiques
– http://www.madics.fr/actions/actions-en-cours/arquads/
• MAESTRO:MassededonnéesenAstrophysique:
– http://www.madics.fr/actions/actions-en-cours/maestro/
• PlateformesTypeGALACTICA
• AlgorithmesdetraitementsBigData
• Optimisationdetraitementetdestockage
16/05/18 8
etuneparticipationnationale
Formation
• ASTROINFO2018
• June25-29-Marseille
• https://astroinfo2018.sciencesconf.org/myspace/index
• STAT4Astro
• every2years(nextin2019)
• https://stat4astro2017.sciencesconf.org/
• CosmoStatandAstronomicalDataanalysis
• http://ada.cosmostat.org/
• http://cosmo21.cosmostat.org/
• Astrostatistics
• http://astrostatistics.psu.edu/datasets/index.html
16/05/18 9
VersunestructurationAMU
• PôlesdeRechercheInterdisciplinairesetIntersectoriels(PR2I)• PR2ISciencesetTechnologiesAvancées(P.Delaporte(LP3))
• Bigdata–MachineLearning(C.DiaconuCPPM))
• Propositiond’InstitutAMUregroupantlesactivitésderecherche
utilisantdonnéesscientifiquesmassivesàl’AMU
16/05/18 10