PROPOSITIONS DE STAGES -

48
Direction des applications militaires Centre DAM Île de France INFORMATIQUE D’ENTREPRISE INFORMATIQUE SCIENTIFIQUE SIMULATION NUMERIQUE SECURITE INFORMATIQUE Date de diffusion : septembre 2018 Commissariat à l’énergie atomique et aux énergies alternatives Centre DAM Île de France - Bruyères-le-Châtel – F- 91297 Arpajon Cedex Tél : (33) – 01 69 26 40 00 Établissement public à caractère industriel et commercial R. C..S. PARIS B 775 685 019 PROPOSITIONS DE STAGES 2019 AU CEA/DAM ÎLE DE FRANCE

Transcript of PROPOSITIONS DE STAGES -

Page 1: PROPOSITIONS DE STAGES -

Di rect ion des appl icat ions mi l i ta i res Centre DAM Î le de France

INFORMATIQUE D’ENTREPRISE INFORMATIQUE SCIENTIFIQUE

SIMULATION NUMERIQUE SECURITE INFORMATIQUE

Date de diffusion : septembre 2018

Commissariat à l’énergie atomique et aux énergies alternatives Centre DAM Île de France - Bruyères-le-Châtel – F- 91297 Arpajon Cedex

Tél : (33) – 01 69 26 40 00 Établissement public à caractère industriel et commercial

R. C..S. PARIS B 775 685 019

PROPOSITIONS DE STAGES 2019

AU CEA/DAM ÎLE DE FRANCE

Page 2: PROPOSITIONS DE STAGES -
Page 3: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

TABLE DES MATIERES 1 Les stages proposés en un coup d’oeil ..................................................................... 4

2 Le CEA ...................................................................................................................... 5

3 Le CEA/DAM ............................................................................................................. 6

4 Le centre DAM - Ile de France .................................................................................. 8

5 Le CAMPUS TERATEC .......................................................................................... 10

6 Les activités informatiques au CEA/DAM – Ile de France ....................................... 12

7 Sites utiles ............................................................................................................... 12

8 Comment postuler pour un stage ? ......................................................................... 12

9 Les thématiques des stages ................................................................................... 13

10 Les stages en informatique d’entreprise ................................................................. 14

11 Les stages en informatique scientifique .................................................................. 17

12 Les stages en simulation numérique ....................................................................... 31

13 Les stages en sécurité informatique ....................................................................... 42

Page 3

Page 4: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

1 LES STAGES PROPOSES EN UN COUP D’OEIL

Thème Titre Référence Formation Durée (mois)

Inform

atique

d'entre

prise

DevOps : automatisation des tests sur l’application PLM IE-19-01 Bac + 4/5 5 à 6

DevOps : intégration continue, analyse et qualité de code IE-19-02 Bac + 4/5 5 à 6

Développement d’un outil de gestion du parc de postes Windows DAM IE-19-03 Bac + 4/5 3 à 6Inform

atique

d'entre

prise

Evaluation de solutions de NAS open source IS-19-01 Bac + 4/5 3 à 6

Interface web de visualisation de filesystem IS-19-02 Bac + 4/5 3 à 6

Conception d'une nouvelle architecture de tests pour le projet open source Lustre IS-19-03 Bac + 4/5 4 à 6

Développement d'une fonctionnalité de classes de service dans un logiciel de stockage

IS-19-04 Bac + 4/5 4 à 6

Bibliothèques d'accès à des nouvelles technologies de stockage IS-19-05 Bac + 4/5 4 à 6

Développement d'une interface S3 pour un logiciel de stockage objet distribué

IS-19-06 Bac + 4/5 4 à 6

Développement d'un mécanisme de versionnage de données IS-19-07 Bac + 4/5 4 à 6

Inform

atique

scien

tifique

Prédiction du taux de dé-duplication pour du stockage massif de données IS-19-08 Bac + 4/5 4 à 6

Définition d'un benchmark générique pour la validation de cluster IS-19-09 Bac + 4/5 4 à 6Inform

atique

scien

tifique

Génération de rapports de profilage pour SELFIE IS-19-10 Bac + 4/5 4 à 6

Génération d'un simulateur de communications MPI IS-19-11 Bac + 4/5 4 à 6

Etude et amélioration d’outils de configuration de fabrics InfiniBand IS-19-12 Bac + 4/5 4 à 6

Etude et intégration d’une solution de monitoring InfiniBand IS-19-13 Bac + 4/5 4 à 6

Evaluation du routage sur les réseaux d’interconnexion de clusters de calcul (HPC)

IS-19-14 Bac + 4/5 4 à 6

Algorithmes de reconstruction d’interface par Machine Learning et Apprentissage Supervisé

SN-19-01 Bac + 4/5 4 à 6

Opérateur de diffusion vectoriel pour l’hydrodynamique lagrangienne turbulente SN-19-02 Bac + 5 5 à 6

Optimisation géométrique de maillages hexaédriques SN-19-03 Bac + 5 5 à 6

Métriques orientées pour maillages quadrangulaires surfaciques SN-19-04 Bac + 5 5 à 6

Simulat

ion

numérique

Etude et implantation d’algorithmes parallèles de génération d’hexaèdres par combinaison de tétraèdres SN-19-05 Bac + 5 5 à 6

Equilibrage de charge dynamique pour la visualisation scientifique SN-19-06 Bac + 5 5 à 6

Etude et évaluation de la structure de donnée SVDAG et ses variantes pour le RayTracing en visualisation scientifique SN-19-07 Bac + 5 5 à 6

Etude et implémentation d’algorithmes massivement multi-threads et GPU en visualisation scientifique SN-19-08 Bac + 5 5 à 6

Algorithme concurrent d’appariement de sommets dans un graphe SN-19-09 Bac + 5 5 à 6

Simulateur des flux de données des codes de calcul HPC SN-19-10 Bac + 5 5 à 6

Couplage d’un framework de visualisation in-situ avec un code de calcul hydrodynamique HPC

SN-19-11 Bac + 5 5 à 6

Simulat

ion

numérique

R&D autour de la cartographie réseau SI-19-01 Bac + 5 3 à 6

Dé-obscurcissement de JavaScript SI-19-02 Bac + 5 5 à 6

Sécurit

é

inform

atique

Reconnaissance automatique de fonctions par effets de bord SI-19-03 Bac + 4 3

Techniques de fuzzing et d'audit de code appliquées à l'évaluation de la sécurité de systèmes de fichiers réseau

SI-19-04 Bac + 5 5 à 6Sécurit

é

inform

atique

Technique de reverse engineering de protocole réseaux propriétaires par émulation de binaires et data slicing

SI-19-05 Bac + 5 5 à 6

Page 4

Page 5: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

2 LE CEA

Acteur majeur de la recherche, du développement et de l'innovation, le Commissariat à l’énergie atomique et aux énergies alternatives intervient dans quatre domaines :

• la défense et la sécurité,

• les énergies nucléaires et renouvelables,

• la recherche technologique pour l’industrie,

• la recherche fondamentale (sciences de la matière et sciences de la vie).

S’appuyant sur une capacité d’expertise reconnue, le CEA participe à la mise en place de projets de collaboration avec de nombreux partenaires académiques et industriels.

Le CEA est implanté sur 9 centres répartis dans toute la France. Il développe de nombreux partenariats avec les autres organismes de recherche, les collectivités locales et les universités. A ce titre, le CEA est partie prenante des alliances nationales coordonnant la recherche française dans les domaines de l’énergie (ANCRE), des sciences de la vie et de la santé (AVIESAN), des sciences et technologies du numérique (ALLISTENE), des sciences de l’environnement (AlIEnvi) et des sciences humaines et sociales (ATHENA).

Reconnu comme un expert dans ses domaines de compétence, le CEA est pleinement inséré dans l'espace européen de la recherche et exerce une présence croissante au niveau international.

Le CEA compte 16 010 techniciens, ingénieurs, chercheurs et collaborateurs pour un budget de 4,1 milliards d'euros (chiffres publiés fin 2016).

ORGANIGRAMME DU CEA

Page 5

Page 6: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France 3 LE CEA/DAM

Une direction au service de la dissuasion La Direction des applications militaires (DAM) du CEA, a pour mission de concevoir, fabriquer, maintenir en condition opérationnelle, puis démanteler les têtes nucléaires qui équipent les forces nucléaires aéroportée et océanique françaises. La DAM est chargée de la conception et de la réalisation des réacteurs et de cœurs nucléaires équipant les bâtiments de la Marine nationale, sous-marins et porte-avions. Elle apporte son soutien à la Marine nationale pour le suivi en service et le maintien en condition opérationnelle de ces réacteurs. La DAM est également responsable de l'approvisionnement des matières nucléaires stratégiques pour les besoins de la dissuasion. Dans un monde en profonde mutation, la DAM contribue aussi à la sécurité nationale et internationale à travers l’appui technique qu’elle apporte aux autorités, pour les questions de lutte contre la prolifération nucléaire et le terrorisme et de désarmement. Depuis le transfert du centre de Gramat en 2010 de la Direction générale de l’armement au CEA, la DAM apporte son expertise à la Défense dans le domaine de l’armement conventionnel. Une direction ouverte à la recherche Le partage national et international des connaissances (lorsqu’il est possible), la confrontation à l’évaluation scientifique extérieure, l’intégration à des réseaux de compétences constituent des gages de crédibilité scientifique. Les équipes de la DAM réalisent chaque année environ 2000 publications et communications scientifiques. Cette ouverture de la DAM passe également par la mise à la disposition de la communauté des chercheurs de ses moyens expérimentaux et par la contribution de ses équipes à d’autres programmes de recherche. Une direction actrice de la politique industrielle française La DAM partage très largement son activité avec l’industrie française : c’est ainsi que le montant des achats, auprès de celle-ci, représente plus des deux tiers de son budget ; le dernier tiers se répartit entre les salaires des personnels (un cinquième) et les taxes. La politique industrielle de la DAM est originale à plus d’un titre :

• d’abord parce que la DAM conserve la maîtrise d’œuvre d’ensemble de la grande majorité des systèmes dont elle a la responsabilité : elle veille ainsi au juste équilibre entre les grands groupes industriels de la Défense et les PME souvent innovantes, en contractualisant directement avec ces dernières, leur permettant ainsi de recevoir la juste rémunération de leur production ;

• ensuite, parce que la répartition de son budget est sous-tendue par une répartition des travaux : la DAM conduit la recherche dans ses laboratoires grâce à son personnel de haut niveau scientifique et technologique. Une fois la définition d’un produit acquise, la DAM transfère la définition et les procédés vers les industriels qui en réalisent le développement, puis la production.

La DAM a également pour objectif que ses centres participent à la vie économique locale par leur implication dans les pôles de compétitivité. Hors de son propre champ d’utilisation, elle valorise ses recherches par le transfert de technologies vers l’industrie et le dépôt de nombreux brevets.

Page 6

Page 7: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Le format La DAM comprend cinq centres aux missions homogènes, dont les activités se répartissent entre la recherche de base, le développement et la fabrication :

• DAM Ile-de-France (DIF), à Bruyères-le-Châtel, où sont menés les travaux de physique des armes, les activités de simulation numérique et de lutte contre la prolifération nucléaire ; DIF est aussi le centre responsable de l’ingénierie à la DAM ; enfin, au centre DIF est rattachée l’INBS-Propulsion Nucléaire du centre CEA/Cadarache, en région Provence Alpes-Côte d’Azur, où sont implantées les installations d'essais à terre et une partie des fabrications de la propulsion nucléaire ;

• Le Cesta, en Aquitaine, consacré à l’architecture des

armes, aux tests de tenue à l’environnement. Il met en œuvre le Laser Mégajoule, équipement majeur de la Simulation ;

• Valduc, en Bourgogne, dédié aux matériaux nucléaires et à

l’installation expérimentale Epure du programme Simulation ;

• Le Ripault, en région Centre, dédié aux matériaux non

nucléaires (explosifs chimiques…) ;

• Gramat, (ex-DGA) en Midi-Pyrénées, qui conduit au profit de la Défense des activités en vulnérabilité des systèmes et efficacité des armements.

Centre DAM Île-de-France

Page 7

Page 8: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France 4 LE CENTRE DAM - ILE DE FRANCE

Le CEA/DAM - Île de France (DIF) est l'une des directions opérationnelles de la DAM.

Le site de la DIF compte environ 2000 salariés CEA et accueille quotidiennement environ 600 salariés d'entreprises extérieures. il est situé à Bruyères-le-Châtel à environ 40 km au sud de Paris, dans l'Essonne.

Les missions de la DIF comprennent :

• la conception et garantie des armes nucléaires, grâce au programme Simulation. L'enjeu consiste à reproduire par le calcul les différentes phases du fonctionnement d'une arme nucléaire et à confronter ces résultats aux mesures des tirs nucléaires passés et aux résultats expérimentaux obtenus sur les installations actuelles (machine radiographique, lasers de puissance, accélérateurs de particules) ;

• la lutte contre la prolifération et le terrorisme, en contribuant notamment au programme de garantie du Traité de Non Prolifération et en assurant l'expertise technique française pour la mise en œuvre du Traité d'Interdiction Complète des Essais Nucléaires (TICE) ;

• l'expertise scientifique et technique, dans le cadre de la construction et du démantèlement d'ouvrages complexes ainsi que pour la surveillance de l'environnement et les sciences de la terre ;

• l'alerte des autorités, mission opérationnelle assurée 24h sur 24, 365 jours par an, en cas d'essai nucléaire, de séisme en France ou à l'étranger, et de tsunami dans la zone Euro-méditerranéenne. La DIF fournit aux autorités les analyses et synthèses techniques associées.

Depuis 2003, le centre DAM-Île-de-France héberge le complexe de calcul scientifique du CEA, qui regroupe l’ensemble des supercalculateurs du CEA, et qui comprend à ce jour :

• le supercalculateur Tera1000-1 pour les besoins du programme Simulation du CEA/DAM, mis en service en 2016, dispose d’une puissance de calcul de 2,5 petaflops, c’est à dire capable d’effectuer 2,5 millions de milliards d’opérations par seconde. Il est complété en 2018 par Tera1000-2, autre composante du projet Tera1000, qui préfigure les architectures et technologies du futur supercalculateur qui sera installé à l’horizon 2020.Sa puissance de calcul est de 12,5 petaflops.

Page 8

Page 9: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

• Le supercalculateur Cobalt du Centre de Calcul pour la Recherche et la Technologie (CCRT), ouvert à la communauté civile de la recherche et de l’industrie, pour une puissance globale de 1,5 petaflops.

• le supercalculateur IRENE, d’une puissance de 9 petaflops, deuxième élément d’un réseau de supercalculateurs de classe petaflopique destiné aux chercheurs de la communauté scientifique européenne. Ce supercalculateur est hébergé au TGCC (Très Grand Centre de Calcul) et exploité par les équipes du CEA, qui apporte ainsi sa contribution à la participation de la France au projet PRACE (Partnership for Advanced Computing in Europe)

Page 9

Page 10: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

5 LE CAMPUS TERATEC La plupart des stages proposés se déroulent dans les locaux du campus Ter@tec. Les autres se déroulent dans les locaux situés à l’intérieur du site CEA.

Le Campus TERATEC est l’une des deux composantes de la Technopole TERATEC, l’autre composante étant le « Très Grand Centre de Calcul du CEA » (TGCC).

Cette technopole, a été créée à l’initiative du CEA afin de développer et promouvoir la simulation numérique haute performance, à proximité du site du CEA, sur la commune de Bruyères-le-Châtel, dans le département de l’Essonne.

Une cantine « inter-entreprises » est accessible à tous les stagiaires.

L’accès principal à la Technopole TERATEC se fait par une entrée commune au TGCC et au Campus, située au nord-ouest, sur le chemin de la Piquetterie.

Page 10

Page 11: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Le CEA a mis en place un réseau spécifique de cars qui dessert Paris et de nombreuses communes de la région parisienne. Par ailleurs, le campus Ter@tec est desservi par la ligne de transport en commun 91-04, entre la gare routière d’Evry et la gare autoroutière de Briis-sous-Forges.

Page 11

Page 12: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France 6 LES ACTIVITES INFORMATIQUES AU CEA/DAM – ILE DE FRANCE

Le système d’information (SI) de la DAM est constitué de 4 sous-systèmes : entreprise, technique, industriel et scientifique, concernant respectivement :

• les aspects budget, ressources humaines, logistique, sécurité des personnes et des biens, patrimoine …

• les activités « Programme » de la DAM : bureau d’études, méthodes, calcul, fabrication, qualité des produits fabriqués, gestion des matières …

• les procédés industriels : acquisition mesures, système de supervision, surveillance, commande contrôle, contrôle des utilités, accès, autocom télécom …

• le domaine scientifique associant la simulation avec le calcul haute performance.

Les activités déclinées dans ces systèmes d’information dans lesquelles s’inscrivent les stages proposés, sont les suivantes :

• étude, conception et réalisation du système d’information du CEA/DAM ; • définition, conception, déploiement et exploitation des réseaux et des serveurs ; • étude, conception, développement et maintenance de codes et outils de simulation

numérique et d’environnement logiciel dans le domaine du calcul haute performance ; • étude, conception, développement de systèmes informatiques dans le domaine du calcul

haute performance ; Auxquelles deux activités transverses sont ajoutées :

• expertise et activités opérationnelles dans le domaine de la sécurité informatique ; • animation scientifique dans le domaine du calcul scientifique haute performance.

7 SITES UTILES Pour plus d’informations, vous pouvez consulter les sites suivants : http://www.cea.fr http://www-hpc.cea.fr/ http://www.teratec.eu/ Retrouvez tous les stages proposés par le CEA sur le site : http://www.cea.fr/recrutement

8 COMMENT POSTULER POUR UN STAGE ? Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00. Nous attirons l’attention des candidats sur le fait que les délais d’instruction des dossiers de candidature sont de 2 mois, sauf pour les thématiques « Informatique d’entreprise » et « sécurité informatique » pour lesquels le délai est de 4 mois.

Page 12

Page 13: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

9 LES THEMATIQUES DES STAGES

Les stages proposés se déclinent dans les 4 thématiques suivantes : Informatique d’entreprise : serveurs bureautiques et applicatifs, applications de gestion, postes de travail, bases de données, Intranet ; Informatique scientifique, Calcul Haute Performance (HPC) et réseaux : grands calculateurs à vocation scientifique, High Performance Computing, stockage haute performance, logiciels « système », Linux, réseaux d’entreprise, interconnexion des calculateurs ; Simulation numérique : développement de logiciels scientifiques, IHM, visualisation, gestion de données, pré et post-traitement ; Sécurité informatique : développement d’outils logiciels.

Page 13

Page 14: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

10 LES STAGES EN INFORMATIQUE D’ENTREPRISE

Titre

DevOps : automatisation des tests sur l’application PLM

Référence IE-19-01

Contexte

L’application SEQUOIA a été déployée en 2010 au sein des différents centres de la DAM, et regroupe aujourd’hui plusieurs centaines d’utilisateurs. L’activité couverte par cette application est centrale : il s’agit de gérer le cycle de vie des produits et de garantir leur qualité. Cette application s’appuie sur un outil du marché, complété par des développements spécifiques qui évoluent régulièrement. La complexité de l’application et la richesse des fonctionnalités qu’elle offre, nécessite d’automatiser les tests sur toutes les versions avant leur déploiement. Ce sujet s’inscrit dans la démarche DevOps engagée au sein du service informatique. Le patrimoine de tests automatiques a été initié et doit être enrichi continuellement. Dans ce contexte, l’outil Selenium a été mis en œuvre. D’autres briques logicielles viennent progressivement compléter la solution d’automatisation, et s’interfacer avec le système d’intégration continue. Une interface avec l’outil de gestion de test TestLink a par exemple été mise en place. Compte tenu des enjeux métier auxquels répond ce sujet, des méthodes de travail très rigoureuses ont été mises en place et devront être respectées, rendant ainsi l’environnement de travail très enrichissant.

Objectifs

Les objectifs du stage sont :

Prise de connaissance de l’application et montée en compétence sur son architecture Montée en compétence sur l’outil d’automatisation de test Selenium Développement des tests automatiques Intégration de la solution aux autres briques DevOps

Rédaction de la documentation technique

Domaines de spécialité requis Programmation, génie logiciel, web

Langages/logiciels Java, Selenium, ant, HTML, Javascript

Mots clés DevOps, intégration continue, développement, tests, automatisation, qualité logicielle, web, javascript

Formation recherchée BAC+4 ou 5

Durée du stage 5 mois minimum Durée de l’apprentissage 1 an minimum

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 14

Page 15: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre DevOps : intégration continue, analyse et qualité de code

Référence IE-19-02

Contexte

Le département informatique du CEA / DAM prend à sa charge certains développements d’informatique de gestion, et intègre également des solutions commerciales ou open source, souvent enrichies par des fonctionnalités développées spécifiquement pour ses besoins propres. Dans ces deux cas, développements internes et sous-traités, le CEA / DAM souhaite contrôler de façon très régulière la qualité du code des applications dont il a la responsabilité, voire même contribuer à la recette fonctionnelle. Un environnement technique est déjà existant (gestion de version notamment). Les autres briques n’existent pas encore.

Objectifs

Les objectifs du stage sont :

Prise de connaissance de l’environnement et de la cible Etude et analyse des différentes solutions possibles pour chaque brique Prototypage et maquettage éventuel de certaines solutions (installation, intégration, paramétrage, développements spécifiques) Intégration des solutions retenues aux autres briques DevOps de production Rédaction de la documentation technique Présentation de la solution aux unités informatiques

Domaines de spécialité requis

Programmation, génie logiciel, web, architecture technique, qualité logicielle

Langages/logiciels Langages web, langages de programmation (C#, Java, Python), Sonar, Jenkins, …

Mots clés DevOps, intégration continue, développement, automatisation, qualité logicielle

Formation recherchée BAC+3, 4 ou 5

Durée du stage 5 mois minimum

Durée de l’apprentissage 1 an minimum

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]

Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 15

Page 16: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Développement d’un outil de gestion du parc de postes Windows DAM

Référence IE-19-03

Contexte

Le laboratoire IS (Ingénierie des Systèmes) est responsable des services d’infrastructure des différents réseaux centralisés du CEA/DAM répartis sur cinq centres. Les activités du Laboratoire Ingénierie des Systèmes portent principalement sur : la conception et maintien en condition opérationnelle des plates formes hébergeant les services d’administration, de stockage, de virtualisation, de sauvegarde, de sécurité et d’exploitation des réseaux DAM, l’optimisation et l’adaptation de tous ces services pour l’accueil des plates formes applicatives, la mise en production auprès de l’infogérant dans le respect des pratiques ITIL, la résolution des incidents escaladés, le maintien en sécurité exigée sur les réseaux qu’il maîtrise. Le laboratoire est garant de la mise en œuvre du niveau de sécurité attendu sur chacun des réseaux qu’il opère. Il doit répondre de manière récurrente à des sollicitations concernant la mise en place de nouveaux mécanismes de sécurité demandées par des entités internes ou externes.

Objectifs

Dans le cadre du renforcement de la sécurité informatique, le LIS souhaite automatiser et standardiser son outil de gestion de parc informatique Microsoft SCCM. Afin d’assurer sa mission d’harmonisation du poste de travail au standard DAM en Windows 10 pour tous les centres DAM. Les objectifs du stage sont : l’optimisation du déploiement des postes en Windows 10 avec l’élaboration de scripts en Powershell. Suivant la durée de la mission, le stagiaire sera amené à se déplacer sur les centres. Des connaissances en administration systèmes et en filtrage de réseaux IP serait un plus.

Domaines de spécialité requis

Windows, Linux, Active Directory et Réseaux IP

Langages/logiciels Windows 2016 Server, Microsoft SCCM

Mots clés Informatique, Administration Windows, Sécurité, SCCM

Formation recherchée Minimum BAC+4/5

Durée du stage 5 mois Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante :

[email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 16

Page 17: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

11 LES STAGES EN INFORMATIQUE SCIENTIFIQUE

Titre

Evaluation de solutions de NAS open source

Référence IS-19-01

Contexte

Les utilisateurs des centres de calcul du CEA disposent d’un espace de travail sur un serveur de fichiers de type NAS. Il est utilisé pour préparer leurs codes de calculs avant de les faire tourner sur le calculateur. Cet es-pace dispose de plusieurs fonctionnalités qui permettent notamment de récupérer facilement des fichiers effacés ou modifiés (snapshot), de fonc-tionner en haute disponibilité, etc.

Objectifs

Les objectifs du stage sont : évaluer les alternatives Open Source de la solution propriétaire actuel-lement en place avec les différentes fonctionnalités proposées, mettre en place une ou des solutions retenues sur plusieurs configura-tions matérielles pour en évaluer les performances, réaliser une série de tests proche de l’usage des équipements en centre de calcul afin d’évaluer la tenue des différentes solutions, valider le fonctionnement des différentes fonctionnalités (Haute disponibi-lité, …). Le stagiaire explorera plus particulièrement le système de fichiers ZFS qui est utilisé dans plusieurs solutions de NAS.

Domaines de spécia-lité requis Informatique

Langages/logiciels Linux

Mots clés Linux ; FreeBSD, NAS, NFS, CIFS, stockage, ZFS

Formation recher-chée BAC+4/5

Durée du stage 3 à 6 Mois

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]

Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 17

Page 18: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre

Interface web de visualisation de filesystem

Référence IS-19-02

Contexte

Les supercalculateurs du CEA produisent tous les jours de grandes quanti-tés de données qui sont stockées sur des systèmes de fichiers distribués. Robinhood[1] (Policy Engine) est un logiciel open source qui permet de sur-veiller et gérer l’ensemble des fichiers/dossier/… qui se trouvent sur ces systèmes de fichiers (Récupérer le nombre de fichiers d’un utilisateur, la taille, l’espace utilisé par un groupe d’utilisateur, de déplacer des fichiers selon certaines règles, …). Cet outil dispose actuellement d’une interface web « sommaire » qui permet de visualiser quelques éléments principaux. [1]https://github.com/cea-hpc/robinhood

Objectifs

L’interface web de Robinhood se décompose en deux parties : Une API qui expose les données contenues dans la base de Robinhood Une interface « End-User » qui permet d’afficher les données exposées par l’API Le stage consistera à : Développer l’interface pour ajouter une vision « globale » du système de fichier (Semblable à de celle de Baobab[1] ou qdirstat[2]), Proposer une extension à Baobab pour qu’il puisse se connecter à l’API de Robinhood, Améliorer la fonctionnalité de recherche et visualisation des fichiers des utilisateurs, Proposer et ajouter d’autres visualisations pour aider à l’administration, Ajouter une interface/API pour exporter les données vers des outils tiers. [1] : https://wiki.gnome.org/Apps/Baobab [2] : https://github.com/shundhammer/qdirstat

Domaines de spécia-lité requis Programmation PHP, Web, Base de données, Linux

Langages/logiciels PHP, HTML, Javascript, SQL, Git

Mots clés Web, Visualisation, Stockage

Formation recher-chée BAC+4/5

Durée du stage 3 à 6 Mois

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]

Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 18

Page 19: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre

Conception d'une nouvelle architecture de tests pour le projet open

source Lustre

Référence IS-19-03

Contexte

Lustre est un système de fichiers distribué, hautement parallèle, open source, couramment utilisé dans le domaine du HPC. Le CEA contribue activement au projet. Actuellement, le temps d'exécution séquentiel de la base de tests du projet avoisine les 21h. Ceci impacte lourdement le développement de Lustre.

Objectifs

Les objectifs du stage sont : étudier et réaliser une architecture qui facilitera la création de nouveaux tests et réduira le temps d'exécution des bases de tests tout en conservant une grande simplicité d'utilisation. Ce stage n'a pas pour objectif de réécrire les bases de tests de Lustre. définir un protocole de migration de l'architecture actuelle vers celle qu'il aura retenue, évaluer les gains apportés par son architecture via une preuve de con-cept, présenter son architecture à la communauté Lustre.

Domaines de spécia-lité requis Génie logiciel, tests, Linux, développement système

Langages/logiciels C, bash, git

Mots clés Programmation distribuée, tests, open source, système de fichiers

Formation recher-chée BAC+4/5

Durée du stage 4 à 6 mois

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 19

Page 20: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre

Développement d'une fonctionnalité de classes de service dans un

logiciel de stockage

Référence IS-19-04

Contexte

R&D du laboratoire en matière de stockage massif de données en environ-nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets par an) à des débits extrêmes (centaines de gigaoc-tets par seconde). Pour stocker ces données de manière robuste et perfor-mante, le CEA développe un logiciel de stockage de données parallèle et distribué. Ce logiciel doit notamment gérer plusieurs types de données, avec des be-soins de performance et de fiabilité différents.

Objectifs

Les objectifs du stage sont : développer un mécanisme de gestion de classes de services (COS) dans un logiciel de stockage développé par le CEA, Le choix d'une classe de service permet à un utilisateur de choisir le type de média sur lequel il souhaite stocker une donnée, et d'indiquer le niveau et le type de redondance souhaité (RAID1, Erasure coding…). Définir solution (définition de l'API, des structures de données...), Réaliser le développement en langage C et l'intégrer au projet existant.

Domaines de spécia-lité requis Programmation en C, programmation système, bases de données

Langages/logiciels C, git, systèmes Linux

Mots clés Systèmes distribués, stockage, programmation, développement

Formation recher-chée BAC+4/5

Durée du stage 4 à 6 mois

Stage pouvant se poursuivre en thèse Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]

Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 20

Page 21: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre

Bibliothèques d'accès à des nouvelles technologies de stockage

Référence IS-19-05

Contexte

R&D du laboratoire en matière de stockage massif de données en environ-nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets) à des débits extrêmes (centaines de gigaoctets par seconde). Pour stocker ces données de manière robuste et performante, le CEA développe un logiciel de stockage de données parallèle et distribué. Ce logiciel vise notamment à gérer une grande variété de technologies de stockage, telles que les disques, bandes, SSD, NVMe, NVRAM, stockage objet...

Objectifs

Les objectifs du stage sont : d'intégrer de nouvelles technologies de stockage dans un logiciel déve-loppé par le CEA pour préparer les nouvelles générations de supercalcula-teurs, pour faciliter cette intégration, développer une couche d'abstraction of-frant une même interface d'accès quelle que soit la technologie sous-jacente. Il s'agira par exemple d'intégrer des technologies de stockage novatrices de disques connectés en réseau (Seagate Kinetic, appliances OpenIO, …), des logiciels de stockage objet pour le Cloud (Scality) ou pour le HPC (MERO)...

Domaines de spécia-lité requis Programmation en C, programmation système

Langages/logiciels C, git, systèmes Linux

Mots clés Stockage objet, programmation, développement

Formation recher-chée BAC+4/5

Durée du stage 4 à 6 mois

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 21

Page 22: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre

Développement d'une interface S3 pour un logiciel de stockage objet

distribué

Référence IS-19-06

Contexte

R&D du laboratoire en matière de stockage massif de données en environ-nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets) à des débits extrêmes (centaines de gigaoctets par seconde). Pour stocker ces données de manière robuste et performante, le CEA développe un logiciel de stockage de données parallèle et distribué. S3 est un protocole initialement développé et utilisé par Amazon Web Ser-vices. Il est aujourd'hui communément utilisé comme interface d'accès aux données dans le Cloud Computing.

Objectifs

L'objectif final du stage est de : concevoir un serveur S3 pour un logiciel de stockage développé par le CEA, dans un premier temps, d’étudier la sémantique du protocole S3, réaliser un état de l’art des serveurs S3 disponibles en ‘’open source’’, adapter la solution retenue à un logiciel de stockage distribué développé au CEA.

Domaines de spécia-lité requis Programmation en C, programmation système, réseau et sécurité

Langages/logiciels C, git, systèmes Linux

Mots clés Cloud Computing, stockage, programmation, développement

Formation recher-chée BAC+4/5

Durée du stage 4 à 6 mois

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 22

Page 23: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre

Développement d'un mécanisme de versionnage de données

Référence IS-19-07

Contexte

R&D du laboratoire en matière de stockage massif de données en environ-nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets) à des débits extrêmes (centaines de gigaoctets par seconde). Pour stocker ces données de manière robuste et performante, le CEA développe un logiciel de stockage de données parallèle et distribué. Ce logiciel doit pouvoir gérer un grand nombre d'accès concurrents aux données, ce qui nécessite un mécanisme élaboré de gestion de versions. Ce mécanisme doit notamment permettre un passage à l'échelle pour les prochaines générations de super-calculateurs (calculateurs Exaflopiques).

Objectifs

L'objectif de ce stage est : développer un mécanisme de gestion des versions de données dans un logiciel de stockage développé par le CEA, Ce mécanisme devra permettre de gérer des lectures et des écritures sur de multiples versions des données, tout en offrant certaines garanties sur la cohérence finale des données. réaliser une étude de mécanismes existants de versionage de données (copy-on-write, generation numbers, …), proposer un design de mécanisme adapté aux besoins du CEA, développer la solution (en langage C) et l'intégrera au projet existant.

Domaines de spécia-lité requis Programmation en C, programmation système

Langages/logiciels C, git, systèmes Linux

Mots clés Systèmes distribués, stockage, programmation, développement

Formation recher-chée BAC+4/5

Durée du stage 4 à 6 mois

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 23

Page 24: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre

Prédiction du taux de dé-duplication pour du stockage massif

de données

Référence IS-19-08

Contexte

R&D du laboratoire en matière de stockage massif de données en environ-nement HPC. Les supercalculateurs du CEA produisent d'immenses quantités de données (dizaines de pétaoctets) à des débits extrêmes (centaines de gigaoctets par seconde). Pour stocker ces données de manière robuste et performante, le CEA développe un logiciel de stockage de données parallèle et distribué. Face à l'explosion de la quantité de données à stocker, la dé-duplication peut s'avérer une stratégie efficace pour gagner en capacité mais également en performance.

Objectifs

Les objectifs du stage sont de : développer un outil permettant de prédire le taux de dé-duplication d'un très large ensemble de données pouvant excéder plus de 10 millions de fichiers pour plusieurs pétaoctets, Cet outil devra être optimisé en temps d'exécution et en ressources néces-saires. Pour cela, on pourra s'inspirer d'une part des dernières avancées et algorithmes statistiques récemment proposés dans ce domaine [1][2] et d'autre part du parallélisme largement utilisé au sein des environnements HPCs. tester et valider cet outil sur des jeux de données représentatifs des centres de calculs du CEA un design de mécanisme adapté aux besoins du CEA, contribuer au développement de mécanismes de dé-duplication au sein des logiciels parallèles et distribués de stockage massif de données déve-loppés au CEA. [1] : https://www.usenix.org/system/files/conference/fast16/fast16-papers-harnik.pdf [2] : http://theory.stanford.edu/~valiant/papers/VV_stoc11.pdf

Domaines de spécia-lité requis programmation, systèmes distribués, base de données

Langages/logiciels C, C++, python, administration Linux, SQL/NoSQL, git

Mots clés stockage, big data, dé-duplication, programmation, développement, statis-tique

Formation recher-chée BAC+4/5

Durée du stage 4 à 6 mois

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 24

Page 25: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Définition d'un benchmark générique pour la validation

de cluster

Référence IS-19-09

Contexte

Le CEA/DAM gère des clusters de calculs hautes performances composés de plusieurs milliers de serveurs. Le besoin de puissance de calcul est croissant et la nécessité de développer, de paralléliser et d'optimiser les codes de calcul est cruciale. D'un autre côté, une meilleure compréhension des codes de calcul permet aussi d'optimiser le cluster afin de fournir le meilleur service possible aux utilisateurs. La production sur ces clusters est constituée de plusieurs codes de calcul très différents. Dans le processus de validation de ces clusters, il faudrait dans l'idéal passer tous les codes, ce qui en pratique est très difficile à mettre en place. Le sujet du stage consiste à définir et développer un ben-chmark générique où il serait possible de le paramétrer pour qu'il reproduise le comportement d'un code de calcul donné. Ce benchmark permettrait de choisir un noyau de calcul particulier, un type de schéma de communication ou bien un schéma de lecture/écriture de fichiers. Les logiciels libres sont au cœur de l'infrastructure qui pilote ces machines, le CEA/DAM y contribue et en développe.

Objectifs

Les objectifs du stage sont :

Prendre en main les technologies liées au calcul parallèle (MPI, OpenMP, entrées/sorties, etc ...), Définir un benchmark générique, Développer un prototype de ce benchmark, Rédiger une documentation sur le travail effectué. Prérequis: Langage C, Environnement Linux Anglais technique et scientifique Compétences appréciées: Programmation parallèle (MPI) Python http://www-hpc.cea.fr/ https://github.com/cea-hpc/

Domaines de spécia-lité requis

Calcul massivement parallèle

Langages/logiciels C LINUX MPI

Mots clés Open source, HPC, Calcul Haute Performance, Linux, Parallélisme, MPI

Formation recher-chée BAC+4/5

Durée du stage 6 mois Stage pouvant se poursuivre en thèse Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 25

Page 26: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Génération de rapports de profilage pour SELFIE

Référence IS-19-10

Contexte

Le CEA/DAM gère des clusters de calculs hautes performances composés de plusieurs milliers de serveurs. Le besoin de puissance de calcul est croissant et la nécessité de développer, de paralléliser et d'optimiser les codes de calcul est cruciale. D'un autre côté, une meilleure compréhension des codes de calcul permet aussi d'optimiser le cluster afin de fournir le meilleur service possible aux utilisateurs. Le CEA a développé l'outil SELFIE pour profiler des codes de calcul. Cet outil génère des données et le CEA souhaiterait les présenter sous forme de rapport. Le CEA a une préférence pour des rapports sous forme page HTML (avec les technologies web dynamiques) non connecté car le format est lisible sur n'importe quel navigateur récent. Le rapport contiendra des gra-phiques interactifs permettant d'analyser les données. Les logiciels libres sont au cœur de l'infrastructure qui pilote ces machines, le CEA/DAM y contribue et en développe.

Objectifs

Les objectifs de ce stage sont :

Prendre en main les données fournies sous forme JSON de SELFIE Développer un outil pour générer les rapports Rédiger une documentation sur le travail effectué.

Prérequis: HTML/JavaScript/CSS Anglais technique et scientifique Compétences appréciées: Framework JavaScript (pour front-end web) Python http://www-hpc.cea.fr/ https://github.com/cea-hpc/ https://github.com/cea-hpc/selFIe

Domaines de spécia-lité requis Calcul massivement parallèle

Langages/logiciels C LINUX MPI

Mots clés Open source, HPC, Calcul Haute Performance, Linux, Parallélisme, MPI

Formation recher-chée BAC+4

Durée du stage 4 mois

Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 26

Page 27: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Génération d'un simulateur de communications MPI

Référence IS-19-11

Contexte

Le CEA/DAM gère des clusters de calculs hautes performances composés de plusieurs milliers de serveurs. Le besoin de puissance de calcul est croissant et la nécessité de développer, de paralléliser et d'optimiser les codes de calcul est cruciale. D'un autre côté, une meilleure compréhension des codes de calcul permet aussi d'optimiser le cluster afin de fournir le meilleur service possible aux utilisateurs. Le modèle de programmation MPI (Message Passing Interface) basé sur des communications inter-processus est le modèle le plus utilisé pour déve-lopper des codes parallèles. Les schémas de communications deviennent de plus en plus compliqués et il y a besoin de mieux comprendre ces com-munications afin de les optimiser tant côté code que côté gestion du cluster. Le problème est qu'un code de calcul en production est très complexe à manipuler lorsqu'on souhaite simplement étudier les communications MPI. Ce stage consiste à étudier les moyens pour extraire le schéma de commu-nication d'un code de calcul puis de générer un code qui va reproduire les communications MPI.

Les logiciels libres sont au cœur de l'infrastructure qui pilote ces machines, le CEA/DAM y contribue et en développe.

Objectifs

Les objectifs du stage sont :

Prendre en main le modèle de programmation MPI. La prise en main pourra se faire avec un code de calcul parallèle, Prendre en main un outil de profilage type Score-P et/ou Vampitrace, Développer un outil qui à partir d'une trace OTF de profilage génère un code qui reproduit les communications MPI d'un code profilé, Rédiger une documentation sur le travail effectué. prérequis: Langage C, Environnement Linux Anglais technique et scientifique Compétences appréciées: Programmation parallèle (MPI) Python http://www-hpc.cea.fr/ https://github.com/cea-hpc/ https://tu-dresden.de/zih/forschung/projekte/vampirtrace http://www.vi-hps.org/projects/score-p/

Domaines de spécia-lité requis

Calcul massivement parallèle

Langages/logiciels C LINUX MPI

Mots clés Open source, HPC, Calcul Haute Performance, Linux, Parallélisme, MPI Formation recher-chée BAC+4/5

Durée du stage 6 mois Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 27

Page 28: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Etude et amélioration d’outils de configuration de fabrics InfiniBand

Référence IS-19-12

Contexte

La technologie InfiniBand est utilisée sur les réseaux d’interconnexion internes aux clusters de calculs du CEA, ainsi que sur les réseaux de stockage de données des centres de calculs.

Divers outils de configuration et de monitoring des réseaux InfiniBand existent, qu’il convient au travers de ce stage de faire évoluer

Objectifs

Les objectifs du stage sont :

Dans un premier temps, le candidat travaillera sur la configuration des réseaux InfiniBand, permettant une prise en main du domaine et des outils existants. L’évolution principale demandée concerne l’interface utilisateur de l’outil. Aujourd’hui en CLI, nous souhaitons apporter une GUI Web, simplifiant l’accès et l’utilisation. Entre autres choses l’interface devra apporter : Vision synthétique de la configuration déployée (topologie logique) Configuration des serveurs, groupes, partitions et QoS sur le réseau Vision physique du réseau InfiniBand avec identification des différents groupes de ressources.

Une seconde évolution de l’outil consiste en l’automatisation de la découverte des serveurs virtuels InfiniBand utilisant SRIOV. En effet, l’usage de la virtualisation est grandissant et il est primordial de pouvoir apporter les mêmes niveaux de configuration à une machine physique et virtuelle, avec la même simplicité. Dans un second temps, le stage s’orientera vers l’analyse du routage InfiniBand sur les fabrics, et l’intégration de métriques pertinentes à la fois sur la vision physique du réseau InfiniBand de la GUI développée, ainsi que dans un système de stockage pour analyse ultérieure. L’ensemble des éléments nécessaires à la solution de monitoring retenue devra être packagée de manière à être intégrable à une distribution linux de type CentOS. Le candidat devra faire preuve de curiosité intellectuelle et de rigueur.

Domaines de spécialité requis Informatique (Linux), Réseaux

Langages/logiciels Python, python-rdma, InfiniBand, Opensm

Mots clés Réseau, Infiniband, Informatique, Programmation

Formation recherchée BAC+5

Durée du stage 6 mois Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 28

Page 29: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Etude et intégration d’une solution de monitoring InfiniBand

Référence IS-19-13

Contexte

La technologie InfiniBand est utilisée sur les réseaux d’interconnexion internes aux clusters de calculs du CEA, ainsi que sur les réseaux de stockage de données des centres de calculs. Divers outils de configuration et de monitoring des réseaux InfiniBand existent, qu’il convient au travers de ce stage de faire évoluer.

Objectifs

Dans un premier temps, le candidat travaillera sur l’étude de la technologie InfiniBand, permettant une prise en main du domaine, ainsi que la proposition d’une solution de monitoring basée sur des outils OpenSource. Cette solution pourrait se baser sur un prototype existant reposant sur le couple InfluxDB/Grafana, ou proposer une architecture plus adaptée. Dans un second temps, le stage s’orientera sur la collecte des compteurs InfiniBand. Le challenge est complexe et se validera par étape :

Proposer et implémenter des solutions efficaces de collecte pour les topologies de taille moyenne (jusque 4000 ports InfiniBand) garantissant une collecte et une synchronisation toutes les secondes

Autoriser le passage à l’échelle sur des topologies de grande taille (jusque 20000 ports IB) le plus rapidement possible avec une tolérance à 10 secondes d’intervalle de collecte

Proposer les opérations mathématiques permettant d’enrichir les compteurs avant stockage (calcul de congestion, statistiques d’émission…)

Un troisième volet du stage porte sur la collecte de métriques sur des équipements Ethernet en prenant en compte les spécificités et contraintes de sécurité des centres de calcul du CEA. Un accent particulier sera mis sur la possibilité de migrer des données vers un système OpenTSDB. L’ensemble des éléments nécessaires à la solution de monitoring retenue devra être packagée de manière à être intégrable à une distribution linux de type CentOS. Le candidat devra faire preuve de curiosité intellectuelle et de rigueur.

Domaines de spécialité requis Informatique (Linux) et Réseaux

Langages/logiciels Python, pyhton-rdma, Monitoring, Grafana

Mots clés Réseau, Infiniband, Informatique, Programmation

Formation recherchée BAC+5

Durée du stage 6 mois Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 29

Page 30: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Evaluation du routage sur les réseaux d’interconnexion de clusters de calcul (HPC)

Référence IS-19-14

Contexte

La toute nouvelle technologie Bull eXascale Interconnect sera utilisée sur les réseaux d’interconnexion internes aux clusters de calculs du CEA. Cette technologie innovante permet un routage différencié par port permettant une meilleure répartition des communications. Il convient au travers de ce stage de faire évoluer l’outil d’évaluation du routage afin de mener une comparaison des performances du routage Infiniband, traditionnellement utilisé sur les réseaux d’interconnexion de clusters et du routage nouvelle génération proposé par la technologie BXI.

Objectifs

Les objectifs du stage sont :

Dans un premier temps, le candidat travaillera sur l’étude des réseaux d’interconnexion de cluster ainsi que sur la technologie BXI afin de se familiariser avec le domaine. L’essentiel du travail consistera en la collecte des informations de routage et de topologie spécifique à la technologie BXI. Le candidat travaillera sur un simulateur de réseau BXI et devra adapter le code python existant afin de permettre l’interprétation des informations collectées par l’outil d’analyse du routage. Le stage se conclura par l’analyse des résultats produits permettant de valider la performance du routage sur BXI, en regard des analyses existantes sur Infiniband. Le candidat devra faire preuve d’autonomie, de curiosité intellectuelle et de rigueur.

Domaines de spécialité requis Informatique (Linux), Réseaux, Programmation python

Langages/logiciels Python, python-rdma, InfiniBand, Opensm

Mots clés Réseau, Infiniband, BXI, HPC, Programmation

Formation recherchée BAC+5

Durée du stage 6 mois

Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00. .

Page 30

Page 31: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

12 LES STAGES EN SIMULATION NUMERIQUE

Titre Algorithmes de reconstruction d’interface par Machine Learning et Apprentissage Supervisé

Référence SN-19-01

Contexte

Les approches « Machine Learning » font l’objet d’un engouement croissant dans de nombreux domaines relevant des Sciences de l’Ingénieur. Jusqu’alors, peu de publications traitent d’applications aux méthodes de résolution d’équations aux dérivées partielles. Lors de ce stage, on évaluera l’apport de telles approches sur un problème difficile, objet d’une littérature abondante dans le cadre des méthodes numériques « traditionnelles » : le problème de reconstruction d’interfaces à partir de fractions de présence de matériaux sur maillages 2D/3D cartésiens. Il s’agit d’un problème purement géométrique, souvent coûteux avec les méthodes traditionnelles et qui se prête à l’utilisation de frameworks ML (Machine Learning) utilisés en reconnaissance d’images.

Objectifs

Les méthodes VOF (Volume Of Fluid) constituent une classe importante de méthodes de résolution des équations de la mécanique des fluides. Pour des écoulements bi-fluides, les algorithmes LVIRA et ELVIRA font actuellement référence pour l’étape de reconstruction d’interface à partir des fractions volumiques de présence sur les mailles voisines.

1) Ces algorithmes seront utilisés pour constituer des bases de

configurations sur lesquelles seront lancées les phases d’apprentissage (solutions exactes pour des interfaces planes).

2) Les capacités de l’approche ML seront alors évaluées par prises d’erreurs et comparaisons des coûts selon taille & type de base.

Dans un second temps, on examinera des cas non lipchitziens et l’extension à 3 matériaux (points triples, configurations trop complexes pour un traitement géométrique exhaustif et rigoureux de type ELVIRA). Références bibliographiques Itay Lieder, Yehezkel resheff, Tom Hope, Learning TensorFlow A guide to Building Deep Learning systems, O’Reilly media (2017) Kevin P. Murphy, Machine Learning: a probabilistic perspective, MIT Press (2012) J. E. Pilliod and E. G. Puckett, “Second-order accurate volume-of-fluid algorithms for tracking material interfaces”, J. Comput. Phys., Vol. 199, p. 465-502 (2004)

Domaines de spécialité requis

Première formation aux méthodes d’apprentissage (+) Informatique, Méthodes Numériques, Mathématiques Appliquées

Langages/logiciels Python, TensorFlow + Keras (Google, cours MIT, Stanford, etc)

Mots clés CNN (Convolutional Neural Network), ML (Machine Learning), VOF (Volume Of Flui), CFD (Computational Fluid Dynamics)

Formation recherchée BAC+4/5

Durée du stage 3 à 6 mois Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 31

Page 32: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Opérateur de diffusion vectoriel pour l’hydrodynamique la-grangienne turbulente sur maillage déformé

Référence SN-19-02

Contexte

La description lagrangienne consiste à suivre dans le temps les particules fluides le long de leurs trajectoires. Elle est souvent utilisée pour résoudre les équations d'Euler en dynamique multi-matériaux, car elle permet de préserver exactement les interfaces des matériaux au niveau discret. Cependant, elle n'est pas toujours suffisante pour décrire la dynamique des gaz compressibles. C'est le cas si le rapport entre les forces d'inertie et visqueuse est localement faible (nombre de Reynolds petit). Le terme de diffusion moléculaire des équations de Navier-Stokes n'est alors plus négligeable et doit être pris en compte. Si le nombre de Reynolds est grand, les modélisations de la turbulence (Reynolds Averaged Navier-Stokes-RANS ou Large-Eddy-Simulation-LES) sont généralement basées sur l'approximation de Boussinesq. Celle-ci consiste à approcher l'effet de la turbulence non résolue sur l'écoulement moyen par un opérateur de diffusion, proportionnel au tenseur des contraintes.

Objectifs

Le stage a pour objectifs de : proposer, analyser numériquement et tester différentes stratégies de discrétisation de l'opérateur de diffusion, et son couplage au solveur de Godunov acoustique pour les équations d'Euler [1,2]. Les stratégies retenues seront testées en 1D et 2D sur maillages non réguliers dans un code écrit en C++. Une bonne connaissance du lan-gage est souhaitée.

[1] B. Després et C. Mazeran, Arch. Rat. Mech. Anal., 2005, 178, pages 327-372. [2] P.-H. Maire, R. Abgrall, J. Breil et J. Ovadia, Siam J. Sci. Comp., 2007, 29.

Domaines de spé-cialité requis Analyse numérique

Langages/logiciels C/C++

Mots clés simulation numérique, système hyperbolique, lois de conservation

Formation recher-chée BAC+5 (Master/Ingénieur)

Durée du stage 6 mois

Stage pouvant se poursuivre en thèse Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 32

Page 33: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre

Optimisation géométrique de maillages hexaédriques

Référence SN-19-03

Contexte

Le CEA, acteur majeur en matière de recherche et d’innovation, est re-connu comme un expert du domaine HPC ayant une implication forte dans le domaine de la simulation numérique. Cette dernière consiste à reproduire par le calcul le fonctionnement d’un système physique, préala-blement décrit par un ensemble de modèles mathématiques. Certains de ces modèles nécessitent de discrétiser le domaine d’étude à l’aide d’un maillage hexaédrique 3D. La génération automatique de tels maillages est un problème difficile qui suscite de nombreuses recherches. De plus, tout maillage hexaédrique n’est pas utilisable en simulation numérique, et différents critères doivent être vérifiés. En particulier, la « qualité » géométrique des mailles doit être estimée et améliorée si nécessaire. Dans cette optique, les auteurs de [1] proposent un algorithme de relaxation qui repose sur la transformation du problème d’optimisation de la forme géométrique des hexaèdres en un problème d’optimisation sur les arêtes du maillage. Il reste à résoudre une succession de problèmes d’optimisation quadratiques et convexes. L’espace des solutions étant potentiellement vide du fait de contraintes trop importantes, une heuristique locale est en outre proposée. [1] M. Livesu, A. Sheffer, N. Vining and M. Tarini. Practical Hex-Mesh Optimization via Edge-Cone Rectification, Transactions on Graphics (Pro-ceedings of SIGGRAPH 2015), 2015.

Objectifs

L’objectif du stage proposé est : 1) d’étudier et implanter les algorithmes proposés dans [1], 2) puis de les étendre à des maillages mixtes composés à la fois

d’hexaèdres, tétraèdres, prismes à base triangulaire, et pyra-mides à base quadrangulaire.

L’implantation se fera dans le cadre du projet open-source GMDS, projet développé et maintenu au CEA/DAM. Les résultats seront évalués au vu de la qualité des maillages générés à partir de modèles de pièces méca-niques plus ou moins complexes

Domaines de spé-cialité requis Informatique – Mathématiques appliquées

Langages/logiciels C/C++

Mots clés Maillage hexaédrique, géométrie algorithmique, problèmes d’optimisation

Formation recher-chée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected]

Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 33

Page 34: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Métriques orientées pour maillages quadrangulaires surfaciques

Référence SN-19-04

Contexte

Le CEA est un acteur majeur en matière de recherche et d’innovation avec une implication forte dans le domaine de la simulation numérique. Le travail de stage s’inscrit justement dans le contexte de la simulation numérique de phénomènes physiques sur des architectures modernes de calculateurs, et plus précisément dans la génération automatique de mail-lages surfaciques quadrangulaires. L’idée est d’adapter des maillages aux problèmes physiques à traiter en considérant à la fois les caractéris-tiques géométriques de la surface à discrétiser (courbures, discontinuités) et des caractéristiques du problème (couches limites le long d’une aile d’avion, choc dans un fluide). Dans notre contexte, ces dernières sont modélisées à l’aide de métriques. Sur l’exemple ci-dessous le maillage régulier (à gauche) et adapté à la métrique (au centre) pour obtenir le maillage aligné sur cette métrique (à droite).

Objectifs

Le cadre proposé est de se baser sur l’extension de techniques d’adaptation de maillages triangulaires. Celles-ci sont robustes et permet-tent intrinsèquement de contrôler la densité, l’orientation et la qualité du maillage. En considérant les travaux récents sur les champs d’orientations 3D, elles peuvent être complétées d’une information d’orientation pour générer des maillages quadrangulaires. Partant des travaux de [1] et [2], l’objectif du stage sera de : valider une nouvelle procédure d’insertion de points durant la phase d’adaptation du maillage ainsi qu’une procédure de création directe de quadrilatères. Ce travail nécessite de développer des opérateurs topologiques de modi-fication de maillages et des opérateurs géométriques reposant sur les notions de métriques et d’orientations pour placer les nouveaux points du maillage. D’un point de vue mathématique, tous les développements reposeront sur le socle théorique des espaces métriques Riemanniens. L’implantation se fera dans le cadre du projet open-source GMDS, projet C++ développé et maintenu au CEA/DAM. Les résultats seront évalués sur différents exemples analytiques et sur des données issues de codes de simulation numérique. [1] A. Loseille. Metric-orthogonal anisotropic mesh generation. Procedia Engineering, 82:403–415, 2014. [2] N. Kowalski, F. Ledoux, and P. Frey. Smoothness driven frame field generation for hexa-hedral meshing. Computer Aided Design, vol. 72, pages 65-77, 2016.

Domaines de spé-cialité requis Informatique – Mathématiques appliquées

Langages/logiciels C/C++

Mots clés Maillage quadrangulaire, géométrie algorithmique, adaptation de maillage, métrique, orientations.

Formation recher-chée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 34

Page 35: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Etude et implantation d’algorithmes parallèles de génération

d’hexaèdres par combinaison de tétraèdres

Référence SN-19-05

Contexte

Le CEA, acteur majeur en matière de recherche et d’innovation, est re-connu comme un expert du domaine HPC grâce à l’impulsion du « Pro-gramme Simulation ». La simulation numérique consiste à reproduire par le calcul le fonctionnement d’un système physique, préalablement décrit par un ensemble de modèles. Le CEA/DAM travaille à l’élaboration de méthodes mathématique qui nécessitent le plus souvent la discrétisation en hexaèdres du domaine d’étude. De tels maillages sont utilisés par de nombreux organismes de recherche et industriels pour la résolution de problèmes physiques (interaction fluide-structure, aérodynamisme). La génération automatique de maillages 3D purement hexaédriques est un problème difficile pour lequel aucune solution satisfaisante n’existe actuellement. De ce fait, depuis quelques années, différentes solutions [1,2,3] ont été proposées pour générer des maillages à dominante hexaé-drique, c’est-à-dire composés majoritairement d’hexaèdres et minoritaire-ment de tétraèdres, prismes à base triangulaire et de pyramides à base quadrangulaire. [1] S. Meshkat, D. Talmor, Generating a mixed mesh of hexahedra, pentahedra and tetrahe-dra from an underlying tetrahedral mesh, International Journal for Numerical Methods in Engineering, pp. 17-30, 2000. [2] S. Yamakawa, K. Shimada, Fully-automated hex-dominant mesh generation with direc-tionality control via packing rectangular solid cells, International Journal for Numerical Meth-ods in Engineering, pp. 2089-2129, 2003. [3] D. Sokolov, N. Ray, L. Untereiner, B. Levy, Hexahedral-dominant meshing, ACM Tran-sactions on Graphics, pp. 1-23, 2016.

Objectifs

Les algorithmes proposés dans [1,2,3] suivent une approche indirecte qui consiste à générer un maillage tétraèdrique puis à combiner des té-traèdres pour créer des hexaèdres. Les heuristiques employées sont de nature « gloutonne ». Relativement coûteuse en temps de calcul, elles ne garantissent pas d’obtenir une solution optimale au problème posé. C’est pourquoi le stage proposé consistera à :

1. Développer au sein du projet open-source GMDS, une version concurrente d’au moins un algorithme de recombinaison de té-traèdres en hexaédres. L’implémentation pourra se faire indiffé-remment en C++ ou en Rust.

2. A l’aide de méthodes issues de la recherche opérationnelle (pro-grammation dynamique par exemple), proposer une approche as-surant l’optimalité de la solution.

Evaluer théoriquement et expérimentalement les solutions développées aux étapes 1 et 2.

Domaines de spé-cialité requis Informatique

Langages/logiciels C/C++ et/ou Rust Mots clés Maillage, théorie des graphes, recherche opérationnelle Formation recher-chée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante :

[email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 35

Page 36: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Equilibrage de charge dynamique pour la visualisation scientifique

Référence SN-19-06

Contexte

Le CEA, acteur majeur en matière de recherche et d’innovation, est con-sidéré comme étant un expert du Calcul Haute Performance. Ses équipes développpent des codes de simulation numérique et des logiciels d’environnement de codes pouvant s’exécuter efficacement sur des su-percalculateurs. En particulier, les équipes du CEA/DAM spécialisées en visualisation scientifique sont reconnues pour leur expertise en visualisa-tion parallèle sur supercalculateur. Pour cela, elles participent activement au développement de la bibliothèque open-source VTK, qui fournit un pipeline complet de visualisation mixant différents types de données et d’algorithmes (des filtres). Pour répondre aux besoins des codes de simulations, le CEA/DAM a dé-veloppé depuis quelques années des structures de données et des filtres VTK dédiés à la manipulation de maillages AMR [1]. Intuitivement, un maillage AMR est un grille régulière (I,J,K) où chaque maille de la grille peut elle-même être subdivisée en une sous-grille et ce de manière récur-sive. Le stage proposé s’inscrit dans la manipulation parallèle de tels maillages et plus spécifiquement dans leur partitionnement. Partitionner un maillage consiste à attribuer chaque maille à exactement un et un cœur, dans le but d'équilibrer les temps de calcul sur chaque cœur [2]. [1] Guénolé Harel, Jacques-Bernard Lekien, Philippe P. Pébaÿ. Two New Contributions to the Visualization of AMR Grids: I. Interactive Rendering of Extreme-Scale 2-Dimensional Grids II. Novel Selection Filters in Arbitrary Dimension. [2] C. Chevalier and F. Pellegrini, PT-SCOTCH: a tool for efficient parallel graph ordering. Parallel Computing, 34(6-8), pp 318-331, 2008.

Objectifs

L’objectif du stage est de proposer un nouvel algorithme de partitionne-ment dédié à la visualisation scientifique de maillages AMR. Le travail consistera à :

1. Effectuer une étude bibliographique des algorithmes de partition-nement généralistes de graphes et implémenter une première ap-proche en utilisant les structures AMR de VTK ;

2. Puis, en tirant parti des caractéristiques intrinsèques des mail-lages AMR, l’approche sera étendue pour gérer des maillages disposant de mailles fantômes (i.e. des mailles dupliquées sur plusieurs coeurs).

Selon l’état d’avancement des travaux et le profil du stagiaire, ce travail pourra être complété par : (1) une extension parallèle de l’algorithme où l’on s’intéressa au paradigme de programmation concurrente (multi-threads) ; (2) la modification d’un partitionnement existant (ou repartition-nement). L’ensemble des travaux réalisés sera implémenté et évalué expérimenta-lement au sein de la bibliothèque VTK écrite en C++. L’étudiant aura pour cela accès à plusieurs supercalculateurs et par la même différents types d’accélérateurs modernes.

Domaines de spé-cialité requis Informatique

Langages/logiciels C/C++, Python

Mots clés Visualisation scientifique, AMR, Partitionnement, VTK. Formation recher-chée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 36

Page 37: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Etude et évaluation de la structure de donnée SVDAG et ses

variantes pour le RayTracing en visualisation scientifique

Référence SN-19-07

Contexte

Le CEA, acteur majeur en matière de recherche et d’innovation, est considéré comme étant un expert du Calcul Haute Performance. Dans ce contexte, les équipes du CEA/DAM spécialisées en visualisation scientifique sont reconnues pour leur expertise en visualisation parallèle sur supercalculateur. Elles participent activement au développement de la bibliothèque open-source VTK, qui fournit un pipeline complet de visualisation associant différents types de données et d’algorithmes. Pour répondre aux besoins de codes de simulation, le CEA/DAM a développé depuis quelques années des structures de données et des filtres VTK dédiés à la visualisation et la manipulation de maillages AMR [1]. D’autres structures hiérarchiques utilisées dans le cadre de l’industrie cinématographique ou du jeux-vidéo permettent un rendu réaliste de type ray-tracing en temps réel en faisant appel à la programmation sur carte graphique (CUDA). Ces structures sont basées sur les Smart Voxel Octrees (SVO) [2], une représentation d’une scène voxelisée de type octree optimisée. Des techniques de compressions offrent par la suite des gains substantiels en tenant compte des motifs similaires : les Smart Voxel Directed Acyclic Graph (SVDAG) [2] ou encore les Symmetric SVDAG (SSVDAG) [3]. [1] Guénolé Harel, Jacques-Bernard Lekien, Philippe P. Pébaÿ. Visualization and Analysis of Large-Scale, Tree-Based, Adaptative Mesh Refinement Simulations with Arbitrary Rectilinear Geometry. [2] Viktor Kämpe, Erik Sintorn et Ulf Assarsson. High Resolution Sparse Voxel DAGs. [3] Alberto Jaspe Villanueva, Fabio Marton et Enrico Gobbetti. Symmetry-aware Sparse Voxel DAGs (SSVDAGs) for compression-domain tracing of high-resolution geometric scenes.

Objectifs

L’objectif du stage est de permettre l’évaluation de ces structures hiérarchiques pour la visualisation scientifique. En contact avec les équipes de recherche suédoises à la base du SVDAG, le stagiaire devra : 1. Tout d’abord, étudier et comprendre la théorie et l’implémentation des

structures SVO/SVDAG/SSVDAG pour en évaluer les performances de rendu ray-tracing dans un contexte maitrisé.

2. Un premier convertisseur VTK-AMR vers SVDAG/SSVDAG sera à implémenter.

3. Le travail se poursuivra par l’application de rendu réaliste de type lancé de rayons à base de SVDAG sur ces données issues de VTK-AMR.

Plusieurs développements seront possibles en vue de prendre en compte la notion de variables ou de compresser encore plus les informations dans le cadre de rendu de films interactifs. Les développements effectués seront évalués aussi bien sur GPU que sur les nombreux accélérateurs et processeurs disponibles au CEA/DAM.

Domaines de spécialité requis

Informatique

Langages/logiciels C/C++, Python

Mots clés Visualisation scientifique, AMR, multithread, GPU, VTK, MPI, Anglais. Formation recherchée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse

Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 37

Page 38: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Etude et implémentation d’algorithmes massivement multi-threads et GPU en visualisation scientifique

Référence SN-19-08

Contexte

Le CEA, acteur majeur en matière de recherche et d’innovation, est considéré comme étant un expert du Calcul Haute Performance. Dans ce contexte, les équipes du CEA/DAM spécialisées en visualisation scientifique sont reconnues pour leur expertise en visualisation parallèle sur supercalculateur. Elles participent activement au développement de la bibliothèque open-source VTK, qui fournit un pipeline complet de visualisation associant différents types de données et d’algorithmes (des filtres). Pour répondre aux besoins de codes de simulation, le CEA/DAM a développé depuis quelques années des structures de données et des filtres VTK dédiés à la visualisation et la manipulation de maillages AMR [1]. Intuitivement, un maillage AMR est un grille régulière (I,J,K) où chaque maille de la grille peut elle-même être subdivisée en une sous-grille et ce de manière récursive. Ces structures de données AMR dans VTK sont conçues pour une utilisation dans un contexte de mémoire distribuée. En considérant la prise en charge récente de la programmation concurrente dans VTK à l’aide de la bibliothèque VTK-m [2], il devient possible d’envisager des structures et des filtres AMR dans un contexte hybride (mémoire distribuée et partagée). [1] Guénolé Harel, Jacques-Bernard Lekien, Philippe P. Pébaÿ. Two New Contributions to the Visualization of AMR Grids: I. Interactive Rendering of Extreme-Scale 2-Dimensional Grids II. Novel Selection Filters in Arbitrary Dimension. [2] Kenneth Moreland, Christopher Sewell, and all. VTK-m: Accelerating the Visualization Toolkit for Massively Threaded Architectures.. IEEE Computer Graphics and Applications, 36(3), May/June 2016.

Objectifs

L’objectif du stage est de fournir une première version multi-threads des structures de données AMR de VTK développées au CEA/DAM. En s’appuyant sur la bibliothèque VTK-m, le stagiaire devra :

1. Tout d’abord, étudier et comprendre l’architecture de VTK-m d’une part et évaluer son utilisation sur des algorithmes standards de VTK-m.

2. Puis, un premier travail consistera à proposer une structure de grille régulière (sans sous-grille) basée sur Vtk-m et des algorithmes simples de manipulation.

3. Le travail se poursuivra enfin sur les structures de données et les traitmements AMR complets.

Une extension au contexte hybride sera possible. Les développements effectués seront évalués aussi bien sur GPU que sur les nombreux accélérateurs et processeurs disponibles au CEA/DAM.

Domaines de spécialité requis Informatique

Langages/logiciels C/C++, Python

Mots clés Visualisation scientifique, AMR, multithread, GPU, VTK, MPI. Formation recherchée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse

Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 38

Page 39: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Algorithme concurrent d’appariement de sommets dans un graphe Référence SN-19-09

Contexte

Le CEA, acteur majeur en matière de recherche et d’innovation, est reconnu comme un expert du domaine HPC grâce à l’impulsion du « Programme Simulation ». La simulation numérique consiste à reproduire par le calcul le fonctionnement d’un système physique, préalablement décrit par un ensemble de modèles. Au vu de la taille des données manipulés, il est nécessaire de recourir à des techniques de parallélisme pour optimiser les temps de traitement. Parmi les outils algorithmiques nécessaires figurent les algorithmes d’appariement qui traitent la résolution d’un problème combinatoire important pour de nombreux champs applicatifs en informatique. Un appariement dans un graphe G=(V,E), où V est un ensemble de sommets et E un ensemble d’arêtes reliant des sommets de V, est un sous-ensemble A de E tel que les arêtes de tout couple de A n’ont aucun sommet en commun. Si l’on pondère les arêtes de E, alors un problème classique d’appariement est de trouver un appariement A de poids maximum. C’est ce problème qui sera traité dans le stage proposé en considérant une approche parallèle concurrente (en d’autres termes multi-threads). Plus précisément le travail consistera à étudier, implanter et évaluer expérimentalement l’approche proposée dans [1]. [1] F. Manne and M. Halappanavar, New Effective Multithreaded Matching Algorithms, 28th International Parallel & Distributed Processing Symposium, 2014.

Objectifs

L’objectif premier du stage est d’étudier, implanter et évaluer expérimentalement l’approche proposée dans [1]. L’ensemble des travaux réalisés seront intégrés au sein du projet open-source COUPE, pour COncUrrent PartitionEr. Cette bibliothèque, développée au CEA, a pour objectif de fournir un cadre pour la définition et l’évaluation d’algorithmes concurrents de partitionnement de graphes et de maillage. Elle est écrite à l’aide du langage de programmation Rust, langage voisin du C et C++, développé et supporté par la fondation Mozilla. Aucune connaissance en Rust n’est nécessaire pour candidater à ce stage.

Selon les résultats obtenus et le profil du stagiaire, ce travail pourra être complété par :

• L’utilisation de l’algorithme d’appariement pour la résolution d’un problème de partitionnement de maillages ;

• La comparaison avec un second algorithme d’appariement ; • La modification de la stratégie de parallélisation concurrente.

Domaines de spécialité requis Informatique

Langages/logiciels Rust

Mots clés Théorie des graphes, algorithmique, implémentation, parallélisme Formation recherchée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse

Oui

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 39

Page 40: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Simulateur des flux de données des codes de calcul HPC

Référence SN-19-10

Contexte

L’explosion du volume de données produites par les codes de calcul scientifique sur les supercalculateurs de classe exaflopique impose de mettre en place des stratégies innovantes afin de relâcher les contraintes s’appliquant sur les systèmes de fichiers parallèles et d’améliorer les performances des outils d’analyse, de visualisation et de sauvegarde des données. Un domaine de recherche actif consiste à mettre en place des solutions de visualisation et de traitement des données dit in-situ, c’est-à-dire au cours de la simulation et alors que les données résident encore en mémoire. La complexité croissante des codes de calcul et l’évolution vers l’exascale rendent impraticable l’évaluation des performances à grande échelle de ces mécanismes de traitement des données in-situ. Il devient donc nécessaire de recourir à des simulateurs, légers et flexibles, de codes de calcul, reproduisant les flux de données caractéristiques de ces simulations.

Objectifs

L’objectif de ce stage est de développer un simulateur parallèle capable de reproduire des flux de données caractéristiques des codes de calcul du CEA/DAM. Le stagiaire devra notamment : caractériser les données produites par différents codes de calculs parallèles du CEA/DAM (types, volume, fréquence, distribution parallèle, histogramme, etc.), proposer une modélisation de ces flux de données, développer un simulateur parallèle et paramétrable reproduisant les flux de données caractéristiques des codes de calculs, évaluer les performances de différentes bibliothèques d’écritures de données grâce à ce simulateur. Le stagiaire aura accès aux calculateurs du centre de calcul du CEA pour réaliser ses expérimentations

Domaines de spécialité requis Informatique

Langages/logiciels Python, C/C++, git, json

Mots clés HPC, données, communications Formation recherchée BAC+5

Durée du stage 6 mois Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 40

Page 41: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Couplage d’un framework de visualisation in-situ avec un code

de calcul hydrodynamique HPC

Référence SN-19-11

Contexte

L’explosion du volume de données produites par les codes de calcul scientifique sur les supercalculateurs de classe exaflopique impose de mettre en place des stratégies innovantes afin de relâcher les contraintes s’appliquant sur les systèmes de fichiers parallèles et d’améliorer les performances des outils d’analyse, de visualisation et de sauvegarde des données.

Un domaine de recherche actif consiste à mettre en place des solutions de visualisation et de traitement des données dit in-situ, c’est-à-dire au cours de la simulation et alors que les données résident encore en mémoire.

Objectifs

L’objectif de ce stage est de visualiser une simulation en cours de calcul en couplant le framework open source Paraview Catalyst à un code de calcul hydrodynamique du CEA/DAM.

Le stagiaire devra notamment : prendre en main le code de calcul et le framework de visualisation Paraview, effectuer les développements nécessaires à l’intégration du framework dans les sources du code de calcul, faire une démonstration de l’utilisation du framework pour visualiser une simulation en cours de calcul documenter dans un rapport les étapes nécessaires à la mise en place d’un tel couplage

Le stagiaire aura accès aux calculateurs du centre de calcul du CEA pour réaliser ses expérimentations.

Domaines de spécialité requis Informatique

Langages/logiciels C/C++, git, Python

Mots clés HPC, visualisation, in-situ, traitement, simulation

Formation recherchée BAC+5

Durée du stage 6 mois

Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 41

Page 42: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

13 LES STAGES EN SECURITE INFORMATIQUE

Titre R&D autour de la cartographie réseau

Référence SI-19-01

Contexte

La cartographie active de réseau consiste à interroger des machines et des services et à en tirer des informations quant aux systèmes et logiciels utilisés. Certaines fonctionnalités font défaut aux principaux outils de cartographie réseau existants (par ex : Nmap, Zmap).

Objectifs

Il s’agira d’ajouter de nouvelles fonctionnalités et de les tester largement sur des réseaux locaux et sur Internet. Le stage consistera à développer et implémenter les fonctionnalités suivantes : index des fichiers partagés, large distribution des analyses (scans), capture d’écran de différents services, Indexation efficace des résultats.

Domaines de spécialité requis Sécurité des systèmes d’information, Réseaux

Langages/logiciels Python, Nmap + NSE (LUA), ElasticSearch, MongoDB

Mots clés Scan réseau, découverte réseau

Formation recherchée BAC+5

Durée du stage 3 à 6 mois

Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 42

Page 43: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Dé-obscurcissement de JavaScript

Référence SI-19-02

Contexte

Les « Exploit Kits » sont des kits clé-en-main d’exploitation de vulnérabilités, visant principalement les navigateurs et les différents plug-ins associés. Afin d’éviter les détections automatiques, ils embarquent des moteurs d’obscurcissement de leurs différents composants. Une partie conséquente de ces composants (notamment la détection de version, d’antivirus, la création de la charge finale, etc.) est développée en JavaScript. Plus l’obscurcissement est important et efficace, plus les ressources (temps, compétences) des analystes vont être consommées, et donc plus le « temps de vie » de la plateforme d’attaque sera long.

Objectifs

Le stage consistera à :

faire un état des lieux des méthodes d’obscurcissements utilisées (sources publiques et interne au service), faire un inventaire des outils existants et de leurs limitations (par ex : Google V8, SpiderMonkey, Thug), proposer des méthodes et des outils permettant d’analyser ce genre de code, c’est-à-dire permettant d’améliorer la lisibilité, de découvrir interactivement les possibilités d’attaques embarquées, d’annoncer une cible virtuelle et d’observer le comportement du code, …

Ces livrables devront pouvoir être facilement adaptables aux nouvelles méthodes et implémentations ajoutées dans les Exploit Kits (potentiellement plusieurs fois par semaine). Les outils seront testés sur des cas réels, à l’état de l’art et rencontrés tous les jours sur des réseaux connectés à Internet.

Domaines de spécialité requis Analyse de code, méthode d’obscurcissement

Langages/logiciels JavaScript, Python

Mots clés ExploitKits, JavaScript, Obscurcissement, Analyse et extraction de malwares

Formation recherchée BAC+5

Durée du stage 6 mois

Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 43

Page 44: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Reconnaissance automatique de fonctions par effets de bord

Référence SI-19-03

Contexte

Sibyl est un outil, open-source, développé au CEA/DAM. Il a pour but de reconnaître des fonctions connues dans un binaire en « brute-forçant » leurs APIs et en comparant leurs effets de bord avec un ensemble de signatures. Même si l’outil est encore récent, il est déjà utilisé notamment dans l’analyse de codes malveillants (malwares) et pour l’audit de logiciels type firmware, apportant un gain de temps important

Objectifs

Le but du stage est d’étendre les capacités de l’outil, notamment en : agrandissant le pool de signatures (par exemple : ajout de la librairie OpenSSL) ; améliorant le parallélisme (par exemple : port OpenMPI, réduction de l’empreinte) ; trouvant de nouvelles applications (par exemple : l’outil pourrait permettre de rechercher automatiquement l’ABI des fonctions, de faire du différentiel de fonctions en comparant leurs effets de bord) ; exprimant de manière indépendante de l’ABI et de l’architecture de nouveaux éléments (par exemple : représentation des structures en tenant compte des technique de packing des compilateurs).

Domaines de spécialité requis Reverse Engineering

Langages/logiciels Python, Miasm (facultatif)

Mots clés Miasm, Signature de fonctions, Firmware, Malware, Reverse-Engineering

Formation recherchée BAC+4

Durée du stage 3 mois

Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante : [email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 44

Page 45: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Techniques de reverse engineering de protocoles réseaux propriétaires

par émulation de binaires et data slicing

Référence SI-19-04

Contexte

Il n'est pas rare de voir déployées des solutions propriétaires dans les grandes entreprises, à la fois logicielles ou matérielles. Dans les deux cas, les produits concernés sont susceptibles d'être raccordés au système d'information, et ainsi d'offrir à un attaquant potentiel un angle d'attaque difficile à investiguer. Les techniques usuelles de reverse engineering peuvent être laborieuses quand il s'agit de comprendre et reverser un protocole réseau propriétaire. Grâce aux techniques de data tainting et de data slicing, il est possible de formaliser (ou au moins tracer) les fonctions de transfert des données envoyées sur le réseau : les opérations qui sont effectuées à partir des données reçues sur les interfaces réseau, ou la manière dont sont construites les données qui sont envoyées sur celui-ci. A travers une série de scénarii d'exécutions possibles, les techniques usuelles d'émulation de binaires permettent de générer des traces analysables à partir desquelles il est envisageable de reconstruire des protocoles à l'envers, et d'en retrouver une partie des spécifications. À partir de là, des angles d'attaque à distance peuvent être élaborés, et des vulnérabilités d'implémentation exploitées. Il serait aussi intéressant de pouvoir visualiser les résultats de ce type d'analyses graphiquement (sous forme de graphes d'appels avec les valeurs des arguments passés aux fonctions par exemple), et cela malgré la grande quantité de données potentiellement générée.

Objectifs

Les objectifs chronologiques sont : réalisation d'un état de l'art des publications et outils déjà existants dans ce domaine ; compréhension et maîtrise de Miasm2, une plateforme Python complete de reverse engineering ; création de scenarii simples de tests unitaires pour valider le fonctionnement de l'outil ; développement d'un outil qui exécute un binaire et aide à la reconstruction de son protocole ; mise en place d'une solution ergonomique de visualisation des résultats sous forme graphique.

Il sera également possible d'atteindre les objectifs supplémentaires suivants :

valider le fonctionnement sur des binaires réels, compilés pour des architectures différentes ; développer un module capable de détecter les erreurs d'implémentation dans les binaires analysés, et de construire un payload qui permettra l'exploitation directe ou au moins un fuzzer.

Domaines de spécialité requis Reverse engineering

Langages/logiciels Python, Miasm

Mots clés Reverse Engineering, Protocoles, Développement Formation recherchée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante :

[email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 45

Page 46: PROPOSITIONS DE STAGES -

Propositions de stages informatiques 2019 au CEA/DAM Ile de France

Titre Techniques de fuzzing et d'audit de code appliquées à l'évaluation de la sécurité de systèmes de fichiers réseau

Référence SI-19-05

Contexte

Les serveurs de fichiers sont un point névralgique de toute infrastructure informatique d'entreprise. D'un point de vue sécurité, il est essentiel qu'ils puissent garantir un contrôle des accès correct et précis. Ceci implique à la fois une bonne robustesse du code et des fonctionnalités de sécurité correctement pensées et implémentées. En particulier, pour ses clusters de calcul scientifique (HPC), le CEA/DAM construit des systèmes de fichiers réseau à grande échelle, avec des capacités de stockage de plusieurs dizaines de Po et des bandes passantes de plusieurs centaines de Go/s. Ainsi, les choix d'implémentation sont dirigés autant par les performances que par la sécurité. Au sein de ces architectures, un logiciel est utilisé en particulier, le serveur Ganesha pour Linux. Il s'agit d'une implémentation en espace utilisateur d'un serveur de différents protocoles dont NFS et v9fs (aussi appelé 9P). Il est principalement développé au CEA/DAM.

Objectifs

L'objectif du stage est d'effectuer une évaluation de la sécurité de Ganesha, afin de mettre en évidence d'éventuelles vulnérabilités résiduelles. Afin de mener cette évaluation, les techniques envisagées sont de deux types. D'une part, les techniques de fuzzing peuvent être appliquées du point de vue des appels système liés au VFS de Linux, ou du point de vue du réseau. D'autre part, les techniques d'analyse de code source ont pour but de détecter des erreurs d'implémentation menant à des vulnérabilités ou à des défauts dans les fonctions de sécurité. Le travail du stagiaire sera a priori découpé en deux phases appliquées aux deux types de techniques :

une phase de recensement des outils et techniques adaptées, une phase de test sur le logiciel Ganesha.

Domaines de spécialité requis Sécurité système, systèmes de fichiers réseau

Langages/logiciels Ganesha : https://github.com/nfs-ganesha/nfs-ganesha v9fs : https://www.kernel.org/doc/Documentation/filesystems/9p.txt

Mots clés Network file system, fuzzing, analyse du code source Formation recherchée BAC+5

Durée du stage 5 à 6 mois Stage pouvant se poursuivre en thèse

Non

Pour faire acte de candidature, veuillez transmettre un CV et une lettre de motivation par mail à l’adresse suivante :

[email protected] Pour tout renseignement complémentaire, vous pouvez contacter Isabelle Visotto au 01.69.26.40.00.

Page 46

Page 47: PROPOSITIONS DE STAGES -
Page 48: PROPOSITIONS DE STAGES -

Crédit photos : CEA CADAM ; P. Stroppa

Page 48