Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de...

18
Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Transcript of Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de...

Page 1: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Filière Data Mining(Fouille de données)

Pierre Morizet-Mahoudeaux

Page 2: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Plan

• Objectifs

• Débouchés

• Formation

• UVs spécifiques

• UVs connexes

• Enseignants et partenaires

Page 3: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Structure générale des études à l’UTC

1

2

3

Fondamental Training

1st InternshipFondamental&Specialisation

Specialisation 2nd InternshipRèglement des études :

-Minimum 22 UVs réussies-Dont 14 dans lescatégories CF/CP

-NPML, communication-Culture générale-Validation stage et projet

Page 4: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Structure du département GI

Pierre Morizet

Page 5: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Les séjours à l’étranger

Double-diplômes :Cranfield (UK)Saragosse (Esp)Turin (It)*

Page 6: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Photographie d’une promotion

• Flux moyen : 150 diplômés par an• Profil moyen d’un diplômé du GI– 25 UV environ.• Dont 18 CF/CP• Plus de 3 mentionnées– 2 semestres en entreprise

• Quelques chiffres– Près de 40% ont passé au moins 6 mois dans un pays étranger– Plus de 20% sortiront avec 2 diplômes (DEA, Masters étrangers)

Page 7: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Objectifs

• Les entreprises et administrations sont confrontées à desdonnées surabondantes

•Extraire des informations permettant de faciliter les prisesde décision.

•Former des ingénieurs “mineurs” de données

– information = minerai

– ingénieur = mineur

Constat

Besoin

Réponse

Page 8: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Débouchés

•Deux orientations

– Informatique décisionnelle

– Gestion d’entrepôts de données

• Secteurs d’activités très variés :

– Entreprises utilisatrices : des multinationales à l’administrationen prililégiant les banques et les assurances ;

– Sociétés de Services et d’Ingénierie Informatiques (SSII)

– Editeurs de logiciels (SAS, SPPS...).

Page 9: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Débouchés

•Domaines d’applications

– Analyse de risque: assurance

– Analyse financière: tendance boursière

– Décisionnel : stratégie industrielle et commerciale

– Marketing: prospection de clients, CRM

– Médecine: recherche de structures génétiques,

– Prédiction : pic de pollution

– Gestion de stock

– ...

Page 10: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Formation

•Objectif double :

– structurer et constituer de vastes entrepôts de données àpartir de systèmes parfois hétérogènes

– « fouiller » ces données pour

• répondre à des questions précises,

• tester des hypothèses,

• réaliser des prédictions ou découvrir des relations cachées.

Page 11: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Formation UV’s spécifiques

•NF26 : Data Warehouse et décisionnel

• Principes de développement et d'exploitation des outilsinformatiques pour

• la conception et l'exploitation d'entrepôts de données

• la prise de décision

Concepts de base des modèles multidimensionnels;

Alimentation;

Interrogation, requêtage, OLAP (On-Line Analytical Processing).

Outils décisionnels (régression, CRM, tableaux de bord, …)

NF26

SY09

SY19

AP

MetadonnéesAnalysed’Impacts

Origine desdonnées

TempsRéel

Batch

Sources de données

Bases

ApplicationsMétiers, ERP

Fichiers, Web,XML, COBOL

BO Enterprise

PilotageReporting

Interrogation Analyses

Data WarehouseDat

a p

rofi

ling

MoteurETL

BO Data Integrator

Data Auditing

Data Validation

DataCleansing

Page 12: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Formation UV’s spécifiques

• SY09: Analyse de données pour le Data Mining

• Visualisation des données

• Exploration statistique

• Classification automatique

• Regression

NF26

SY09

SY19

AP

Page 13: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Formation UV’s spécifiques

• SY19 : Méthodes de décision statistiques

• Théorie de la décision

• Reconnaissance des formes

• Réseaux de neurones à couches

• Arbres de décision

NF26

SY09

SY19

AP

Page 14: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Formation UV’s spécifiques

• Atelier projet (en cours d’élaboration)

• En partenariat avec des industriels,

• Des problèmes concrets

• Réalisé par groupe de deux étudiants

• Suivi par un enseignant de l’équipe pédagogique de la filière.

NF26

SY09

SY19

AP

Page 15: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

FormationsUVs Connexes

• Prérecquis du profil commun de branche

• SY02: Méthodes statistisques pour l’ingénieur

• NF16: Algorithmique et structures de données

• NF17: Bases de données

• UV’s liées:

• GE40: Management de projets

• LO17: Recherche d’information: indexation et multimédia

• LO18: Projet multimédia

• SR03: Programmation des applications internet

• LO20: Génie logiciel

• RO04: Optimisation discrète et continue

• RO05: Processus stochastiques

• RO06: Simulation et technique d’optimisation

• SY23: Vision et image

Page 16: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Enseignants et partenaires

• Partenaires industriels

• EDF,

• Micropole-Univers,

• Exalead

• KXEN

• SAS

• CEA

• ..

• Equipe pédagogique

• Stéphane Crozat (UTC),

• Thierry Denœux (UTC),

• Gérard Govaert (UTC),

• Pierre Morizet (UTC),

• Samuel Samson (Micropole-Univers)

Page 17: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Promotions FD

• Depuis l’automne 2004 20 étudiants/an en moyenne

• Domaines couverts en stages et projets– Informatique financière, workflow, reporting,

– traitement d’images, analyse de procédé,

– business intelligence, datawarehouse, décisonnel

– analyse multivariée, modèles prédictifs, règles d’association

• Entreprises ayant accueilli des projets de fin d’études FD– Bios-groupe Keyrus, Business & Decision, Cadexan, Cap

Gemini, CERF, CEA, CSC Infogerance, Dassault Systems,Ernst & Young, France Télécom, GDF, General Electric, GEHealthcare System, Glaxowellcome, IBM, INRIA, LegrandS.A, Logia-CMG-Unilog, Mereo, Mircropole Univers, Parexelinternational, PSA, Siemens, Société Générale, Solystic,Umanis Nord, Universités, …

Page 18: Filière Data Mining (Fouille de données) - hds.utc.frpmorizet/filiereFD.pdf · (Fouille de données) Pierre Morizet-Mahoudeaux. Plan •Objectifs •Débouchés ... • Les entreprises

Merci de votre attention…