Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

21
Présentation Société Cédric Carbone Talend CTO ccarbone (at) talend. com

description

Slides corporate de la société Talend (Oct08) et ses 4 plateformes Open Source :-Talend Open Studio-Talend Integration Suite-Talend Open Profiler-Talend Data QualityPlus d'info à http://www.talend.com

Transcript of Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Page 1: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Présentation Société

Cédric CarboneTalend CTOccarbone (at) talend. com

Page 2: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 2© 2008 Talend – All Rights Reserved

Agenda

Introduction Le marché et ses drivers Présentation des solutions Produits & services Clients et partenaires

Page 3: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 3© 2008 Talend – All Rights Reserved

Talend en Quelques Mots

Principal éditeur open source d’intégration de données Offre aux entreprises de toutes tailles des solutions d’intégration

de données répondant à l’ensemble de leurs besoins Financé par des fonds de capital risque

Galileo Partners et Allianz Private Equity Partners Opérations et utilisateurs dans le monde entier

Page 4: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 4© 2008 Talend – All Rights Reserved

Résumé des Tendances

Un taux élevé d’adoption 500 000 téléchargements du "core product" 2,5 millions de "lifetime downloads" 20% s’enregistrent comme utilisateurs 30% acceptent les mises à jour automatiques

1 download de Talend Open Studio

chaque minute

1 nouveau clientchaque jour

Page 5: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 5© 2008 Talend – All Rights Reserved

Second tour de table

Historique

Premier éditeur open source spécialisé dans l’intégration Créé en 2005 après 3 ans de R&D

2005 2006 2007 2008

Talend Open Studio Beta 1

Talend OpenStudio v1.0

Premier tour de table: Allianz Private

Equity and Galileo Partners

Lancement des opérations US

avec bureau à Los Altos, CA

Data QualityTalend Integration

Suite

Talend OnDemand / SaaS

Opérations

Produits

2,5 millions de lifetime downloads

Page 6: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 6© 2008 Talend – All Rights Reserved

L’Open Source et l’Intégration de Données

Création de l’Open Source

Accès libre au code

« Free Software Foundation »(Richard Stallman)

Lancement de la GPL et de GNU

Création de l’Open Source Initiative

Mise en œuvre d’une politique répondant aux réalités économiques et techniques

Émergence des solutions Open Source

Apache…

Apparition des premiers éditeurs

MySQL, JBoss, SugarCRM…

Les principaux acteurs de l’Open Source deviennent des leaders

JBoss, SugarCRM…

Apparition d’acteurs de plus en plus mûrs

Red Hat, Jaspersoft, Talend…

1970 1984 1998 2000 2003 2005 2007

Page 7: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 7© 2008 Talend – All Rights Reserved

L’Etat du Marché

Situation Croissance exponentielle des volumes de données Diversité, hétérogénéité et mauvaise qualité des sources de

données (internes & externes) Upgrades par ajout de couches successives

Contraintes Réglementaires (Sarbanes-Oxley, Bâle II, HIPAA, etc.) Opérationnelles (“just-in-time”)

Conséquences Raccourcissement continuel des délais d’intégration de données Demande d’amélioration de la qualité des données Besoin d’une vue unique sur les données afin de mieux les

contrôler

Page 8: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 8© 2008 Talend – All Rights Reserved

Positionnement de Talend

Décisionnel

(ETL)

IntégrationOpérationnelle

Duplication & synchronisation des données

Migration d’applicationsMigration &

chargement de données

Chargement des systèmes décisionnels

Solutions de Talend

Profiling & nettoyage

de données

Qualitéde Données

Page 9: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 9© 2008 Talend – All Rights Reserved

Solution

Simple à télécharger, evaluer et utiliser Faible coût Facile à utiliser et à maintenir Prix et technologie scalables et flexibles Fonctionnalités et performances supérieures Développement accéléré de nouvelles fonctionnalités

grâce à la communauté Une solution d’intégration de données fiable, reposant

sur des technologies récentes et disponible en Open Source

Page 10: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 10© 2008 Talend – All Rights Reserved

Talend Data QualityEnterprise Edition

• Teamwork• Enterprise Deployment• Production Monitoring

L’Offre de Talend

Talend Data QualityPersonal Edition

• Data Profiler Advanced• Data Cleanser

Talend Integration Suite

• Advanced Studio• Teamwork• Enterprise Deployment• Production Monitoring

Talend On Demand

• Hosted Repository

Activity Monitoring Console /PE

Intégration de Données Qualité de Données

Talend Open Profiler

• Data Profiler• Metadata Manager

Data Q

uality Option

Talend Open Studio

Talend Open Studio

• Business Modeler• Job Designer• Metadata Manager

Souscription G

PL

Open Source

EntrepriseIndividuel

Page 11: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 11© 2008 Talend – All Rights Reserved

Talend Open Studio

Fonctionnalités Clés Modélisation de processus orientés métier Développement graphique Performance, fiabilité et montée en charge Connectivité élargie et universelle Design et exécution reposant sur un référentiel unique Debugging en temps réel

Page 12: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 12© 2008 Talend – All Rights Reserved

Talend Integration Suite

Bénéfices clés Augmentation de la productivité des développements Collaboration et promotion des standards de développement Gestion des déploiements entreprise Centralisation de la surveillance des processus d’intégration

Modules Advanced Studio Shared Repository Job Conductor & Job Conductor Advanced Grid Conductor CPU Balancer Distant Run Activity Monitoring Console & Dashboard

Page 13: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 13© 2008 Talend – All Rights Reserved

Talend On Demand

Première plateforme ouverte d’intégration de données en mode Software as a Service (SaaS) Référentiel en ligne partagé, hébergé par Talend Consolidation des métadonnées et des informations projet

Bénéfices Consolidation du travail des équipes

Facilite collaboration, réutilisation d’objets et de code Promeut les standards de développement

Facile à mettre en œuvre Pas d’installation, de configuration ou d’administration Utilisation de Talend Open Studio pour la conception et l’exécution

Sécurité Accès sécurisé Comptes séparés Seules les métadonnées sont stockées en central

Les données des applications restent à l’intérieur du SI

Page 14: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 14© 2008 Talend – All Rights Reserved

Talend Open Profiler

Profiling de Données Examiner les données contenues dans les sources Collecter des informations et des statistiques sur ces données

Fonctionnalités Découverte des métadonnées Définition des statistiques Résultats & graphiques

Bénéfices Découverte de la qualité Compréhension des

caractéristiques des données Identification des problèmes potentiels Réduction du temps et des ressources pour identifier des

données problématiques Plus de contrôle pour les fonctionnels

Page 15: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 15© 2008 Talend – All Rights Reserved

Talend Data Quality

Solution complète de gestion de la qualité des données Data Profiler

Découverte et évaluation de la qualité des données Traçage de l’historique de la qualité des données

Data Cleanser Transformation des données pour améliorer leur qualité Élimination ou recyclage des enregistrements erronés Correction des mauvaises données Interfaces avec :

Bases de validation de noms, adresses & téléphones Tables de synonymes et données de référence Routines externes de nettoyage des données

Types de traitement : Filtrage & identification Correction Enrichissement

Page 16: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 16© 2008 Talend – All Rights Reserved

Talend Data Quality

Bénéfices Suite intégrée pour diagnostiquer et corriger les données

erronées Data profiling

Mesure et trace le niveau de qualité Préserve l’historique pour mesure l’amélioration ou la

dégradation Data cleansing

Élimine les incohérences, les doublons, etc. Produit des données augmentées/enrichies Standardise les données

Gestion complète du cycle de vie de la qualité des données Intégration native avec l’intégration de données

Implémente un "Data Quality Firewall" dans les processus d’intégration de données

Page 17: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 17© 2008 Talend – All Rights Reserved

Services et Support

Formation 2 niveaux de formation : Foundation et Advanced Une bonne connaissance des solutions de Talend maximise

l’efficacité de l’implémentation

Support Garantit une version stable maintenue par l’équipe R&D de

Talend Niveaux Gold, Silver et Platinum

Consulting Une équipe de consultants, experts en intégration de données,

dédiée aux clients et partenaires de Talend

Page 18: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 18© 2008 Talend – All Rights Reserved

Quelques Clients

Finance& Assurance

Services

Industrie& Distribution

Secteur Public& Éducation

Page 19: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 19© 2008 Talend – All Rights Reserved

Partenariats (Exemples)

Technologiques IntégrateursOEMPowered by Talend

Alliances

Page 20: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Slide 20© 2008 Talend – All Rights Reserved

Principaux Differentiateurs Techniques

Générateur de code Code exécuté totalement visible Pas de surcoût d’interprétation lors de l’exécution Exploite les serveurs existants Déploiement des jobs d’intégration sur multiples serveurs (grid)

Utilisation des standards (Eclipse, Java, Perl, SQL) Exploite les compétences existantes Abaisse les coûts de formation

Facilement extensible Incorporation de routines Perl ou Java existantes Création de vos propres composants – ou utilisation de ceux développés

par la communauté Métadonnées et monitoring centralisés

Tous les jobs, dépendances, documentation sont stockés et versionnés en central

Monitoring global

Page 21: Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

Merci