Informatica Enterprise Data Catalog...Les données sont diverses et réparties entre un grand nombre...

6
Informatica Enterprise Data Catalog Libérez la puissance des données avec un catalogue de données intelligent Les données sont devenues le poumon de notre économie, et les sociétés qui reposent sur ces dernières transforment leurs ressources de données en recettes et bénéfices. La première étape de toute initiative de transformation numérique axée sur les données consiste à gérer les données d'entreprise : dressez- en l'inventaire, évaluez leur valeur et maximisez leur utilisation — tout comme vous le faites avec les investissements d'exploitation et en capital importants. Les données sont diverses et réparties entre un grand nombre de services, d'applications et de data warehouses (certains sur site et d'autres dans le Cloud), si bien qu'il est difficile d'identifier et localiser précisément les données dont vous disposez. À l'heure des Big Data, cette situation devient d'autant plus complexe. Informatica ® Enterprise Data Catalog est un catalogue de données basé sur l'IA qui fournit un moteur de découverte basé sur l'apprentissage automatique, permettant d'examiner et d'inventorier les ressources de données au sein de l'entreprise, dans le Cloud et sur site, ainsi que les Big Data n'importe où. Les données de veille incluses à Enterprise Data Catalog proviennent du moteur CLAIRE™. Celui-ci fournit des données de veille via l'exploitation des métadonnées, afin de proposer des recommandations, des suggestions et une automatisation des tâches de gestion de données intelligentes. Les utilisateurs informatiques s'en trouvent plus productifs, tandis que les utilisateurs métiers peuvent s'impliquer pleinement dans la gestion et l'utilisation des données. Informatica Enterprise Data Catalog offre aux utilisateurs métiers et informatiques une recherche sémantique puissante ainsi que des facettes dynamiques permettant d'obtenir un filtrage des résultats, une traçabilité des données, des statistiques de profilage, une vision globale des relations, des recommandations de données similaires et un glossaire métier intégré. Vous pouvez désormais gérer facilement et efficacement les ensembles de données d'entreprise pour maximiser leur valeur partout dans votre société. Les utilisateurs métiers peuvent trouver rapidement des données et gérer facilement le cycle de vie des termes métiers, des définitions, des données de référence et plus encore. Informatica Enterprise Data Catalog est un catalogue de données basé sur l'IA qui fournit un moteur de découverte basé sur l'apprentissage automatique, permettant d'examiner et d'inventorier les ressources de données au sein de l'entreprise, dans le Cloud et sur site, ainsi que les Big Data n'importe où. Avantages Cataloguez et classez automatiquement tous les types de données dans l'ensemble de l'entreprise, à l'aide d'un catalogue basé sur l'IA Identifiez les domaines et les entités grâce à la conservation intelligente Enrichissez les ensembles de données avec des annotations gérées et issues du crowdsourcing Trouvez des données par le biais de puissantes recherches sémantiques de type Google Découvrez et comprenez vos ressources de données grâce à une vue globale incluant la traçabilité, les vues de relations, le profilage des données et des statistiques de qualité Obtenez une vue d'ensemble de votre environnement de données Intégrez à votre environnement des API ouvertes et exposez des métadonnées intelligentes où que vous soyez 1 Fiche technique

Transcript of Informatica Enterprise Data Catalog...Les données sont diverses et réparties entre un grand nombre...

Page 1: Informatica Enterprise Data Catalog...Les données sont diverses et réparties entre un grand nombre de services, d'applications et de data warehouses (certains sur site et d'autres

Informatica Enterprise  Data Catalog

Libérez la puissance des données avec un catalogue de données intelligent

Les données sont devenues le poumon de notre économie, et les sociétés qui reposent sur ces dernières transforment leurs ressources de données en recettes et bénéfices. La première étape de toute initiative de transformation numérique axée sur les données consiste à gérer les données d'entreprise : dressez-en l'inventaire, évaluez leur valeur et maximisez leur utilisation — tout comme vous le faites avec les investissements d'exploitation et en capital importants.

Les données sont diverses et réparties entre un grand nombre de services, d'applications et de data warehouses (certains sur site et d'autres dans le Cloud), si bien qu'il est difficile d'identifier et localiser précisément les données dont vous disposez. À l'heure des Big Data, cette situation devient d'autant plus complexe.

Informatica® Enterprise Data Catalog est un catalogue de données basé sur l'IA qui fournit un moteur de découverte basé sur l'apprentissage automatique, permettant d'examiner et d'inventorier les ressources de données au sein de l'entreprise, dans le Cloud et sur site, ainsi que les Big Data n'importe où. Les données de veille incluses à Enterprise Data Catalog proviennent du moteur CLAIRE™. Celui-ci fournit des données de veille via l'exploitation des métadonnées, afin de proposer des recommandations, des suggestions et une automatisation des tâches de gestion de données intelligentes. Les utilisateurs informatiques s'en trouvent plus productifs, tandis que les utilisateurs métiers peuvent s'impliquer pleinement dans la gestion et l'utilisation des données.

Informatica Enterprise Data Catalog offre aux utilisateurs métiers et informatiques une recherche sémantique puissante ainsi que des facettes dynamiques permettant d'obtenir un filtrage des résultats, une traçabilité des données, des statistiques de profilage, une vision globale des relations, des recommandations de données similaires et un glossaire métier intégré. Vous pouvez désormais gérer facilement et efficacement les ensembles de données d'entreprise pour maximiser leur valeur partout dans votre société. Les utilisateurs métiers peuvent trouver rapidement des données et gérer facilement le cycle de vie des termes métiers, des définitions, des données de référence et plus encore.

Informatica Enterprise Data Catalog est un catalogue de données basé sur l'IA qui fournit un moteur de découverte basé sur l'apprentissage automatique, permettant d'examiner et d'inventorier les ressources de données au sein de l'entreprise, dans le Cloud et sur site, ainsi que les Big Data n'importe où.

Avantages• Cataloguez et classez

automatiquement tous les types de données dans l'ensemble de l'entreprise, à l'aide d'un catalogue basé sur l'IA

• Identifiez les domaines et les entités grâce à la conservation intelligente

• Enrichissez les ensembles de données avec des annotations gérées et issues du crowdsourcing

• Trouvez des données par le biais de puissantes recherches sémantiques de type Google

• Découvrez et comprenez vos ressources de données grâce à une vue globale incluant la traçabilité, les vues de relations, le profilage des données et des statistiques de qualité

• Obtenez une vue d'ensemble de votre environnement de données

• Intégrez à votre environnement des API ouvertes et exposez des métadonnées intelligentes où que vous soyez

1

Fiche technique

Page 2: Informatica Enterprise Data Catalog...Les données sont diverses et réparties entre un grand nombre de services, d'applications et de data warehouses (certains sur site et d'autres

CaractéristiquesAPI de métadonnées à intégrer à votre environnementEnterprise Data Catalog comprend des API REST qui vous permettent de l'intégrer à votre environnement et d'utiliser le contenu du catalogue où que vous soyez. Les entreprises peuvent partager des métadonnées intelligentes — comme des applications, des rapports de Business Intelligence et des tableaux de bord — avec les utilisateurs métiers.

Des plug-ins pour Tableau afin de gouverner les données et d'assurer leur fiabilitéInformatica Enterprise Catalog for Tableau fournit des analyses agiles et en libre-service, à l'aide de données gouvernées. Les utilisateurs de Tableau peuvent ainsi accéder à l'ensemble des ressources Enterprise Data Catalog pour créer ou fournir des visualisations de données. Les utilisateurs métiers qui utilisent des rapports Tableau bénéficient d'une vue complète et simultanée du contexte métier et technique au niveau de la feuille de route, du tableau de bord ou des sources de données dans Tableau.

Une recherche sémantique aux facettes intelligentesRecherchez et découvrez les ensembles de données les plus pertinents pour votre analyse à l'aide d'une recherche sémantique puissante dotée de facettes intelligentes. La recherche avancée de mots-clés avec mise en correspondance des jetons permet de trouver les ensembles de données les plus pertinents du catalogue. La recherche sémantique est même appliquée aux domaines de données déduits, de façon à n'omettre aucun ensemble de données. Grâce à des facettes intelligentes basées sur les résultats de recherche, les utilisateurs peuvent modifier la recherche afin qu'elle porte sur les ensembles de données pertinents.

Traçabilité des données et analyse d'impactSuivez l'origine des données de manière interactive grâce à des vues de traçabilité conviviales pour les utilisateurs métiers qui mettent en évidence les terminaux sans se perdre dans des détails complexes. Une vue de traçabilité déroulante détaille tous les chemins permettant d'afficher les colonnes et les mesures des schémas de traçabilité. Les utilisateurs peuvent effectuer des analyses d'impact détaillées sur les données en amont comme en aval.

Découverte globale des relationsObtenez une vision globale des données dans un graphe de connaissances, qui permet de rechercher, découvrir et comprendre rapidement les données d'entreprise et les relations de données pertinentes. Découvrez automatiquement les ensembles de données associés, ainsi que les relations techniques, métiers, sémantiques et basées sur l'utilisation. La vision globale des données présente les ensembles de données, les vues, les domaines de données, les rapports et les utilisateurs associés, ce qui constitue une aide progressive à la découverte d'autres ensembles de données pertinents.

Classifications automatisées grâce à la reconnaissance intelligente des domaines et des entitésClassez et identifiez automatiquement les domaines et les entités (comme les clients, les produits, les commandes, etc.) sur l'ensemble des ressources de données structurées et non structurées, au niveau du champ, de la colonne et du tableau. Il s'agit pour les sociétés d'une étape cruciale pour cataloguer, gouverner et extraire la valeur de leurs ensembles de données. Ces données classées permettent d'effectuer de meilleures recherches, de filtrer les résultats de celles-ci et de faire des recommandations basées sur le glossaire métier. Informatica fournit plus de 60 domaines de données, tels que l'e-mail, le numéro de carte de crédit, le numéro de sécurité sociale, le pays, la ville, l'URL et nom de la société. Les utilisateurs peuvent également ajouter leurs propres domaines personnalisés. Les ensembles de données peuvent être classés à l'aide de règles de données (par exemple, des colonnes comportant des données correspondant à une logique spécifique définie dans la règle) ou de règles de nom de colonne (par exemple, recherche des colonnes correspondant à la logique de nom de colonne définie dans la règle).

2

Page 3: Informatica Enterprise Data Catalog...Les données sont diverses et réparties entre un grand nombre de services, d'applications et de data warehouses (certains sur site et d'autres

Figure 1 : Trouvez rapidement des ensembles de données avec la recherche sémantique et les attributs dynamiques.

Statistiques relatives à la qualité des données intégréesAffichez les statistiques de profilage des données avec les métadonnées techniques pour évaluer la qualité des ressources de données avant d'utiliser les données pour analyse. Les statistiques de profilage incluent des distributions de valeur, des modèles, ainsi qu'une inférence du type et du domaine de données.

Intégration de glossaire métier avec Informatica AxonInformatica Enterprise Data Catalog facilite l'importation des ressources de glossaire métier, comme les termes, les politiques et les classifications d'Informatica Axon™. Ajoutez un contexte métier riche aux données, en associant les termes métiers aux métadonnées techniques correspondantes. Informatica Enterprise Data Catalog recommande également des associations de termes. Cela permet aux gestionnaires métiers et informatiques de gérer de manière collaborative les métadonnées métiers, ce qui procure une automatisation efficace du workflow humain. Informatica Enterprise Data Catalog prend également en charge l'importation des ressources de glossaire métier depuis le glossaire métier Informatica et des outils tiers.

Similarité intelligente des donnéesLes algorithmes d'apprentissage machine et statistiques avancés identifient les données et sous-ensembles de données similaires. Cette fonctionnalité puissante permet aux utilisateurs de trouver les données les plus pertinentes et fiables dont ils ont besoin. Par exemple, un analyste des télécommunications intéressé par l'analyse de la perte de clients est susceptible d'interroger les données contenant l'activité prépayée des clients pour le trimestre en cours. Informatica Enterprise Data Catalog peut recommander une version plus claire des données (données de substitution), des données contenant l'activité des clients pour le trimestre précédent (données non joignables) et un tableau détaillé des clients pour enrichir l'ensemble de données (données joignables).

3

Page 4: Informatica Enterprise Data Catalog...Les données sont diverses et réparties entre un grand nombre de services, d'applications et de data warehouses (certains sur site et d'autres

Connectivité universelle des métadonnéesExtrayez les métadonnées issues de nombreux types de sources de données au sein de l'entreprise, telles que des bases de données, des data warehouses, des applications, des magasins de données Cloud, des outils de Business Intelligence, Hadoop, NoSQL et plus encore. Voici des exemples de sources de données prises en charge par l'extraction de métadonnées :• Bases de données : Oracle, MS SQL Server, Sybase ASE, IBM DB2, IBM Netezza, Teradata, JDBC, MySQL,

Amazon Redshift, DB Azure SQL, DW Azure SQL, PostgreSQL, Greenplum• Hadoop : Cloudera Navigator, Hive (Cloudera/HW/MapR/HDInsights/EMR), HDFS, Hortonworks Atlas• Mainframes : DB2 z/OS, DB2 i5/OS, COBOL, JCL• BI : SAP BusinessObjects, Tableau, Cognos, MicroStrategy, OBIEE, QlikView, Microsoft SSRS• ETL : Informatica PowerCenter®, Informatica Big Data Management®, Informatica Cloud®,

Informatica Data Integration Hub, Microsoft SSIS, Oracle Warehouse Builder, Oracle Data Integrator• Glossaire métier : Informatica Axon, Glossaire métier Informatica• Modélisation des données : ERWin• Systèmes de fichiers : HDFS, Amazon S3, Azure WASB, Azure Blob, Azure Data Lake Store,

Microsoft SharePoint, Microsoft OneDrive, Windows/Linux• Applications : Salesforce, SAP, Oracle, Siebel, PeopleSoft, JD Edwards, Microsoft Dynamics,

Informatica MDM• Documents : MS Excel, MS Word, MS PowerPoint, Adobe PDF, fichiers plats, fichiers compressés

PowerCenter | DQ | MDM

BDM | MM | TDM | S@S

BG | Axon | Informatica Cloud

Informatica

Oracle | DB2 | DB2 pour z/OS

MS SQL Server | Sybase | Teradata

Netezza | MySQL | JDBC

Bases de données

SAP R/3 | Salesforce

Oracle | Siebel | PeopleSoft

JD Edwards | MS Dynamics

Applications

HIVE (Cloudera, Hortonworks, MapR, IBM BaigInsights, EMR, HDI)

HDFS (CVS, XML, JSON, Avro, Parquet)

Cloudera Navigator | Atlas

Big Data

AWS S3 (CSV/XML/JSON)

AWS Redshift | DW Azure SQL

Azure ADLS | Azure Blob

Plates-formes Cloud

Microsoft SSIS | SharePoint | OneDrive

Oracle Warehouse Builder

Oracle Data Integrator

Modèles ERwin | Scanner personnalisé

Autre

MS Excel | PDF Adobe |

Fichier plat | MS PowerPoint |

MS Word | Fichiers compressés

Documents

Tableau | IBM Cognos |

SAP BusinessObjects | QlikView

MicroStrategy | OBIEE

Business Intelligence

EnterpriseData Catalog

Figure 2 : Informatica Enterprise Data Catalog prend en charge la connectivité universelle des métadonnées

Attributs personnalisés avec classifications métiersEnrichissez des ensembles de données par des classifications d'expert ou issues du crowdsourcing, des commentaires ou d'autres attributs disponibles à quiconque détient les autorisations de sécurité appropriées. L'affectation d'attributs et d'annotations personnalisées à des ensembles de données comprenant des termes issus de glossaires métiers améliore la collaboration entre les équipes métiers/informatiques et les résultats de recherche.

4

Page 5: Informatica Enterprise Data Catalog...Les données sont diverses et réparties entre un grand nombre de services, d'applications et de data warehouses (certains sur site et d'autres

Sécurité au niveau des ressourcesAccordez aux utilisateurs et groupes des autorisations en lecture/écriture au niveau des ressources pour permettre aux utilisateurs de voir ou de modifier les attributs personnalisés, d'appliquer une conservation des domaines et d'associer les termes issus du glossaire métier.

Déploiements à l'échelle des Big DataEnterprise Data Catalog est conçu pour les déploiements à l'échelle des Big Data pouvant être réalisés sur des clusters Hadoop. Il prend en charge l'ingestion parallèle des métadonnées et l'indexation distribuée à grande vitesse pour mettre à jour rapidement le contenu du catalogue et offrir des performances de recherche inégalées. Il offre un haut niveau de disponibilité tolérant les défaillances pour des implémentations 24 h/24 et 7 j/7.

Administration unifiéeGérez et surveillez les ressources de catalogue, les calendriers d'extraction des métadonnées, les exécutions de profilages, et plus encore, depuis une console d'administration unifiée. Un tableau de bord de contrôle des tâches propose des widgets pour la surveillance des tâches et les vues de ressources. Des alertes par e-mail aident les administrateurs à répondre de manière proactive aux problèmes de catalogue.

Figure 3 : Comprenez vos données grâce aux vues globales de relations de données.

AvantagesCataloguer intelligemment tous les types de données sur l'ensemble de l'entrepriseInformatica Enterprise Data Catalog permet de découvrir de nombreux types de données et leurs relations au sein de l'entreprise. Des analyseurs préintégrés collectent les métadonnées issues des bases de données, des data warehouses, des applications, des magasins de données Cloud, des outils de Business Intelligence, d'Hadoop, de NoSQL, et plus encore. Toutes les métadonnées sont indexées et cataloguées dans une base de données orientée graphe hautement évolutive conçue pour les mises à jour rapides, la recherche intelligente et les interrogations rapides. La création et la propagation sans cesse croissante des données au sein de l'entreprise entraînent inévitablement une similarité et une duplication des données. Informatica Enterprise Data Catalog exploite des algorithmes d'apprentissage machine et des statistiques avancées permettant de découvrir les données et sous-ensembles de données similaires, ce qui donne la possibilité aux utilisateurs de trouver les données les plus pertinentes et les plus fiables dont ils ont besoin.

5

Page 6: Informatica Enterprise Data Catalog...Les données sont diverses et réparties entre un grand nombre de services, d'applications et de data warehouses (certains sur site et d'autres

Trouver des ressources de données rapidement grâce à une puissante recherche sémantique de type GoogleEssayer de trouver les données dont vous avez besoin parmi des centaines de systèmes d'entreprise peut parfois paraître futile. Seule une recherche sémantique puissante reposant sur des services de métadonnées complets et une infrastructure évolutive peut vous permettre de trouver les données pertinentes. Informatica Enterprise Data Catalog offre une recherche sémantique aux facettes intelligentes pour affiner davantage les résultats de recherche. Grâce à son association unique de métadonnées métiers, techniques et opérationnelles, Informatica permet aux utilisateurs métiers d'effectuer une recherche avec des termes métiers afin de trouver leurs données, puis de parcourir des vues globales des relations pour trouver les données associées.

Découvrir et comprendre les ressources de données grâce à des vues complètes des relations et à la traçabilitéLe dicton « On ne peut gérer ce qu'on ne peut mesurer » s'applique également à la gestion des données. Afin de tirer le meilleur parti des données, vous devez identifier celles dont vous disposez, leur provenance, leur transformation et leur fiabilité. Informatica Enterprise Data Catalog répond à toutes ces questions et plus encore par le biais d'une synthèse de bout en bout et d'une traçabilité détaillée, de statistiques de profilage et des vues globales des relations, qui vous donnent une image claire de vos données.

Enrichir des ressources de données avec du contexte métier grâce à des annotations gouvernées et issues du crowdsourcingInformatica Enterprise Data Catalog (EDC) maximise la réutilisation et la valeur des données en classant automatiquement les données d'entreprise au niveau du champ ou de la colonne. Pour accroître la valeur des données, EDC capture le contexte relatif à l'auteur et au motif de l'utilisation des données, ainsi que les balises et annotations issues du crowdsourcing. Ce procédé permet d'enrichir et de conserver des données tout en leur donnant encore plus de valeur au sein de l'entreprise. Informatica Enterprise Data Catalog s'intègre à Informatica Axon afin de faciliter l'importation des ressources de glossaires métiers, comme les termes métiers, les définitions et les politiques d'Axon. Ces métadonnées métiers sont associées à des métadonnées techniques et opérationnelles, de sorte que les analystes et les gestionnaires de données, ainsi que les autres utilisateurs, puissent trouver et comprendre rapidement les données et collaborer sur ces dernières.

En savoir plusPour en savoir plus sur Informatica Enterprise Data Catalog rendez-vous sur le site https://www.informatica.com/products/big-data/enterprise-data-catalog.html.

IN06_0119_03238Siège mondial Tour CB 21, 16 Place de l'Iris, 92040 Paris La Défense Cedex Tél : +33 01 42 04 89 00 Numéro gratuit aux États-Unis : 1.800.653.3871

© Copyright Informatica LLC 2019. Informatica, le logo Informatica, CLAIRE, AXOM, PowerCenter, Big Data Management et Informatica Cloud sont des marques commerciales ou déposées appartenant à Informatica LLC aux États-Unis et dans de nombreux autres pays. La liste des marques commerciales d'Informatica est disponible sur le Web, à l'adresse https://www.informatica.com/fr/trademarks.html. Les autres noms de sociétés et de produits sont la propriété de leurs détenteurs respectifs et peuvent avoir fait l'objet d'un dépôt de marque. Les informations contenues dans ce document sont susceptibles d'être modifiées sans préavis. Elles sont fournies « telles quelles », sans aucune garantie d'aucune sorte, expresse ou implicite. 

À propos d'Informatica

La transformation digitale fait évoluer les attentes : service amélioré, livraisons plus rapides, à moindre coût. Les données sont la clé de la réussite des entreprises, ces dernières doivent évoluer pour rester compétitives.

En tant que leader mondial dans la gestion des données Cloud d'entreprise, nous sommes prêts à vous guider de manière intelligente — quel que soit le secteur, la catégorie ou la niche. Informatica vous permet de prendre une longueur d'avance pour gagner en agilité, concrétiser de nouvelles opportunités de croissance ou même innover. Nous nous concentrons sur les données afin de vous offrir la polyvalence nécessaire pour réussir.

Découvrez nos solutions et libérez tout le potentiel de vos données en vue de la prochaine révolution intelligente.