COMPUTE VIRTUALIZATION - Mise en œuvre d'une …€¦ · – vCloud Hybrid Service – Disaster...

38
© 2014 VMware Inc. Tous droits réservés. Mise en oeuvre d’une stratégie de continuité ou de reprise d’activité complète avec VMware VMware vForum, 2014 Matthieu Gross Solutions Consultant, Global Accounts [email protected]

Transcript of COMPUTE VIRTUALIZATION - Mise en œuvre d'une …€¦ · – vCloud Hybrid Service – Disaster...

© 2014 VMware Inc. Tous droits réservés.

Mise en œuvre d’une stratégie de continuité ou de reprise d’activité complète avec VMware

VMware vForum, 2014

Matthieu GrossSolutions Consultant, Global [email protected]

À l’ordre du jour

• Définition du problème

• Définitions

• Technologies VMware qui assurent des fonctions de continuité et de reprise d’activité

– vSphere High Availability et App HA (HA, App HA)

– vSphere Fault Tolerance (FT)

– vSphere Data Protection / Advanced (VDP / VDPA)

– vSphere Replication (VR)

– vCloud Hybrid Service – Disaster Recovery (vCHS – DR)

– vCenter Site Recovery Manager (SRM)

– vCenter Infrastructure Navigator (VIN)

• En savoir plus

La disponibilité et la protection des donnéessont critiques pour l’entreprise

Revenue

Productivité

Conformité

Réputation

Continuité informatique

Quelle est la différence ?

Évitementde sinistreÉvitementde sinistre

Reprised’activitéReprise

d’activité

Interruptions planifiéesou non planifiées

Tolérance à la panne / Haute disponibilité

• Tolérance à la panne– Capacité de récupération après une panne de composant

– Exemple : défaillance d’un disque dur

• Haute disponibilité

Pourcentage de temps disponible sur un an

Interruptions de service sur un an

99 3,65 jours

99,9 8,76 heures

99,99 52 minutes

99,999 « Les cinq neufs » 5 minutes

X

RTO, RPO et MTD

• Objectif de temps de récupération (RTO)– Quel devrait être le délai de reprise ?

• Objectif de point de récupération (RPO)– Volume de perte de données potentiel

• Tolérance d’interruptions de service maximum (MTD)– Nombre d’interruptions possibles avant que d’importantes pertes

ne surviennent

– Exemples : domaine financier, réputation

Dernièresauvegarde

Temps

Evènement Service restauréImpact potentiel

RPO RTOMTD

Service restauréImpact critique

VMware : plusieurs niveaux de protectionProtection au niveau de la VM par HA/App HA, FT

SQL

vSphere HA/FT

Site A

Rendre un service d’application hautementdisponible• vSphere HA

• NOUVEAU (vSphere 5.5) : prise en compte des règles d’anti-affinitéavant démarrage de la VM

• NOUVEAU (vSphere 5.5) : vSphere App HA

VMware vFabric™ tc Server

vSphere App HA Nouveau

Basé sur des règles

Protection des applications prêtes à l’emploi

vSphere App HA

Cluster vSphere HA

vFabric HypericAppliance virtuelle

vSphere App HAAppliance virtuelle

Agents Hyperics’exécutantdans les VM

vCenterServer

vSphere vSphere vSphere vSphere

Nouveau

vSphere App HA Nouveau

vSphere HA – À retenir…

• Le RTO se mesure en minutes (et non en secondes)

• Requiert un stockage partagé

• Meilleures pratiques– Utilisation du contrôle d’admission – règle de pourcentage

– Test post-défaillance des performances en mode maintenance de l’hôte

– Réponse d’isolement – Laisser sous tension

– Redondance du stockage et du réseau

vSphere Fault Tolerance (FT)

• Pas de délai de reprise ni de perte de données– Panne matérielle de l’hôte uniquement

– Ne protège pas contre les pannes d’application et d’OS

• Parfaitement compatible avec HA, App HA

• Pourquoi ne pas mettre en place FT ?– Besoins en ressources ; est-ce vraiment nécessaire pour la charge de travail ?

– VM dotée de plusieurs processeurs (voir BCO5065 ☺)

– Pas de snapshot de VM ; agent nécessaire pour les sauvegardes

VMware : plusieurs niveaux de protectionProtection des données: vSphere Data Protection (Advanced)

SQL

vSphere HA/FT

VDPA

Site A

Protection des données(sauvegarde et restauration )• Des agents ? Aucun agent ? – Les deux !

– Pas d’agent pour la plupart des charges de travail (simplicité garantie)

– Des agents pour certaines applications

• vSphere Data Protection (VDP) Advanced– Sauvegarde et récupération pour et par VMware

– Basé sur la technologie éprouvée et aboutie EMC Avamar™

– Sauvegarde et restauration de VM sans agent

– Agents pour une protection granulaire des applicationsde niveau 1

vSphere Data Protection Nouveau

VDP Advanced – À retenir…

• Conçu pour les environnements de PME

• Utilise VADP (vStorage API for Data Protection) – snapshots de VM, Changed Block Tracking

• Utilise Windows Volume Shadow Copy Service dans les outils VMware

• Parfaitement compatible avec HA, mais pas avec FT

• Le Raw Device Mapping en mode virtuel est pris en charge, mais pas le RDM en mode physique

• S’agit-il d’une solution de reprise d’activité ?– Peut-être, cela dépend des attentes en matière de RTO/RPO

– La réplication hors site est nécessaire, n’est-ce pas ?

VMware : plusieurs niveaux de protectionProtection de site: vSphere Replication, Site Recovery Manager

SQL

vSphere HA/FT

VR/SRMSQL

VDPA

Site A Site B

vSphere Replication – Reprise d’activité

• Outil natif intégré dans la plate-forme

• Réplication par VM au niveau de l’hyperviseur, gérée dans VC

Choix du RPO : de 15 minutes à

24 heures

Datastore de destination

sélectionnable(indépendant du type de disque)

Réplication sur tous les sites

vCenter Server

VMware ESXi

NFC

VRA

VMware ESXi

NFC

VRA

VMware ESXi

NFC

VRA

StockageStockage(VMDK1)

vCenter Server

VMware ESXi

NFC

VRA

VMware ESXi

NFC

VRA

VMware ESXi

NFC

VRA

Appliance vSphere

Replication

Appliance vSphere

Replication

StockageStockageVMDK1

vCenter Server vCenter Server

Une reprise complète en quatre étapesCliquez avec le bouton

droit et sélectionnezRecover (Récupérer).

Cliquez avec le boutondroit et sélectionnez

Recover (Récupérer).

Sélectionnez un dossier cible.

Sélectionnez un dossier cible.

Sélectionnez uneressource cible.

Sélectionnez uneressource cible.

Cliquez sur Finish (Terminer).

Cliquez sur Finish (Terminer).

Validation de vos choix à l’acte

Nouvelle fonction : conservation de répliqueshistoriques

vSphere

AgentvSphere

Replication

Après la récupération, utilisez le gestionnaire de sn apshot pourrevenir à des états antérieurs

La rétentionde multiples instantanéspermet de

revenir à des états antérieurs

connus

Instantanés multiples présentés comme des snapshots de VM après un basculement

Utilisation du gestionnaire de snapshot pour revenir à desétats antérieurs ; une interface dont tous les administr ateurs

sont familiers depuis longtemps.

vSphere Replication – Interopérabilité

� Fault tolerance : non compatible avec VR

• FT entre en conflit au niveau du filtre de disque vSCSI.

� VDP

• Pratiquement aucun problème !

• Si vous utilisez VSS… assurez-vous que c’est la version 5.5 !

� HA, vMotion, DRS

� Storage vMotion et Storage DRS

• La prise en charge est maintenantassurée

vCloud Hybrid ServicesDisaster Recovery to Cloud 1.0

VMware vSphere

VMwarevCenter Server

vSphere Replication

Site A (Primaire)

Servers

vCHS, Site B (Recovery)

US East Region

US West Region

1Dependant de la bande passante disponible

Réplication asynchrone et reprise simple et sécuris ée pour les environnements virtuels vSphere

• US-Nevada• US-Virginia• US-Texas• US-California• EUR-United Kingdom

• Repose sur vSphere Replication

• Capacités warm standby sur vCHS

• Protection self-service, Workflowfailover et failback par VM

• RPO (Recovery Point Objective de 15 min. à 24h 1

• RTO (Recovery Time Objective) garanti de 4 heures

• Support de l’envoi de données offline (via un transporteur)

• Support et SLA de niveau Production

• Options de souscription flexibles

26

Site Recovery Manager (SRM)

• Un moteur de reprise d’activité• Un outil qui utilise des données répliquées en externe

(VR ou basé sur la baie) pour accélérer le RTO d’un plande continuité d’activité

• Un produit qui permet de tester, automatiser, planifier, répéter et personnaliser la reprise d’activité

De quoi s’agit-il ?De quoi s’agit-il ?

• Un moteur de réplication• Un outil pour des systèmes nécessitant un RPO quasi

instantané• Un cluster étiré pour la prévention des sinistres

Ce qu’il n’est pasCe qu’il n’est pas

Principaux composants de SRM

Réplication

vCenter Server

Site Recovery Manager Server

� Un vCenter Server (Windows ou VCVA) par site (versions identiques)

� Un SRM Server par site (versions identiques)

� Des hôtes vSphere, versions identiques par site recommandées (antérieursà vSphere 5.x uniquementsi la réplication de baieest utilisée)

vSphere Essentials Plus et les versions ultérieures s ont prises en charge

vCenter Server

Options de réplication SRM • SRM peut utiliser À LA FOIS la

réplication basée sur les baiesET la réplication vSphere

• SRM « voit » les VM existantes et autonomesprotégées par vSphere Replication

• SRM peut installer vSphere Replication intégralementsi nécessaire

HubLUN 2

Web

Application n-tier

BD

Application

vSphere Replication

Réplication basée sur le stockage

LUN 1

Web

BD

Application

Application n-tier

Workflows de reprise

• Plan de reprise défini par l’utilisateur• Réduction des erreurs

Automatisation du basculementAutomatisation du basculement

• Environnement de test isolé• Amélioration de la confiance dans le

processus de reprise d’activité

Test de basculement sans interruption de l’activitéTest de basculement sans interruption de l’activité

• Aucune perte de données• Migration des opérations

Migration planifiéeMigration planifiée

• Nouvelle protection des VM, annulation de la migration

Automatisation des retours arrièreAutomatisation des retours arrière

Interopérabilité avec SRM

• Fonctionne avec VR et ArrayBased Replication

• Les sauvegardes, VADP ouautre conviennent

• HA ne pose aucun problème

• vMotion et DRS fonctionnentcorrectement

• Storage vMotion and Storage DRS – On peut dire ça…

– Dépendance vis-à-vis de la réplication

• FT est au « jaune »

– Répliqué sur baie uniquement et le statut FT n’est pas récupéré

• Web / Client vSphere

SRM : quelques pratiques d’excellenceListe non exhaustive

De nombreux documents de support sont disponibles sur les blogs, vmware.com et les sites d'informations techniques

Pratiques importantes :

Topologie du stockage

Test de la configuration réseau

Fréquence des tests

Dimensionner vCenter correctement

La plus importante :

Effectuer une analyse d’impact commercial

RPO, RTO, coût des interruptionsde service, interdépendances, importance stratégique des applications, priorités, unités de basculement, facteurs externesnégligés, adhésion des cadres dirigeants, etc.

Groupes de protection

• Davantage de groupes de protection = test granulaire/basculement amplifiés– Le test de reprise d’activité est plus facile et nécessite moins de ressources

– Basculement uniquement des éléments nécessaires

– Configuration plus complexe / Complexité accrue

• Moins de groupes de protection = complexité réduite– Moins de LUN, de groupes de protection et de

plans de reprise

– Flexibilité réduite

• Trouver un bon équilibre entre flexibilité et simplicitéMoins de LUN /groupes de protectionComplexité réduiteFlexibilité réduite

Davantage de LUN / groupes de protectionComplexité accrueUne flexibilité accrue

Un bon équilibreentre complexitéet flexibilitéDépend du client

La majorité des pannessont partielles (n’affectentqu’une partie du data center) – Conception en conséquence

Réseau de test

– Utiliser un VLAN ou un réseau isolé pour l’environnement de tests• Le paramètre Auto par défaut ne permet pas la communication des VM entre

les hôtes

– Différents vSwitch peuvent être spécifiés dans SRM (test / exécution)• Indiqués dans le plan de reprise

vSphere Infrastructure Navigator

Ressources complémentaires

En savoir plus• Exercez-vous dans un laboratoire

d’essai pratique en ligne• Demandez à voir une

démonstration• Installez une version d’évaluation

de 60 jours

Merci

Matthieu GrossSolutions Consultant, Global [email protected]