Sauvegardes délocalisées et reprise d'activité au SIMSU
description
Transcript of Sauvegardes délocalisées et reprise d'activité au SIMSU
Sauvegardes délocalisées et reprise d’activité - JRES 2013
SAUVEGARDES DÉLOCALISÉES
ET REPRISE D'ACTIVITÉ AU SIMSU
LAURE PERRET - DIDIER MATHIAN – WILLIAM MARCHAL
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PRÉSENTATION DU SIMSU Structure inter-universitaire : 7 établissements Socle commun de service : réseau, annuaires, mail
étudiants … Applications mutualisées : scolarité, RH, finances,
web, plateformes collaboratives …
criticité des données et des services
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Clustervmware
VMware ESX VMware ESX
Metro ClusterNetApp FAS 3240
1er ÉtageRez de chaussée 200 VM, 334 vCPU795 Go ram 25 To
7 hôtes1.4 To ram (60%)144 cœurs (20%)
75 To (70%)
SAN FC
HA/DRS
INFRASTRUCTURE SIMSU
Sauvegardes délocalisées et reprise d’activité - JRES 2013
LE PRA Ensemble de Moyens
visant à garantir la reprise d’activité
Couverture actuelle de notre PRA
Moyens Matériel
Moyens Logiciel
Moyens humain
Moyens Logistique 0
5
10
Sauvegardes délocalisées et reprise d’activité - JRES 2013
POURQUOI CE PROJET? Procédures anciennes, fastidieuses et trop longues
Reconstruction d’infrastructure, réinstallation des applications, restauration des données
Virtualisation : toujours plus de serveurs Audit du système financier
incertitudes sur le temps de reprise coût de perte des données
Mise en place de mécanismes de reprise d’activité completsNécessité d’une infrastructure délocalisée prête à fonctionner
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
SCÉNARIO DE REPRISE : SCHÉMA LOGIQUE Sinistre sur notre infrastructure SIMSU
Perte de nos serveurs et de nos données Par où commence-t-on et avec quels moyens?
PCPRA
Accès au site PRA
Reconfiguration réseau
DNS
Redémarrage VM
Restauration
Sauvegardes délocalisées et reprise d’activité - JRES 2013
SCÉNARIO DE REPRISE : RECONFIGURATION RÉSEAU
Sauvegardes délocalisées et reprise d’activité - JRES 2013
REDÉMARRAGE DES MACHINES VIRTUELLES
VirtualCenter réplica
PC PRADirectement raccordé
à nos équipements
Client vsphère directement sur esx « reprise »
Rdp bureau à distance
R-PRAActivation vlan
simsu+acl
Port console
DNS Replica
Restauration des VM
Serveur de Sauvegarde
Démarrage des réplicas
1
1’
2
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
INFRASTRUCTURE SIMSU-PRA (SITE DE VIALLET) 2 vm en standby
Chassis blade2 lames780 Go ram32 cœurs
2 Esx 5.1 ESX Sauvegarde
Sauvegarde120To
Reprise40To
SAN iSCSI 10Gb
ESX reprise
Veeam Rsync Vcenterreplica
DNSreplica
2 vm de sauvegarde
Site PRA : Grenoble INP Viallet
SIMSU -> VIALLET9 Km
Fibre dédiée 10Gb/sMaitrise du routeur
R-PRA
Sauvegardes délocalisées et reprise d’activité - JRES 2013
MÉCANISMES DE SYNCHRONISATION ENTRE LES SITES Synchronisation routeur R-PRA : vlan et acl Délocalisation des sauvegardes
Machines virtuelles : logiciel Veeam Backup & Recovery Régulier mais pas forcement quotidien
Bases de données : rsync Quotidien
Réplication : vCenter + DNS
Sauvegardes délocalisées et reprise d’activité - JRES 2013
MÉCANISMES DE SAUVEGARDE
Site VialletSite SIMSU
VM
Base de données
/backup_local
OS
Fichiers
Dump (Bases oracle
arrêtées)
Snapshot Netapp SMVI
VM
Sauvegardemachine virtuelle
Netbackup/BaculaSauvegarde Fichiers
VeeamVM
Sauvegarde machine virtuelle
RsyncSauvegarde Fichiers
Sauvegardes délocalisées et reprise d’activité - JRES 2013
FOCUS VEEAM Réplication Backup
« Reverse incrémental » :
Déduplication + compressionVolumétrie Source
Volumétrie modifiée quotidiennement
Volumétrie transférée
Volumétrie stockée(7 jours de rétention)
18 To 1,2 To 500Go 7 To
Incr J-2
Incr J-1
FullJ
Incr J-3
Incr J-2
IncrJ-1
FullJ
+ incr J+1
Sauvegardes délocalisées et reprise d’activité - JRES 2013
SOLUTIONS DE BASCULE
Accès au site PRA
Reconfiguration réseau
DNS
Redémarrage VM
Restauration
Sauvegardes délocalisées et reprise d’activité - JRES 2013
MÉCANISMES DE BASCULE RÉSEAU
Sauvegardes délocalisées et reprise d’activité - JRES 2013
MÉCANISMES DE RESTAURATION
Site VialletSite SIMSU
VM
Base de données
/backup_local
OS
Fichiers
Restauration Base (Dump)
Snapshot Netapp SMVI
VM
Sauvegarde VM
Netbackup/BaculaSauvegarde Fichiers
VeeamVM
Restauration machine virtuelle
RsyncRestauration Fichiers
Incident majeur
1
2
3
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
2 TESTS DE REPRISE
RESTAURATION VEEAM (VM) Durée Volumétrie7 machines virtuelles 6H30 4,00 ToRESTAURATION RSYNC (restauration des dump)7 dump 1H 1,00 To
RESTAURATION SAP (restauration base)
7 restaurations 1H
1. Validation scénario réseau: Re-routage d’un VLAN de test avec des VM de test.
2. Validation scénario reprise de VM : Restauration des vm SIFAC de prod sur site PRA et validation par les gestionnaires des 7 universités.
Temps de reprise : 8H30
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
BILAN DU PROJET Facilités
Trouver un bon site PRA Prêt de matériel pour maquettage avant investissement Association des partenaires et de notre équipe réseau
Difficultés Choix de topologie réseau Choix de logiciels de sauvegarde Prise en main des équipements
Sauvegardes délocalisées et reprise d’activité - JRES 2013
CONCLUSION Incident Niveau de service Mécanisme local Mécanisme délocaliséPanne matériellePanne électrique
Continuité d’activité Cluster VmWare + Netapp
Perte d’un fichier RPO : J-1 (svg la nuit)RTO : <1HGranularité : fichier
Netbackup ou Bacula
Corruption Base d’une base de donnée
RPO : J-1 (svg la nuit)RTO : <1/2 jGranularité : BD
Netbackup ou Bacula rsync (site Viallet)
Corruption VM/système RPO : J-1RTO : <2HGranularité : vm
SMVI (site SIMSU) Veeam (site Viallet)
Incident site SIMSU(excepté nœud RENATER)
RPO : J-1RTO : 1 à n jours. Granularité : 1 ou n vm
PRA :Incident majeur
Amélioration du niveau de service
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PERSPECTIVES Délocalisation de l'archivage Réduction des points faibles : point d'entrée réseau,
équilibreur de charge Systématisation des tests Elargissement du PRA : chaine d'alerte, moyens
humain et logistique Cloud hybride