Sauvegardes délocalisées et reprise d'activité au SIMSU

24
Sauvegardes délocalisées et reprise d’activité - JRES 2013 SAUVEGARDES DÉLOCALISÉES ET REPRISE D'ACTIVITÉ AU SIMSU LAURE PERRET - DIDIER MATHIAN – WILLIAM MARCHAL

description

Laure Perret - Didier Mathian – William Marchal. Sauvegardes délocalisées et reprise d'activité au SIMSU. Plan. Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives. - PowerPoint PPT Presentation

Transcript of Sauvegardes délocalisées et reprise d'activité au SIMSU

Page 1: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

SAUVEGARDES DÉLOCALISÉES

ET REPRISE D'ACTIVITÉ AU SIMSU

LAURE PERRET - DIDIER MATHIAN – WILLIAM MARCHAL

Page 2: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives

Page 3: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

PRÉSENTATION DU SIMSU Structure inter-universitaire : 7 établissements Socle commun de service : réseau, annuaires, mail

étudiants … Applications mutualisées : scolarité, RH, finances,

web, plateformes collaboratives …

criticité des données et des services

Page 4: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

Clustervmware

VMware ESX VMware ESX

Metro ClusterNetApp FAS 3240

1er ÉtageRez de chaussée 200 VM, 334 vCPU795 Go ram 25 To

7 hôtes1.4 To ram (60%)144 cœurs (20%)

75 To (70%)

SAN FC

HA/DRS

INFRASTRUCTURE SIMSU

Page 5: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

LE PRA Ensemble de Moyens

visant à garantir la reprise d’activité

Couverture actuelle de notre PRA

Moyens Matériel

Moyens Logiciel

Moyens humain

Moyens Logistique 0

5

10

Page 6: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

POURQUOI CE PROJET? Procédures anciennes, fastidieuses et trop longues

Reconstruction d’infrastructure, réinstallation des applications, restauration des données

Virtualisation : toujours plus de serveurs Audit du système financier

incertitudes sur le temps de reprise coût de perte des données

Mise en place de mécanismes de reprise d’activité completsNécessité d’une infrastructure délocalisée prête à fonctionner

Page 7: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives

Page 8: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

SCÉNARIO DE REPRISE : SCHÉMA LOGIQUE Sinistre sur notre infrastructure SIMSU

Perte de nos serveurs et de nos données Par où commence-t-on et avec quels moyens?

PCPRA

Accès au site PRA

Reconfiguration réseau

DNS

Redémarrage VM

Restauration

Page 9: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

SCÉNARIO DE REPRISE : RECONFIGURATION RÉSEAU

Page 10: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

REDÉMARRAGE DES MACHINES VIRTUELLES

VirtualCenter réplica

PC PRADirectement raccordé

à nos équipements

Client vsphère directement sur esx « reprise »

Rdp bureau à distance

R-PRAActivation vlan

simsu+acl

Port console

DNS Replica

Restauration des VM

Serveur de Sauvegarde

Démarrage des réplicas

1

1’

2

Page 11: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives

Page 12: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

INFRASTRUCTURE SIMSU-PRA (SITE DE VIALLET) 2 vm en standby

Chassis blade2 lames780 Go ram32 cœurs

2 Esx 5.1 ESX Sauvegarde

Sauvegarde120To

Reprise40To

SAN iSCSI 10Gb

ESX reprise

Veeam Rsync Vcenterreplica

DNSreplica

2 vm de sauvegarde

Site PRA : Grenoble INP Viallet

SIMSU -> VIALLET9 Km

Fibre dédiée 10Gb/sMaitrise du routeur

R-PRA

Page 13: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

MÉCANISMES DE SYNCHRONISATION ENTRE LES SITES Synchronisation routeur R-PRA : vlan et acl Délocalisation des sauvegardes

Machines virtuelles : logiciel Veeam Backup & Recovery Régulier mais pas forcement quotidien

Bases de données : rsync Quotidien

Réplication : vCenter + DNS

Page 14: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

MÉCANISMES DE SAUVEGARDE

Site VialletSite SIMSU

VM

Base de données

/backup_local

OS

Fichiers

Dump (Bases oracle

arrêtées)

Snapshot Netapp SMVI

VM

Sauvegardemachine virtuelle

Netbackup/BaculaSauvegarde Fichiers

VeeamVM

Sauvegarde machine virtuelle

RsyncSauvegarde Fichiers

Page 15: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

FOCUS VEEAM Réplication Backup

« Reverse incrémental » :

Déduplication + compressionVolumétrie Source

Volumétrie modifiée quotidiennement

Volumétrie transférée

Volumétrie stockée(7 jours de rétention)

18 To 1,2 To 500Go 7 To

Incr J-2

Incr J-1

FullJ

Incr J-3

Incr J-2

IncrJ-1

FullJ

+ incr J+1

Page 16: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

SOLUTIONS DE BASCULE

Accès au site PRA

Reconfiguration réseau

DNS

Redémarrage VM

Restauration

Page 17: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

MÉCANISMES DE BASCULE RÉSEAU

Page 18: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

MÉCANISMES DE RESTAURATION

Site VialletSite SIMSU

VM

Base de données

/backup_local

OS

Fichiers

Restauration Base (Dump)

Snapshot Netapp SMVI

VM

Sauvegarde VM

Netbackup/BaculaSauvegarde Fichiers

VeeamVM

Restauration machine virtuelle

RsyncRestauration Fichiers

Incident majeur

1

2

3

Page 19: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives

Page 20: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

2 TESTS DE REPRISE

RESTAURATION VEEAM (VM) Durée Volumétrie7 machines virtuelles 6H30 4,00 ToRESTAURATION RSYNC (restauration des dump)7 dump 1H 1,00 To

RESTAURATION SAP (restauration base)  

7 restaurations 1H  

1. Validation scénario réseau: Re-routage d’un VLAN de test avec des VM de test.

2. Validation scénario reprise de VM : Restauration des vm SIFAC de prod sur site PRA et validation par les gestionnaires des 7 universités.

Temps de reprise : 8H30

Page 21: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

PLAN Présentation du SIMSU et du projet Scénario de reprise d'activité Les solutions utilisées Tests de reprise d’activité Bilan du projet, conclusion et perspectives

Page 22: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

BILAN DU PROJET Facilités

Trouver un bon site PRA Prêt de matériel pour maquettage avant investissement Association des partenaires et de notre équipe réseau

Difficultés Choix de topologie réseau Choix de logiciels de sauvegarde Prise en main des équipements

Page 23: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

CONCLUSION Incident Niveau de service Mécanisme local Mécanisme délocaliséPanne matériellePanne électrique

Continuité d’activité Cluster VmWare + Netapp

Perte d’un fichier RPO : J-1 (svg la nuit)RTO : <1HGranularité : fichier

Netbackup ou Bacula

Corruption Base d’une base de donnée

RPO : J-1 (svg la nuit)RTO : <1/2 jGranularité : BD

Netbackup ou Bacula rsync (site Viallet)

Corruption VM/système RPO : J-1RTO : <2HGranularité : vm

SMVI (site SIMSU) Veeam (site Viallet)

Incident site SIMSU(excepté nœud RENATER)

RPO : J-1RTO : 1 à n jours. Granularité : 1 ou n vm

PRA :Incident majeur

Amélioration du niveau de service

Page 24: Sauvegardes délocalisées  et reprise d'activité au SIMSU

Sauvegardes délocalisées et reprise d’activité - JRES 2013

PERSPECTIVES Délocalisation de l'archivage Réduction des points faibles : point d'entrée réseau,

équilibreur de charge Systématisation des tests Elargissement du PRA : chaine d'alerte, moyens

humain et logistique Cloud hybride