12 mai 2014
Module n°2 : Plans de Continuité d'Activité (PCA)
QSE : qualité et gouvernance des systèmes d’information
2
Agenda
1. Introduction à la continuité d'activité ► 1. 1 Concepts clés
1. 2 Démarche de mise en place d'un PCA
2. Plan de Continuité Informatique
3. Plan de Continuité des Opérations
12 mai 2014 - Propriété de Solucom, reproduction interdite
3
Introduction à la continuité d’activité
Des menaces pèsent sur les entreprises
Inondation Panne
électrique
...
Panne
matérielle Incendie
Défaillance de
prestataires
Coupure
informatique
Panne
logicielle Grèves
Séisme
Les entreprises
12 mai 2014 - Propriété de Solucom, reproduction interdite
4
Introduction à la continuité d’activité
Des menaces bien réelles !
21 septembre 2001 Explosion de l’usine AZF
11 mars 2011 Séisme au large du Japon
2011 Printemps arabe
…et 2014 ?
17 avril 2011 Intrusion sur le Playstation
Network
17 novembre 2004 Panne nationale du réseau
Bouygues Telecom
11 septembre 2001 Attentats du World Trade Center
24 avril 2013 Catastrophe de Dacca au
Bengladesh
1127 morts, 2500 rescapés, destruction
de plusieurs ateliers de confection, de
commerce et une banque.
2750 morts, 800 000 m² de bureaux
rasés. 350 entreprises et 40 000
personnes étaient présentes sur le site.
31 morts, des milliers de blessés.
Destruction du site et des alentours (150
bus de transport public, plusieurs
entreprises touchées, un lycée, une salle
de concert, …)
Impossible de passer et recevoir des
appels pendant 1 journée suite à une
panne informatique. Coût estimé de 20
millions d’euros et dégâts d’image
considérables.
Séisme puis tsunami et catastrophe
nucléaire. 20 000 morts, conséquences
majeures sur les infrastructures, forte
perturbation de l’activité économique du
pays.
Vol de données personnelles et
bancaires. Mise hors ligne du service
pendant 1 mois. Un coût évalué à
plusieurs centaines de millions d’euros.
Révoltes importantes dans une quinzaine
de pays arabes. Instabilité sociale et
politique entraînant la suspension des
activités de plusieurs entreprises
internationales dans certaines zones.
12 mai 2014 - Propriété de Solucom, reproduction interdite
5
Introduction à la continuité d’activité
Des menaces qui ont des impacts multiples
L’indisponibilité d’activités clés peut causer des impacts majeurs et multiples pour les organisations
Interne
Ex : des incidents à répétition sur
les systèmes informatiques
pourraient entraîner des
mécontentements clients en
agences et une dégradation des
conditions de travail des agents.
Image
Ex : une perturbation importante
des activités entraînerait une
dégradation de l’image de marque
de la banque vis-à-vis du public et
des autres acteurs de la place.
Juridique
Ex : la continuité des activités
vitales des banques est rendue
obligatoire par la règlementation
(CRBF 97-02).
Client
Ex : un incident informatique
pourrait entraîner la perception
avec retard des prestations
sociales.
Financier
Ex : la perturbation de certaines
activités critiques (ex : salles de
marchés) peut entraîner
rapidement des impacts de
plusieurs millions d’euros.
Exemples d’impacts pour une grande banque
12 mai 2014 - Propriété de Solucom, reproduction interdite
6
Introduction à la continuité d’activité
Exemple de menace : la crue de Seine…
Une menace ancrée
dans l’histoire de Paris
Plus grandes crues connues Crues les plus récentes
27 février 1658 : 8,96 m 06 janvier 1924 : 7,32 m
28 janvier 1910 : 8,62 m 23 janvier 1955 : 7,12 m
26 décembre 1740 : 8,05 m 14 janvier 1982 : 6,16 m
09 février 1799 : 7,65 m 24 mars 2001 : 5,21 m
28 janvier 1802 : 7,62 m
Différents scénarios à envisager,
pas uniquement celui de la crise extrême
60% du débit de 1910 115% du débit de 1910
Une dynamique de crise relativement lente,
mais une crise de longue durée
Crue « lente » : 10 à 15 jours entre l’atteinte de la
cote d’alerte et la cote maximale
Décrue tout aussi lente, de l’ordre de 15 jours…
… mais qui peut aller jusqu’à 40 jours (1910)
Une crise dont l’ampleur
n’est pas prévisible
Au moment de l’alerte, le pic de crue ne peut pas
encore être déterminé
Pour les crues majeures, les fortes évolutions de
l’urbanisme en Ile de France depuis 1910 rendent
difficile toute prévision
Une menace dont on ne peut se prémunir totalement
12 mai 2014 - Propriété de Solucom, reproduction interdite
7
Introduction à la continuité d’activité
…aux impacts significatifs
Impacts sur la région Ile-de-France
Eau potable :
5 000 000 de personnes seraient
privées d’eau potable
Électricité :
870 000 foyers et 2 640 sites de haute
tension sont concernés par le risque de
coupure électrique
Télécommunications :
Sous-répartiteurs situés dans les sous-
sols inondables
Réseau dépendant de l’alimentation
électrique
Transports en commun :
Arrêt de fonctionnement des RER A, B
et C, des gares de Lyon et d’Austerlitz
et des lignes de métro (par tronçons)
Transport routier :
• 100% des ponts à Paris et en
Petite Couronne seront
inaccessibles
• Les autoroutes A86, A4 et A6
coupées à certains endroits
• Engorgement des voies de
circulation
Énergie :
Usagers ne seraient plus alimentés par le
chauffage urbain
De nombreux centres de distribution
d’hydrocarbures sont inondés
Assainissement :
Les égouts débordent et
l’élimination des déchets
ménagers est rendue très
difficile
12 mai 2014 - Propriété de Solucom, reproduction interdite
8
Introduction à la continuité d’activité
Des risques que l’on peut traiter de différentes manières
Scénario
de
risque
Accepter Éviter
Transférer Réduire
probabilité
Limiter
impacts
Accepter
Accepter la menace et ses impacts
potentiels pour l’entreprise
Éviter
Ne pas lancer ou arrêter une activité à
cause des risques encourus
Réduire la probabilité
Traiter le risque en amont, en réduisant
sa probabilité d’occurrence
Transférer
Déporter le risque sur un tiers (prise
d’une assurance, transfert d’une activité
à un prestataire, …)
Limiter les impacts
Plan de Continuité d’Activité (PCA) : ensemble de dispositifs permettant de limiter les impacts lorsqu’un ou plusieurs scénarios de
risques sont avérés
Un dispositif relevant d’un équilibre coût / couverture de risques Couverture
de risques Coût
12 mai 2014 - Propriété de Solucom, reproduction interdite
9
Introduction à la continuité d’activité
Quelques définitions : PCA, PCO et PCI
Le Plan de Continuité d’Activité englobe l’ensemble des actions, processus et organisations
permettant la continuité des activités critiques de l’Entreprise
Le PCA est une démarche qui couvre à la fois les métiers et l’informatique
SI Métier
Le PCI (Plan de Continuité Informatique) se focalise sur la disponibilité des
données et des ressources informatiques
PCA
Le PCO (Plan de Continuité des Opérations) se focalise sur les actions des Métiers pour la poursuite de leurs opérations vitales
PCO
PCI
Ex. de solutions :
site de secours, solutions de
haute disponibilité ou de
reprise informatique
Ex. de sinistre :
incendie ou inondation
d’un datacenter
Ex. de solutions :
site de repli utilisateurs,
modes de fonctionnement
dégradés
Ex. de sinistre :
indisponibilité du siège ou
d’une agence, pandémie
12 mai 2014 - Propriété de Solucom, reproduction interdite
10
Introduction à la continuité d’activité
Définitions : DIMA et PDMA
Deux critères essentiels sont utilisés pour l’expression des besoins de continuité. Ils permettent de
déterminer la criticité des applications et des infrastructures informatiques sous-jacentes
Délai d’Interruption Maximal Admissible, DIMA (Métiers et informatique)
Durée maximale d’interruption d’une ressource que peuvent tolérer les Métiers utilisateurs de la
ressource
On parle également de Recovery Time Objective (RTO)
Perte de Données Maximale Admissible, PDMA (Informatique)
Durée maximale acceptable entre la dernière sauvegarde et l’incident survenu, quantifiant ainsi les
données que les Métiers tolèrent de perdre au maximum
On parle également de Recovery Point Objective (RPO)
Période de reprise
Période non présente sur les sauvegardes
Dernière Sauvegarde
T-x
Reprise T+y
DIMA
Incident majeur à T
Application disponible à nouveau
PDMA
Un autre critère à ne pas oublier : le niveau de performance retrouvée (Informatique)
12 mai 2014 - Propriété de Solucom, reproduction interdite
11
Introduction à la continuité d’activité
Les différentes composantes d’un PCA
Procédures RH
exceptionnelles
Suppléance du
personnel
Acheminement du
personnel
Référentiel documentaire
Mesures d’anticipation,
de contournement, formulaires Métiers
Engagement (contractuel) des
fournisseurs clés, stratégie achat
multifournisseurs, capacité à
ré-internaliser…
Sites de repli
et d’hébergement
Plan de Continuité
Informatique et Télécoms
• Stratégie de secours
• Procédures
• Organisation
• Ressources humaines
• Ressources techniques
Stockage ou
approvisionnement des
ressources matérielles
nécessaires, …
Fournisseurs
Coordination / Maintenance du PCA (Responsables, correspondants, …)
Organisation de crise (Cellules de crise, moyens, procédures, …)
Sites
Informatique et
télécoms
Positions de
travail Procédures
Organisation
et personnel
Secours
ACTIVITE
METIER
Ressources à secourir
12 mai 2014 - Propriété de Solucom, reproduction interdite
12
Introduction à la continuité d’activité
Une norme pour le PCA : ISO 22301…
Conduire l’analyse des
risques, le BIA (Bilan
d’Impact sur Activité)
Définir et mettre en
œuvre les plans d’action
Contrôler et mesurer
l’efficacité
Gérer les incidents et
crises de continuité
Sensibiliser et former
à la continuité d’activité
Piloter et améliorer le
SMCA
Gérer la documentation
et les enregistrements
Plan
Do
Check
Act
Système de Management de la Continuité d’Activité (SMCA)
Publié en 2012, l’ISO 22301 est la référence en matière de management de la continuité d’activité. Elle
spécifie les exigences pour mettre en place et améliorer un Système de management de la Continuité
d’activité (SMCA)
12 mai 2014 - Propriété de Solucom, reproduction interdite
13
Introduction à la continuité d’activité
…qui met en place un SMCA
Et répondre à des objectifs :
De confiance , à la demande des parties
prenantes et pour les parties prenantes Clients, actionnaires, partenaires, direction, employés,
public…
D’amélioration permanente de la sécurité du SI,
sur un périmètre bien défini
En intégrant :
Un engagement du
management
Une amélioration continue
12 mai 2014 - Propriété de Solucom, reproduction interdite
14
Agenda
1. Introduction à la continuité d'activité ► 1. 1 Concepts clés
1. 2 Démarche de mise en place d'un PCA
2. Plan de Continuité Informatique
3. Plan de Continuité des Opérations
12 mai 2014 - Propriété de Solucom, reproduction interdite
15
Démarche générale de mise en place d’un PCA
Analyser les risques
Définir les besoins
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
PCI
Organisation
Infrastructure technique
Procédures de reprise
du SI
Site(s) de secours
informatique
PCO
Organisation
Moyens de secours
Procédures
dégradées
Site(s) de repli
utilisateurs
PCI
Valider le
fonctionnement des
solutions
techniques
Valider le caractère
applicable des
procédures et de
l’organisation
PCO
Valider le
fonctionnement des
moyens de secours
Valider le caractère
applicable des
procédures et de
l’organisation
1
2
3 4
5 Recenser les
solutions
Évaluer les scénarios
Tester
régulièrement
Mettre à jour la
stratégie de
secours
Mettre à jour
les solutions
techniques
Mettre à jour
les procédures
12 mai 2014 - Propriété de Solucom, reproduction interdite
16
ETAPE 1 : Cadrage
1.A – Analyser les risques
Recensement des menaces
Facteurs environnementaux
Proximité de sites industriels, d’infrastructures ou de
voies de communication à risque
Facteurs naturels
Séismes, inondations, éboulements, glissements de
terrain, …
Facteurs humains
Phénomènes sociétaux, mouvements sociaux,
dégradations volontaires, erreurs humaines, …
Facteurs techniques
Pannes matérielles, indisponibilité d’équipements,
défaillances logicielles, infections virales…
Élaboration et sélection des scénarios de risques à couvrir 2
Indisponibilité totale ou
partielle du système
d’information
Indisponibilité des
prestataires critiques
Indisponibilité totale ou
partielle d’un site hébergeant
du personnel
Indisponibilité de
collaborateurs
Panne électrique du Datacenter
Propagation d’un virus informatique
…
Sinistre dans les locaux du prestataire
Indisponibilité du SI du prestataire
…
Pandémie
Mouvement social
….
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
1
2
3 4
5
Analyser les risques
Définir les besoins
Incendie / Inondation
Périmètre de sécurité autour du bâtiment
…
12 mai 2014 - Propriété de Solucom, reproduction interdite
17
ETAPE 1 : Cadrage
1.B – Définir les besoins
Identification des activités critiques 3
Quelles sont les activités dont l’interruption provoquerait un impact fort
pour l’entreprise ?
Quel est le délai d’interruption maximal? D 0 D 1 D 2 D 3 D 4 D 5
1 H 4 H 1 J 2 /3 J 1 S 2 /3 S
Recensement des ressources nécessaires 4
Combien et quels sont les collaborateurs à replier en priorité pour
réaliser ces activités critiques?
De quel matériel a-t-on besoin ?
Quelles applications sont nécessaires ?
Sous quels délais (DIMA/PDMA) ?
Quels sont les prestataires indispensables ?
?
Outil utilisé : le BIA*
* Bilan d’Impact sur l’Activité
Questionnaire rempli et mis à jour par les Métiers, en
collaboration avec les équipes PCA
PLAN DE CONTINUITE DES ACTIVITES DU SIEGE (PCA)
SYNTHESE DES ACTIVITES CRITIQUES DE LA DIRECTION
Dénomination de la Direction Principaux pôles RLCA
Directeur Suppléant 1 Suppléant 2 Localisation Effectifs sur site
M.DUPONT Directeur de Marchés Directeur des Ventes Crossing 0
Personnels-clef Suppléant 1 Suppléant 2 Sèvres 0
Directeur des Marchés Directeur Marché VAD Directeur Marché Industrie Aphelion 210
Directeur Opérations ADV Responsabe Dept. Support autre site : à préciser sans objet
Objectifs clef de la direction
Impact d'une suspension d'activité / Effectif de reprise
4h 1 jour 2/3 jours 1 semaine 2/3 sem. 1 mois
Impact 2 3 4 5 5
Effectif 1 1 3 3 7
Impact 2 3 4 5 5
Effectif 5 10 15 18 18
Impact 3 4 5
Effectif 7 15 20
Impact 1 1
Effectif 1 2
Impact 1 2 3 4 5
Effectif 1 3 4 5 5
Impact 2 3 3 4 4
Effectif 1 1 1 2 2
Impact
Effectif
107 Effectif 0 8 15 30 44 54
Commentaire / Remarque particulière
La DMC dispose de sa propre Cellule de Crise Métier composée de 4 personnes.
DMC.6. Autres activités non critiques
DMC.5. Mise en Marché / Communication
39
2
Total
20DMC.1. Administration des Ventes : Opérations
- Définition de l’offre marketing destinée aux Professionnels et aux Entreprises
- Mise en marché de nouveaux produits (déclinaison, définition et mise à disposition d’outils)
- Animation fonctionnelle des forces de ventes et relation commerciale pour les
DMC.3. Relation Client : Développement
30
2
DMC.0. Pilotage de la Filiale 7
Mme DURAND
7
DMC.2. Définition de l’Offre Commerciale
DMC.4. Relation Client : Service Client
- Définition de l'Offre Commerciale
- Mise en Marché
- Relation Clientèle (support agences, télévente, SAV, développement, etc.)
- Administration des Ventes (facturation/recouvrement, stratégie, etc.)
- MOA du Système d'Information DMC
Direction Marketing et Commerciale (DMC)
Effectif
nominalActivités-clef pour La Banque Postale
107
Effectifs
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
1
2
3 4
5
Analyser les risques
Définir les besoins
12 mai 2014 - Propriété de Solucom, reproduction interdite
18
ETAPE 2 : Stratégie
2.A – Définir la stratégie PCI (1/2)
Définition des solutions possibles pour le secours 1
Pour chaque couche technique SI, étude des solutions disponibles pour le
secours.
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
1
2
3 4
5 Recenser les solutions
Évaluer les scénarios
Applications
Services d’infrastructure (annuaires, DNS, hyperviseur…)
Stockage / Sauvegarde des
données
Réseau
Hébergement
Matériel dédié
Matériel
mutualisé
Matériel
approvisionné
Actif
(Clustering, partage
de charge,…)
Activable Dormant
Mutualisé interne
(Pré-production, Intégration,
Tests,…)
Mutualisé externe
(chez un prestataire)
Commande lors du sinistre Pré-contractualisation
Réplication baie
Synchrone
Asynchrone
Réseau
dupliqué
Réseau
distincts Réseau étendu Réseau mixte
Nombre de sites
Réplication serveurs
Sauvegarde
Bandes magnétiques
VTL
Hébergement interne
ou externe
Résilience du
datacenter
12 mai 2014 - Propriété de Solucom, reproduction interdite
19
ETAPE 2 : Stratégie
2.A – Définir la stratégie PCI (2/2)
Construction des scénarios et choix du secours cible 2
1621 juin 2010 - Confidentiel
Présentation du sujet de stage
Un travail à poursuivre pour présenter les grandes stratégies de secours
Différents scénarios à choisir en fonction des performances, de la couverture de risques souhaitée et du coût.
Hébergement et
réplication
Secours des
applications
vitales
Secours de la
majorité du SI
S1 S2 <20 km
Rép. synch.
S1 S2 >200 km
Rép. asynch.
Bi-site proche Bi-site éloigné Bi-site éloigné avec 2 salles sur le 1er site
S1 S2 >200 km
Rép. asynch.
Bi-site éloigné. 2ème site externalisé
Eventuellement 2 salles sur le 1er site
Tri-site
Scénario B1 Scénario CScénario A Scénario B2 Scénario B3
S1 S2 <20 km
Rép. synch.
INTou EXT
S1 EXT >200 km
Rép. asynch.
0
1
2
3
4
5
0
1
2
3
4
5
0
1
2
3
4
5
0
1
2
3
4
5
0
1
2
3
4
5
Couverture de risques Couverture de risques Couverture de risques Couverture de risques Couverture de risques
Aspect
financier
Performances Performances Performances Performances PerformancesFaisabilité
technique
Aspect
financier
Aspect
financierAspect
financier
Aspect
financier
Faisabilité
technique
Faisabilité
technique
Faisabilité
technique
Faisabilité
technique
Faisabilité
organisationnelle
Faisabilité
organisationnelleFaisabilité
organisationnelle
Faisabilité
organisationnelleFaisabilité
organisationnelle
Haute-disponibilité
distante
Dédié activable ou
mutualisé avec
Boot-On-SAN
Haute-disponibilité
locale
Mutualisation
interne
Mutualisation
externe
Eventuellement
haute-disponibilité
locale
Haute-disponibilité
distante
Mutualisation
(interne ou externe)
Mutualisé interne Mutualisé interne Mutualisé externe Mutualisé interne
et/ou externe Mutualisé interne
Continuité distante Reprise distante Reprise distante
Continuité locale
Reprise distante
(Continuité locale)
Continuité distante
Reprise distante
Construction des différents scénarios pour le secours, et choix du scénario cible sur la base de
la réponse aux besoins et des coûts.
12 mai 2014 - Propriété de Solucom, reproduction interdite
20
ETAPE 2 : Stratégie
2.B – Définir la stratégie PCO
Un panel de solutions à disposition des PCO pour apporter une réponse adaptée au sinistre
Définition de la « Boîte à outils » des solutions des secours 1 Choix des stratégies 2
Définition des solutions à appliquer pour chaque activité
à secourir et cas de sinistre à traiter
Repli sur site interne ou
externe
Nomadisme et travail à
distance
Maillage / transfert des
activités (interne ou externe) Fonctionnement dégradé
sur site nominal
Approvisionnement de
ressources de
remplacement
….
Activité à secourir
SI Site Collaborateurs Prestataires
Solution A Solution B Solution C Solution D
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
1
2
3 4
5 Recenser les solutions
Évaluer les scénarios
12 mai 2014 - Propriété de Solucom, reproduction interdite
21
ETAPE 3 : Conception et mise en œuvre
3.A – Concevoir et mettre en œuvre le PCI
PCI
Organisation
Infrastructure technique
Procédures de reprise du
SI
Site(s) de secours
informatique
Mise en œuvre des solutions techniques 1
Conception détaillée des solutions
techniques
Commande du matériel et équipement du
site informatique de secours
Configuration des solutions
…
Documentation du secours informatique 2
Documentation des solutions mises en place
Formalisation des procédures unitaires de
bascule des applications
Formalisation du plan d’activation globale du
secours informatique
Formalisation des procédures de test
techniques et fonctionnels du secours
Définition de l’organisation de crise SI
…
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
1
2
3 4
5
12 mai 2014 - Propriété de Solucom, reproduction interdite
22
ETAPE 3 : Conception et mise en œuvre
3.B – Concevoir et mettre en œuvre le PCO
PCO
Organisation
Moyens de secours
Procédures
dégradées
Site(s) de repli
utilisateurs
Rédaction de la documentation 1
Modalités de gestion de crise
Procédures Métiers de fonctionnement
dégradé
Mesures de prévention
…
Préparation du matériel 2
Préparation des sites de repli
Préparation des postes de secours
Choix des prestataires (repli /
approvisionnement)
…
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
1
2
3 4
5
12 mai 2014 - Propriété de Solucom, reproduction interdite
23
ETAPE 4 : Tests et recette
Définition du plan de test 1 Déroulement des tests 2
2014 2015 2016
A
B
C
Définition des éléments à tester, des types de tests à
conduire et des objectifs de délais Déroulement des différents tests prévus dans le plan de test
Tests sur table / tests de
gestion de crise
Tests de repli
Tests unitaires de
procédures
Tests fournisseurs
Tests techniques …
PCI
Valider le
fonctionnement des
solutions techniques
Valider le caractère
applicable des
procédures et de
l’organisation
PCO
Valider le fonctionnement
des moyens de secours
Valider le caractère
applicable des
procédures et de
l’organisation
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
1
2
3 4
5
12 mai 2014 - Propriété de Solucom, reproduction interdite
24
ETAPE 5 : Maintenance et amélioration
Tester régulièrement
Mettre à jour la stratégie de secours
Mettre à jour les solutions
techniques
Mettre à jour les procédures
Mise à jour des besoins Mise à jour des solutions et procédures Adaptation de la stratégie 1 2 3
PLAN DE CONTINUITE DES ACTIVITES DU SIEGE (PCA)
SYNTHESE DES ACTIVITES CRITIQUES DE LA DIRECTION
Dénomination de la Direction Principaux pôles RLCA
Directeur Suppléant 1 Suppléant 2 Localisation Effectifs sur site
M.DUPONT Directeur de Marchés Directeur des Ventes Crossing 0
Personnels-clef Suppléant 1 Suppléant 2 Sèvres 0
Directeur des Marchés Directeur Marché VAD Directeur Marché Industrie Aphelion 210
Directeur Opérations ADV Responsabe Dept. Support autre site : à préciser sans objet
Objectifs clef de la direction
Impact d'une suspension d'activité / Effectif de reprise
4h 1 jour 2/3 jours 1 semaine 2/3 sem. 1 mois
Impact 2 3 4 5 5
Effectif 1 1 3 3 7
Impact 2 3 4 5 5
Effectif 5 10 15 18 18
Impact 3 4 5
Effectif 7 15 20
Impact 1 1
Effectif 1 2
Impact 1 2 3 4 5
Effectif 1 3 4 5 5
Impact 2 3 3 4 4
Effectif 1 1 1 2 2
Impact
Effectif
107 Effectif 0 8 15 30 44 54
Commentaire / Remarque particulière
La DMC dispose de sa propre Cellule de Crise Métier composée de 4 personnes.
DMC.6. Autres activités non critiques
DMC.5. Mise en Marché / Communication
39
2
Total
20DMC.1. Administration des Ventes : Opérations
- Définition de l’offre marketing destinée aux Professionnels et aux Entreprises
- Mise en marché de nouveaux produits (déclinaison, définition et mise à disposition d’outils)
- Animation fonctionnelle des forces de ventes et relation commerciale pour les
DMC.3. Relation Client : Développement
30
2
DMC.0. Pilotage de la Filiale 7
Mme DURAND
7
DMC.2. Définition de l’Offre Commerciale
DMC.4. Relation Client : Service Client
- Définition de l'Offre Commerciale
- Mise en Marché
- Relation Clientèle (support agences, télévente, SAV, développement, etc.)
- Administration des Ventes (facturation/recouvrement, stratégie, etc.)
- MOA du Système d'Information DMC
Direction Marketing et Commerciale (DMC)
Effectif
nominalActivités-clef pour La Banque Postale
107
Effectifs
Revue périodique du Bilan d’Impact
sur l’Activité (BIA) Adaptation de la stratégie aux nouveaux
besoins recensés / aux tests réalisés
Adaptation des solutions et procédures en fonction des
adaptations de la stratégie / des résultats des tests
Stratégie de secours
Cadrage
Stratégie
Conception
et mise en œuvre
Test & recette
Maintenance et
amélioration
1
2
3 4
5
12 mai 2014 - Propriété de Solucom, reproduction interdite
25
La théorie…. et la pratique !
La démarche présentée ci-dessus est celle qui serait utilisée pour
construire un secours « de A à Z , en partant de rien »
Dans la plupart des grandes entreprises, la prise en compte de
l’existant en matière de SI, d’organisation, de modes de
fonctionnement … impose souvent quelques « entorses » à cette
démarche théorique !
12 mai 2014 - Propriété de Solucom, reproduction interdite
26
Agenda
1. Introduction à la continuité d'activité
2. Plan de Continuité Informatique ► 2. 1 Composantes et stratégies
2. 2 Quel PCI pour demain ?
3. Plan de Continuité des Opérations
12 mai 2014 - Propriété de Solucom, reproduction interdite
27
Plan de Continuité Informatique
Les composantes de la continuité
Hébergement
Réseaux et sécurité
Stockage
Serveurs, middlewares
et composants
d’infrastructure
Applications
Architecture
applicative
Définir une stratégie de secours consiste à :
combiner en un ensemble cohérent, exploitable
et maintenable…
… des solutions variées définies pour chaque
couche technique
Tendance majeure du secours
Mise en œuvre progressive de solutions
« actif/actif », en commençant par les couches
basses du SI :
Pour implémenter rapidement un secours HD
pour les applications récentes…
… tout en permettant le maintien de solutions
plus anciennes pour les autres
Principes de conception
12 mai 2014 - Propriété de Solucom, reproduction interdite
28
Plan de Continuité Informatique
Trois angles de vue
Stratégie PCI
Performances
Quelles sont les
performances attendues ?
Continuité de fonctionnement ou
reprise d’activité ?
Délais de reprise
Fraicheur des données
Risques
Quelle est la couverture de
risques souhaitée ?
Panne ou sinistre local
Sinistre de site
Sinistre régional / Choc extrême
Activation
Quel est le mode
d’activation du secours
souhaité?
Bascule de tout ou rien en
secours
Bascule modulaire par
application
Un stratégie PCI permet de répondre à des besoins qu’il convient d’identifier.
Trois angles de vue sont à examiner pour déterminer les besoins à couvrir.
12 mai 2014 - Propriété de Solucom, reproduction interdite
29
Plan de Continuité Informatique
Des questions amenant à des choix
A. Stratégie d’hébergement Couverture de risques
B. Stratégie de secours des
serveurs et des données Performances de reprise
C. Stratégie d’activation Mode d’activation du
secours
Une combinaison de stratégies à déterminer en fonction de l’existant et du secours souhaité
Question ? Choix
A. La stratégie d’hébergement du secours est à déterminer en fonction des types de
risques à couvrir
B. La stratégie de secours des serveurs et des données est à déterminer en fonction des
performances de reprises (DIMA et PDMA) souhaitées
C. La stratégie d’activation du secours est à déterminer en fonction de la granularité du
secours souhaité et des processus d’activation acceptables 12 mai 2014 - Propriété de Solucom, reproduction interdite
30
Plan de Continuité Informatique
A. Hébergement de secours
Légende :
Pas de contrainte technique majeure
Haute-dispo et réplication synchrone non possible
Couverture de sinistre de site majeur
2 datacenters sur 2 sites différents, éloignés de
plus de 10 km
Couverture de sinistre majeur régional,
Choc extrême
2 datacenters sur 2 sites différents, éloignés de
plus de 100 km
Adapter l’hébergement du secours à la couverture de sinistre souhaitée
Couverture de panne locale
Doublement des équipements dans une même
salle
Couverture de sinistre local
2 datacenters dans 2 salles / bâtiments différents,
indépendants l’un de l’autre (alimentation
électrique, climatisation, cloisons pare-feux,
infrastructures informatiques …)
Local Régional (10-100 km) National ( > 100 km)
12 mai 2014 - Propriété de Solucom, reproduction interdite
31
Plan de Continuité Informatique
B. Secours des serveurs
Adapter le secours des serveurs aux délais de reprise souhaités (DIMA / RTO)
Serveurs
dédiés
Serveurs
mutualisés
Serveurs
approvisionnés
4h 12h 24h 1 semaine et plus 1h
Haute disponibilité
Activable /
Hot Stand-by
Dormant
Mutualisation
fournisseur
Mutualisation interne
Pré-contractualisation de
l’approvisionnement
Approvisionnement en cas
de sinistre
DIMA / RTO 2/3j
12 mai 2014 - Propriété de Solucom, reproduction interdite
32
Plan de Continuité Informatique
B. Secours des données
Réplication synchrone
Adapter le secours des données à la perte de données tolérée (PDMA, RPO)
Quelques secondes à
quelques heures 24h et plus Nulle
PDMA
RPO
Contraintes de distance
Facilite la synchronisation inter-
applicative (car temps réel)
Risque de corruption logique non
couvert
Réplication
Confirmation BDD
Distante BDD
Locale
Envoi d’une
requête
Validation
de la requête
Réplication asynchrone
Réplication
BDD
Distante BDD
Locale
Envoi d’une
requête
Validation
de la requête
Sauvegarde
BDD
Distante BDD
Locale
Sauvegarde Restauration
Solution « historique »
A adopter en complément des
autres solutions pour traiter les
cas de corruption logique par
exemple
Pas de contrainte de distance
Perte de données limitée
Resynchronisation inter-
applicative généralement
nécessaire
Stockage des
sauvegarde sur site de
secours ou prestataire
spécialisé
12 mai 2014 - Propriété de Solucom, reproduction interdite
33
Plan de Continuité Informatique
B. Secours des serveurs et des données
DIMA
RTO< 1h 1 à 4h 4 à 12h 12 à 48h > 48h > 1 semaine
PDMA
RPO Secours activable Secours dormant Secours mutualiséSecours
approvisionné
< Quelques
secondes
Ré
plic
atio
n
Syn
ch
ron
e
Ressources
dédiées activables
Synchrone
Ressources
dédiées dormantes
Synchrone
Ressources
mutualisées
Synchrone
Ressources
approvisionnées
Synchrone
< Quelques
heures
< 1 journée
> 1 journée
Sa
uve
ga
rde
Ressources
dédiées activables
Sauvegardes
Ressources
dédiées dormantes
Sauvegardes
Ressources
mutualisées
Sauvegardes
Ressources
approvisionnées
Sauvegardes
Ré
plic
atio
n
Asyn
ch
ron
e
Secours en haute-
disponibilité
Ressources
dédiées dormantes
Asynchrone
Ressources
mutualisées
Asynchrone
Ressources
approvisionnées
Asynchrone
Haute-disponibilité
distante
Synchrone
Haute-disponibilité
distante
Asynchrone Ressources
dédiées activables
Asynchrone
Des moyens à mettre au regard des besoins exprimés par les Métiers en termes de DIMA et PDMA
12 mai 2014 - Propriété de Solucom, reproduction interdite
34
Plan de Continuité Informatique
C. Stratégie d’activation
Plusieurs stratégies d’activation, correspondant à des architectures réseaux différentes, sont
envisageables :
Activation « tout ou rien »
Réseau de secours identique et isolé du réseau nominal, possédant un plan d’adressage identique.
L’activation du secours se fait par bascule IP : configuration des routeurs, pour rediriger les flux vers le
réseau de secours (possédant la même adresse IP que le réseau nominal).
Le secours ne peut être activé de façon modulaire. Cette solution est la solution historique des plans de
reprises informatiques
Activation « modulaire »
2 typologies de solutions :
1) Le réseau de secours et le réseau nominal sont distincts l’un de l’autre. L’activation du secours se fait
par bascule DNS : configuration des serveurs DNS pour rediriger les flux vers les adresses IP des
machines de secours
2) Le réseau de secours et le réseau nominal sont sur des VLAN partagés (« datacenter virtuel ») entre
les deux salles. Cette solution permet notamment l’implémentation de clusters.
Ces 2 typologies de solution permet une activation modulaire du secours
Combinaison de solutions
La combinaison des solutions précédentes permet d’adapter le type d’activation du secours aux besoins
exprimés par les métiers et à l’existant informatique
12 mai 2014 - Propriété de Solucom, reproduction interdite
35
Agenda
1. Introduction à la continuité d'activité
2. Plan de Continuité Informatique ► 2. 1 Composantes et stratégies
2. 2 Quel PCI pour demain ?
3. Plan de Continuité des Opérations
12 mai 2014 - Propriété de Solucom, reproduction interdite
36
Plan de Continuité Informatique
Des constats alarmants nécessitant de repenser le PCI
Constats
Le PCI, un dispositif coûteux, vécu comme une contrainte et non comme une
assurance Des solutions unitaires sans vision globale du secours
Un coût perçu comme prohibitif, identifié comme levier d’économie lors des réductions budgétaires
Des tests complexes à organiser sans résultats probants…
…Ne permettant pas d’avoir confiance dans l’utilisation du PCI
Comment y
répondre
aujourd’hui ?
Une nécessaire transformation de la production pour construire un socle
résilient permettant d’avoir un PCI plus efficace Industrialiser et être agile
Augmenter la confiance
Réduire les coûts
Et demain ?
Passer d’un socle résilient à un SI résilient Intégrer dans le développement des mesures permettant un fonctionnement multi-site sans
contrainte de distance (exemple de cas aujourd’hui : Facebook, Google Apps)
12 mai 2014 - Propriété de Solucom, reproduction interdite
37
Plan de Continuité Informatique
Trois axes pour améliorer le PCI
Industrialiser et être agile
Rétablir la confiance
Réduire les coûts
Construire un socle résilient homogène multi-sites dès la
conception
Aller vers une réplication standardisée unique des
données
Définir la stratégie de tests dès la conception
Intégrer le PCI dans les processus existants
Impliquer les directions Métiers dans la définition
du périmètre à secourir pour assurer la
cohérence
S’assurer que la cellule de crise est en mesure
de déclencher le PCI
Tirer profit des gains apportés par la virtualisation
Valoriser le PCI (augmentation de la couverture de
risques)
Intégrer dans la négociation achat la
problématique PCI
Virtualiser les architectures applicatives et
restreindre les technologies
12 mai 2014 - Propriété de Solucom, reproduction interdite
38
Agenda
1. Introduction à la continuité d'activité
2. Plan de Continuité Informatique
3. Plan de Continuité des Opérations ► 3. 1 Composantes et stratégies
3. 2 Conclusion
12 mai 2014 - Propriété de Solucom, reproduction interdite
39
Plan de Continuité des Opérations
Définir une stratégie partagée par tous
…à identifier au plus près du
terrain pour s’assurer de leur caractère opérationnel et
maintenable
… à combiner au mieux pour couvrir les besoins, en veillant à la réutilisation de l’existant
et à la mutualisation pour réduire les coûts
… à valider par le management pour assurer une mise en
œuvre efficace
… à maintenir régulièrement, pour
conserver un PCA opérationnel
PCA
efficient
Opérationnels
Équipe projet
3 visions à faire converger pour assurer un PCA
conforme aux besoins, opérationnel et
maintenable
Opérationnels
Équipe projet
Management
Des solutions …
Management
12 mai 2014 - Propriété de Solucom, reproduction interdite
40
Plan de Continuité des Opérations
Objectifs et cas de sinistres traités
Objectif Le Plan de Continuité des Opérations vise à poursuivre les activités critiques de l’entreprise
(éventuellement en mode dégradé) en cas d’indisponibilité de ressources dont elles ont besoin.
Afin de limiter les coûts en mutualisant les solutions, les entreprises raisonnent
souvent sur la nature de l’impact plutôt que sur la menace.
4 grands types d’impacts sont généralement considérés dans le cadre
de la mise en place d’un PCO :
Indisponibilité du système
d’information
Indisponibilité des
prestataires critiques
Indisponibilité d’un site
hébergeant du personnel
Indisponibilité de
collaborateurs
12 mai 2014 - Propriété de Solucom, reproduction interdite
41
Plan de Continuité des Opérations
Des solutions multiples, à combiner pour augmenter la couverture
Site
sinistré
Site externe (IBM / Sungard) Réquisition de bureaux
Site interne
dédié au
repli
Utilisation de
salles de réunion /
formation
Dual-office Nomadisme
Déport
d’activité Centre d’affaires (Regus)
site dédié
Rep
rise
ou
ma
intie
n d
e l’a
ctiv
ité
alt
ern
ati
ve
s
Prestation spécialisée
Souscription dédiée ou mutualisée
avec d’autres clients
Savoir faire du
secouriste Meilleure couverture
des sinistres étendus
Utilisation des positions de
travail d’autres collaborateurs
Arrêt potentiel d’autres activités
Politiquement délicat
Difficile à
tester Nécessité de pré-câbler
(courants faible et fort) les
salles de réunion
Capacités de réunion réduites
Configuration des salles à examiner
(salles aveugles)
Mode de fonctionnement par
construction réparti entre
plusieurs sites pouvant
assurer le maintien et la
reprise de l’activité d’un site
affecté
Reprise de l’activité
sans déplacement de
collaborateurs soit en
interne soit en externe
(prestataires)
Mise à disposition de
bureaux prêts à l’emploi
(secrétariat, fax, internet)
mais sans poste de
travail
Portable, carte 3G,
accès ADSL, BlackBerry,
iPad, etc.
Environnement technique parfaitement
maitrisé
Mutualisation possible entre plusieurs
entités d’un même groupe
cro
isé
Repli
Rep
li s
ur
par d’autres personnels (internes ou externes) Positions de travail 12 mai 2014 - Propriété de Solucom, reproduction interdite
42
Plan de Continuité des Opérations
Indisponibilité des fournisseurs : solutions les plus courantes
Intégration du critère de criticité des prestations dans la stratégie achats
Intégration de clauses PCA dans les contrats avec les prestataires critiques
Développement de bonnes relations avec les fournisseurs et prestataires en situation de
quasi monopole et/ou difficiles à remplacer
Sécurisation des prestations critiques via l’utilisation en situation nominale de deux
prestataires
Internalisation de l’activité si le maintien de l’externalisation est jugé trop
risqué
En amont
En cas de défaillance de prestataire
Si plusieurs prestataires en situation nominale, transfert de l’ensemble des
tâches aux prestataires non-impactés
Changement de prestataire
Internalisation provisoire de l’activité
12 mai 2014 - Propriété de Solucom, reproduction interdite
43
Plan de Continuité des Opérations
Indisponibilité du système d’information : Solutions les plus courantes
Un constat global : le SI prend toujours plus d’importance au sein des entreprises.
Les modes de fonctionnement dégradé sans SI deviennent de moins en moins nombreux, et
lorsqu’ils existent sont souvent complexes à mettre en œuvre.
Déclenchement du PCI
Principales solutions possibles
Extensions au besoin des horaires de
travail des Métiers
Repli
Fonctionnement dégradé sans SI
Maillage
Mode nominal Avant le sinistre Indisponibilité du SI Retour au mode nominal
Mise en œuvre et
MCO du secours SI
Préparation et tests
de procédures de
fonctionnement
dégradé
Réintégration des données
produites dans le SI /
rattrapage du retard accumulé
Une étape pouvant être grandement accélérée si elle
a été prise en compte en amont dans la conception
des modes de fonctionnement dégradé
Tests fonctionnels des applications
12 mai 2014 - Propriété de Solucom, reproduction interdite
44
Indisponibilité de collaborateurs
Indisponibilité de collaborateurs : Quelques solutions pour le scénario de pandémie
En
am
on
t A
u m
om
en
t d
e l
a c
rise
Mise en place de mesures sanitaires renforcées (nettoyage des locaux plus fréquents, distribution de masques,
consignes sanitaires aux collaborateurs, fermeture des RIE, …)
Amélioration de la polyvalence des équipes (formation des collaborateurs, formalisation des processus de
fonctionnement critiques, …)
Restriction des accès aux sites (selon l’ampleur de la crise, restriction des accès uniquement aux collaborateurs
internes à l’entreprise, puis uniquement aux contributeurs d’activités critiques devant exercer sur site)
Limitation des déplacements (limitation des déplacements entre plaques régionales pour éviter la propagation du
virus entre sites)
Priorisation des activités (focalisation des collaborateurs sur les activités critiques, pour pallier à l’absence de
personnel ou aux mesures de restriction des accès aux sites)
Recours au télétravail (pour éviter la propagation du virus sur les sites de l’entreprise et/ou pallier à une fermeture
sanitaire ou des perturbations dans les transports)
Adaptation des horaires de travail (pour pallier aux perturbations dans les transports publics et permettre aux
collaborateurs de prendre soin de proches malades)
Définition du plan de continuité pandémie grippale
Préparation des solutions de travail à distance (augmentation des stocks de roulement de PC, préparation et test
des kits de connexion à distance, …)
4 3
2 1
Gel des prestations de services non critiques (arrêt des prestations externes non indispensables pour le bon
fonctionnement de l’entreprise)
Recours à l’intérim (pour le remplacement de collaborateurs malades ou s’occupant de proches, plutôt sur des
postes peu qualifiés)
12 mai 2014 - Propriété de Solucom, reproduction interdite
45
Agenda
1. Introduction à la continuité d'activité
2. Plan de Continuité Informatique
3. Plan de Continuité des Opérations ► 3. 1 Composantes et stratégies
3. 2 Conclusion
12 mai 2014 - Propriété de Solucom, reproduction interdite
46
Conclusion
Le PCA est nécessaire pour savoir réagir à tout moment à des incidents graves qui pourraient arriver
1
Le PCA doit être un processus continu et non un projet ponctuel, car pour rester efficient, le PCA doit rester « aligné » sur les besoins d’une
entreprise, son organisation, ses processus, ses architectures, et ses infrastructures
Le PCA est un compromis entre les coûts et la couverture de risque souhaitée
2
3
12 mai 2014 - Propriété de Solucom, reproduction interdite
www.solucom.fr
Raphaël BRUN
Consultant senior
Tel : +33 (0)1 49 03 26 65
Mobile : +33 (0)6 10 38 03 00
Mail : [email protected]
Contact
Top Related