Reprise sur incident - RMLL 2011

Post on 27-Jun-2015

1.221 views 5 download

description

Que se soit suite à une attaque, une défaillance matérielle ou un bogue applicatif, et malgré toute les précautions prises en amont, aucune application en production n’est à l’abri d’une catastrophe.L’important est d’avoir un plan de reprise sur incident efficace pour limiter le plus possible l’impact d’un tel incident sur la qualité de service.Cela passe par une phase de préparation (mise en place de logs, sauvegardes régulière, etc) et par un plan d’action pour le jour J (Communication de crise, diagnostiques, priorisation des tâches, etc.)

Transcript of Reprise sur incident - RMLL 2011

RMLL 2011

Reprise sur incident

Qui suis-je ?

» Jean-Marc Fontaine

» Consultant pour Alter Way Consulting

» Président de l'AFUP

» Formateur / Professeur vacataire à l'université de Saint Quentin

» Co-auteur du livre blanc « Industrialisation PHP »

» Auteur du blog Industrialisation-PHP.com

Cela va arriver !Cela va arriver !

22/07/11 ALTER WAY - Reprise sur incident

Diminuer la gravité

» Durée d'indisponibilité

» Perte de données

» Rupture de la confidentialité

22/07/11 ALTER WAY - Reprise sur incident

Minimiser l'impact

» En terme d'image

» Financier

22/07/11

Se préparerSe préparer

22/07/11 ALTER WAY - Reprise sur incident

Avoir un plan

» Se préparer pour être efficace le jour J

» Equipe spécialisée

» Implication des fournisseurs

22/07/11 ALTER WAY - Reprise sur incident

Mesures de mitigation

» Machines virtuelles configurées

» Réplication de la base de données

» Désactivation de certaines fonctionnalités

» Version statique

22/07/11 ALTER WAY - Reprise sur incident

Sauvegardes

» Sauvegarder tout

» Sauvegarder régulièrement

» Garder un historique intelligent

22/07/11 ALTER WAY - Reprise sur incident

Journalisation (1/2)

» Système

» Application

» Déploiements

» Opérations de maintenance

22/07/11 ALTER WAY - Reprise sur incident

Journalisation (2/2)

» Privilégier les formats plats– Manipulation aisée– Signature– Compressibles– Gestion des droits aisées– Rotation

22/07/11 ALTER WAY - Reprise sur incident

Communiquer en interne

» Certains pics de fréquentations sont anticipables :– Période de l'année– Publicité– Promotion– Communication dans les médias

22/07/11 ALTER WAY - Reprise sur incident

Déploiement automatisé

» Rapide

» Pas sujet à la pression

» Outils :– Ant– Capistrano– Phing

22/07/11 ALTER WAY - Reprise sur incident

Tester les procédures

» Régulièrement

» Avec précaution

22/07/11

DétecterDétecter

22/07/11 ALTER WAY - Reprise sur incident

Supervision

» Ressources– Nagios– Centreon– Zabbix

» Journaux

» Application

» Disponibilité– Pingdom– NetVigie

22/07/11 ALTER WAY - Reprise sur incident

Facilitez le contact

» Personne / service à contacter identifiés

» Moyens de contact disponibles facilement

» Réactivité aux contacts entrants

22/07/11

CommuniquerCommuniquer

22/07/11 ALTER WAY - Reprise sur incident

Communication

» Isoler l'équipe d'intervention

» Escalader en interne si nécessaire

» Communication externe :– Régulière– Aussi transparente que possible– Page d'état

22/07/11

AnalyserAnalyser

22/07/11 ALTER WAY - Reprise sur incident

Identification de la cause

» Interne– Panne matérielle– Instabilité logicielle– Bogue applicatif– Erreur humaine

» Externe– Attaque– Panne matérielle– Pic de fréquentation

22/07/11 ALTER WAY - Reprise sur incident

Portée

» Quels sont les éléments touchés ?

» Le service est-il réduit ou coupé ?

22/07/11 ALTER WAY - Reprise sur incident

Impact

» Problème de sécurité ?

» Perte de données ?

» Atteinte à l'image ?

22/07/11

CorrigerCorriger

22/07/11 ALTER WAY - Reprise sur incident

Correction

» Activer les mesures de mitigation si nécessaire

» Appliquer les mesures correctives

» Déployer l'application si nécessaire

» En dernier recours tout couper

22/07/11

ApprendreApprendre

22/07/11 ALTER WAY - Reprise sur incident

Capitaliser

» Méthode des 5 pourquoi

» Intégrer le résultat aux procédures de test

22/07/11 ALTER WAY - Reprise sur incident

Récapitulatif

» Se préparer

» Communiquer

» Analyser

» Corriger

» Apprendre

22/07/11 ALTER WAY - Reprise sur incident

Merci !

» Email : jm@jmfontaine.net

» Twitter : jmfontaine

» Blog : www.jmfontaine.net

» Autre blog : www.industrialisation-php.net

22/07/11 ALTER WAY - Reprise sur incident

Crédits photos

» http://www.flickr.com/photos/r000pert/136999467/

» http://www.flickr.com/photos/illetirres/2214018398/

» http://www.flickr.com/photos/larimdame/2575986601/

» http://www.flickr.com/photos/techne/107093245/

» http://www.flickr.com/photos/p-doodle/466500483/

» http://www.flickr.com/photos/dennissylvesterhurd/141183312/