Itil v2 La Gestion De La Disponibilité Itilfrance Com

22
ITIL V2 La gestion de la disponibilité Création : novembre 2004 Mise à jour : août 2009

Transcript of Itil v2 La Gestion De La Disponibilité Itilfrance Com

Page 1: Itil v2 La Gestion De La Disponibilité Itilfrance Com

ITIL V2

La gestion de la disponibilité

Création : novembre 2004 Mise à jour : août 2009

Page 2: Itil v2 La Gestion De La Disponibilité Itilfrance Com

2

A propos

A propos du document Ce document de référence sur le référentiel ITIL a été réalisé en 2004 et la traduction des 2 livres ITIL Service Support et Service Delivery a nécessité 4 mois de traduction et d écriture. Il est mis à la disposition de la communauté francophone ITIL pour diffuser les connaissances de base sur ce référentiel. Ce document peut être utilisé de manière libre à condition de citer le nom du site (www.itilfrance.com) ou le nom de l auteur (Pascal Delbrayelle).

A propos de l'auteur Pascal Delbrayelle intervient avec plus de 25 ans d'expérience comme consultant sur les projets d'une direction informatique ayant comme facteur de succès la mise en oeuvre des bonnes pratiques ITIL comme, par exemple, la mise en place d'un site de secours, la mise en place d'un outil de gestion des configurations ou la définition des normes et standards techniques des environnements de production. Ces projets requièrent :

la connaissance des différents métiers du développement et de la production informatique

la pratique de la conduite de projets techniques de la direction informatique

la maîtrise de la définition et de la mise en place de processus pour rationaliser et adapter les méthodes de travail au sein de la direction informatique

A propos de mission et de formation

Si vous pensez que l expérience de l auteur sur le référentiel ITIL ou la formalisation de documents sur le sujet peut vous aider dans vos projets de production ou de mise en oeuvre des processus ITIL, n hésitez pas à le contacter pour toute question ou demande :

par mail : [email protected]

par téléphone : +33 (0)6 61 95 41 40 Quelques exemples de mission :

Modélisation simple des processus de gestion des changements, des projets et des mises en production en vue de la sélection, l'achat et l'implantation d'un outil de gestion de projets avec planification, gestion des ressources, des budgets, des livrables et des connaissances

Accompagnement avec la réorganisation d'un DSI passant d'une organisation en silos techniques vers une organisation inspirée du référentiel ITIL et la mise en oeuvre d'outils pour institutionnaliser les processus ITIL

Accompagnement d'une DSI dans la formulation de l'appel d'offres au futur centre de services en se basant sur les processus et la fonction centre de services du référentiel ITIL

Page 3: Itil v2 La Gestion De La Disponibilité Itilfrance Com

3

Sommaire 1 Introduction .................................................................................................................................................... 5

1.1 Pourquoi une Gestion de la Disponibilité ? .............................................................................................. 5 1.2 But ......................................................................................................................................................... 5 1.3 Objectifs ................................................................................................................................................. 5 1.4 Périmètre ............................................................................................................................................... 5 1.5 Hors périmètre ........................................................................................................................................ 5

2 Concepts de base .......................................................................................................................................... 5 2.1 L’infrastructure des SIs et le support informatique ................................................................................... 5 2.2 Principe n°1 : La Disponibilité est au coeur de la satisfaction Utilisateurs et Métiers ................................ 6 2.3 Principe n°2 : Reconnaître que même si les choses se passent mal, il est encore possible d’obtenir la satisfaction des Utilisateurs ................................................................................................................................ 6 2.4 Principe n°3 : L’amélioration de la Disponibilité ne peut seulement débuter que lorsque l’on a compris comment les Services des SIs supportent les activités Métiers ........................................................................... 7 2.5 Terminologie .......................................................................................................................................... 7

2.5.1 Disponibilité .................................................................................................................................... 7 2.5.2 Fiabilité ........................................................................................................................................... 7 2.5.3 Maintenabilité ................................................................................................................................. 8 2.5.4 « Serviçabilité » ou serviceability ..................................................................................................... 8

3 Processus ....................................................................................................................................................... 8 3.1 En entrée du processus .......................................................................................................................... 8 3.2 En sortie du processus ........................................................................................................................... 9 3.3 Activités clés du processus ..................................................................................................................... 9 3.4 Relations avec les autres processus ..................................................................................................... 10

3.4.1 Gestion des Niveaux de Service ................................................................................................... 10 3.4.2 Gestion de la Continuité des Services ........................................................................................... 10 3.4.3 Gestion Financière des Services ................................................................................................... 10 3.4.4 Gestion des Changements ............................................................................................................ 10

3.5 Bénéfices de la Gestion de la Disponibilité ............................................................................................ 10 3.6 Exemples de difficultés en absence de toute Gestion de la Disponibilité................................................ 11 3.7 Problèmes potentiels ............................................................................................................................ 11

4 Coût de la (non-)disponibilité ......................................................................................................................... 11 4.1 Lors de la mise en place de nouveaux Services .................................................................................... 11 4.2 Sur des Services existants .................................................................................................................... 11 4.3 Coûts de la non-Disponibilité ................................................................................................................ 12 4.4 Comment évaluer le coût d'une interruption de Service ? ...................................................................... 12

4.4.1 Impact sur les fonctions Métiers vitales ......................................................................................... 12 4.4.2 Impact financier ............................................................................................................................ 12 4.4.3 Les coûts tangibles ....................................................................................................................... 12 4.4.4 Les coûts intangibles .................................................................................................................... 12

4.5 Les difficultés et dérives possibles dans le calcul .................................................................................. 12 5 Mise en oeuvre ............................................................................................................................................. 12

5.1 Déterminer les besoins en Disponibilité................................................................................................. 13

Page 4: Itil v2 La Gestion De La Disponibilité Itilfrance Com

4

5.2 Activités de conception ......................................................................................................................... 13 5.2.1 Disponibilité .................................................................................................................................. 13 5.2.2 Restauration ................................................................................................................................. 13

5.3 Activités de conception : la Disponibilité ................................................................................................ 13 5.3.1 Points à considérer dans la conception ......................................................................................... 13 5.3.2 Définitions suggérées ................................................................................................................... 14

5.4 Activités de conception : la Restauration ............................................................................................... 14 5.4.1 Elément clé : le rôle de la Gestion des Incidents et du Centre de Services .................................... 14 5.4.2 Le « cycle de vie » d’un Incident ................................................................................................... 14 5.4.3 La supervision des systèmes ........................................................................................................ 14 5.4.4 Déterminer les besoins en sauvegarde et restauration .................................................................. 15 5.4.5 Développer et tester une stratégie de sauvegarde et restauration et sa planification ...................... 15 5.4.6 Métrologie de restauration............................................................................................................. 15 5.4.7 Performance dans la sauvegarde et la restauration ....................................................................... 15 5.4.8 Restauration du Service et vérification .......................................................................................... 15 5.4.9 Différence entre Gestion des Incidents et Gestion de la Disponibilité ............................................. 15

5.5 Activités de conception : les arrêts planifiés .......................................................................................... 15 5.5.1 Options pour réduire l’impact Métier .............................................................................................. 15

6 Métrologie et rapports ................................................................................................................................... 16 6.1 Bases de la métrologie ......................................................................................................................... 16 6.2 Les quatre vérités de la métrologie ....................................................................................................... 16 6.3 Les statistiques ..................................................................................................................................... 16

6.3.1 La vision traditionnelle de la DSI ................................................................................................... 16 6.3.2 Les inconvénients de la vision traditionnelle .................................................................................. 16 6.3.3 La métrologie Métiers de la Disponibilité ....................................................................................... 17

7 Onze exemples de méthodes et techniques .................................................................................................. 17 7.1 Component Failure Impact Analysis ...................................................................................................... 17

7.2 Fault Tree Analysis ............................................................................................................................... 18 7.3 CRAMM ............................................................................................................................................... 18

7.4 Calcul de la Disponibilité ....................................................................................................................... 19 7.5 Calcul de l’indisponibilité ....................................................................................................................... 19 7.6 Développer la métrologie de base de la Disponibilité ............................................................................ 20

7.6.1 Calcul de base de la Disponibilité .................................................................................................. 20 7.6.2 Rapport sur la durée totale d’arrêt ................................................................................................. 20 7.6.3 Rapports basés sur les Incidents................................................................................................... 20

7.7 Développer la métrologie Métiers de la Disponibilité ............................................................................. 20 7.7.1 Exemple de métrologie Métiers de la Disponibilité ......................................................................... 21

7.8 Analyse des pannes de Services (Service Outage Analysis) ................................................................. 21 7.9 Le « cycle de vie » étendu d’un Incident................................................................................................ 21 7.10 L’amélioration continue ......................................................................................................................... 22 7.11 Technical Observation Post .................................................................................................................. 22

Page 5: Itil v2 La Gestion De La Disponibilité Itilfrance Com

5

1 Introduction

1.1 Pourquoi une Gestion de la Disponibilité ? Depuis plusieurs années, l’interdépendance entre activités métiers et activités informatiques est parvenue à un point tel que si l’informatique s’arrête, l’entreprise s’arrête. L’activité économique nécessite de plus en plus un fonctionnement 7/7 et 24/24 (mondialisation, commerce électronique, flexibilité, etc.). Les Clients sont de plus en plus « volatils » (un Client ne pouvant pas être satisfait immédiatement en raison de l’Indisponibilité d’un service passera chez un concurrent). La Disponibilité fait partie de la réputation d’une entreprise.

1.2 But Optimiser la capacité de l’infrastructure informatique, des services et de l’organisation de support pour délivrer la Disponibilité adéquate (niveau suffisant et coût optimisé) permettant aux activités métiers de satisfaire leurs objectifs. En comparant les besoins et la capacité réelle, la Gestion de la Disponibilité permet cette optimisation.

1.3 Objectifs s’assurer que les Services des SIs sont définis pour délivrer les niveaux de Disponibilité requis par les Métiers

fournir des rapports sur la Disponibilité, la fiabilité et la maintenabilité

optimiser la Disponibilité de l’infrastructure en termes de coût

diminuer durablement la fréquence et la durée des Incidents ayant un impact en Disponibilité

s’assurer que les petites interruptions de Disponibilité soient identifiées et éradiquées

créer et maintenir un Plan prévisionnel pour améliorer globalement la Disponibilité afin d’anticiper les besoins futurs métiers sur les aspects de Disponibilité.

1.4 Périmètre devrait s’appliquer pour tout nouveau Service ou Service en cours ayant des besoins définis en Disponibilité ou étant

liés à des activités métiers critiques (SLA en place ou non).

devrait s’appliquer à tous les fournisseurs (internes et externes) avant la mise en place de SLAs formels.

1.5 Hors périmètre Ce processus n'est pas responsable du Plan de Continuité Métiers (Business Continuity Plan) et le rétablissement des activités métiers en cas de désastre majeur (Gestion de la Continuité).

2 Concepts de base

2.1 L’infrastructure des SIs et le support informatique La Disponibilité fournie dépend :

de la complexité des SIs

de la fiabilité des composants et de l’environnement des SIs

de la capacité du support informatique à gérer l’infrastructure

du niveau et de la qualité de la maintenance apportés par les fournisseurs

de la qualité des procédures et processus opérationnels Les niveaux de Disponibilité devraient être précisés dans les Accords de Niveaux de Service (SLAs).

Page 6: Itil v2 La Gestion De La Disponibilité Itilfrance Com

6

2.2 Principe n°1 : La Disponibilité est au coeur de la satisfaction Utilisateurs et Métiers

A l’intérieur de la DSI, nul ne conteste ce principe. Cependant, avec les possibilités technologiques et les pressions métiers, il est facile de créer des activités diversifiées. Il arrive que les préoccupations de Disponibilité soient tournées vers l’interne et non plus vers la satisfaction Utilisateurs, perdant de vue les métiers et les Utilisateurs que la DSI doit servir.

2.3 Principe n°2 : Reconnaître que même si les choses se passent mal, il est encore possible d’obtenir la satisfaction des Utilisateurs

Page 7: Itil v2 La Gestion De La Disponibilité Itilfrance Com

7

Pendant une interruption de Service, le niveau de satisfaction ne dépend pas seulement de la rapidité de redémarrage. Les organisations Métiers et les Utilisateurs ont une grande diversité de besoins, en plus de la rapidité de redémarrage et l’ensemble doit être traité.

2.4 Principe n°3 : L’amélioration de la Disponibilité ne peut seulement débuter que lorsque l’on a compris comment les Services des SIs supportent les activités Métiers

L’analyse doit porter sur les transactions Métiers et non pas sur chacun des composants techniques utilisés par les transactions.

2.5 Terminologie 2.5.1 Disponibilité Capacité pour un Service des SIs ou un composant à remplir sa fonction à un instant donné ou sur une période de temps prédéterminée.

2.5.2 Fiabilité La fiabilité d’un Service des SIs peut être définie comme étant son indépendance vis-à-vis des dysfonctionnements opérationnels. Elle est déterminée par :

la fiabilité de chacun des composants utilisés pour délivrer le Service.

le niveau de redondance (resilience) de l’infrastructure, c’est-à-dire la capacité de l’infrastructure à masquer le dysfonctionnement d’un composant et à continuer à délivrer le Service normalement.

Page 8: Itil v2 La Gestion De La Disponibilité Itilfrance Com

8

2.5.3 Maintenabilité Capacité d’un composant de l’infrastructure à rester, ou à être restauré dans un état opérationnel. La maintenabilité peut être divisé en 7 étapes séparées :

l’anticipation des pannes.

la détection des pannes.

le diagnostic des pannes.

la résolution des pannes.

le redémarrage après panne.

la restauration des données et des Services des SIs.

les niveaux de maintenance préventive permettant d’éviter l’apparition des pannes.

2.5.4 « Serviçabilité » ou serviceability Décrit les accords contractuels signés avec les fournisseurs tiers de la DSI et définissant la Disponibilité, la fiabilité et la maintenabilité des composants et Services des SIs sous leur responsabilités.

3 Processus La Gestion de la Disponibilité couvre la définition, l’implémentation, la métrologie et la gestion de la Disponibilité de l’infrastructure des SIs.

3.1 En entrée du processus

Besoins Métiers en Disponibilité (Service existant ou nouveau Service).

Analyse d’impact Métiers pour chaque fonction métier vitale supportée par des Services des SIs.

Besoins en Disponibilité, fiabilité et maintenabilité des composants supportant les Services.

Informations sur les Incidents et les Problèmes (interruptions de Service et pannes de composants).

Informations sur les Configurations et la surveillance des Services et des composants.

Comparaison des niveaux de service rendus par rapport aux niveaux attendus dans les Accords (SLAs).

Page 9: Itil v2 La Gestion De La Disponibilité Itilfrance Com

9

3.2 En sortie du processus

Critères de définition de Disponibilité et de restauration (pour les Services existants et les nouveaux Services).

Fiabilisation de l’infrastructure des SIs et Analyse des Risques (Détail des techniques d’augmentation de la Disponibilité qui seront mises en œuvre pour diminuer les pannes et minimiser leur impact).

Objectifs validés pour la Disponibilité, la fiabilité et la maintenabilité.

Rapports sur la réalisation des objectifs de Disponibilité, de fiabilité et de maintenabilité dans une perspective Métiers.

Surveillance de la Disponibilité (besoins en surveillance des composants pour s’assurer que les écarts sont détectés et signalés).

Plans d’amélioration de la Disponibilité (amélioration pro-active de l’Infrastructure des SIs).

3.3 Activités clés du processus

Déterminer les besoins en Disponibilité pour un nouveau Service ou un Service existant et formuler les critères de définition de Disponibilité et de restauration pour l’Infrastructure.

En collaboration avec la Gestion de la Continuité des Services, déterminer les fonctions Métiers vitales et l’impact de pannes de composants de l’infrastructure.

Définir les objectifs de Disponibilité, de fiabilité et de maintenabilité pour les composants de l’infrastructure pour permettre de les documenter et de les valider dans les Accords de Niveaux de Service (SLAs), les Accords de Niveaux Opérationnels (OLAs) et les contrats.

Etablir la métrologie et les rapports sur la Disponibilité, la fiabilité et la maintenabilité reflétant les préoccupations des organisations Métiers.

Page 10: Itil v2 La Gestion De La Disponibilité Itilfrance Com

10

Surveiller et analyser les tendances de la Disponibilité, de la fiabilité et de la maintenabilité des composants de l’infrastructure.

Faire le bilan de la Disponibilité des Services et des composants afin d’identifier les niveaux inacceptables.

Produire et maintenir le Plan d’amélioration de la Disponibilité.

3.4 Relations avec les autres processus La Gestion de la Disponibilité travaille avec l’ensemble des processus de la Gestion des Services (Service Management) et en particulier avec les processus suivants :

3.4.1 Gestion des Niveaux de Service Exemples :

En entrée : Analyse de la Disponibilité pouvant être fournie pour un nouveau Service (aide à la négociation).

En sortie : Détails d’un Accord de Niveau de Service (SLA) signé pour mise en place de la métrologie de la Disponibilité.

3.4.2 Gestion de la Continuité des Services Exemples :

En sortie : Analyse d’impact Métiers détaillant les fonctions Métiers vitales dépendant de la Disponibilité de l’Infrastructure.

En entrée : Informations sur les moyens mis en œuvre pour diminuer le nombre et l’impact des pannes de composants.

3.4.3 Gestion Financière des Services Exemples :

En entrée : Coûts de l’indisponibilité résultante d’une interruption de Service pour aider à la justification financière définis dans le Plan d’amélioration de la Disponibilité.

En sortie : Coûts associés à l’implémentation d’une modernisation (upgrade) de l’Infrastructure proposée pour augmenter la Disponibilité.

3.4.4 Gestion des Changements Exemples :

En entrée : Détails des opérations de maintenance préventive à réaliser (fréquence, durée, impact).

En sortie : Calendrier des Changements prévus et leur impact en termes de Disponibilité sur les Services fournis.

3.5 Bénéfices de la Gestion de la Disponibilité Les besoins en Disponibilité sont adressés à un coût connu et justifié et à un niveau pré-déterminé de qualité et de sécurité. La Gestion de la Disponibilité, si elle est mise en œuvre en collaboration étroite avec les organisations Métiers et Utilisateurs, assure que la DSI reconnaît la Disponibilité comme le principal élément pour générer et soutenir un comportement d’amélioration continue et une culture de service. Voici quelques bénéfices de la Gestion de la Disponibilité :

un seul point dans la DSI pour répondre aux exigences de Disponibilité.

les Services des SIs sont élaborés pour répondre aux besoins de Disponibilité des Métiers.

les niveaux de Disponibilité fournis sont financièrement justifiés.

les niveaux de Disponibilité requis sont agréés, mesurés et suivis pour supporter complètement la Gestion des Niveaux de Service.

les faiblesses dans les niveaux de Disponibilité fournis sont reconnus et corrigés.

une vision Métiers et Utilisateurs de la Disponibilité des SIs est utilisée pour assurer une utilisation et une performance optimale de ces SIs .

la fréquence et la durée des interruptions de Services sont progressivement en diminution.

l’organisation de support DSI passe d’une approche correction de problèmes (attitude réactive) à une approche amélioration des Services (attitude proactive).

Page 11: Itil v2 La Gestion De La Disponibilité Itilfrance Com

11

l’organisation de support DSI est vue comme apportant de la valeur (« add value ») aux organisations Métiers.

3.6 Exemples de difficultés en absence de toute Gestion de la Disponibilité il est difficile de définir des niveaux de Service sur la Disponibilité qui soient mesurables, réalisables et

compréhensibles par la DSI et les Métiers.

la gestion et la performance des fournisseurs internes et externes sont compromises par le manque d’objectifs de Disponibilité.

il devient difficile de comprendre quel niveau de Disponibilité est réalisable et à quel coût.

les nouveaux Services sont implémenter sans considérer comment la Disponibilité sera fournie ; cela peut entraîner à des Changements après coup sur l’Infrastructure et potentiellement onéreux.

l’instabilité des nouveaux Services entraîne la perte d’opportunités Métiers et une dégradation de la réputation de l’entreprise.

les préoccupations de Disponibilité ne sont pas reconnues ou appropriées par l’organisation du support DSI (manque de clarté dans la responsabilité).

les conséquences de l’échec à délivrer les niveaux de Disponibilité demandés : insatisfaction, manque de confiance et conflit entre la DSI et les organisations Métiers.

3.7 Problèmes potentiels Ils souvent de nature organisationnels comme par exemple :

la DSI considère que la Disponibilité est de la responsabilité des responsables de la DSI et ne dédie pas une ressource spécifiquement à ce processus.

la DSI et les équipes de support ne voient pas l’intérêt de traiter de la Disponibilité alors que les autres processus de Gestion des Incidents, des Problèmes et des Changements traite déjà de cete problématique.

la DSI considère que les niveaux actuels de Disponibilité sont bons et qu’il n’y a donc aucun intérêt à dédier une ressource spécifique.

4 Coût de la (non-)disponibilité Le niveau de Disponibilité requis influence directement le coût global des Services fournis par la DSI. Plus le niveau de Disponibilité demandé est élevé, plus le coût global est élevé :

technologies et services de base.

efficacité des processus de la Gestion des Services.

outils de surveillance des composants de l’infrastructure.

élaboration et mise en place de solutions avec un haut niveau de Disponibilité (redondance, etc.).

4.1 Lors de la mise en place de nouveaux Services Il est essentiel de participer au plus tôt dans la définition de l’architecture :

fournit une indication très tôt du coût de la Disponibilité demandée.

propose des scénarios alternatifs avec des niveaux de Disponibilité différents à des coûts différents.

des niveaux élevés de Disponibilité s’obtiennent plus facilement si l’architecture du Service prend en compte directement cet aspect (plus difficile si ajouté plus tard).

évite les coûts et les délais de Changements complémentaires pour atteindre les objectifs.

4.2 Sur des Services existants Peut nécessiter des revues régulières sur le sujet. Lorsqu’un haut niveau de Disponibilité est déjà en place, un petit gain peut demander beaucoup d’efforts et de budgets. Considérer en permanence les opportunités d’amélioration de l’existant est une activité clé du processus. Cette approche d’optimisation est la première étape pour fournir plus de valeurs au même coût. Recommandé : ne pas restreindre le périmètre d’analyse à la technologie (processus, responsabilités de bout en bout).

Page 12: Itil v2 La Gestion De La Disponibilité Itilfrance Com

12

4.3 Coûts de la non-Disponibilité Il s'agit de trouver un point d'équilibre entre :

Coûts de la Disponibilité (coûts des solutions mises en place pour assurer la Disponibilité).

Coûts de la non-Disponibilité (coûts sur les activités Métiers conséquence d’une interruption de Service).

4.4 Comment évaluer le coût d'une interruption de Service ? 4.4.1 Impact sur les fonctions Métiers vitales Expression simple : Affaires non réalisées ou nombre de transactions non effectuées par exemple (mesuré ou estimé). Avantage : Calculs simples et compréhensibles. Inconvénient : Ne permet pas de justifier des investissements lourds pour augmenter la Disponibilité.

4.4.2 Impact financier Intègre :

les coûts tangibles associés à la panne.

les coûts intangibles.

potentiellement l’impact financier global sur l’entreprise.

4.4.3 Les coûts tangibles Il s'agit des pertes à court terme :

perte de productivité des Utilisateurs.

perte de productivité des équipes de la DSI.

perte de revenus.

retards dans les règlements.

matériels et périssables perdus.

pénalités de retards déclenchés.

4.4.4 Les coûts intangibles Il s'agit des pertes à long terme et des pertes diffuses :

perte de la Satisfaction Clients.

perte de Clients.

perte d’opportunités Métiers.

dommages causés à la réputation de l’entreprise.

perte de confiance dans le fournisseur informatique interne qu’est la DSI.

dommages causés au moral des équipes . Il est important de ne pas les valoriser au minimum parce qu’elles sont parfois difficiles à estimer.

4.5 Les difficultés et dérives possibles dans le calcul étendue du périmètre à prendre en compte dans l’analyse.

les difficultés à estimer les coûts intangibles.

résistance des organisation Métiers à divulguer leurs coûts (idée que la DSI traite mieux ses clients qui ont du budget).

résistance de la DSI à rendre public les coûts des Services fournis à ses Clients.

temps et efforts pour obtenir les informations. Une approche pragmatique est recommandée. Les coûts de la non-Disponibilité sont souvent influencés par le montant de l’investissement à justifier.

5 Mise en oeuvre

Page 13: Itil v2 La Gestion De La Disponibilité Itilfrance Com

13

5.1 Déterminer les besoins en Disponibilité définition des fonctions Métiers vitales.

définition Métier de la notion d’indisponibilité d’un Service.

l’impact Métier de l’interruption du Service.

délais Métiers acceptables pour l’interruption de Service et le fonctionnement en dégradé.

les jours et heures demandées pour la fourniture du Service.

le calendrier des différentes périodes de travail Métiers (périodes critiques, etc.).

besoins de sécurité spécifiques.

5.2 Activités de conception 5.2.1 Disponibilité Conception des architectures techniques de l’infrastructure et de l’alignement des fournisseurs internes et externes pour répondre aux besoins de Disponibilité. Activité proactive : éviter l’interruption des Services.

5.2.2 Restauration Conception des différents points pour le redémarrage le plus rapide possible d’un Service après son interruption. Activité réactive : minimiser l’impact Métier et Utilisateurs d’une interruption de Service.

5.3 Activités de conception : la Disponibilité

5.3.1 Points à considérer dans la conception 1. Composants et produits de base La commande et le développement des composants de base de l’infrastructure doivent intégrer les critères nécessaires à la Disponibilité attendue. Si ces composants de base ne répondent pas aux critères demandés, il est illusoire de travailler sur les autres points.

Page 14: Itil v2 La Gestion De La Disponibilité Itilfrance Com

14

2. Processus de la Gestion des Services Les processus de Gestion des Incidents, des Problèmes, des Changements jouent un rôle crucial . 3. Administration des systèmes Surveillance, diagnostic et corrections automatiques des pannes permettent d’accélérer leur détection et leur résolution. 4. Solutions de haute disponibilité Eradication des points simples de panne (SPOF ou Single Point Of Failure) et/ou le stockage de composants de remplacement en cas de panne en production (pour minimiser le temps de restauration du Service). Elimination ou minimisation de l’effet des arrêts planifiés (maintenance ou mises en production) . 5. Solutions spécifiques avec redondance totale Solutions onéreuses avec redondance (duplication des composants et utilisation en parallèle). Inclut obligatoirement l’environnement informatique (alimentation électrique, etc.).

5.3.2 Définitions suggérées Haute Disponibilité (High Availability) : Caractéristique d’un Service des SIs qui minimise ou masque les effets

d’une panne de composant sur les activités Utilisateurs.

Exploitation en continu (Continuous operation) : Caractéristique d’un Service des SIs qui minimise ou masque les effets d’un arrêt de production planifié.

Disponibilité en continu (Continuous availability) : Caractéristique d’un Service des SIs qui minimise ou masque les effets de TOUTES les pannes ET arrêts de production PLANIFIES.

5.4 Activités de conception : la Restauration Il est impossible d’avoir une Disponibilité de 100% et des pannes surviendront. Il est nécessaire de travailler sur la phase de restauration et de redémarrage du Service après une panne. Chaque panne est un « moment de vérité » : chaque interruption de Service est l’occasion de faire ou de défaire votre réputation chez les organisations Métiers. Il est nécessaire de prendre en compte les besoins :

Métiers : avoir des informations pour les aider à gérer au mieux la période de la panne.

DSI : ensemble des outils et procédures pour restaurer en un délai optimum le Service interrompu.

5.4.1 Elément clé : le rôle de la Gestion des Incidents et du Centre de Services Eviter que des Incidents mineurs se transforment en Incidents majeurs en impliquant dès le début de la panne les bons interlocuteurs afin d’éviter les erreurs. Lors d’Incidents majeurs, la Gestion des Incidents et le Centre de Services doivent agir selon des règles déjà établies :

procédures d’escalade rigoureuses.

rôles et responsabilités clairement définis pour la gestion des Incidents majeurs.

plan de communication vers les Utilisateurs et Clients pour répondre aux besoins importants d’informations lors d’Incidents majeurs.

5.4.2 Le « cycle de vie » d’un Incident Chaque Incident passe par les étapes suivantes :

apparition.

détection.

diagnostic.

réparation du composant.

restauration du composant (réintégration dans l’infrastructure).

restauration du Service (et vérification). Ceci donne une trame dans la réflexion sur la définition d’une restauration rapide des Services.

5.4.3 La supervision des systèmes Les outils de supervision permettent d’augmenter le niveau de Disponibilité.

Page 15: Itil v2 La Gestion De La Disponibilité Itilfrance Com

15

Ils peuvent aussi être utilisés pour :

fournir une détection automatique des pannes.

assister au diagnostic.

réparation automatisée des erreurs.

5.4.4 Déterminer les besoins en sauvegarde et restauration A intégrer très tôt dans le développement ou la sélection de solutions. Cela devrait couvrir : le matériel, le logiciel et les données.

5.4.5 Développer et tester une stratégie de sauvegarde et restauration et sa planification Les opérations de sauvegarde et de restauration doivent être automatisées le plus possible. Les tests de sauvegarde et restauration donnent une approximation des temps (information destinées au plan de communication .

5.4.6 Métrologie de restauration La durée approximative de restauration d’un Service est une données essentielle pour les organisations Métiers. Elle permet aux organisations Métiers de prendre des décisions importantes pour gérer la période d’indisponibilité.

5.4.7 Performance dans la sauvegarde et la restauration La Gestion de la Disponibilité doit continuer rechercher et promouvoir des méthodes rapides de restauration pour tous les Problèmes potentiels.

5.4.8 Restauration du Service et vérification Un Incident ne devrait être considéré comme fermé qu’au moment où le Service a redémarré et que les activités Métiers fonctionnent de nouveau correctement. Il est important de vérifier que le Service restauré fonctionne correctement :

le plus souvent en ayant un retour des Utilisateurs.

quelquefois avec des outils et des méthodes (cas d’un site Internet par exemple). Ces outils et méthodes doivent être définies et testées.

5.4.9 Différence entre Gestion des Incidents et Gestion de la Disponibilité Les objectifs des deux processus sont complémentaires : restaurer le plus rapidement le Service interrompu et minimiser l’impact sur les activités Métiers. La Gestion des Incidents est utilisée par le Centre de Services pour utiliser une approche structurée et cohérente pour la gestion, le suivi et la résolution des Incidents. La Gestion de la Disponibilité fournit les méthodes, les outils et les techniques employées par les équipes de support à chacune des étapes du « cycle de vie » d’un Incident.

5.5 Activités de conception : les arrêts planifiés Les arrêts planifiés concernent :

les maintenances préventives.

les montées de version matérielles et logicielles pour mettre en place de nouvelles fonctions ou pour augmenter la Capacité de production.

les Changements sur les applications suite à des demandes Métiers.

les activations de nouvelles fonctions sur l’Infrastructure. Les arrêts planifiés sont problématiques sur des Services 24/24 et 7/7 (sites Internet par exemple).

5.5.1 Options pour réduire l’impact Métier Utiliser des composants de l’infrastructure (CI ou Configuration Item) alternatifs lors des arrêts programmés Attention que des arrêts planifiés ne tombent pas en même temps sur ces composants. Planifier les arrêts dans les périodes où il y a le moins d’impact Métiers Travailler avec les organisations Métiers. Regrouper les opérations de maintenance en une seule opération

Page 16: Itil v2 La Gestion De La Disponibilité Itilfrance Com

16

Le bénéfice est de n’avoir qu’un seul arrêt pour plusieurs opérations. Les risques potentiels à analyser sont :

la capacité de l’organisation informatique à mettre en place simultanément un nombre élevé de changements.

la capacité à analyser un Problème survenant après l’opération de maintenance multiple.

la dépendance des Changements les uns par rapport aux autres lorsqu’un Retour Arrière sur l’un d’entre eux est nécessaire.

6 Métrologie et rapports

6.1 Bases de la métrologie La métrologie donne les bases pour :

établir des mesures de Disponibilité et valider les objectifs avec les organisations Métiers.

superviser la Disponibilité fournie et la comparer aux objectifs.

identifier les niveaux inacceptables de Disponibilité qui impactent les Métiers et les Utilisateurs.

faire des revues de la Disponibilité avec les Métiers et les représentants des Utilisateurs.

faire des revues de la Disponibilité avec le support informatique.

activités continues d’amélioration de la Disponibilité.

6.2 Les quatre vérités de la métrologie Si vous ne faites pas de mesures, vous ne pouvez pas gérer.

Si vous ne faites pas de mesures, vous ne pouvez pas améliorer. Si vous ne faites pas de mesures, vous ne portez probablement pas attention.

Si vous ne pouvez pas faire évoluer [un domaine], alors ne faites pas de mesures.

6.3 Les statistiques Trois cibles différentes à prendre en considération :

1. l’organisation de support informatique. 2. la perspective Utilisateurs (fréquence, durée et périmètre impacté). 3. la perspective Métiers (la contribution de la Disponibilité aux fonctions vitales).

6.3.1 La vision traditionnelle de la DSI Basée sur la mesure de la Disponibilité des composants :

% disponibilité : LA mesure traditionnelle par excellence (par exemple : 98,3% réel contre 98,5% dans l’Accord, ce qui ne semble pas trop mauvais).

% indisponibilité : le contraire de la précédente (1,7% réel contre 1,5% dans l’Accord, ce qui semble moins bon que le premier).

Durée totale des Indisponibilités.

Fréquence des pannes.

Impact des pannes. Pendant longtemps, les organisations Métiers ont accepté ces mesures mais ont maintenant tendance à demander des chiffres permettant de démontrer les conséquences positives et négatives de la Disponibilité sur leurs activités.

6.3.2 Les inconvénients de la vision traditionnelle Les avancées technologiques permettent, du point de vue de la DSI, d’améliorer la Disponibilité. Les organisations Métiers étant de plus en plus dépendantes de l’informatique, l’impact des pannes est de plus en plus grand. Le paradoxe suivant peut alors apparaître :

Page 17: Itil v2 La Gestion De La Disponibilité Itilfrance Com

17

La vision "Mesures traditionnelles de la DSI" est nécessaire pour les équipes de support de la DSI mais elle ne reflète pas le ressenti des organisations Métiers. Les objectifs de Disponibilité sont souvent atteints même lorsqu’il y a eu des perturbations importantes dans les organisations Métiers et des plaintes des Utilisateurs.

6.3.3 La métrologie Métiers de la Disponibilité La vision Utilisateurs de la Disponibilité est influencée par trois facteurs :

la fréquence des arrêts.

la durée des arrêts.

le périmètre impacté. La métrologie employée devrait considérer ces deux axes :

Impact par minutes Utilisateurs perdues : durée de l’arrêt multipliée par le nombre d’Utilisateurs impactés.

Impact par transaction Métier : nombre de transactions ne pouvant pas être réalisées pendant les pannes. Les éléments à mesurer :

fonctions vitales Métiers.

applications.

données.

réseaux.

composants de l’Infrastructure.

plates-formes. Les informations à mesurer :

la Disponibilité (mesurée contre prévue dans les Accords).

la fiabilité (fréquence des pannes).

la maintenabilité (durée des pannes et de leur réparation).

les temps de réponse (certains temps de réponse longs sont assimilés par les Utilisateurs comme étant de l’indisponibilité).

7 Onze exemples de méthodes et techniques Voici onze méthodes et techniques pouvant être utilisées dans le cadre de la Gestion de la Disponibilité.

7.1 Component Failure Impact Analysis

Page 18: Itil v2 La Gestion De La Disponibilité Itilfrance Com

18

CFIA simple : Tableau Composant x Service avec :

blanc si le Service n’est pas impacté par le Composant.

« X » si le Service dépend du Composant.

« A » si le Composant est un Composant alternatif au Service.

« B » si le Composant est un Composant alternatif au Service mais que le Service doit d’abord être restauré. En combinant avec les fonctions Métiers vitales et les Utilisateurs associés à chaque Service, on peut obtenir un tableau reliant un Composant de l’Infrastructure au nombre d’Utilisateurs impactés par une panne de ce dernier. Cette méthode permet d’identifier rapidement les points de panne simples (SPOF) et les Services en risque lors d’une panne de Composant. CFIA élaboré : il est possible d’ajouter les paramètres suivants :

probabilité de panne (à partir du MTBF = Mean Time Between Failure).

temps de réparation.

procédures de restauration (existence ou absence).

7.2 Fault Tree Analysis Utilisé pour déterminer la chaîne d’événements qui cause une interruption de Service.

Les événements :

événement de base : point terminal d’une arborescence (défaillance électrique, etc.).

événement résultant : nœud intermédiaire de l’arborescence (la racine de l’arborescence est généralement l’interruption d’un Service).

événement conditionnel : événement ne survenant que dans certaines conditions.

événement déclencheur : événement déclenchant d’autres événements (une panne électrique peut lancer un arrêt automatique de Services).

7.3 CRAMM Cette méthode permet de définir les contre-mesures justifiables pour protéger la confidentialité, l’intégrité et la Disponibilité de l’Infrastructure face à des risques potentiels.

Page 19: Itil v2 La Gestion De La Disponibilité Itilfrance Com

19

7.4 Calcul de la Disponibilité Cette méthode utilise des formules mathématiques pour calculer la Disponibilité d’un Service en fonction de la Disponibilité de ses composants élémentaires.

Temps validé = Temps de Disponibilité du Service dans l’Accord. Temps d’arrêt = Temps d’arrêt du Service pendant la période validée dans l’Accord. Eléments en série :

Eléments en parallèle :

7.5 Calcul de l’indisponibilité Pour justifier le coût d’un investissement, il est nécessaire d’intégrer tous les paramètres de coût de l’indisponibilité qui sera levée.

Page 20: Itil v2 La Gestion De La Disponibilité Itilfrance Com

20

7.6 Développer la métrologie de base de la Disponibilité Quelques suggestions :

7.6.1 Calcul de base de la Disponibilité La mesure la plus simple est de donner le taux de Disponibilité. La grande majorité des Accords de Niveau de Service (SLAs) sont basés sur ce taux de Disponibilité.

7.6.2 Rapport sur la durée totale d’arrêt non prévu (pannes).

planifié (arrêts programmés pendant les heures de Service).

étendu (temps supplémentaire non prévu pour terminer les opérations de maintenance planifiées).

7.6.3 Rapports basés sur les Incidents fréquence des pannes.

performance des restaurations (temps de restauration et de redémarrage du Service après interruption).

MTBF (Mean Time Between Failures) : temps moyen entre le redémarrage complet d’un Service et son interruption suivante.

MTBSI (Mean Time Between System Incidents) : temps moyen entre deux pannes.

MTTR (Mean Time To Repair) : temps moyen entre l’apparition d’un Incident et sa résolution.

7.7 Développer la métrologie Métiers de la Disponibilité Le taux de Disponibilité réel ne reflète pas toujours la satisfaction Clients. Différentes approches :

Le CFIA (Componant Failure Impact Analysis) peut servir de base en y ajoutant une information sur le nombre d’utilisateurs affectés par la panne d’un composant.

Intégration dans les développements des mesures de Disponibilité.

Estimation du nombre de transactions perdues pendant la panne (informations fournies par la Gestion des Capacités).

Sondage quotidien d’un panel d’Utilisateurs (réponses : BON, ACCEPTABLE ou MAUVAIS par exemple).

Outils de simulations de transactions passées par les Utilisateurs.

Plaintes des Clients (en relation avec la Disponibilité).

Pénalités de retard.

Calcul de la Disponibilité Utilisateurs (absolu) : o Rapport sur les Incidents avec la durée et le nombre d’Utilisateurs impactés. o Total : nombre d’Utilisateurs concernés par les Incidents.

Page 21: Itil v2 La Gestion De La Disponibilité Itilfrance Com

21

Calcul de la Disponibilité Utilisateurs (productivité). o Idem avec le produit durée x nombre d’Utilisateurs impactés. o Total : nombre de jours hommes perdus en raison des Incidents (EUDT ou End-User Downtime).

Calcul de la Disponibilité Utilisateurs (pourcentage de disponibilité). o EUPT (End-User Processing Time) = AST (Agreed Service Time ou Durée de Service validée dans

l’Accord de Niveau de Service) x Nombre d’Utilisateurs. o EUA (End-User Availability) = (EUPT – EUDT) / EUPT x 100

7.7.1 Exemple de métrologie Métiers de la Disponibilité Service fourni 24/24 et 7/7 à 1 000 Utilisateurs et avec 2 heures de maintenance le week-end. 4 Incidents : 60 min et 50 Utilisateurs, 25 min et 20 Utilisateurs, 125 min et 1000 Utilisateurs, 20 min et 1 Utilisateur. Durée de Service hebdomadaire (AST ou Agreed Service Time) = (24 x 7) – 2 = 166 heures. EUPT (End-User Processing Time) = 166 h x 1000 Utilisateurs soit 166 000 h ou 9 960 000 minutes. EUDT = (60 x 50) + (25 x 20) + (15 x 1000) + (20 x 1) = 128 520 min. EUA (End-User Availability) = (EUPT – EUDT) / EUPT x 100 = (9 960 000 – 128 520) / 9 960 000 x 100 = 98,7 %.

7.8 Analyse des pannes de Services (Service Outage Analysis) Approche structurée pour identifier des opportunités d’amélioration de la Disponibilité finale (côté Utilisateurs). En collaboration étroite avec la Gestion des Problèmes. Les objectifs sont :

identifier les causes sous-jacentes d’une interruption de Service.

analyser l’efficacité des équipes de support et des processus.

produire des recommandations.

initier un programme pour mettre en place les recommandations.

mesures effectuées sur les améliorations mises en place.

7.9 Le « cycle de vie » étendu d’un Incident Permet d’étudier le cycle de vie complet de son apparition au rédémarrage du Service et de s’assurer que les temps de chaque phase sont bien optimisés. En collaboration avec la Gestion des Incidents et des Problèmes.

Page 22: Itil v2 La Gestion De La Disponibilité Itilfrance Com

22

7.10 L’amélioration continue La Gestion de la Disponibilité peut aussi jouer un rôle clé dans l’optimisation des coûts et dans la stabilité de l’Infrastructure. L’amélioration continue est un élément clé de la Gestion de la Qualité.

7.11 Technical Observation Post Equipe de spécialistes support transversale travaillant sur un sujet particulier concernant la Disponibilité. Exemple : une équipe peut être constituée pour améliorer l’efficacité des batches de nuit en travaillant sur l’ensemble des domaines concernés :

planification des traitements batch.

procédures de relance des traitements batch après incident.

automatisation.

performance des applications.

performance de l’Infrastructure.

procédures et processus opérationnels.