Description d'Un Cluster

6
Description Ensemble logique de serveurs qui garantissent une haute disponibilité des ressources et une répartition des charges de traitement. Présentation Pourquoi le clustering ? La technologie de clustering permet d'avoir une haute disponibilité des ressources publiées. On utilise cette technologie pour avoir une disponibilité et stabilité des ressources proche de 100 %. Tolérance zéro pour les pannes matérielles ou logicielles. Il y a également une répartition des charges entre les nœuds d'un cluster. Quelques explications... Le clustering est une technique permettant de mettre en parallèle plusieurs systèmes d'exploitation. Un ensemble de machines en réseau destiné à un fonctionnement en parallèle (gérant des ressources stockées sur des disques partagés) constitue un cluster. Dans ce cluster, chaque machine sera un Nœud ("node" en anglais). Tous les nœuds sont des stations de travail dans le sens où elles possèdent un ou plusieurs processeurs en opposition aux terminaux. Le réseau ainsi formé est un NOW (Network Of Workstation - réseau de stations de travail). Cette méthode permet de diviser les temps d'exécution d'un programme entre plusieurs machines réparties sur un réseau. Le principe utilisé dans le clustering consiste à diminuer le temps d'exécution d'une tâche en la fractionnant sur plusieurs machines. Une tâche répartie sur N machines arrivera N fois plus vite à terme que sur une seule. Les différentes techniques de clustering Shared Everything Model : Permet aux 2 noeuds de faire des entrées/sorties et lecture/écriture sur tous lesdisques partagés. Il y a un partage des ressources matérielles. Shared Nothing Model : Chaque nœud gère son propre disque et est le seul habilité à écrire et lire sur les ressources du disque qui lui est attribué. Chaque nœud se voit attribuer ses propresressources matérielles à gérer. Mirrored Servers : Un seul nœud répond aux requêtes clientes, l’autre nœud est en attente prêt à remplacer son homologue en cas de défaillance. Il s’agit d'une copie conforme du premier nœud.

description

Description d'Un Cluster

Transcript of Description d'Un Cluster

Page 1: Description d'Un Cluster

Description

Ensemble logique de serveurs qui garantissent une haute disponibilité des ressources et une répartition des charges de traitement.Présentation

Pourquoi le clustering ?

  La technologie de clustering permet d'avoir une haute disponibilité des ressources publiées. On utilise cette technologie pour avoir une disponibilité et stabilité des ressources proche de 100 %. Tolérance zéro pour les pannes matérielles ou logicielles. Il y a également une répartition des charges entre les nœuds d'un cluster.

Quelques explications...

  Le clustering est une technique permettant de mettre en parallèle plusieurs systèmes d'exploitation. Un ensemble de machines en réseau destiné à un fonctionnement en parallèle (gérant des ressources stockées sur des disques partagés) constitue un cluster.

Dans ce cluster, chaque machine sera un Nœud ("node" en anglais). Tous les nœuds sont des stations de travail dans le sens où elles possèdent un ou plusieurs processeurs en opposition aux terminaux.

Le réseau ainsi formé est un NOW (Network Of Workstation - réseau de stations de travail).

Cette méthode permet de diviser les temps d'exécution d'un programme entre plusieurs machines réparties sur un réseau. Le principe utilisé dans le clustering consiste à diminuer le temps d'exécution d'une tâche en la fractionnant sur plusieurs machines. Une tâche répartie sur N machines arrivera N fois plus vite à terme que sur une seule.

Les différentes techniques de clustering

Shared Everything Model :Permet aux 2 noeuds de faire des entrées/sorties et lecture/écriture sur

tous lesdisques partagés. Il y a un partage des ressources matérielles.

Shared Nothing Model :Chaque nœud gère son propre disque et est le seul habilité à écrire et lire

sur les ressources du disque qui lui est attribué. Chaque nœud se voit attribuer ses propresressources matérielles à gérer.

Mirrored Servers :Un seul nœud répond aux requêtes clientes, l’autre nœud est en attente

prêt à remplacer son homologue en cas de défaillance. Il s’agit d'une copie conforme du premier nœud.

Clusters Microsoft  Depuis la version NT4 de son système d'exploitation Windows, Microsoft propose de mettre en place un cluster constitué de serveurs Microsoft pour répondre aux besoins croissants des entreprises en terme de messagerie électronique, de base de données et depuis quelques années de serveurs WEB ou FTP.

La firme de Redmond propose deux types de clustering :

Le clustering de Service Il s'agit de réaliser des clusters d'application et de rendu de service. En fait

Microsoft propose un cluster de Haute Disponibilité, à tolérance aux fautes. Il permet

Page 2: Description d'Un Cluster

de fournir une garantie et une qualité de service aux utilisateurs d'applications comme Microsft SQL Server.

Le clustering à répartition de chargeIci, Microsoft garantit une répartition de charge réseau sur des flux IP à travers un

cluster constitué de 32 nodes au maximum. Typiquement, il s'agit de répartir les charges réseaux d'un serveur WEB, d'un serveur de média,...

A travers ses solutions, Microsoft vise les entreprises désireuses d'améliorer leur production, en proposant des systèmes permettant d'améliorer et d'accélérer le travail quotidien des employés, mais aussi permettant de réaliser du commerce (comme le e-business) avec un plus grand nombre de clients.

Toutefois, il existe encore quelques freins dans l'utilisation de tels systèmes. En effet, les clusters Microsoft ne fonctionnent que sur de l'architecture Microsoft. De plus, les systèmes d’exploitation proposés subissent trop souvent des correctifs pour en faire des systèmes fiables et stables.

Clusters Linux  L'alternative, à tous ces clusters chers, est Linux. Il suffit de posséder quelques PC, une distribution Linux et quelques logiciels permettant de réaliser le parallèle entre les nodes du système. Toutefois, il faut savoir que de nombreuses personnes ont déjà effectué des recherche et mises en œuvre des clusters en développant des applications Open Source et donc disponible sur le réseau en version gratuite.

En fait, le caractère quasi gratuit de ce type de clustering réside dans le fait que le système n'est pas livré clé en main et nécessite donc un investissement humain important pour le mettre en place. De plus, la mise en œuvre de ce type de solution n'est pas aisée et demande de bonnes compétences en informatique et réseaux, et de bonnes connaissances du monde Linux, mais surtout un travail de patience et de passionné.

Enfin, dans un dernier temps, il faut trouver le meilleur support et le meilleur emplacement qui mettront en valeur le système réalisé. Pour l'administrateur, il s'agira de trouver le meilleur matériel et de placer son système là où il est le plus attendu.Points Points forts- Optimisation des performances- Haute disponibilité- Sécurité- Redondance- Rapidité

Points faibles- Coût important- Nécessite de solides connaissances informatiques- Technique gourmande en bande passante et en temps.

EvaluationLe clustering est en fait une solution d'alternative pour les personnes et/ou les

entreprises n'ayant pas les moyens de posséder un super-calculateur. En effet, le coût d'une architecture en clusters reste tout de même très inférieur à celui des supers-ordinateurs.

De plus, dans un cluster, l'administrateur peut étendre la puissance de son système sans trop de difficultés dans la mesure où cette mise à jour ne consiste qu'à rajouterun node dans l'architecture et à le déclarer auprès des autres acteurs du cluster(surtout le node server, le "chef d'orchestre" du cluster).

Néanmoins, les systèmes en clustering les plus puissants et les plus performants restent des solutions basées sur du matériel et des Unix propriétaires, et apparaissent tout de même comme des solutions très chères et donc réservées au grandes structures.

Page 3: Description d'Un Cluster

Pour palier ce problème, il existe tout de même d'autres alternatives pour monter un cluster.

Qu'est-ce que RAID?

RAID (Redundant Array of Independent Disks, à l'origine Redundant Array of Inexpensive Disks ) est une manière de stocker les mêmes données à différents endroits (donc, de manière redondante) sur de multiples disques durs s. En plaçant des données sur plusieurs disques, I / O (entrée / sortie) les opérations peuvent se chevaucher de façon équilibrée, l'amélioration des performances. Depuis plusieurs disques augmente le

Page 4: Description d'Un Cluster

temps moyen entre pannes ( MTBF ), de stocker des données de manière redondante augmente également la tolérance aux pannes .

Un RAID apparaît dans le système d'exploitation à un seul disque dur logique. RAID utilise la technique de la entrelacement , ce qui implique le partitionnement d'espace de stockage de chaque disque en parts allant d'un secteur (512 octets) jusqu'à plusieurs mégaoctets.Les rayures de tous les disques sont entrelacés et traitées dans l'ordre.

Dans un système mono-utilisateur où les dossiers volumineux, tels que le médical ou d'autres images scientifiques, sont stockés, les rayures sont typiquement mis en place pour être petit (peut-être 512 octets) de sorte qu'un seul enregistrement s'étend sur tous les disques et peut être consulté rapidement par la lecture tous les disques dans le même temps.

Dans un système multi-utilisateur, une meilleure performance nécessite l'établissement d'une bande assez large pour détenir le record de taille typique ou maximale.

Cela permet chevauchaient E / S disque sur les lecteurs.

Il ya au moins neuf types de RAID ainsi qu'un tableau non redondant (RAID-0):

RAID-0: Cette technique a entrelacement, mais sans redondance des données. Il

offre les meilleures performances, mais pas de tolérance aux pannes.

RAID-1: Ce type est également connu comme miroir de disque et se compose d'au

moins deux disques qui reproduisent le stockage des données. Il n'ya pas de

rayures. Lire la performance est améliorée puisque soit le disque peut être lu en

même temps. Les performances en écriture sont les mêmes que pour le stockage de

disque unique. RAID-1 fournit les meilleures performances et la meilleure tolérance

aux pannes dans un système multi-utilisateurs.

RAID-2: Ce type utilise entrelacement sur plusieurs disques avec quelques disques

de stockage de vérification d'erreur et la correction (ECC ) de l'information. Il n'a

aucun avantage sur RAID-3.

RAID-3: Ce type utilise l'entrelacement et consacre un disque à stocker la

parité de l'information. La vérification intégrée d'erreur (ECC) l'information est utilisée

pour détecter les erreurs. La récupération des données est réalisée en calculant le OU

exclusif (XOR) des informations enregistrées sur les autres lecteurs. Depuis une

opération d'E / S s'adresse à tous les lecteurs dans le même temps, le RAID-3 ne

peuvent se chevaucher I / O. Pour cette raison, le RAID-3 est le meilleur pour

systèmes mono-utilisateur avec les applications d'enregistrement de long.

RAID-4: Ce type utilise des bandes de grandes, ce qui signifie que vous pouvez lire

les enregistrements de n'importe quel lecteur unique. Cela vous permet de profiter

Page 5: Description d'Un Cluster

des E / S superposées pour les opérations de lecture. Comme toutes les opérations

d'écriture doivent mettre à jour le lecteur de parité, pas d'E / S qui se chevauchent est

possible.RAID-4 offre aucun avantage sur RAID-5.

RAID-5: Ce type comprend une gamme de parité tournante, répondant ainsi à la

limitation écriture en RAID-4. Ainsi, tous les lire et les opérations d'écriture peuvent

être chevauchés. RAID-5 des informations de parité des magasins, mais pas les

données redondantes (mais les informations de parité peut être utilisé pour

reconstruire les données). RAID-5 nécessite au moins trois et habituellement cinq

disques de la matrice.Il est préférable pour les systèmes multi-utilisateurs dans

lesquels la performance n'est pas critique ou qui ne les opérations d'écriture peu.

RAID-6: Ce type est similaire au RAID-5, mais comporte un régime de parité

seconde qui est répartie sur différents disques et offre ainsi aux pannes et de très

haute drive-échec de la tolérance.

RAID-7: Ce type comprend un système d'exploitation temps réel embarqué en tant

que contrôleur, la mise en cache via un bus haute vitesse, et d'autres caractéristiques

d'un ordinateur autonome. Un vendeur propose ce système.

RAID-10: Combinaison RAID-0 et RAID-1 est souvent appelé RAID-10, qui offre des

performances supérieures à celles RAID-1, mais à beaucoup plus de coûts. Il ya deux

sous-types: Dans RAID-0 +1, les données sont organisées en bandes sur plusieurs

disques, puis les jeux de disques rayés sont en miroir. Dans RAID-1 0, les données

sont en miroir et les miroirs sont rayés.

RAID-50 (ou RAID-5 0): Ce type se compose d'une série de RAID-5 groupes et

bandes en RAID-0 de la mode pour améliorer les performances RAID-5 sans pour

autant réduire la protection des données.

RAID-53 (ou RAID-5 3): Ce type utilise entrelacement (en RAID-0 de style) pour les

blocs de RAID-3 du disque virtuel. Cette offre de meilleures performances que RAID-3,

mais à un coût beaucoup plus élevé.

RAID-S (également appelé RAID Parité): Il s'agit d'une alternative, une méthode

brevetée pour la parité RAID rayé de stockage EMC Symmetrix qui n'est plus en usage

sur l'équipement actuel. Il semble être similaire au RAID-5 avec quelques

améliorations de performances ainsi que les améliorations qui viennent d'avoir un

cache disque à haute vitesse sur la baie de disques.