Détecteurs de fautes pour réseaux dynamiques P. Sens, L. Arantes, M. Bouillaguet Projet REGAL.

Post on 03-Apr-2015

104 views 0 download

Transcript of Détecteurs de fautes pour réseaux dynamiques P. Sens, L. Arantes, M. Bouillaguet Projet REGAL.

Détecteurs de fautes pour réseaux dynamiques

P. Sens, L. Arantes, M. Bouillaguet

Projet REGAL

Plan

• Détecteurs de fautes non fiables• Implémentation asynchrone• Caractéristiques des réseaux dynamiques• Algorithmes• Performances

FLP 85

• Impossible de résoudre le consensus de façon déterministe– Asynchrone– Réseau fiable– 1 seul crash

• Idée : – Impossible de différencier un processus défaillant

d’un processus lent– La décision peut dépendre d’un seul vote

Contourner FLP 85

• Changer le problème– k-agreement [Cha90]

• Plusieurs valeurs peuvent être décidées

– Consensus probabiliste [BO83]• Des processus peuvent ne pas terminer

• Systèmes partiellement synchrones [DDS87]– Les bornes sont non connues, valables uniquement à partir d’un

moment– Algorithmique dépendante du système

• Les détecteurs de défaillances non fiables [CT96]– Algorithmique en asynchrone (indépendante du système)– Hypothèses plus facilement utilisables

Détecteur de défaillances

• Oracle local sur chaque nœud• Fournit une liste des processus suspectés

d’être défaillants• Informations non fiables

– Possibilité de fausses suspicions

p

rq

ts

u

s

s

s

s

s

s

LENT

r

r

r

Complétude : un processus défaillant doit être détecté comme défaillant

Justesse : un processus correct ne doit pas être considéré comme défaillant

Classes de détecteurs

• Complétude forte : – Il existe un instant à partir duquel tout processus défaillant est suspecté par

tous les processus corrects

• Justesse :– Forte : aucun processus correct n’est suspecté

– Faible : il existe au moins un processus correct qui n’est jamais suspecté

– Finalement forte : il existe un instant à partir duquel tout processus correct n’est plus suspecté par aucun processus correct

– Finalement faible : il existe un instant à partir duquel au moins un processus correct n’est suspecté par aucun processus correct

• Consensus résoluble avec ◊S• Impossible à implémenter en asynchrone

Justesse

Forte Faible Finalement forte Finalement faible

Complétude forte P S ◊P ◊S

Implémentations basées sur les temporisateurs

• Pinging

• Heartbeat

toDétecteur de q

p up

p down

p up

p

q

Détecteur de qp up

p down

p up

p

q

H

H

to

to

to

Implémentations asynchrones• [Mostefaoui03]• Hypothèses:

– Ensemble de processus connus – Réseau maillé / fiable – f crashs au maximum– pas de temporisateur

• Basé sur un mécanisme de requêtes-réponse• Principe nœud pi:

Envoyer requête aux n nœudsAttendre n-f réponsesConstruire l’ensemble des suspects

Réception requête :• Renvoyer l’ensemble des réponses recus

Caractéristiques réseaux dynamiques

• Nombre de nœuds inconnu• Graphe non complet• Mobilité

Modèle

• Nombre de nœuds inconnu• f fautes maximum• Chaque nœud possède un « range » de

transmission contenant au moins d nœuds (densité)

• Communication fiable• Hypothèse temporelle :

– Certains nœuds (les nœuds relais) doivent avoir la « Responsivness Property »: répondre parmi les premiers

F-covering network

1

2 3

4

5

67

89

range 1,2

range 5,6

range 9

range 3, 4

range 7, 8

Algorithmes (1)

• Variables du processus i:– range i– suspected i : ensemble des suspects– mistake i : les dernières erreurs– K i : la connaissance des voisins directs

Algorithmes (2)

Agrégation des réponsesAgrégation des suspectsAgrégation des erreurs

Exemple

Exemple

Exemple

Exemple

Preuve

• Preuve de <>S (voir rapport)• Nécessité de propriété de responsivness : « Il

existe dans chaque intersection au moins un nœud qui répond parmi les premiers »

Extension pour la mobilité

• Mobilité limitée : les propriétés de densité et « f-covering » doivent maintenue

• Idée : Lorsque la mobilité est détectée retirer le nœud des K du range source

Algorithme avec mobilité

Performances - Configurations

Performances – temps de détection

Performances – temps de détection

Performances – Justesse

Performances - Mobilité

Conclusion

• Problèmes ouverts :– F-covering trop « fort » : l’algorithme marcherait avec

des hypothèses plus faibles– Le consensus

• Perspectives :– Algorithme moins dépendant de la densité – Etendre la mobilité

Référence

• Titre :– Asynchronous Implementation of Failure Detectors

with partial connectivity and unknown participants

• Auteur :– Pierre Sens, Luciana Arantes, Mathieu Bouillaguet

• Rapport de recherche RR6088• hal.inria.fr