Les réseaux de neurones artificiels (RNA) Un outil efficace pour appréhender le caractère...

Post on 04-Apr-2015

115 views 4 download

Transcript of Les réseaux de neurones artificiels (RNA) Un outil efficace pour appréhender le caractère...

Les réseaux de neurones artificiels (RNA)

Un outil efficace pour appréhender le caractère

saisonnier des débits dans un bassin versant ?

Dilemme de la modélisation hydrologique

• Tend vers la prédiction• Prédiction basée sur des séries hydrologiques

• Le DÉBAT : Ces séries sont-elles chaotiques ?– Si OUI, problème majeur

• Recours à l’APPROCHE NEURONALE

Qu’est-ce qu’un RNA ?

Ce qu’on veut faire :

Étudier le comportement intelligent du RN, qui émerge de la structure et du comportement

des éléments de base (les neurones)

Réseau

Stimulus Réponse

0 1 0 1 1 1 0 0

1 1 00 10 10

Architecture d’un RNA

Coulibaly et al., 1999

Les RNA sont…

• Nouvel outil d’approximation des systèmes complexes

• Efficaces lorsque les systèmes sont non linéaires

Les RNA sont-ils… ?

Capables de capter et de reproduire la variabilité et les effets de saisonnalité qui

existent dans certaines séries hydrologiques ?

Site d’étude : Bassin versant de l’Hermine (0,05 km²)– Variabilité inter-saisonnière très forte– Variabilité intra-saisonnière également forte

CONSTRUIRE LE RNA

LES ÉTAPES

Rassembler les données

• Données enregistrées quotidiennement

Choisir la variable cible et les variables de forçage

Variable cibleLe débit moyen Q au jour t

Variables prédictives

Au jour t-n, avec n = 1, 2, 3 ou 5

Équation symbolique :

Le débit moyen Q

La quantité de pluie P

La quantité de neige N

La température moyenne T

( , , , )t t n t n t n t nQ f Q P N T

Choisir la structure du RNA

• Perceptron multicouches– 1 couche d’entrée, 1 couche cachée, 1 couche de sortie

• Algorithme d’apprentissage : Rétro-propagation

• Fonction d’activation– Couche d’entrée Couche cachée : tanh– Couche cachée Couche de sortie : linéaire

S Y S T E M E

couche

cachée

(hidden ) j

couche

d'entrée

(input) i

couche

de sortie

(output) k

Env

iron

nem

ent

Env

iron

nem

ent

11bias bias

j aj

ia

W ji

bias = 1

W bias

a f x e x e x

e x e x xfxfxf 1.1

Séparer l’ensemble de données initial

• Effet de saisonnalité– Données enregistrées à l’année longue– Données enregistrées sur chaque saison (PR, ET, AU)

• Phases ou étapes de travail– Sous-fichier d’apprentissage– Sous-fichier de validation– Sous-fichier de test

• Effet de la taille des sous-fichiers– Permutation

Entraîner le RNA

• Couche d’entrée : 4 variables + 1 neurone de biais

• Couche de sortie : 1 variable

• Couche cachée : On teste 3 options différentes– Même nombre de neurones que la couche d’entrée– 75 % de la couche d’entrée

– √(neurones d’entrée ∙ neurones de sortie)

Évaluer les résultats

1

( )²n

i ii

Q QRMSE

n

1

1

( )²1

( )²

n

i iin

ii

Q QEfficience

Q Q

2

1

1 1

( ) ( )²

( )² ( ) ²

n

i ii

n n

i ii i

Q Q Q Qr

Q Q Q Q

INTERPRÉTER LES RÉSULTATS

Points communs des simulations

• Concernant les sous-fichiers :– Les meilleurs résultats sont toujours ceux de

l’apprentissage– Performance moins bonne des phases de test et de

validation

• Concernant les variables prédictives :– Gradient des résultats en fonction de la valeur de n

– Plus la valeur de n est grande, plus le RNA a du mal à prédire Qt

( , , , )t t n t n t n t nQ f Q P N T

Résultats selon la période de l’année modélisée

• Architecture de base : RNA (5, 5, 1)

• Résultats assez surprenants– Efficience des données annuelles > Efficience des

données saisonnières– Meilleurs résultats saisonniers : Printemps

– Résultats les plus décevants : Été et automne

Débits réels et simulés par le RNA pour le fichier

ANSE1-1

Autres résultats pour le fichier ANSE1-1

Débits réels et simulés par le RNA pour les fichier PR-1 et

ET-1

Fichier ET-1

Fichier PR-1

Expliquer la contre-performance du RNA pour l’été et l’automne

• Hypothèse 1 : Conditions d’humidité antécédentes

0

5

10

15

20

25

30

35

1 51 101 151 201 251 301 351

0

10

20

30

40

50

60

70

80

90

Pluie (mm) Débit (mm/jour)

0

5

10

15

20

25

1 51 101 151 201 251 301 351

0

50

100

150

200

250

Pluie (mm) Neige (mm) Débit (mm/jour)

Expliquer la contre-performance du RNA pour l’été et l’automne

• Hypothèse 2 : Taille de l’ensemble de données initial

• Taille des fichiers de données annuelles : – 1462 échantillons

• Taille des fichiers de données saisonnières : – 368 ou 372 échantillons

Expliquer la contre-performance du RNA pour l’été et l’automne

En l’absence de données de conditions d’humidité antécédentes à fournir en « input » au RNA, comment s’assurer que ledit RNA identifie et

distingue les conditions sèches et les conditions humides par lui-même pour fournir des résultats

corrects ?

– Résultats saisonniers sont mauvais Le RNA ne fait pas la distinction

– Résultats annuels satisfaisants Le RNA fait la distinction

• Hypothèse 3 : Apprentissage non supervisé nécessitant beaucoup de données

superviseur

réseau

sortie désirée

sortie obtenue

erreur

EN

TR

EE

S

réseau sortie obtenueEN

TR

EE

S

Permutation des sous-ensembles de données

• Meilleurs résultats : Grand nombre d’échantillons affectés aux phases d’apprentissage et de validation

• Fichier ANSE1-1– Apprentissage sur 731 échantillons (366 de l’année 1996

humide et 365 de l’année 1997 sèche)– Validation sur 365 échantillons de l’année 2002 sèche– Test sur 366 échantillons de l’année 2004 humide

Efficience assez bonne• Fichier ANSE2-1

– Validation sur 731 échantillons (366 de l’année 1996 humide et 365 de l’année 1997 sèche)

Efficience meilleure que ANSE1-1• Fichier ANSE3-1

– Apprentissage sur une année humide seulement– Validation sur une année sèche uniquement

Efficience moins bonne, surtout pour la phase de test

Rôle du nombre de neurones dans la couche cachée

• Pas de différence significative entre :– RNA (5, 5, 1)– RNA (5, 4, 1)

– RNA (5, 2, 1)

Conclusion

• Bon potentiel des RNA en hydrologie

• L’application d’un RNA sur de grands ensembles de données non dépourvues de leurs tendances ou de leurs fluctuations saisonnières semble efficace

• Maier et Dandy (2000) : – There is a tendancy among users to throw a problem

blindly at a neural network in the hope that it will formulate an acceptable solution…

Questions ?