République algérienne démocratique et populaire
Ministère de l’enseignement supérieur et la recherche scientifique
Université Larbi Ben M’hidi Oum El Bouaghi
Faculté des Sciences Exactes et Sciences de la Nature et de la Vie
Département de Mathématiques et Informatique
Mémoire de fin d’étude en vue de l’obtention du diplôme de master en Informatique
Option
Vision artificielle
Thème
Présenté par :
Guendouz Ahmed Dhiya Eddine.
Devant le jury Dr. Berkane Mohamed Encadreur Pr NINI Brahim Président Mme CHEBBOUT Samira Examinatrice
Année Universitaire : 2019-2020
Conception et réalisation d’un système de reconnaissance
automatique des plaques d’immatriculation algérien
Remerciements
Merci Allah (mon dieu) de m'avoir donné la
capacité d'écrire et de réfléchir la patience
et le courage durant ces longues années
d'étude.
Tout d’abord, ce travail ne serait pas
aussi riche et n’aurait pas pu voir le jour
sans l’aide et l’encadrement de Monsieur
Berkane Mohamed, Je le remercie de m’avoir
encadré, orienté, aidé et conseillé.
J’exprime aussi mes gratitudes à tous les
enseignants du département mathématiques et
d'informatique sans exception, qui nous ont
fournis les outils nécessaires à la réussite
dans nos études universitaires.
Je remercie mes très chers parents, Fateh
et Kaltoum, qui ont toujours été là pour moi.
Je remercie ma sœur Bouchra, et mes frères
Alla Eddine et Oussama pour leurs
encouragements.
Je remercie mob amis Bensiah Oussama Akram
pour leurs encouragements.
À tous ces intervenants, je présente mes
remerciements, mon respect et ma gratitude.
Dédicaces
Je dédie ce modeste travail :
A mes chers parents, pour tous leurs
sacrifices, leur amour, leur tendresse, leur
soutien et leurs prières tout au long de mes
études,
À mes adorables frères Bouchera ,Alla Eddine et
Oussama ,
A toute ma famille pour leur soutien tout au
long de mon parcours universitaire,
Que ce travail soit l’accomplissement de vos
vœux tant allégués, et le fuit de votre soutien
infaillible,
Merci d’être toujours là pour moi.
Résumé
L’IA est un vaste domaine qui vise à améliorer la vie des gens et à trouver des solutions aux divers problèmes auxquels ils font face, en particulier ceux liés à la sécurité, comme l’identification des visages, des voix et des formes. Dans cette recherche, nous avons utilisé les réseaux de neurones artificielles pour construire un système intelligent pour la reconnaissance des plaques d'immatriculation afin de l’exploiter dans les systèmes d'identification automatique au niveau des parkings ou des radars routiers et autres. Pour cela nous avons entrainé un réseau de neurones de type perceptron multicouches en utilisant une base de données contenant plus de 2000 images de numéros des plaques d'immatriculation. Avec la méthode proposée nous avons obtenues des résultats avec une grande précision.
Abstract
Artificial Intelligence is a vast field that aims to improve people's lives and find solutions to the various problems they face, especially those related to security, such as identifying faces, voices and shapes. In this research, we used artificial neural networks to build an intelligent system for license plate recognition for use in automatic identification systems at parking lots or road radars and others. For this we trained a multi-layered perceptron neural network using a database containing more than 2000 images of license plate numbers. With the proposed method we obtained results with great precision.
ملخص
خاصة ،ٌوجهونها التً المشكلات لمختلف حلول وإٌجاد الناس حٌاة تحسٌن إلى ٌهدف واسع مجال هو الاصطناعً الذكاء العصبٌة الشبكات استخدمنا البحث، هذا فً. والأشكال والأصوات الوجوه على التعرف مثل بالأمن، المتعلقة تلك
اأوتوماتٌكً السٌارات مواقف تسٌٌر أنظمة فً لاستخدامه ترقٌم المركبات لوحة على للتعرف ذكً نظام لبناء الاصطناعٌة بٌانات قاعدة باستخدام الطبقات متعددة عصبٌة شبكة بتدرٌب قمنا بذلك، للقٌام. ذلك شابه وما الطرق مراقبةكامٌرات أو
.كبٌرة بدقة نتائج على حصلنا المقترحة، بالطرٌقة. ترقٌم المركبات لوحات لأرقام صورة 2000 من أكثر على تحتوي
TABLE DES MATIERES
7 .................................................................................................................................................. .ة
Introduction général .................................................................................................................. 1
Chapitre 01 : Revue de littérature.............................................................................................. 1
1. Introduction ........................................................................................................................ 3
2. La reconnaissance de forme RDF ....................................................................................... 3
2.1. Le prétraitement .......................................................................................................... 4
2.1.1. Filtrage .................................................................................................................. 5
2.1.2. Binarisation d’image ............................................................................................. 8
2.1.3. Détection de contours .......................................................................................... 9
2.2. La classification .......................................................................................................... 10
2.2.1. méthode de classification .................................................................................. 11
2.3. Domaine d’application .............................................................................................. 14
2.3.1. La vision artificielle ............................................................................................. 14
2.3.2. La reconnaissance des caractères et des mots .................................................. 16
2.3.3. La reconnaissance vocale ................................................................................... 18
3. La reconnaissance des plaques d’immatriculation .......................................................... 20
3.1. Les différentes formes d’immatriculation dans le monde ........................................ 20
4. Travaux ............................................................................................................................. 21
4.1. Travaux au niveau mondiales : .................................................................................. 21
4.1.1. Système de vision par ordinateur basé sur FCN et LSTM pour la reconnaissance
du type de véhicule, du numéro de plaque d'immatriculation (Nauris , Jaundalders,
Kadikis, & Nesenbergsa, 2018): ........................................................................................ 22
4.1.2. Reconnaissance automatique de plaque d'immatriculation basée sur un réseau
neuronal à convolution (Raj, et al., 2019) : ...................................................................... 23
4.2. Travaux au niveau local : ........................................................................................... 25
4.2.1. Reconnaissance automatique des plaques d’immatriculation (KOHILI , 2015) . 25
4.2.2. Système de reconnaissance des plaques d'immatriculation Algérienne
(TOUAMRIA, 2019) ........................................................................................................... 25
4.2.3. Evaluation et critique ......................................................................................... 25
5. Conclusion ........................................................................................................................ 27
Chapitre 2 Méthode proposée ................................................................................................... 3
1. Introduction ...................................................................................................................... 23
2. Méthode proposée ........................................................................................................... 23
2.1. Création de la base de données : .............................................................................. 24
2.2. Prétraitement et extraction de caractéristiques........................................................... 26
2.2.1 Prétraitement .......................................................................................................... 26
2.2.2. Extraction de caractéristiques ................................................................................ 26
5.1. 2.3. Classification basée sur les réseaux de neurones .............................................. 27
3. Implémentation ................................................................................................................ 31
3.1. Environnement de travail .......................................................................................... 31
3.2. Description de l’application ....................................................................................... 34
3.2.1. Interface utilisateur ............................................................................................ 34
3.2.2. Importation d'image ........................................................................................... 37
3.2.3. Localisation de la plaque d'immatriculation ...................................................... 38
3.2.4. Segmentation des caractères ............................................................................. 38
3.2.5. Stockage des résultats ........................................................................................ 39
4. Test et résultats ................................................................................................................ 39
4.1. Importation de l’image .............................................................................................. 40
4.2. Localisation de plaque d’immatriculation ................................................................. 40
4.3. Cas de test de segmentation ..................................................................................... 41
4.4. Test de reconnaissance des caractères ..................................................................... 41
4.5. Fonctionnalités de l'interface ALPR ........................................................................... 42
5. Conclusion ........................................................................................................................ 43
conclusion générale ................................................................................................................. 43
References ......................................................................................................................... 44
Table des figures
FIGURE 2.1 Schéma générale d’un système de reconnaissance des formes.
FIGURE 1.2 les techniques de filtrages
FIGURE 1.3 apprentissage supervise d'une machine.
FIGURE 1.4 imagerie médicale.
FIGURE 1.5 contrôle de qualité.
FIGURE 1.6 imagerie satellitaire.
FIGURE 1.7 imagerie satellitaire.
FIGURE 1.8 traitement d’un document papier par numérisation et reconnaissance.
FIGURE 1.9 acquisition d’un signal au moyen d’un stylet et d’une tablette tactile.
FIGURE 1.10 documents imprimes et manuscrits.
FIGURE 1.11 reconnaissance vocale.
FIGURE 1.12 identification biométrique.
FIGURE 1.13 Schéma de plaque d’immatriculation de type AAA 111.
FIGURE 1.14 schéma de plaque d’immatriculation de type AA 111 AA.
FIGURE 1.15 schéma de plaque d’immatriculation de type AA/11-AA-11.
FIGURE 1.16 schéma de plaque d’immatriculation de type AAA 1111 et 1111 AAA .
FIGURE 1.17 Schéma de plaque d’immatriculation : 11111 111 11.
FIGURE 1.18 proposent un système de reconnaissance automatique des plaques
d'immatriculation (ANPR)
FIGURE 1.19 un système de reconnaissance automatique des plaques d'immatriculation
(RAPI).
FIGURE 2.1 schéma de notre proche
Figure 2.2 exemple 1 sue la base de donnée
FIGURE 2.3 EXEMPLE 2 sue la base de donnée
FIGURE 2.4 les différentes situations considérées par le détecteur de Moravec
FIGURE 2.5 schéma de perceptron multicouche
FIGURE 2.6 schéma de perceptron multicouche
Figure 2.7 LOGO MATLAB
Figure 2.8 logo Photoshop
Figure 2.9 interface d’accueil
Figure 2.10 Menu d’application
Figure 2.11 le guide du l’interface
Figure 2.12 chemin de la photo
Figure 2.13 Implémentation de Harris
Figure 2.14 la Segmentation
Figure 2.15 le résultat
Figure 2.16 Erreur quadratique moyen RMS
Table des tableaux
Tableau 1.1 Montre les résultats obtenus par le système (ANPR).
Tableau 1.2 les résultats obtenus par le système (RAPI).
Tableau 2.1 importation de l’image
Tableau 2.2 localisation de plaque d’immatriculation
Tableau 2.3 test de segmentation
Tableau 2.4 fonctionnalité de l’application
1
INTRODUCTION GENERAL
Les progrès technologiques que l’informatique a apportés ont un impact direct sur la
vie des individus, facilitant ce qui semblait être complexe à savoir en bureautique et dans le
domaine de la communication, en outre, l'intérêt accru pour le domaine de l'intelligence
artificielle, comme dernières évolution de Informatique, a ouvert de nouveaux horizons et
différentes visions pour plusieurs domaines, tels que la médecine, les études et les sciences
spatiales, ce qui améliore et augmente la qualité de vie des individus.
La reconnaissance des formes, des visages et des sons représentent les défis les plus
importants de l’intelligence artificielle dans toutes ses branches de l’apprentissage
automatique à l’apprentissage profond, qui ont été une source de recherche pour de
nombreux chercheurs afin de trouver des solutions à ses différentes lacunes. L’une des
solutions la plus importante est l'utilisation des différents types des réseaux de neurones
artificiels et leurs introduction de la manière la plus adéquate pour atteindre les objectifs
nécessaires pour résoudre les problèmes posés et trouver des solutions à ces défis,
l’utilisation de réseaux de neurones artificiels est inspiré du fonctionnement du cerveau
humain ou animal en simulant les opérations de reconnaissance de formes ( RdF) à partir du
le fonctionnement biologique du cerveau.
La contribution principale de ce travail est de construire un système de reconnaissance
automatique basée sur les réseaux de neurones appliqué au plaques d’immatriculation
algérien extrait en temps réel à partir d’une image de véhicule.
Ce manuscrit est organisé en deux chapitres :
Chapitre 01 : Revue de littérature
Au début de ce chapitre nous allons présenter une vue générale sur la reconnaissance de
forme RDF ensuite nous allons illustrer quelques travaux sur la détection et reconnaissance
automatique des plaques d’immatriculation. A la fin, nous allons établir une évaluation des
différents travaux dans le domaine en présentant leurs avantages ainsi que leurs
inconvénients.
2
Chapitre 02 : Méthode proposée
Ce chapitre est composé de trois partie, la première présente l’approche que nous avons
développé pour l’identification et la reconnaissance des plaques d’immatricule algériennes,
dans la deuxième partie nous allons montrer l’implémentation de l’approche proposée sous
forme de système complet en illustrant les principales interfaces d’entrées sorties.
Concernant la troisième partie, elle contient une évaluation de cette approche en précisant
les principaux tests que nous avons effectués ainsi que les résultats obtenus.
CHAPITRE
01 : REVUE
DE
LITTERATUR
E
Chapitre 01
Revue de littérature
Chapitre 1 : Revue de littérature
3
1. INTRODUCTION
La vision par ordinateur, appelée également vision artificielle ou vision numérique, est
une branche de l'intelligence artificielle dont la principe est de permettre à une machine
d'interpréter, de traiter et de comprendre une ou plusieurs images capturées par un
système d'acquisition (ex. des caméras) .
Cette approche consiste à essayer d'imiter la vision humaine ou animale par exemple, vision
à large champ de certains oiseaux, de certains insectes, avec des composants électroniques.
Cette approche peut être vue comme le traitement des données visuelles par la géométrie,
la physique, la biologie, les statistiques et des modèles basés sur la théorie de
l'apprentissage. La vision par ordinateur a également été développée dans le but
d'automatiser et d'incorporer une grande variété de processus et de modèles de perception
visuelle.
2. LA RECONNAISSANCE DE FORME RDF
On désigne par reconnaissance de formes RdF (ou parfois reconnaissance de motifs)
un ensemble de techniques et méthodes visant à identifier des motifs à partir de données
brutes afin de prendre une décision dépendant de la catégorie attribuée à ce motif. La RdF
est considérée comme une branche de l’intelligence artificielle qui fait largement appel aux
techniques d’apprentissage automatique et aux statistiques. Les formes ou motifs à
reconnaître peuvent être de nature très variée. Il peut s'agir de contenu visuel (code barre,
visage, empreinte digitale...) ou sonore (reconnaissance de parole), d'images médicales
(rayon X, EEG, IRM...) ou multi spectrales (images satellitaires) et bien d'autres. [3]
L'objectif de la RdF est de réaliser des systèmes informatisés qui simulent les activités
humaines de perception, de reconnaissance et de compréhension :
Reconnaissance de l'écrit, de la parole.
Interprétation de scènes, robotique.
Reconnaissance des signaux EEG (électroencéphalogramme), ECG
(électrocardiogramme).
Chapitre 1 : Revue de littérature
4
L’ensemble des étapes majeures d’une approche de reconnaissance des formes se
décompose comme l’illustre la figure suivante (Voir Figure 1.1) :
FIGURE 2.1 Schéma générale d’un système de reconnaissance des formes.
2.1. LE PRETRAITEMENT
Les données brutes issues des capteurs sont les représentations initiales des données à
partir desquelles des traitements permettent de construire celles qui seront utilisées pour la
reconnaissance.
Les données brutes sont bruitées, elles contiennent des informations parasites, elles
sont non normalisées et redondantes et elles n'explicitent pas les informations utiles pour la
reconnaissance. Ainsi, une étape de prétraitement consiste à sélectionner dans l’espace de
représentation l’information nécessaire au domaine d’application.
Cette sélection passe souvent par l’élimination du bruit, la normalisation des données,
ainsi que par la suppression de la redondance. Le nouvel espace de représentation a une
dimension R’ très inférieur à R mais demeure un espace de grande dimension et contient des
informations encore assez primitives. [4]
Il existe plusieurs méthodes dans cette étape, parmi ces méthodes on distingue 03 types :
Chapitre 1 : Revue de littérature
5
Filtrage.
Binarisation.
Détection de contour.
2.1.1. FILTRAGE
Le filtrage des données d'image est un processus standard utilisé dans presque tous les
systèmes de traitement d'image.
Les filtres sont utilisés pour Lissage et élimination du bruit d'une image numérique tout
en préservant les détails de l'image [5]. Le choix du filtre est déterminé par :
La nature de la tâche effectuée par le filtre.
Comportement du filtre.
Type de données.
2.1.1.1. TECHNIQUES DE FILTRAGES
Le chemin suivant illustre les différents technique de filtrages (Voir Figure 1.2)
FIGURE 1.2 les techniques de filtrages
Chapitre 1 : Revue de littérature
6
A- Filtrage linéaires :
Les filtres linéaires sont utilisés pour éliminer certains types de bruit.il est facile à
concevoir, ces filtres fonctionnent mieux avec le bruit du sel et du poivre et le bruit gaussien.
Soit I l’image numérique, soit h une fonction de *x1, x2+ x *y1, y2+ a valeurs réelles, la
convolution de I par h est définie par :
(I ∗ h)[x, y] = ∗
𝑋2
𝐼=𝑋1
h(i, j)[x − i, y − j]
𝑌1
𝐽=𝑌2
Tels que h est un noyau de convolution
Le filtrage linéaire contient 2 types de masque sont :
Filtre moyen :
Est un filtre linéaire simple. Son principe est basé sur le remplacement de
chaque valeur de pixel dans une image par la valeur moyenne de ses
voisins, y compris elle-même. Mais ne conserve pas les détails de l'image.
Certains détails seront supprimés de d'image avec l'utilisation de ce filtre, le
filtrage de l’image est donné par :
𝑓 𝑥, 𝑦 =1
𝑚𝑛 𝑔(𝑠, 𝑡)
∞
(𝑠,𝑡)∈𝑆𝑥𝑦
Soit Sxy représentent l'ensemble de coordonnées dans une fenêtre de
sous-image rectangulaire de taille m * n, centrée au point (x, y). Le
processus de filtrage de la moyenne arithmétique calcule la valeur
moyenne de l’image corrompue g (x, y) dans la zone définie par Sxy. La
valeur de l’image restaurée en un point quelconque (x, y) est simplement la
moyenne arithmétique calculée à l’aide des pixels de la région définie par S
[6].
(01)
(02)
Chapitre 1 : Revue de littérature
7
Filtre Gaussien :
Le filtre gaussien lisse une image en calculant la moyenne pondérée dans
une boite à filtrée. Il est utilisé pour supprimer le bruit et le flou de l’image.
Le filtrage gaussien. Il est effectué par convolution de chaque point du
tableau en entrée avec un noyau gaussien, puis additionner pour produire
la valeur en sortie. La distribution gaussienne en une-Dimension à la forme
:
𝑮 𝒙 =𝟏
𝟐𝝅𝝈𝒆−𝒙𝟐
𝟐𝝈𝟐
En deux dimensions, il est le produit de deux telles fonctions gaussiennes,
une dans chaque dimension :
𝑮 𝒙, 𝒚 =𝟏
𝟐𝝅𝝈𝒆
−𝒙𝟐+𝒚𝟐
𝟐𝝈𝟐
Ou x est la distance de l’origine sur l’axe horizontal, y est la distance de
l’origine sur l’axe vertical et 𝝈 est l’écart type de la distribution de
gaussienne [5].
B- Filtrage non linéaires :
Ils sont plus puissants que les filtres linéaires car ils permettent de réduire les
niveaux
De bruit sans brouiller les contours, peuvent être difficiles à concevoir.
Filtre médian
Est un filtre non linéaire simple et puissant, Il est utilisé pour réduire la
variation d'intensité entre un pixel et l'autre pixel. Dans ce filtre, nous
remplaçons la valeur de pixel par la valeur médiane. Cette dernière est
calculée en triant d'abord toutes les valeurs de pixels dans l'ordre croissant,
puis en remplaçant le pixel calculé par la valeur de pixel médiane.
Le filtrage de l’image est donné par la formule suivante :
(03)
(04)
Chapitre 1 : Revue de littérature
8
𝒇 𝒙, 𝒚 = 𝒎𝒆𝒅𝒊𝒂𝒏 𝒈 𝒔, 𝒕 /(𝒔, 𝒕) ∈ 𝑺𝒙𝒚
Ou Sxy représente l'ensemble des coordonnées dans un masque
rectangulaire de taille m * n centré au point (x, y), l'image donnée est g (x,
y) [6].
2.1.2. BINARISATION D’IMAGE
Pour les images acquises en niveaux de gris, la binarisation devient nécessaire avant
d’attaquer la phase du traitement.
La binarisation permet de mieux distinguer les caractères du fond, elle consiste à
attribuer à chaque pixel de l’image une valeur de 0 ou 1.
Le résultat de la reconnaissance de caractères dépend fortement de la binarisation.
L'image binarisée de haute qualité peut donner plus de précision dans la
reconnaissance des caractères par rapport à l'image d'origine, car de la présence du bruit
dans l'image d'origine.
En fait, le problème est de savoir quel algorithme de binarisation est approprié pour
toutes les images. La sélection de l'algorithme de binarisation le plus optimal est difficile car
différents algorithmes donnent des performances différentes sur des ensembles de données
différents. Cela est particulièrement vrai dans le cas de documents historiques, les images
présentant des variations de contraste et d’éclairage.
Les algorithmes se divisent en deux catégories :
Binarisation globale Binarisation locale
Les méthodes de binarisation globales utilisaient une valeur de seuil unique pour
l’image entière et la méthode de binarisation locale, où la valeur de seuil était calculée
localement pixel par pixel ou région par région [8].
Pour la binarisation globale, nous choisissons :
Méthode de seuillage fixe
Méthode Otsu
(05)
Chapitre 1 : Revue de littérature
9
Méthode de Kittler
Pour la binarisation locale, nous choisissons :
Méthode Niblack
Méthode adaptative
Méthode Sauvola
2.1.3. DETECTION DE CONTOURS
L’objectif de la détection de contours est de repérer les points d’une image numérique qui
correspondent à un changement brutal de l’intensité lumineuse. La détection des contours
d’une image réduit de manière significative la quantité de données et élimine les
informations qu’on peut juger moins pertinentes, tous en préservant les propriétés
structurelles importantes de l’image [9].
Il existe plusieurs méthodes de détection de l’image telle que
1. Méthode de Sobel
Le principe de ce filtre est que l'opérateur calcule le gradient de l'intensité de chaque
pixel. Ceci indique la direction de la plus forte variation du clair au sombre, ainsi que
le taux de changement dans cette direction. On connaît alors les points de
changement soudain de luminosité, correspondant probablement à des bords, ainsi
que l'orientation de ces bords. L'opérateur utilise des matrices de convolution. La
matrice (généralement de taille 3×3) subit une convolution avec l'image pour calculer
des approximations des dérivées horizontale et verticale. Soit A l'image source, GX et
Gy deux images qui en chaque point contiennent des approximations respectivement
de la dérivée horizontale et verticale de chaque point. Ces images sont calculées
comme suit :
𝐺𝑋 =+1 0 −1 +2 0 −2 ∗ 𝐴 +1 0 −1
𝐺𝑌 =+1 +2 +1 0 0 0 ∗ 𝐴 −1 −2 −1
.
Et (06)
Chapitre 1 : Revue de littérature
10
En chaque point, les approximations des gradients horizontaux et verticaux peuvent
être combinées comme suit pour obtenir une approximation de la norme du
gradient :
𝐺 = 𝐺𝑥2 + 𝐺𝑦
2
2. Méthode de Prewitt
La matrice qui correspond au filtrage horizontal, faisant ressortir essentiellement
les contours verticaux, selon l'opérateur de Prewitt, s'écrit hx = [-1 0 1] tandis que la
matrice verticale hy est sa transposée. Les deux convolutions avec le tableau de
valeurs initiales créent deux tableaux Gx et Gy à l'origine du tableau G sur lequel on
peut localiser les maximums [9].
3. Méthode de Canny
Le filtre de Canny (ou détecteur de Canny) est utilisé en traitement d’images
pour la détection des contours. L’algorithme est conçu par John Canny en 1986 pour
être optimal suivant trois critères clairement explicités :
Bonne détection : faible taux d’erreur dans la signalisation des contours.
Bonne localisation : minimisation des distances entre les contours détectés et
les contours réels
Clarté de la réponse : une seule réponse par contour et pas de faux positifs
[10].
2.2. LA CLASSIFICATION
La classification est l’élaboration d’une règle de décision qui transforme les attributs
caractérisant les formes en appartenance à une classe (passage de l’espace de codage vers
l’espace de décision). Avant qu’un modèle de décision ne soit intégré dans un système de
reconnaissance de l’écriture, il faut avoir procédé auparavant à deux étapes : l’étape
d’apprentissage et l’étape de test.
(07)
Chapitre 1 : Revue de littérature
11
2.2.1. METHODE DE CLASSIFICATION
Généralement, un système de reconnaissance est construit à partir des connaissances
a priori sur le problème. Le fait de classer un objet correspond donc à prendre une décision
en basant sur une ou plusieurs règles. Dans les années 90, l'approche Machine Learning (ML)
ou apprentissage machine devient très populaire. Il s'agit d'apprendre automatiquement les
règles de décision en basant sur un ensemble d'exemples déjà classés.
L'apprentissage machine inclut entre autres les méthodes supervisées et non
supervisées. Dans les techniques non-supervisées, les objets sont présentés sans leur
catégorie. Un exemple type de méthodes non-supervisées est le clustering dont le but est de
créer des groupes (clusters) d'objets présentant des caractéristiques semblables. Dans le cas
des méthodes supervisées, on cherche à estimer une fonction f(x) à partir des exemples x,
comme l'indique la figure ci-dessous [11] (Voir Figure 1.3).
FIGURE 1.3 apprentissage supervise d'une machine.
Où x, f(x) une donnée et son étiquette et F’ est une estimation de f(x).
Les données préparées sont stockées dans des entrepôts de données qui sont
directement accessibles par la phase d’extraction des connaissances. Dans cette phase,
plusieurs techniques et outils sont utilisés selon les objectifs et les informations recherchées.
Cependant, deux grandes tendances partagent ces techniques : la prédiction et la
description.
La prédiction englobe une famille de méthodes qui visent à utiliser les données
disponibles pour prédire le comportement des données futures. La description englobe des
méthodes qui visent à découvrir les modèles (patterns) compréhensibles par les humains et
qui décrivent les données analysées. La prédiction est un processus à deux étapes : une
étape d’apprentissage (entrainement) et une étape de classification (utilisation). Dans
Chapitre 1 : Revue de littérature
12
l’étape d’apprentissage, un classificateur (une fonction, un ensemble de règles, ...) est
construit en analysant (ou en apprenant de) une base de données d’exemples
d’entrainement avec leurs classes respectives [11].
2.2.1.1. APPRENTISSAGE STATISTIQUE
Les techniques d’apprentissage statistique se basent sur les lois statistiques, ce sont
des méthodes qui reposent sur la théorie de Bayes représentant une référence théorique
pour les approches statistiques de résolution des problèmes de classification. Les réseaux
Bayésiens (ou réseaux de croyance) représentent l’application la plus connue de la théorie
de bayes dans la classification. Ils sont beaucoup plus précis que d’autres techniques
d’apprentissage, puisqu’ils, d’un côté, prennent en considération les dépendances entre les
attributs, et d’un autre côté, peuvent intégrer des connaissances humaines au préalable.
Malheureusement, ces réseaux sont très coûteux en temps de calcul pour
l’apprentissage et l’espace nécessaire pour les stocker est aussi exhaustif [12].
2.2.1.2. RESEAUX DE NEURONES
Un réseau de neurones est un assemblage de neurones connectés entre eux. Un
réseau réalise une ou plusieurs fonctions algébriques de ses entrées, par composition des
fonctions réalisées par chacun des neurones. La capacité de traitement de ce réseau est
stockée sous forme de poids d'interconnexions obtenus par un processus d'apprentissage à
partir d'un ensemble d'exemples d'apprentissage Il arrive souvent que les exemples de la
base d'apprentissage comportent des valeurs approximatives ou bruitées.
Si on oblige le réseau à répondre de façon quasi parfaite relativement à ces exemples,
on peut obtenir un réseau qui est biaisé par des valeurs erronées [12].
2.2.1.3. LES ARBRES DE DECISION
Les arbres de décision représentent une méthode très efficace d’apprentissage
supervisé. Il s’agit de partitionner un ensemble de données en des groupes les plus
homogènes possible du point de vue de la variable à prédire. On prend en entrée un
ensemble de données classées, et on fournit en sortie un arbre qui ressemble beaucoup à un
diagramme d’orientation où chaque nœud final (feuille) représente une décision (une classe)
et chaque nœud non final (interne) représente un test. Chaque feuille représente la décision
Chapitre 1 : Revue de littérature
13
d’appartenance à une classe des données vérifiant tous les tests du chemin menant de la
racine à cette feuille [13].
Les arbres de décisions sont très répandus, à cause de la simplicité de lecture de leurs
résultats et leur traitement naturels des cas multi-classe. Néanmoins, ils posent beaucoup de
problèmes tel que :
La difficulté de manipulation des attributs numériques,
L’espace nécessaire pour leur déduction,
Leur non scalabilité.
2.2.1.4. LA REGRESSION
La régression est la méthode utilisée pour la prédiction des valeurs continues. Son
objectif est de trouver le meilleur modèle qui décrit la relation entre une variable continue
de sortie et une ou plusieurs variables d’entrée. Dans l’analyse des bases de données, la
régression est utilisée pour prédire des informations continues telles que la valeur d’une
action d’une entreprise dans une bourse [14].
2.2.1.5. CLUSTERING
Le clustering regroupe un ensemble de techniques qui visent à regrouper les
enregistrements d’une base de données en des groupes selon leur rapprochement les uns
des autres en ne se basant sur aucune information antérieure, c’est un apprentissage non
supervisé. Un système d’analyse en clusters prend en entrée un ensemble de données et
une mesure de similarité entre ces données, et produit en sortie un ensemble de partitions
décrivant la structure générale de l’ensemble de données [14].
2.2.1.6. MACHINES A VECTEUR DE SUPPORT (SVM)
Le SVM est un modèle discriminant qui tente de minimiser les erreurs d’apprentissage
tout en maximisant la marge séparant les données des classes. La maximisation de la marge
est une méthode de régularisation qui réduit la complexité du classificateur. Elle sert à
pénaliser les paramètres du modèle de la même façon que la méthode du « weight decay1 »
qui altère les poids de grande amplitude dans un
PMC2. Le noyau d’un SVM est une fonction symétrique défini-positive qui permet de
projeter les données dans un espace transformé de grande dimension dans lequel s’opère
plus facilement la séparation des classes [15].
Chapitre 1 : Revue de littérature
14
2.3. DOMAINE D’APPLICATION
La reconnaissance de formes est utilisée dans plusieurs domaines d’activités. Parmi ces
domaines on peut citer :
2.3.1. LA VISION ARTIFICIELLE
La vision par ordinateur est l'un des principaux champs d'application de la RdF.
Actuellement, elle a trouvé une place dominante dans un domaine tel que l'imagerie
biomédicale (Figure 1.4). Par exemple, dans la détection des cellules cancéreuses du
cerveau, les images sont acquises en Imagerie par Résonance Magnétique (IRM). Au cours de
l'étape de segmentation, on va rechercher dans les images différentes régions du cerveau :
matière blanche, matière grise, liquide cérébro-spinal, etc comme le montre la figure 1.
Ensuite, on cherche à détecter d'éventuelles tumeurs bénignes ou malignes à partir de
caractéristiques extraites de régions de l'image. Bien évidemment, il ne s'agit là que de
fournir une aide au diagnostic validée ultérieurement par le praticien [16].
FIGURE 1.4 imagerie médicale [16].
En industrie, les industriels cherchent à contrôler la qualité de fabrication de leurs
produits. La vision artificielle peut être utilisée dans un système de détection de défauts. On
peut imaginer diverses pièces industrielles passant sur un tapis roulant et filmées en continu
par une caméra. Avec un traitement en temps réel de cette image, on peut, par exemple,
vérifier si l'angle formé par deux pièces assemblées est conforme au cahier des charges (Voir
Figure 1.5) [16].
Chapitre 1 : Revue de littérature
15
FIGURE 1.5 contrôle de qualité [16].
En imagerie aérienne, l’interprétation des images aériennes ou de satellites (Voir Figure 1.6,
1.7) conduit à la surveillance ou aux prévisions agricoles.
FIGURE 1.6 imagerie satellitaire [16].
FIGURE 1.7 imagerie satellitaire [16].
Chapitre 1 : Revue de littérature
16
On peut citer aussi d'autres domaines récents et très actifs comme la reconnaissance
des gestes, de l'attitude et même des émotions à partir de séquences vidéos ou audio, la
reconnaissance des opinions à partir de tweets [16].
2.3.2. LA RECONNAISSANCE DES CARACTERES ET DES MOTS
La reconnaissance de l’écriture est une application classique de la RdF. Elle est connue
sous le nom d’OCR (Optical Character Recognition) s’il est de l’écriture imprimée. Alors que
s’il s’agit de l’écriture manuscrite, la dénomination est ICR (IntelligentCharacter
Recognition).
Elle vise à transformer un texte manuscrit, sur tout type de support, vers un texte
numérique (éditable par un traitement de texte). Le document, sous forme papier par
exemple, est préalablement numérisé par un scanner pour en obtenir une représentation
sous la forme d'une image. On essaie ensuite d'extraire chacune des lettres présentes sur
l'image et d'en déterminer un équivalent informatique (Voir Figure 1.8,1.9) [16].
FIGURE 1.8 traitement d’un document papier par numérisation et reconnaissance [16].
Chapitre 1 : Revue de littérature
17
FIGURE 1.9 acquisition d’un signal au moyen d’un stylet et d’une tablette tactile [16].
L’OCR (Voir Figure 1.10) connaît plusieurs applications pratiques dans différents
domaines d’activité parmi lesquels on peut citer :
Les banques et les assurances pour l’authentification de chèques bancaires
(correspondance entre montants et libellé d’une part, et correspondance
entre l’identité du signataire et sa signature, d’autre part), et la vérification de
clauses de contrats pour les assurances.
La poste pour la lecture des adresses et le tri automatique du courrier.
Les télécommunications pour l’échange de fichiers informatiques à distance.
La police et la sécurité pour la reconnaissance des plaques minéralogiques
pour le contrôle routier, l’authentification (et l’identification de manuscrits et
l’identification du scripteur (l'identification permet donc de connaître
l'identité d'une entité alors que l'authentification permet de vérifier cette
identité).
Les affaires et l’industrie pour la gestion des stocks et la reconnaissance de
documents techniques.
La bureautique pour l’indexation et l’archivage automatique de documents, et
pour la publication électronique.
L’administration pour la reconnaissance de plans cartographiques et la lecture
automatique de documents administratifs [16].
Chapitre 1 : Revue de littérature
18
FIGURE 1.10 documents imprimes et manuscrits [16].
2.3.3. LA RECONNAISSANCE VOCALE
Elle est d’une utilisation relativement récente des techniques de la RdF donnant lieu à
de nombreuses recherches. D'une manière générale, l'objectif est de faciliter la
communication humaine et Homme/Machine en reconnaissant l'information parlée. La
traduction automatique de la parole ou la dictée vocale en sont des applications potentielles
au même titre de la commande vocale. Dans ce dernier cas, l'instruction parlée est envoyée
deux fois plus rapidement que si elle était dactylographiée. La commande vocale peut
également permettre à des personnes handicapées de contrôler des machines en leur
parlant (Voir Figure 1.11) [16].
Les systèmes de sécurité utilisent la voix pour identifier ou authentifier des locuteurs.
D'autres paramètres biométriques comme les empreintes digitales, la signature, les images
(2D et 3D) de la main et du visage, sont également utilisés (Voir Figure 1.12) [16].
.
Chapitre 1 : Revue de littérature
19
FIG
UR
E 1.11 reconnaissance vocale [16].
FIGURE 1.12 identification biométrique [16].
Chapitre 1 : Revue de littérature
20
3. LA RECONNAISSANCE DES PLAQUES D’IMMATRICULATION
Une plaque d'immatriculation est une plaque portant une combinaison unique de
chiffres ou de lettres (pour une zone géographique donnée), destinée à identifier facilement
un véhicule terrestre (automobile, moto, véhicule agricole, etc.). Dans le cas des véhicules
circulant sur le réseau routier, objet de cet article, ceci permet de retrouver les auteurs
d'infractions au code de la route et les véhicules déclarés volés [17].
3.1. LES DIFFERENTES FORMES D’IMMATRICULATION DANS LE MONDE
Selon les systèmes, la plaque peut comporter des chiffres, des lettres, des chiffres et des
lettres dans un ordre spécifique ou dans un ordre quelconque, voici quelques modèles :
Le modelé AAA 111 : Il existe dans les pays suivants : Allemagne, Chypre, Finlande,
Suède, Hongrie, Lituanie, Malte, Moldavie et Belgique
FIGURE 1.13 Schéma de plaque d’immatriculation de type AAA 111 [13].
Le modèle AA 111 AA : existe dans la Slovaquie, Autriche, France, Italie, Serbie et
Géorgie
FIGURE 1.14 schéma de plaque d’immatriculation de type AA 111 AA [13] .
Le modèle AA/11-AA-11 : existe dans le Pays bas et le Portugal
Chapitre 1 : Revue de littérature
21
FIGURE 1.15 schéma de plaque d’immatriculation de type AA/11-AA-11 [13] .
LE MODELE AAA 1111 ET 1111 AAA : EXISTE DANS LA GRECE ET L'ESPAGNE
FIGURE 1.16 schéma de plaque d’immatriculation de type AAA 1111 et 1111 AAA [13] .
LE MODELE 11111 111 11 : EXISTE DANS LA REPUBLIQUE D’ALGERIE
FIGURE
1.17 Schéma de plaque d’immatriculation : 11111 111 11 [13] .
4. TRAVAUX :
Dans cette section, nous parlerons de quelques travaux qui traitaient l'idée de notre
travail. Cette dernière est divisée en deux parties, la première pour les travaux au niveau
mondiales et la seconde pour les travaux au niveau locales qui ont abordé l'idée en Algérie.
4.1. TRAVAUX AU NIVEAU MONDIALES :
Dans cette partie Nous avons choisi de parler de deux récents travaux, le travail de
(Nauris , Jaundalders, Kadikis, & Nesenbergsa, 2018) nommée « Système de vision par
ordinateur basé sur FCN et LSTM pour la reconnaissance du type de véhicule, du numéro de
plaque d'immatriculation » et (Raj, et al., 2019) nommée « reconnaissance automatique de
plaque d'immatriculation basée sur un réseau neuronal à convolution » .
Chapitre 1 : Revue de littérature
22
4.1.1. SYSTEME DE VISION PAR ORDINATEUR BASE SUR FCN ET LSTM POUR LA
RECONNAISSANCE DU TYPE DE VEHICULE, DU NUMERO DE PLAQUE
D'IMMATRICULATION (NAURIS , JAUNDALDERS, KADIKIS, & NESENBERGSA, 2018):
Ce travail propose un système de reconnaissance automatique des plaques
d'immatriculation (ANPR) (Voir Figure 1.18), qui non seulement reconnaît le numéro et l'état
d'émission, mais également le type et l'emplacement du véhicule dans l'image d'entrée, ce
système est basé sur une combinaison des approches d'apprentissage profond le réseau
neuronal convolutif CNN « Convolutional neural network », réseau entièrement
convolutionnel FCN « Fully Convolutional Network » et LSTM « Long Short-Term Memory »,
ce système compose de trois parties principales:
La segmentation de l'image d'entrée par le réseau entièrement
convolutionnel FCN pour la localisation de plaque d'immatriculation et
détermination du type de véhicule.
LSTM pour reconnaissance des caractères de la plaque localisée avec
l’utilisation d’une couche maxout, cette dernière est simplement une couche
où la fonction d'activation est le maximum des entrées.
Un réseau neuronal convolutif CNN pour détermination de l'état qui a
délivré la plaque d'immatriculation.
FIGURE 1.18 un système de reconnaissance automatique des
plaques d'immatriculation (ANPR)
Chapitre 1 : Revue de littérature
23
Les auteures ont fait l’opération d'apprentissage de ce système avec une base de données
personnalisé étiqueté manuellement.
Le système (ANPR) est capable de localiser et de classer plusieurs types de véhicules, y
compris les motocyclettes et les véhicules d'urgence ainsi que leurs plaques d'immatriculation.
Le tableau suivant montre les résultats obtenus par le système (ANPR) ( Voir Tableau
1.1) :
Tableau 1.1 Montre les résultats obtenus par le système (ANPR).
4.1.2. RECONNAISSANCE AUTOMATIQUE DE PLAQUE D'IMMATRICULATION BASEE SUR UN
RESEAU NEURONAL A CONVOLUTION (RAJ, ET AL., 2019) :
Ce travail propose un système de reconnaissance automatique des plaques
d'immatriculation (RAPI) pour la plaque d'immatriculation indienne (Voir figure1.19) . RAPI
utilisée d'abord une technique adaptative de fenêtre coulissante « sliding window » à l'aide
d'un réseau neuronal convolution CNN pour localise la plaque d'immatriculation, ensuite, les
caractères sont segmentés à partir de la plaque d'immatriculation en utilisant la théorie de la
morphologie mathématique, puis, les caractères Segmentées sont convertis en texte par
l'utilisation de technique d'apprentissage par transfert avec l’architecture Mobilenet qui est
composée de 28 couches dont 13 Convolution en profondeur et 13 Convolution en point.
La précision obtenue de la localisation 99,5%.
La précision de la reconnaissance des nombres entiers 96,7%
La précision de la reconnaissance du niveau des caractères 98,8%.
La détermination de l'état émetteur 92,8%
Chapitre 1 : Revue de littérature
24
FIGURE 1.19 un système de reconnaissance automatique des plaques
d'immatriculation (RAPI).
La performance du RAPI a été satisfaisante en termes de variation condition
d'éclairage, style de texte, étrange et asymétrie de la plaque d'immatriculation, le tableau
suivant montre les résultats obtenus ( Voir Tableau1.2 ) :
La localisation 85%
La reconnaissance 93%.
Tableau 1.2 les résultats obtenus par le système (RAPI).
Chapitre 1 : Revue de littérature
25
4.2. TRAVAUX AU NIVEAU LOCAL :
Dans cette section nous allons aborder deux travaux algériens : (TOUAMRIA, 2019) et
(KOHILI , 2015) qui traitent la reconnaissance des plaques d’immatriculation différemment.
4.2.1. RECONNAISSANCE AUTOMATIQUE DES PLAQUES D’IMMATRICULATION (KOHILI , 2015)
Ce travail présente un système de reconnaissance des plaques d’immatriculation (RPI)
Algériennes. Ce travail passe par un ensemble d’étapes, il commence d’abord par capturer
l’image de véhicule, et il la convertissant en une image au niveau du gris, puis il effectué une
méthode de détection de contours, les numéros de la plaque d’immatriculation sont ensuite
extraits à l'aide du processus de segmentation afin d’être analysé par un système de
reconnaissance de caractères li base essentiellement sur une méthode de corrélation qui
permet la comparaison entre les données obtenues et les données stockées dans leur base
de données afin d’arriver à un meilleur résultat le plus rapidement possible.
4.2.2. SYSTEME DE RECONNAISSANCE DES PLAQUES D'IMMATRICULATION ALGERIENNE
(TOUAMRIA, 2019)
Ce travail présente un système de reconnaissance des plaques d’immatriculation RPI
Algériennes. Ce travail passe par quatre étapes. La première consiste à extraire à partir
d’une image acquise au niveau de gris la plaque de la voiture il se base essentiellement sur
une méthode de détection de contours. Cette plaque subit par la suite une segmentation en
caractères afin d’être analyser par un système de Reconnaissance Optique de Caractère
(ROC) il utilise les Machines à Vecteurs de Support (SVM) comme une méthode de
classification. Le système passe par un ensemble de traitement et de prétraitements comme
les morphologies mathématiques afin d’arriver à un meilleur résultat.
4.2.3. EVALUATION ET CRITIQUE
Le premier travail mentionné et basé sur la méthode de corrélation, cette méthode
statistique a prouvé son efficacité dans l’opération de la détermination des indépendances
entre plusieurs variables aléatoires et précisément entre les variables quantitatives par
contre aux variables qualitatives, et malgré ça les résultats obtenus sont mitigés et variaient
entre 70% et 100%.
Pour le deuxième travail qui basé sur l’utilisation des Machines à Vecteurs de Support
(SVM), cette dernière capable d’effectuée la classification linéaire et non linéaire et même la
régression mais sont particulièrement bien adapté à la classification d’ensemble de données
Chapitre 1 : Revue de littérature
26
complexe mais de petite ou moyenne taille, les résultats de ce travail et résumé comme se
suit :
Les classes "4","7","8","9" et "10" atteignent le taux de reconnaissance100%.
Les classes"3","5", "6", "2" et "1" sont assez satisfaisable avec les taux de
reconnaissance 97.50%, 95%, 85.19%,40.48% et 73.08% respectivement.
Chapitre 1 : Revue de littérature
27
5. CONCLUSION
Dans ce chapitre nous nous sommes basés sur la reconnaissance des formes en précisant
l’intérêt de ce vaste domaine dans le développement de la vision artificielle. Un état de l’art
de différentes méthodes d’identification des plaques de matricules a été présenté suivi
d’une critique constructive afin de remédier aux insuffisances inscrites en proposant une
nouvelle approche que nous avons développée qui sera exposée en détail dans le chapitre
suivant.
Chapitre 01 Etat de l’art
²
CHAPITRE 2 METHODE PROPOSEE
Chapitre 02
Methode Proposée
Chapitre 2 Méthode proposée
23
1. INTRODUCTION
Dans ce chapitre nous allons présenter notre approche proposée qui consiste à faire
une reconnaissance automatique a des plaques de matricule algérien basé sur l’utilisation de
réseaux de neurone « MLP », nous allons présenter également l’implémentation de cette
approche a fin d’utiliser un système complet pour les raisons de sécurité, avec quelques
captures qui montre cette implémentation.
2. METHODE PROPOSEE
La méthode que nous proposons se base sur les réseaux de neurones, son schéma
général se définit par les opérations suivantes qui se succèdent depuis la saisie des données
à traiter, suivie d’un prétraitement qui engendre une mise à niveau afin que les données
soient identifiables et sans ambiguïtés tel que le filtrage, le seuillage et la détection des
contours. Après cela on enchaine avec l’opération d’extraction des caractéristiques, dans
notre cas nous avons utilisé le détecteur de Harris et on finalise par une opération de
segmentation afin d’obtenir des données claires, distinctes, représentatives et prêtes pour
classification. Cette dernière représente le noyau de la méthode que nous proposons, elle se
base sur un modèle des réseaux de neurones dite : perceptron multicouche « MLP » connu
par sa capacité de classification et la possibilité de l’exécuter sous forme parallèle. Nous
terminons notre projet par une étude de cas qui se résume dans l’identification des
véhicules appliquée dans la sécurité des villes pour éviter les vols des voitures (Voir Figure
2.1).
Chapitre 2 Méthode proposée
24
FIGURE 2.1 schéma de notre proche
2.1. CREATION DE LA BASE DE DONNEES :
Afin de tester l’approche que nous avons développée et vu que le matricule algérien
possède une organisation des caractères et une interprétation spécifique, nous avons créé
notre propre base de données afin qu’elle soit prête pour l’évaluation de ce projet ou bien
pour d’autre projets applicable sur ce type de données. Nous avons formé cette base par les
données réalisées pour des projets similaires (sur internet), nous effectuer des prises de
photos et vidéos réelles par nos propres moyens.
Chaque plaque est constituée de plusieurs chiffres regroupés en trois suites. Ces
chiffres issus des plaques d’immatriculations prises en images ont été réduits aux
dimensions de 24 /14 pixels. Cette base comporte en fait 200 images redimensionnées en
24/14 pixels pour chaque caractère numérique de la plaque d’immatriculation; elles sont
Chapitre 2 Méthode proposée
25
stockées au niveau cd plusieurs dossiers nommés de 1 à 200. Les images sont individualisées
en niveau de gris et en format bitmap (Figures 2.2 et 2.3).
FIGURE 2.2 Exemple 1 sur la base de donnée
FIGURE 2.3 EXEMPLE 2 sur la base de donnée
Chapitre 2 Méthode proposée
26
2.2. PRETRAITEMENT ET EXTRACTION DE CARACTERISTIQUES
2.2.1 PRETRAITEMENT
L’étape de prétraitement dépend étroitement de la qualité des images acquises, dans
notre cas nous avons appliqués les étapes suivantes :
Conversion des images en niveau de gris
Amélioration du contraste de l’image
Détection des contours des images par l’application de la méthode « SOBEL »
2.2.2. EXTRACTION DE CARACTERISTIQUES
Dans cette étape nous avons utilisé la méthode de détecteur de Harris. Les coins sont
représentés par une modification partielle du gradient d’une image et c’est ce que cet
algorithme recherche. Cela se fait en considérant une fenêtre locale dans une image de sorte
qu’un changement moyen de l’intensité de l’image détermine un résultat en déplaçant la
fenêtre d’une petite quantité dans différentes directions. Un coin se trouve lorsque tous les
postes ont un grand changement qui peut être détecté si le changement minimum produit
par l’un des postes est grand.
𝐸𝑥,𝑦 = 𝑊𝑢,𝑣 𝐼𝑥+𝑢,𝑦+𝑣 − 𝐼𝑢,𝑣 2
𝑢,𝑣
= 𝑊𝑢,𝑣 𝑥𝑋 + 𝑦𝑌 + 𝑂(𝑥2,𝑦2) 2
𝑢,𝑣
𝑎𝑝𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑡𝑖𝑜𝑛
𝑋 = 𝐼 ⊕ −1,0,1 =∂I
∂x 𝐺𝑟𝑎𝑑𝑖𝑒𝑛𝑡 𝑑𝑒 𝑥
𝑌 = 𝐼 ⊕ (−1,0,1)𝑡 =∂I
∂y 𝐺𝑟𝑎𝑑𝑖𝑒𝑛𝑡 𝑑𝑒 𝑦
𝐸(𝑥,𝑦) = 𝐴𝑥2 + 2𝐶𝑥𝑦 + 𝐵𝑦2 𝐸,𝑝𝑒𝑡𝑖𝑡 𝑑é𝑐𝑎𝑙𝑔𝑒
𝑂ù
𝐴 = 𝑋2 ⊕ 𝑤
𝐵 = 𝑌2 ⊕ 𝑤
𝐶 = (𝑋𝑌) ⊕ 𝑤
𝑤 𝑢, 𝑣 = exp −𝑢2 + 𝑣2
2𝜎2 𝑢𝑡𝑖𝑙𝑖𝑠é 𝑢𝑛𝑒 𝑓𝑒𝑛é𝑡𝑟𝑒 𝑐𝑖𝑟𝑐𝑢𝑙𝑎𝑖𝑟𝑒 𝑙𝑖𝑠𝑠𝑒, 𝐸𝑋𝑃 𝐺𝑎𝑢𝑠𝑠𝑖𝑎𝑛
𝑅𝑒𝑓𝑜𝑟𝑚𝑢𝑙𝑎𝑡𝑖𝑜𝑛
Chapitre 2 Méthode proposée
27
𝐸 𝑥, 𝑦 = 𝑥, 𝑢 𝑀(𝑥, 𝑦)𝑇
𝑀 = 𝐴 𝐶𝐶 𝐵
𝑙𝑒𝑠 𝑣𝑎𝑙𝑒𝑢𝑟𝑠 𝑑𝑒 𝑀 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑛𝑡 𝑑′𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟é𝑙𝑎𝑡𝑖𝑜𝑛 𝑙𝑜𝑐𝑎𝑙𝑒
𝑇𝑟 𝑀 = 𝛼 + 𝛽 = 𝐴 + 𝐵 𝑇𝑟𝑎𝑐𝑒
𝐷𝑒𝑡 𝑀 = 𝛼𝛽 = 𝐴𝐵 − 𝐶² 𝐷𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑛𝑡
𝑅 = 𝐷𝑒𝑡 𝑀 − 𝑘𝑇𝑟(𝑀²) 𝑟𝑒𝑠𝑝𝑜𝑛𝑠𝑒
𝑅 𝑒𝑠𝑡 𝑝𝑜𝑠𝑖𝑡𝑖𝑓 𝑝𝑜𝑢𝑟 𝑙𝑒𝑠 𝑐𝑜𝑖𝑛𝑠 𝑛é𝑔𝑎𝑡𝑖𝑓 𝑝𝑜𝑢𝑟 𝑙𝑒𝑠 𝑏𝑜𝑟𝑑𝑠 𝑒𝑡 𝑝𝑒𝑡𝑖𝑡 𝑝𝑜𝑢𝑟 𝑙𝑒𝑠 𝑟é𝑔𝑖𝑜𝑛 𝑝𝑙𝑎𝑡
5.1. 2.3. CLASSIFICATION BASEE SUR LES RESEAUX DE NEURONES
Les réseaux de neurones sont des modèles mathématiques et informatiques, débutés
des années 1940 par McCulloch et Pitts, ils décrivent les propriétés du système nerveux à
partir de neurones idéalisés. Ils se résument en un assemblage d’unités de calculs dites
neurones formels dont l’inspiration originelle était un modèle du neurone biologique
humain. Cet héritage de la neurobiologie forme une composante importante de la matière
dont l’intérêt d’améliorer le taux de mise en 3correspondance ce système formel et le
système nerveux humain a animé une part importante des recherches dans le domaine.
Historiquement les premiers modèles neuro-mimétiques ont été développés dans la
mouvance cybernéticienne. Ils devaient permettre de valider et d'utiliser en vision artificielle
les premiers modèles neurobiologiques de la conscience. On note que parmi les propriétés
intéressantes des réseaux de neurones est qu'ils savent prévoir avec précision des données
qui ne faisaient pas partie des données d'apprentissage, un processus connu sous le nom de
généralisation. Compte tenu de cette caractéristique, les réseaux de neurones sont
particulièrement bien adaptés à l'application de problématiques concrètes dans les
domaines de la recherche scientifique, commerciale et industrielle. Pour la vision artificielle,
largement utilisés, les réseaux de neurones ont repris leurs brillances principalement depuis
2010, avec l’apparition du « deep learning » qui représente une généralisation du
perceptron multicouches. Ce type de réseau que nous avons exploité pour durant la phase
de classification de l’approche que nous avons proposée.
MLP : Définition
Le perceptron multicouche (Multi Layer Perceptron : MLP) généralise le perceptron
afin d’apprendre des modèles plus complexes, non linéaires. C’est le plus simple et le plus
connu des réseaux de neurones.
Chapitre 2 Méthode proposée
28
MLP : Topologie
Un réseau MLP est caractérisé par (voir figure 2.5) :
Une couche d’entrée
Une ou plusieurs couches cachées (avec un nombre arbitraire de neurones)
Une couche de sortie (un neurone pour la discrimination, un neurone par classe dans
le multi classe)
Il est acyclique
Il est complètement connecté : chaque neurone est relié à tous les neurones de la
couche précédente.
Une fonction d’activation des neurones utilisée en dépond du système à concevoir.
FIGURE 2.5 schéma de perceptron multicouche
Le MLP que nous avons utilisé est conçu selon la topologie suivante (voir figure 2.6) :
Trois couches distinctes : couche d’entrée, couche cachée, couche de sortie.
La couche d’entrée se compose de 336 neurones d’entrée en adéquation avec la
dimension des images de 24*14 pixels.
La couche de sortie est constituée de 10 neurones de sortie étant donné qu’il n’y a
que 10 chiffres à former de 0 à 9. Ce qui de son côté influe sur le nombre de
neurones dans la couche cachée. Ainsi donc pour 336 neurones dans la couche
Chapitre 2 Méthode proposée
29
d’entrée et 10 neurones dans la couche de sortie, le nombre de 50 neurones pour la
couche cachée est largement suffisant. La fonction utilisée est la fonction logistique
sigmoïde.
L’apprentissage
La généralisation de la règle delta aux réseaux à couches cachées s’appelle rétro-
propagation du gradient de l’erreur. Elle consiste à propager l’erreur à travers le réseau dans
le sens inverse de la propagation des activations. Cette technique permet de calculer la
modification des poids des connexions entre les couches cachées. Elle tente de réduire la
différence entre les sorties du réseau et les sorties désirées. L’erreur E du réseau à minimiser
est calculée par l’équation suivante :
𝐸𝑤 =1
2 (𝑑𝑖 − 𝑔𝑖 𝑖𝑛 )2
𝑠𝑖∈𝑠𝑜𝑟𝑡𝑖𝑒𝑠𝑒𝑖∈𝑋
Avec
di : sortie désirée
ai ou gi(in) : sortie obtenue
X : ensemble des exemples ei d’entrainement
S : ensemble des sorties si du réseau
Algorithme de rétro-propagation du gradient
Principe : calculer l’erreur en sortie pour corriger le poids de la couche précédente,
puis propager jusqu’à la couche d’entrée. La correction utilise la dérivée de l’erreur par
rapport à chacun des poids de la couche précédente.
Le MLP que nous avons utilisé est conçu selon la topologie suivante : trois couches
distinctes qui sont : couche d’entrée, couche cachée, couche de sortie.
La couche d’entrée se compose de 336 neurones d’entrée en adéquation avec la
dimension des images de 24*14 pixels.
Chapitre 2 Méthode proposée
30
La couche de sortie est constituée de 10 neurones de sortie étant donné qu’il n’y a que
10 nombres à former de (0………à ……9). Ce qui de son côté influe sur le nombre de neurones
dans la couche cachée. Ainsi donc pour 336 neurones dans la couche d’entrée et 10
neurones dans la couche de sortie, le nombre de 50 neurones pour la couche cachée est
largement suffisant. La fonction utilisée est la fonction logistique (sigmoïde) Le taux
d'apprentissage va être de 0,7 et la période de formation sera de 1000 cycles.
FIGURE 2.6 schéma de perceptron
multicouche
Initialiser les poids à de petites valeurs aléatoires entre -0.05 et 0.05 tant que la
condition d’arrête n’est pas atteinte pour chaque exemple d’entrainement calculer les
sorties du réseau aj
𝑎𝑖 = 𝑔 𝑖𝑛𝑖 = 𝑔( 𝑤𝑗𝑖𝑎𝑗)𝑛
𝑗=1
Pour toutes les unités de sortie aj, calculer l’erreur ∆𝑖
∆𝑗 ← 𝑔′ 𝑖𝑛𝑖 × (𝑑𝑖 − 𝑎𝑖)
Pour toutes les unités cachées j, calculer l’erreur ∆𝑖
Chapitre 2 Méthode proposée
31
∆𝑖 ← 𝑔′ 𝑖𝑛𝑖 𝑤𝑗𝑖∆𝑖
Mettre à jour tous les poids Wji
𝑤𝑗𝑖 ← 𝑤𝑗𝑖 + 𝑎 × 𝑎𝑗 × ∆𝑖
Fin pour
Fin pour
Fin tant que
La convergence de l’algorithme dépend de l’une des conditions d’arrêt suivantes :
Après un certain nombre fixe d’itérations.
Lorsque les poids se stabilisent
Lorsque l’erreur dans les sorties des exemples d’entraînement descend en
dessous d’une certaine borne.
Lorsque l’erreur avec les exemples de validation descend en dessous d’une
certaine borne.
3. IMPLEMENTATION
3.1. ENVIRONNEMENT DE TRAVAIL
a. Environnement matériel
Pour développer cette application nous avons utilisé une machine configurée
Comme suit :
Machine HP avec les configurations suivant :
Mémoire Vive : 4 Go.
Disque Dur : 500 Go.
Processeur : Intel (R) Core (TM) i3-3110M CPU 2.40 GHz.
Type de système : Windows
b. Environnement logiciel
Lors du développement de cette application nous avons utilisé les outils logiciels
suivants :
Matlab.
Photoshop.
Chapitre 2 Méthode proposée
32
Matlab : signifie laboratoire de matrice, est un langage commercial de haute
performance pour le calcul numérique et la visualisation. MATLAB intègre le calcul,
visualisation et programmation dans un environnement simple à utiliser où les problèmes et
les solutions sont communiquées en notation mathématique familière. « MATLAB est un
système interactif où les éléments de données de base sont un tableau qui ne nécessite pas
de dimensionnement, vous permettant de résoudre des problèmes informatiques
techniques, en particulier ceux avec une matrice ou des formulations vectorielles une
fraction du temps qu'il faudrait pour écrire un programme dans un langage scalaire non
interactif comme C ou Fortran » [18] (voir figure 2.7).
FIGURE 2.7 logo Matlab
Les utilisations typiques de MATLAB comprennent :
Développement d'algorithmes
Développement d'applications, création de GUI
Analyse et visualisation des données
Mathématiques et calcul
Simulation, modélisation et visualisation
Graphiques scientifiques et techniques
Photoshop : est un logiciel de retouche, de traitement et de dessin assisté par
ordinateur lancé en 1990 sur MacOS puis en 1992 sur Windows.
Chapitre 2 Méthode proposée
33
Édité par Adobe il est principalement utilisé pour le traitement des photographies
numériques, mais sert également à la création ex nihilo d’images.
Il travaille essentiellement sur images matricielles car les images sont constituées
d’une grille de points appelés pixels. L’intérêt de ces images est de reproduire des gradations
subtiles de couleurs.
Photoshop possède son propre format de fichier (extension psd). Celui-ci permet de
conserver distincts les différents calques formant l'image afin de les manipuler séparément.
Le programme accepte également d’importer et d’exporter des fichiers d’image dans les
formats les plus
courants
(extensions : gif, jpg, tif, png, etc.) (voir figure 2.8).
Chapitre 2 Méthode proposée
34
Figure 2.8 logo Photoshop
Il offre :
Un système de tri et d’organisation des fichiers permettant l’application d’une
opération sur plusieurs fichiers simultanément ;
Des outils de dessin en mode bitmap : pinceau, crayon, formes géométriques… ;
Un outil de dessin vectoriel de formes géométriques libres (courbes de Bézier) : l'outil
Plume ;
Des outils de sélection de zones de travail (ou zones d’intérêt) : lasso, rectangle de
sélection, sélection par plage de couleur… ;
Des outils de copie, collage et duplication de zones de travail ;
Des outils de manipulation de calques : par l’empilement de zones graphiques et
l’utilisation de transparence et autres effets, on peut fabriquer
des photomontages complexes ;
des outils de manipulation de la palette de couleurs : changement de palette,
réglages colorimétriques, de luminosité, de contraste, de saturation… ;
Des filtres pour appliquer divers effets à des zones d’intérêt : textures, ombres,
renforcement des contours, estampage, flou, etc.
3.2. DESCRIPTION DE L’APPLICATION
3.2.1. INTERFACE UTILISATEUR
Chapitre 2 Méthode proposée
35
Figure 2.9 interface d’accueil
Chapitre 2 Méthode proposée
36
Figure 2.10 Menu d’application
L'interface RAPI a été brièvement discutée dans le chapitre de conception sous le
sous-titre L'interface a été construite dans le générateur GUI MATLAB «GUIDE» en utilisant
la fonction glisser-déposer pour ajouter des zones d'édition, des images et des listes à
l'interface.
Chapitre 2 Méthode proposée
37
Figure 2.11 le guide du l’interface
3.2.2. IMPORTATION D'IMAGE
Le système RAPI actuel de ce projet peut fonctionner avec des images fixes et en
temps réel.
Il faut chargée la photo (voir figure 2.12).
Figure 2.12 chargée la photo
Ou lancer l’acquisition (voir figure 2.13).
Figure 2.13 lancer acquisition
Chapitre 2 Méthode proposée
38
3.2.3. LOCALISATION DE LA PLAQUE D'IMMATRICULATION
Apres l’importation d’image ou après l’acquisition il faut localiser la plaque avec le
détecteur Harris (voir figure 2.14).
Figure 2.14 Implémentation de Harris
3.2.4. SEGMENTATION DES CARACTERES
Après la localisation de la plaque d’immatriculation il faut segmente les chiffres de la
plaque (voir figure 2.15) pour l’envoyé au réseau de neurone pour le classé.
Chapitre 2 Méthode proposée
39
Figure 2.15 la Segmentation
3.2.5. STOCKAGE DES RESULTATS
Une fois que le résultat des chiffres de la plaque d'immatriculation a été extrait, ils
sont stocké dans un journal de fichier texte avec la date et l'heure de sa capture. Les chiffres
d'abord doivent être placés dans le bon ordre de NNNN-NNN-NN (voir figure 2.16).
Figure 2.16 le résultat
4. TEST ET RESULTATS
Cette section contiendra les cas de test qui ont été utilisés pour tester le système RAPI
dans ce projet. Il y aura cinq cas de test principaux qui permettront de tester l'importation
Chapitre 2 Méthode proposée
40
de l’image, l’acquisition direct, localiser la plaque d'immatriculation dans différentes
circonstances, la segmentation des caractères, la reconnaissance des caractères et les
fonctionnalités de stockage et accéder aux fichiers de plaque d'immatriculation extraits.
4.1. IMPORTATION DE L’IMAGE
Cas Instruction Résultat attendu Réussite /
échec
1
Insérez le nom de fichier correct d'un Image avec
extension.
L’image est importée et la localisation de la plaque d’immatriculation
commence.
Réussite
2
Insérer un nom de fichier incorrect d'un image et sans
extension.
Une boîte de message contextuelle indiquant l'utilisateur doit saisir le nom
de fichier correct
Réussite
3
Insérer un fichier image
Une boîte de message contextuelle indiquant l'utilisateur doit saisir le nom
de fichier correct
Réussite
Tableau 2.1 importation de l’image
4.2. LOCALISATION DE PLAQUE D’IMMATRICULATION
Le test suivant vérifie si RAPI est capable de localiser les plaques d'immatriculation à partir
de différents angles ou environnements d'éclairage
Cas Instruction Résultat attendu Réussite /
échec
1
Importer l'image avec un
véhicule et plaque d'immatriculation visible
Plaque d'immatriculation située
Réussite
2
Importer une image sans plaque
d’immatriculation
Arrêtez et imprimez une erreur
dans le fichier journal
Réussite
3
Importer une image sombre à faible visibilité
Localiser la plaque d'immatriculation
échec
4 Importer la plaque a 45 degré
Localiser la plaque d'immatriculation
échec
Importer une image avec deux
Chapitre 2 Méthode proposée
41
5 plaques Localisez la plaque d'immatriculation avec le nombre
de coins le plus élevé
Réussite
Tableau 2.2 localisation de plaque d’immatriculation
4.3. CAS DE TEST DE SEGMENTATION
Cas Instruction Résultat attendu Réussite /
échec
1
Segmente les caractères en clair image de la plaque d'immatriculation
Caractères segmentés
Réussite
2
Segmentez les caractères de l'obscurité image de la plaque d'immatriculation
Caractères segmentés
échec
3
Segmente les caractères de bruyant
image de la plaque d'immatriculation
Caractères segmentés
Réussite
4
Si aucun caractère n'est segmenté
Informer l'utilisateur avec
un message d'erreur
Réussite
Tableau 2.3 test de segmentation
4.4. TEST DE RECONNAISSANCE DES CARACTERES
Une fois les objets de la plaque d'immatriculation segmentés, ils sont vérifiés pour voir
s'ils sont caractères utilisant un réseau neuronal alimenté. Ce test a été effectué après
l'entraînement du réseau de neurone. Le diagramme de la figure décrit le taux d'erreur
quadratique moyen de chaque caractère à chaque époque, un cycle d'entraînement
complet. Ce réseau de neurones a eu 200 cycles d'entraînement et le taux d'erreur diminue
très rapidement à chaque cycle après le 80 cycle d'entraînement.
Chapitre 2 Méthode proposée
42
Figure 2.16 Erreur quadratique moyen RMS
Le réseau neuronal a ensuite été testé contre 200 images de chaque chiffre et le
résultat a été Taux de réussite de 95% pour la reconnaissance des chiffres. Ce taux d'erreur
est différent pour chaque ensemble d'entraînement d'images.
4.5. FONCTIONNALITES DE L'INTERFACE ALPR
Cas Instruction Résultat attendu Réussite / échec
1
Recherche dans le fichier journal de licence plaques à l'aide du numéro de plaque
d'immatriculation
Afficher les heures et les dates le numéro de plaque d'immatriculation a
été capturé s'il est dans le journal.
Réussite
Insertion du numéro de plaque d'immatriculation dans journal
Incrémentez le journal de la liste noire avec le nouveau véhicule sur liste
Chapitre 2 Méthode proposée
43
2 de liste noire
noire nombre
Réussite
3
Alerter l'utilisateur si une plaque d'immatriculation
numéro qui a été mis sur liste noire est capturé
Avertir l'utilisateur avec une alerte de liste noire un message et stocker la licence numéro de plaque, heure et
date l'utilisateur a été alerté
Réussite
Tableau 2.4 fonctionnalité de l’application
5. CONCLUSION
Dans ce chapitre nous avons présenté notre approche pour la reconnaissance des
plaques d’immatriculation algérien qui base sur le réseau de neurone après on a descripteur
les étapes de l’implémentation de notre application de l’environnement de développement
a les résultats obtenus avec une explication détaillée de chaque étape.
Chapitre 2 Méthode proposée
44
Conclusion générale
43
CONCLUSION GENERALE
L’intelligence artificielle est un vaste domaine qui vise à améliorer la vie des gens et à
trouver des solutions à divers problèmes auxquels ils font face, en particulier ceux liés à la
sécurité, comme la reconnaissance des visages, voix et formes
Dans ce travail, nous avons développé un système qui permet d’identifier les plaques
d'immatriculation des voitures afin de l’utiliser entre autre dans les systèmes d'identification
des voitures au niveau des parkings ou les radars routiers. Ce système est basé sur
l'utilisation de réseaux de neurones artificiels pour le processus d'identification des numéros
de plaques d'immatriculation.
Les résultats que nous avons obtenus étaient très satisfaisants, notre système a atteint
95 % dans le processus d’identification des plaques de numérotation.
Au cours de cette recherche, nous avons rencontré quelques difficultés, dont la plus
importante est l’absence de bases de données spécifique aux plaques de numérotation
algériennes. Ces plaques prennent une forme complètement différente relativement aux
modèles internationaux.
Nous suggérons que d’autres outils neuronaux puissent être exploiter dans ce type de
reconnaissances tel que le « deep learning » toutes en diversifiant le type d’images en
introduisant les images nocturnes avec des des bruits importants.
44
REFERENCES
[1] simonite , tom. ‘’facebook create software that matchees faces almost as well as tou do’’
mit technology review. Retrieved 2018-04-09
[2] principale of pattern classification : statistical neurol net and syntactique methodes of
getting robots to see and hear-lecteure notes by Dr michel D alder universite of westerm
australia 1994
[3] Wikipédia.
[4] chebout,soumia, Cours Reconnaissance des Formes, Master 1 Vision Artificielle.
,departement informatique universite oum el bouighi,2018
[5] KUMAR, Mentor-Mr MANJEET, Karan Choudhary, and Kovil Singh. "Image Denoising by
Various Filters for Diffèrent Noise using MATLAB."
[6] Abhishek yadav, « Digital image processing », livre, new Delhi boston usa
[7] Collins, Robert. "Lecture 4 : Smoothing." CSE/EE486 Computer Vision I Introduction to
Computer Vision CSE Département, Penn State University, Fall (2007)
[8] Naresh Kumar Garg, « Binarization Techniques used for Grey Scale Images », Article,
grdiet, bathinda india, juin 2013.
incrémental & Machines à Vecteurs Supports », Mémoire présenté en vue de l’obtention du diplôme de Magister en Informatique, Option : Informatique Industrielle, Département d'Informatique, Université HADJ LAKHDAR – BATNA, Soutenu le :18 /12 /2013. [9] Bourahla et Rabhi, Houda et Chaima,’’ Matlab pour traitement de l’image fondement Et
applications’ ’thèse, université Mohammed Boudiaf, m’silla ,2017
[10] Bourennane, E., et al. "Généralisation du filtre de canny-deriche pour la détection des
contours De formes quelconques." 14° Colloque sur le traitement du signal et des images,
FRA, 1993. GRETSI Groupe d’Etudes du Traitement du Signal et des Images, 1993.
[11] ZAIZ Faouzi, Djeffal Abdelhamid, Babahenini Mohamed Chaouki, "An Approach Based on Structural Segmentation for the Recognition of Arabic Handwriting", doi:10.4156/aiss.vol2. issue4.2, 2012. [12] Nadia MARREF, « Apprentissage
45
[13] R. Rakotomalala. Arbres de décision. Revue Modulad, 33 :163–187, 2005.
[14] M.Abdelhamid DJEFFAL, " Utilisation des méthodes Support Vector Machine (SVM) dans l’analyse des bases de données ", Thèse de doctorat, Université Mohamed Khider -Biskra, 2012. [15] R. Collobert and S. Bengio. Svmtorch : Support vector machines for large-scale regression problems. The Journal of Machine Learning Research, 1 :143–160, 2001. [16] chebout,soumia, INTRODUCTION A LA RECONNAISSANCE DES FORMES,departement
informatique universite oum el bouighi,2019
[17] Chris Harris & Mike Stephens, "A COMBINED CORNER AND EDGE DETECTOR," Plessey
Research Roke Manor, United Kingdom, Research 1988.
[18] "What is MATLAB," Cooperative Institute for Meteorological Satellite Studies,.
Top Related