Restauration des Images de Documents Anciens A. Meziane Cerist [email protected].

38
Restauration des Images de Documents Anciens A. Meziane Cerist [email protected]

Transcript of Restauration des Images de Documents Anciens A. Meziane Cerist [email protected].

Page 1: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Restauration des Images de Documents Anciens

A. MezianeCerist

[email protected]

Page 2: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

CONTEXTE DE CE PROJET

Je vous prie d’utiliser cette présentation à des fins

strictement personnellesMerci

Page 3: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

UTILISATEURS POTENTIELS

Bibliothèque Nationale d’Algérie

Centre Nationale des Archives

Centre National du Manuscrit (ADRAR)

Page 4: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

GRSDT vient de dévoiler les 34 PNR et lancera un appel en

janvier 2011

PNR12 TICAxe 1: production et gestion de documents multimédia

Thème 3: reconnaissance des documents écritsThème 4: archivage des documents anciens

PNR25 Culture et CivilisationAxe 3: Les arts

Thème 4: La calligraphie et les manuscritsThème 5: Numérisation du patrimoine culturel Algérien

Page 5: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

INTRODUCTION

Depuis quelques années, on numérise quotidiennement des quantités importantes de

documents issus du patrimoine. Cette révolution technologique a ouvert de nouveaux domaines

de recherche comme la restauration des images.

Page 6: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

La numérisation des documents du patrimoineLe support physique des documents écrits a beaucoup évolué: -supports rigides (le bois, la pierre, le marbre, les galets, les tablettes de cire ou d’argile) -supports souples (le papyrus, le parchemin, le cuir, le papier). -Le papier: moins coûteux et plus commode, mais, fragile dont la conservation est difficile. L’invention de l’imprimerie moderne au XVème siècle a marqué le début d’une nouvelle ère de production et de diffusion massive du savoir Le document électronique est aujourd’hui le vecteur de diffusion le plus utilisé dans le monde.

Les données numériques ne remplaceront jamais les supports physiques traditionnels, elles ne sont qu’une représentation plus ou moins fidèle des documents originaux. Par conséquent, la «copie numérique» ne constitue pas une alternative pérenne à la conservation du patrimoine culturel.

Page 7: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Propriétés du document numérique

– Facilité de reproduction– Indépendance du support physique– Facilité de consultation– Préservation et conservation des documents originaux

Page 8: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

La numérisation seule ne suffit pas. Il faut qu’elle cohabite avec le développement d’outils informatiques destinés à améliorer les conditions d’accès et de recherche.

-L’analyse d’images de documents est un domaine de recherche actif à la frontière de la reconnaissance des formes et de l’analyse d’images.

-L’analyse d’images de documents permet aujourd’hui de retrouver des mots dans les manuscrits imprimés ou bien de reconnaître les mots si on dispose de dictionnaires.

-La numérisation permet de réaliser une «copie numérique» des documents ; mais, pour un grand nombre de ces documents, la numérisation arrive trop tard et beaucoup de documents ont été numérisés en mauvais état.

-En plus de la détérioration physique des documents anciens, les images montrent des dégradations dues au processus même de numérisation.

Page 9: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Les images de documents sont des images particulières :

– Ce sont des images de traits qui forment des structures complexes qui doivent être préservées comme les lettres.

– Les informations sont concentrées sur des parties très réduites de l’image. La simple perte d’une partie infinitésimale peut rendre un texte illisible.

– Il existe une certaine continuité le long des lignes de mêmes intensités.

– La distribution statistique des couleurs montre des classes rarement séparables linéairement.

– La proximité colorimétrique entre les différentes couches d’information rend particulièrement difficile leurs séparations quand elles sont mélangées comme la séparation entre le recto et le verso par transparence.

– Les dégradations sont aléatoires et donc rarement modélisables et prédictibles. Les méthodes à base d’apprentissage ou de modélisation sont généralement limitées au traitement d’une seule dégradation sur des documents particuliers.

– Les dégradations peuvent se superposer de façon non-linéaire rendant très difficiles leurs séparations.

Page 10: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Scanners sans vitre Scanner avec lumière froide Scanner avec plateau pour préserver la reliure du livre

Types de scanners utilisés pour la numérisation

Page 11: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Exemples d’images de documents anciens

Page 12: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

12

Dégradations des images de documents anciens

– Absence de travaux complets sur les dégradations des images de documents anciens.

– Besoin d’une typologie des dégradations pour: • mieux traiter les images de documents,• guider les travaux de restauration.

Page 13: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Dégradations physiques du document

• Dégradations chimiques

Page 14: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Dégradations physiques du document

• Dégradations biologiques Les micro-organismes, Les insectes, Les rongeurs

Page 15: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Dégradations physiques du document

• Dégradations physiques d’origine humaine

Page 16: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

16

Origines des dégradations

Origines des dégradations

Origines des dégradations

- qualité du papier,- acidité de l’encre,…

L’ouvrageL’ouvrage

- résolution ,- compression trop forte,- présence de

courbures..

La numérisationLa numérisation

- humidité du lieu de stockage,- insectes, rongeurs,…

Les phénomènes naturelsLes phénomènes naturels

L’hommeL’homme

- annotations- Soulignement

s..

Page 17: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

17

une typologie des dégradations

DégradationsDégradations

du fonddu fond des formesdes formes globalesglobales

• Passage en interférence du verso sur le recto

• Annotations diverses… Dégradations sous forme

de couches

Procédure de restauration par des méthodes de

segmentation /classification

• Variation de l’éclairage

• Présence de courbures et d’inclinaisons… Dégradations sous forme

de transformation globale

Procédure de restauration par des

transformations inverses

Dégradations aléatoires de l’information

• Extrapolation de l’information perdue

• Réparation des traits

• Pertes de l’information• Caractères

dégradés…

Page 18: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Dégradations dues à la capture

• Dégradations matériellesLes limites technologiques de la numérisation de documents

(L’échantillonnage spatial, Une quantification des intensités lumineuses)

Les limites de la numérisation des microfilms(le microfilm est une copie qui a perdu définitivement toute l’information

colorimétrique et une grande partie de l’information sur la luminosité)

Page 19: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Dégradations dues à la capture

• Dégradations numériquesL’inadéquation de la résolution à la taille des textes

Perte de la topologie avec le déplacement aléatoire d’une grille de résolution

Page 20: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Dégradations dues à la capture

• Dégradations numériquesL’inadéquation de la résolution à la taille des textes

Problème d’une faible résolution sur une image de trait

Page 21: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Dégradations dues à la capture

• Dégradations numériquesChoix de la compression avec perte

Aspect destructif de la compression JPEG ; de gauche à droite respectivement : l’image originale et ses versions compressées avec un facteur de qualité 50 % et 10 %.

Page 22: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

classification non-causale des dégradations

1-Dégradations uniformescolorimétriques ou géométriques comme l’inclinaison, les variations

uniformes des couleurs ou de la luminosité ; elles regroupent les défauts issus d’une transformation globale de l’image qui peut agir uniformément

soit sur la localisation des pixels (inclinaison, courbure) soit sur leurs valeurs (transformation de la couleur ou correction de la luminosité).

La restauration revient, dans le cas présent, à définir la transformée inversequi permettra de se rapprocher de l’information telle qu’elle l’était à l’origine.

La restauration sera donc possible avec des méthodes globales qui appliquent les mêmes traitements sur toute l’image.

Page 23: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

classification non-causale des dégradations

2-Dégradations non-uniformesa-Les dégradations du fond

Page 24: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

classification non-causale des dégradations

2-Dégradations non-uniformesb-Les dégradations des formes

Page 25: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

La restauration physiquevieillissement, modification des couleurs, porosité du papier, acidité de l’encre, humidité et variation de la température de stockage, présence

d’insectes, sinistres...

La restauration numériqueinclinaison du document, courbure apparente le long de la reliure.., des défauts

optiques (éclairage non-homogène, netteté de l’image...), des défauts électroniques (bruit et qualité du capteur), des défauts informatiques (traitements destructifs de l’image sans sauvegarde des originaux, compression avec perte...) ou même des défauts extérieurs dus aux conditions de la prise d’image (présence d’éléments

non-désirés, extérieurs au document).

La restauration virtuellecomplémentaire à la restauration physique.

Elle permet par exemple de retrouver la couleur d’origine, d’atténuer le verso quand il traverse le recto, de remplir les trous, d’enlever les taches ou de corriger la

courbure après la restauration de la reliure.

Page 26: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Les méthodes de restauration virtuelle

1-Méthode supervisée2-Méthode non supervisée

Page 27: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Méthode supervisée

• Utilisation du recto et du verso• Séparation recto/verso par recalage

Suppression des taches en transparence par recalage

Page 28: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

(a) Le recto d’un document de test (b) Le recto du document restauré avec une fuite significative du verso après application de la méthode

Suppression des taches en transparence par recalage

Page 29: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Séparation recto/verso par analyse de l’orientation

• analyse de l’orientation à base de la transformée en ondelettes

(a) (b) (c) (d)Suppression des taches en transparence par analyse de l’orientation :(a) image de test, (b) image associée à l’orientation 135°, (c) image associée à l’orientation 45°, (d) image restaurée de (a)

Page 30: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Séparation recto/verso par analyse de la couleur

• quatre classes (fond, texte, texte coloré et texte du verso)• nécessite une phase d’apprentissage sur une portion

représentative d’une page.

(a) Image d’origine (b) Image finale de recto séparée du verso

Page 31: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Séparation par une approche de segmentation en régions de couleur

Séparation recto/verso par segmentation et agrégation de régions couleurs :Résultats de la sur-segmentation en régions, image dégradée et restaurée

Page 32: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Restauration des formes par modèle

(a) Image originale (b) Résultat pour K=2, le nombre de classes

Exemple de modèle : Taille du texte, la résolution, la translation, la rotation, le changement d’échelle, le défaut de jet d’encre.

Page 33: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Restauration des formes par prototypage

Cas de dégradations de la lettre «e» : (a) caractère idéal ; (b),(c) et (d) caractèresdégradés avec structure du «e» conservée, (e) et (f) caractères dégradés avec structure confuse : (e) «e» ou «c», (f) «e» ou «o»

À partir de la superposition de toutes les formes dégradées d’une même lettre, on construit le modèle de la forme idéale de la lettre.

Page 34: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Restauration géométrique de la courbure

Défauts géométriques de la photographie d’un livre ouvert à gauche et sa version restaurée à droite (source I2S)

Page 35: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Méthodes de restauration non-supervisées

• Restauration du recto/verso par séparation de sources

Utilise l’ACP

Intérêt: Approche ne nécessite ni l’information du verso, ni un modèle, ni un apprentissage

Suppression des taches en transparence par analyse de la couleur :(a) image de synthèse, (b) image restaurée de (a), (c) image réelle, (d) image restaurée de (c)

Page 36: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Restauration des formes par morphologie mathématique

Effets des opérateurs morphologiques sur les images binaires

Page 37: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Restauration Colorimétrique

Restauration de la dégradation colorimétrique par ajustement du contraste

Changement de la valeur de luminance, correction gamma et recalage d’histogramme

Page 38: Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz.

Restauration des Formes par Diffusion

• Les différents modèles de diffusion

pour réduire le bruit,

lisser les contours,

restaurer la continuité des traits

rehausser la netteté des formes.