Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène...

9
Une grille pour l’archivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat [email protected] / [email protected] Journées OAIS pour l’archivage de la recherche en SHS 23-24 octobre 2012

Transcript of Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène...

Page 1: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Une grille pour l’archivage intermédiaire et à long terme des données numériques en SHS

Lorène Béchard / Philippe Prat [email protected] / [email protected]

Journées OAIS pour l’archivage de la recherche en SHS

23-24 octobre 2012

Page 2: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Centre Informatique National de l’Enseignement Supérieur

Le Centre Informatique National de l’Enseignement Supérieur

2Journées OAIS23-24 octobre 2012

Centre Informatique National de l’Enseignement Supérieur

• Basé à Montpellier (Hérault, France)

• EPA créé en 1999, succédant au CNUSC (Centre National Universitaire Sud de Calcul) – créé en 1980

• Placé sous la tutelle de la DGRI (Direction Générale de la Recherche et de l’Innovation) et de la DGESIP (Direction Générale pour l’Enseignement Supérieur et l’Insertion Professionnelle) du Ministère de l’Enseignement Supérieur et de la Recherche

• Missions

– Calcul numérique intensif

– Archivage pérenne de documents électroniques

Activité transversale : hébergement d'environnements informatiques

• Plus d’information : http://www.cines.fr/

Page 3: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Centre Informatique National de l’Enseignement Supérieur

3Journées OAIS23-24 octobre 2012

• PAC : archivage intermédiaire et à long terme de données administratives, patrimoniales et scientifiques– Mandat pour l’archivage des thèses électroniques soutenues en France (arrêté du

7 août 2006)

– Agréé pour l’archivage intermédiaire par le SIAF

– Périmètre opérationnel : données de l’enseignement supérieur et de la recherche

– Partenariat avec le TGE Adonis : archivage et diffusion des données numériques en SHS

• ISAAC : archivage intermédiaire de données scientifiques– Dimensionné pour des petites structures ayant de grands volumes de données

– Une donnée organisée et validée par des communautés d’experts

– Un travail scientifique valorisé par le partage et la diffusion

L’archivage numérique au CINES : deux approches, deux infrastructures

Page 4: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Centre Informatique National de l’Enseignement Supérieur

4

Le service d’archivage pérenne du CINES

PAC : une plateforme d’archivage électronique + un service dédié de 11 personnes

– Une solution générique basée sur les normes et standards du domaine :

• Qualité technique (métadonnées, fichiers, stockage)

• Qualité organisationnelle (processus métiers, gestion des risques, certification)

– Une solution mutualisée et sécurisée

– Des contrôles à tous les niveaux : versement / stockage / communication

– Une démarche qualité basée sur des audits réguliers et l’obtention d’une certification

– En production depuis 2008 (PAC v2) – 10 services versants – 23 To archivés

Dans le respect du contexte législatif et archivistique français

Journées OAIS23-24 octobre 2012

Page 5: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Centre Informatique National de l’Enseignement Supérieur

L’architecture logique de la plateforme PAC

5

PAC : Plateforme d’archivage du CINES

Serveurde

Transfert

Serveurde

Stockage

Serveurd’Accès

Producteur Service Versant

Administrateur

Utilisateur

Service de Contrôle

Journées OAIS23-24 octobre 2012

Page 6: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Centre Informatique National de l’Enseignement Supérieur

Zoom sur… l’expertise en formats de fichier

6

Pour permettre le contrôle de la qualité d’un fichier, celui-ci doit être dans un format identifié et vérifiable :

– Format publié ; ex. WAV, SVG ;

– Format largement utilisé ; ex. XML, MPEG4 ;

– Format normalisé si possible ; ex. PDF (ISO 32000-1:2008), PNG (ISO 15948:2004).

Pour pouvoir être lisibles dans le temps et convertibles, les fichiers doivent respecter à la lettre les spécifications de leur format.

Les outils libres Jhove, ImageMagick, DROID, ODF Validator permettent une identification, validation et caractérisation des formats.

Type Format

Texte HTML, PDF, TXT, XML, ODT

Image GIF, JPEG, TIFF, PNG, SVG

Audio WAV, AIFF, AAC, VORBIS

Vidéo MPEG4, THEORA, MKV

Journées OAIS23-24 octobre 2012

Page 7: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Centre Informatique National de l’Enseignement Supérieur

Deux partenaires : le CINES et le TGE Adonis

• Le TGE Adonis est l’interlocuteur des laboratoires et des structures demandant à bénéficier de l’archivage à long terme– Il labellise des projets de conservation à long terme de documents numériques

• Le CINES est l'opérateur qui assure la conservation, la pérennisation et les migrations futures

Les données sont d’abord déposées au CINES qui vérifie notamment la conformité des fichiers à des formats de conservation définis à l'avance

– Accompagner la mise en forme des données pour l’archivage– Garantir la lisibilité et la compréhension sur le long terme– Faciliter la démarche d’assurance qualité de l’archivage

• Le TGE Adonis assure l’accès aux donnéesLes données communicables sont accessibles depuis la plateforme de diffusion mise en

place et gérée par le TGE Adonis

Le projet d’infrastructure mutualisée pour l’archivage et la diffusion des données SHS

7Journées OAIS23-24 octobre 2012

Page 8: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Centre Informatique National de l’Enseignement Supérieur

8

Plateforme d’Archivage

Transfert

Synchronisation

Synchronisation

Système de diffusion /

communication

Conversions Formats

Infrastructure Mutualisée

(Grille de Données)

L’infrastructure mise en place

Journées OAIS23-24 octobre 2012

Page 9: Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène Béchard / Philippe Prat bechard@cines.fr / prat@cines.fr.

Centre Informatique National de l’Enseignement Supérieur

Les objectifs du projet « pilote » CRDO

• Valider le schéma retenu pour les données orales, sur le plan– Des fonctionnalités d'ensemble– De la répartition des tâches et des responsabilités entre les acteurs

• Prouver la possibilité d’extension aux autres données des SHS créées, gérées et utilisées par différents Centres de Ressources Numériques

Le bilan du projet « pilote » CRDO

• La plateforme est en production depuis Mars 2010– Au 31 Décembre 2011, près de 4000 documents multimédia versés– Respect des normes du domaine (OAIS – ISO14721, etc.)

• Bilan du « pilote » validé par le Conseil Scientifique du TGE ADONIS en Septembre 2010

• Agrément SIAF obtenu par le CINES le 14 Décembre 2010

Les perspectives

• Extension de l’infrastructure à d’autres services et laboratoires

Le projet pilote du CRDO : bilan et perspectives

9Journées OAIS23-24 octobre 2012