La mission de conservation - ctles.fr · informatiques en vue d’assurer la conservation et...
Transcript of La mission de conservation - ctles.fr · informatiques en vue d’assurer la conservation et...
Plan
• La mission de conservation• Les collections numériques à la BnF (action
de préservation ?)• Les services apportés par SPAR• Les filières dans SPAR• La filière tiers-archivage (agrément + tarifs)
• Pensez à récupérer le logo IMPACT
3
Enjeu de la conservation à la BnF
• La conservation est au cœur des missions de la BnF : elle conserve, depuis des siècles, tout ce qui est publié en France.
• Constituées depuis 1537 notamment grâce au dépôt légal, sescollections représentent plus de 30 millions de livres,manuscrits, journaux, photographies, musiques, parmilesquels un grand nombre de pièces uniques.
• 400 km de rayonnage
Décret n °94-3 du 3 janvier 1994 - article 2 :La Bibliothèque nationale de France a pour missions de collecter, cataloguer, conserver et enrichir dans tous les champs de la connaissance, le patrimoine national dont elle a la garde , en particulier le patrimoine de langue française ou relatif à la civilisation française
•Pour le ministère, c’est là le « patrimoine numérique »– http://www.numerique.culture.fr/pub-fr/index.html
•Déjà plusieurs « strates » de numérisation …
Du numérisé
4
• Du papier : livres, images, presse, etc.• Des objets : maquettes, statues, etc.• De l’audiovisuel : cassettes audio, VHS,
disquettes, CD, CD-ROM, etc.– qui nécessite un outil de lecture– qui est parfois déjà numérique
• Des originaux rares, précieux, fragiles• Des versions numériques plus ou moins fidèles à
l’original
Qu’a-t-on numérisé ?
5
• Quel est le statut des documents numériques produits ?– Hors droits, sous droits– Numérisés « à des fins de conservation » ou pour
« préserver les conditions de sa consultation » au sens du Code de la propriété intellectuelle (article L122-5)
– Dans le cadre d’un contrat passé avec un auteur– Dans le cadre d’une convention passée avec une
bibliothèque partenaire
Dans quel cadre ?
6
• Choix techniques :– Liés aux objectifs
• Diffusion, préservation, les deux
– Aux moyens techniques à une date donnée• Format de fichier, résolution, couleur• Mode image, texte (OCR), table des matières et autres
enrichissements (entités nommées, etc.)
Comment ?
7
Débuts de la numérisationN&B - 300dpi -TIFF G4
1 page ~ 200Ko
8
Comparons…
Numérisation maintenantCouleur– 400dpi – TIFF non
compressé1 page ~ 80Mo
Plus de 500 fois plus !
• Acquis ou accessibles ?• Sous licence locale ou globale ?• Catalogués ou indexés ?• Libres ou protégés (DRM) ?• PDF, HTML, EPUB, indéterminés ?• Quelles relations au « papier » : copie exacte,
contenu similaire, genre totalement nouveau ?
– Sans oublier les éditions électroniques de la bibliothèque elle-même…
Livres et périodiques
10
• Dépôt légal de l’internet : à la BnF et à l’INA, depuis 2006 (décret d’application fin 2011)
Internet
Année calendaire
Nom-
bre de
sites
Collectes larges :- annuelles
- internalisées en 2010
Collectes courantes :- sur toute l’année
- sites d’actualité ou de référence
Collectes projet :- ponctuelles
- liées à un événement ou
un thème particulier
12
• Archives publiques• Archives privées, achetées ou reçues
• Quels droits sur les documents ?– Conservation pendant la période d’utilisation
courante (GED), et après ?
• Quelle variété de documents ?– Progiciels, environnements numériques de travail,
e-mails, etc.
Archives
13
Les activités d ’une bibliothèque
Sélection
Acquisition
Catalogage
Équipement
Magasinage
Conservation
Communication
Valorisation
0010000000100000001000000011000100110010001100000010000000100000001000000010000000110101001110000010000000100000001101010010000000100000001000000011000100111001001110000011000100101101001100000011100100101101001100110011000001010100001100010011010000111010001100100011001000111010001100000011000100101110001101100011001000111001010110100010000000100000001000000011001100111000001110010011100000101110001101110011000000100000001000000010000000110010001100110011010100110010001011100011010000110101001000000010000000100000001000000010000000101101001100010010111000110110001101100010000000100000001000000010110100110111001011100110111001100100010000000100000001011010011000100111000001011100011011000110001001000000010000000101101001110000011000000101100011000000110000001000000010000000101101001110000011000000101110001100000011000000100000001000000010000000110001001000000010000000110100001100110010000000100000001000000011100100100000001000000010000000100000001110010011100000111001001011100011010000110010001000000010000000100000001000000010000000110001001101100010111000110000001100100010000000100000001000000010000000100000001101010011001100101110001110000011001100100000001000000010000000100000001000000011010100110110001011100011011000110010001000000010000000100000001000000010000000100000001101000010111000111000001100010010000000100000001000000010000000110111001110010011001100101110001101010011100000100000001000000010000000100000001000000010000000110011001011100011001100110100000010100010000000100000001000000011000100110010001100000010000000100000001000000010000000110101001110000010000000100000001101010010000000100000001000000011000100111001001110000011000100101101001100000011100100101101001100110011000001010100001100010011010000111010001100100011001000111010001100000011010100101110001101110011100000111000010110100010000000100000001000000011001100111000001110010011010000101110001101100011010000100000001000000010000000110010001101010011010000110110001011100011100000111000001000000010000000100000001000000010000001000000010110100111000001100000010
Sélection
Collecte / production
Métadonnées / indexation
Empaquetage
Gestion
Préservation
Accès
Valorisation
14
• Les informaticiens fournissent un service technique,mais pas la définition du service (définition du besoin)
• ce n’est pas la même chose de mettre en place un bon système de climatisation, et de savoir quelle est la température et l’hygrométrie idéales d’un magasin.
• Les méthodologies de conservation sont les mêmes pour le papier et le numérique :
• stratégies préventives, • plans de conservation, • choix de priorités en fonction de la valeur/fragilité des collections, • gestion de risques, • alertes et résolutions de problèmes, • plans d’urgence…
• Ce sont les bibliothécaires qui doivent établir des niveaux de service
Un « plan de conservation » numérique ?
http://www.flickr.com/photos/nate/284184160/
http://www.flickr.com/photos/jurvetson/855530042
15
• La conservation du papier, c’est technique• (désacidification de masse, encres ferrogalliques,
qualité des cuirs, effets des gommes à effacer sur la cellulose du papier…)
• Conserver des documents numériques c’est surtout les préserver– (en général, avec le numérique, après = trop tard)
• Stocker/sauvegarder ce n’est pas archiver !
Un « restaurateur » numérique ?
• Le numérique est lui aussi stocké sur un support physique
• L’infrastructure de stockage coûte cher et prend de la place, il faut la sécuriser et la répliquer
• À partir d’une certaine échelle, il faut une couche logicielle pour gérer les fichiers et les données
Un « magasin » numérique ?
17
• Le catalogage ne se limite plus au descriptif :– Métadonnées techniques,
administratives (dont droits, historique), etc.
• Heureusement, les parties techniques sont les plus faciles à automatiser : extraction
• On jongle avec plusieurs granularités :– d’une logique de document à une
logique d’objet
Un « catalogue » numérique ?
18
Résultat, du numérique partout
Information
bibliographique
et numérique
Communication
Services et réseaux
Collections
collections numériques
(acquisition, signalement,
gestion et diffusion)
Systèmes d’information
Gallica (contenu)
Dépôt légal
numérisation
préservation
du numérique
Dépôt légal numérique
Coopération
Conservation
site Web institutionnel
prospective, standards
métadonnées
14 départements
19
Quel impact sur les métiers ?
20
Gestion des collections numériques
Expertise des chargés de collection +
producteurs d’information numérique
Expertise informatique + nouvelle fonction de magasinier numérique
?
Gestion du magasin numérique
Expertise de conservation + cohérence des
données numériques
Expertise de préservation
20
21
SPAR est un système
• conçu selon des normes– norme OAIS (ISO-14721)
• Modèle de référence pour un Système ouvert d’archivage d’information
– norme NF Z42-013 en certains de ses principes• Spécifications relatives à la conception et à l’exploitation de systèmes
informatiques en vue d’assurer la conservation et l’intégrité des documentsstockés dans ces systèmes
• spécifications RDF du W3C pour l’interrogation des données
• de confiance– répondant aux exigences les plus hautes : agrément SIAF
(mars 2013)– prêt pour la certification ISO 16363:2012– en conformité avec les recommandations de la CNIL relatives à
la protection des données personnelles (audit automne 2011)
22
SPAR : un outil au service de la préservation
• Données redondées, sur 2 sites situés en France, dans des zones en accès restreint, avec cloisonnement des serveurs, plan de reprise d’activité
• Contrôle à l’entrée les données reçues (AQS)• Assure une surveillance continue des données
et des équipements• Gère les habilitations• Fournit un horodatage de toute action• Permet la veille automatisée sur les formats de données versées. • Permet les transformations de formats : « opération de migration »
pour garantir ainsi l’accès à long terme des fichiers.
• Assure la restitution des données
• Experts assurent le gestion et le développement du système
Les accords de qualité de service
• Les accords de qualité de service : contracter avec les utilisateurs pour un système plus transparent
• Le système n’est pas une boîte noire maîtrisée uniquement par les experts techniques.
AQS : prise en compte dans le système
Pré-versement Service d’abstraction du stockage
versement
Stockage
Préservation Administration
Gestion des donnéesAccès
SIP
AIP
DIPmets
rdf
rdf
AIP
A quel format ai-je
droit?
Combien de copies dois-je faire, sur quels
supports ?
Quelle est la taille maximum d’un paquet ?
Dois-je journaliser les demandes de
paquets ?
AQS: définition
• 3 AQS: Versement, Préservation, Accès• Formalise en xml les conditions d’exploitation des
paquets• Ces 3 AQS sont enregistrés dans un paquet de
référence descriptif de la chaîne
AQS-V.xml, AQS-P.xml, AQS-D.xml
Mets.xml
Contrat de service.pdf
La filière et leurs chaînes
• Nécessaire pour gérer l’hétérogénéité des données ; spécialisée en chaîne
• Définie par les accords de qualité de service (AQS) entre les données et les exigences d’archivage :– Numérisation de conservation– Audiovisuel et multimédia– Numérisation de consultation– Dépôt légal automatique– Dépôt légal négocié– Production administrative et technique– Dons et acquisitions– Tiers archivage
Les modules de SPAR
Pré-versement
Pré-versement
Pré-versement Service d’abstraction du stockage
versement
Stockage
Préservation Administration
Gestion des donnéesAccès
SIP
AIP
DIPmets
rdf
rdf
AIP
Numérisation
Audiovisuel
etc …
Infrastructure
SAS
SPAR - Infrastructure
Vue Applicative
Vue Infrastructure
Stockage Principal Stockage secondaire
SPAR - Réalisation
Gestion de plusieurs copies
Migration de supportRafraîchissement de support
L’abstraction de stockage
Risques Enjeux
• Garantir l’intégrité des enregistrements• Garantir la pérennité du stockage• Gérer l’obsolescence technologique• Automatiser les différentes réplications et
copies des enregistrements• Assurer les audits des enregistrements• Assurer les changements de l’infrastructure
de manière transparente• Garantir une indépendance vis-à-vis des
constructeurs• Dissocier stockage logique et physique• Gérer les sites distants • …
Disque Holographique
Disque Optique (Blu-Ray)
Bandes de stockage
Disque dur
Abstraction du stockage Migration transparente de support
Audit des enregistrements
Entité Stockage [4-7]• Remplacer les supports• Contrôle d’erreurs
Migration numérique [5-2 à 10]•Rafraîchissement de support•Duplication•Ré-empaquetage
Rappel OAIS
Rôles et responsabilités
33
Un système ouvert permettant un service pour des tiers
• Dès sa conception, le système SPAR a été conçu pour accueillir un service d’archivage pour des données extérieures.
• Une tarification votée au CA de novembre 2012
• Des collections numérisées de nombreux partenaires de Gallica déjà archivées
• Plusieurs demandes d’archivage numérique pour des tiers :– un contrat signé : centre Pompidou virtuel– d’autres contrats en cours.
• L’ouverture permet une mutualisation des coûts.
34
La fixation des tarifs
• Tarifs standards basés sur : – Le mode de téléchargement des données à
archiver (extranet ou sur-mesure)– Le support de stockage (bandes, disques)– La volumétrie de stockage (de 1 à 50 To)– La durée du contrat initial (3, 5 ou 8 ans).
• Le coût est confirmé à partir de l’accord de qualité de service.
35
Prix de revient lissé sur 5 ans
OptionsArchivage complémentaire sur 1 disque : + 315€Archivage complémentaire sur 2 disques : +630€
BnF - Archivage numériqueTarif général annuel, au téra octet, en € HT, basé sur 5 ans
Volume des données à archiver sur 2 bandes :
extranet sur-mesure
pour 1 To 2 545 € 3 990 €
de 2 à 5 To 1 960 € 2 680 €
de 6 à 9 To 1 740 € 2 160 €
de 10 à 29 To 1 590 € 1 840 €
de 30 à 49 To 1 420 € 1 530 €
La suite…
• Tarifs validés en conseil d’administration en fin d’année 2012.
• Prévoient réductions pour les partenaires Gallica
• Service proposé depuis le 1er trimestre 2013 et décrit en ligne (présentation, contrat, tarifs) :
• http://www.bnf.fr/fr/professionnels/numerisation/a.bnf_archivage_numerique.html
36