La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC,...

21
La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum

Transcript of La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC,...

Page 1: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

La communication scientifique directe et les archives ouvertes

Marne la vallée, le 13-06-06

ENPC, ParisTech, Polytechnicum

Page 2: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Un modèle, la base « ArXiv »La « base de preprints de Los Alamos »

Démarrage en 1991, dans un domaine très spécialisé, par Paul Ginsparg (Los Alamos National Laboratory)

Conçue initialement pour éviter la circulation des prétirages (preprints).. qu’elle a en fait rendus obsolètes ! (*)

A rapidement grossi et rempli une fonction beaucoup plus large

A conquis une grande partie de la physique, une partie des maths

Communication scientifique directe: rapidité et gratuité de la circulation de l’information

(*) Les notions de preprint, de reprint, de postprint, etc.. ont perdu beaucoup de leur actualité dans la pratique des chercheurs.

Page 3: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

ArXiv (suite)

• Plus de 300.000 manuscrits

• 4000 nouveaux textes chargés chaque mois

• Est devenu un « passage obligé » pour toutes une série de spécialités en physique et en maths

…… mais ArXiv a également de nombreuses insuffisances et ne remplit pas tous les services qu’on pourrait en attendre. D’où l’apparition de bases périphériques, type SPIRES (gérée par le SLAC), etc..

Page 4: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

L’autoarchivage des documents scientifiques

• Les dépôts sont effectués par les auteurs eux-mêmes (ou quelquefois

par les bibliothécaires et secrétaires de laboratoires)• Les documents sont consultables presque immédiatement et gratuitement du monde entier• Ils sont centralisés dans quelques bases mondiales; la pérennité à long et très long terme des documents est assurée• Stabilité des adresses http: indispensable pour les citations• Miroirs dans le monde entier • Complémentarité: beaucoup des documents sont par ailleurs

publiés dans les revues traditionnelles.

La référence d’entrée n’est pas la publication avec sa typologie - peu importe d’ailleurs que les documents soient preprints ou postprints, ou post-post-prints. Une archive ouverte n’est pas une base bibliographique, mais un outil de communication scientifique (pleins textes).

Page 5: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Autoarchivage (suite)

• Système d’alerte automatique, recherches rapides, souplesse en cas de voyage, etc.• Pas de retrait (la responsabilité des déposants remplace celle des comité de lecture); mais possibilité de versions différentes• Un filtrage scientifique élémentaire est effectué à l’entrée (quelques minutes au plus par document)• Complémentaire des revues traditionnelles: pas d’évaluation soignée par des rapporteurs, mais une évaluation élémentaire.

Page 6: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Un schéma mondial

A

U

T

E

U

R

S

L

E

C

T

E

U

R

S

Base commune de documents, mondiale, gratuite, permanente

Journaux EpijournauxServices à

valeur ajoutéeVues

personnalisées

(le niveau du bas est gratuit, pas nécessairement celui du haut)

Page 7: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Archives institutionnelles et archives ouvertes

La recherche est totalement internationale. Une archive institutionnelle est perçue par les chercheurs comme trop étroite (« provinciale »). Il faut donc bâtir une archive disciplinaire très ouverte, mais qui puisse bénéficier de l’appui des établissements de recherche (Universités, EPST, Grandes Ecoles, etc.).

Pour cela, il faut construire des interfaces ou chaque établissement puisse opérer dans un environnement propre et personnalisable, et retrouver automatiquement sa propre production.

De plus, une validation officielle doit être possible (notion de « tampon »).

Le mot d’ordre est donc: un appui institutionnel à une archive ouverte !

Page 8: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Rendre au passage des services aux institutions, laboratoires et chercheurs

Les chercheurs et les laboratoires veulent pouvoir, par un seul dépôt, extraire des listes de publications paramétrables (candidatures, demandes de contrat, rapports quadriennaux) et alimenter leurs rapports annuels (CRAC pour le CNRS).

La base doit permettre d’extraire automatiquement la production d’un laboratoire, d’un établissement, ou d’un auteur.

La structure des métadonnées doit donc en tenir compte (laboratoires en listes fixes, etc.); on ne peut pas se contenter des standards courants (DC étendu ou pas, OAI, etc.).

Il faut pouvoir enrichir les métadonnées d’un dépôt en fournissant les références de publication (le document passe de preprint a postprint dans la base), mais ce ne doit pas être le point d’entrée.

La base doit également pouvoir acueillir des notices bibliographiques sans plein texte, pour compléter les listes de publication.

Page 9: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Le CCSD (créé en 2000) et ses missions

1. mettre le CNRS et la France en pointe dans l’utilisation des nouvelles méthodes de communication scientifique

2. s’appuyer sur l’expérience de la base ArXiv en physique et mathématiques ; travailler, non pas en concurrence, mais en coopération avec nos collègues américains

3. faire diffuser ces techniques nouvelles au sein d’un plus grand nombre de disciplines, idéalement de toutes celles étudiées au CNRS ; associer autant que possible les autres EPST et les universités au mouvement

4. assurer la conservation des documents et la stabilité des adresses http à long terme

5. rendre le monde de la recherche plus indépendant des éditeurs commerciaux de journaux scientifiques

Page 10: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Localisation du CCSD

Centre de calcul de l’IN2P3 , campus de La Doua(Université Claude Bernard, Villeurbanne)

Une unité propre CNRS de grandes technicité etsécurité

Capacités de stockage et de sauvegarde exceptionnelles

Connectivité excellente

Page 11: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Organisation des AO au CNRS

• Le CCSD, chargé de la mise en œuvre pratique, et des formations (Daniel Charnay, directeur)

• Le CPAO (comité de pilotage des archives ouvertes), regroupant toutes les directions scientifiques des départements (F. Laloë, président; M. Picco, vice-président).

• Un chargé de mission du DG pour coordonner toutes les initiatives au niveau de l’établissement (F. Laloë), ainsi que les négociations entre établissements. Un acccord très général est en cours de signature pour l’utilisation commune de Hal.

Page 12: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Hal, une démo

• Consultation

• Dépôt

• Recherches, alertes, etc..

• Extraction d’une liste de publications

Page 13: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Versions successives des documents

• Chaque article peut donner lieu à plusieurs versions successives, qui sont toutes conservées et accessibles sur le serveur.• Chaque version reçoit une certification de date• Possibilité d’évolution d’un article même après publication dans un journal, d’erratum, etc.• Documents annexes possibles• Retrait d’un article• Soumission automatique à des journaux traditionnels

Page 14: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Extraction de liste de publications

• Un outil d’extraction de listes de publications d’auteurs, de laboratoires, etc. est proposé• Pour compléter les listes et mettre des références bibliographiques sans plein texte, on peut charger des « notices » dans Hal (non visibles en consultation ordinaire)• L’outil d’extraction permet l’incorporation automatique de listes de publications dans la fiche personnelle annuelle des chercheurs CNRS (application CRAC)• Il permet de faciliter l’établissement des listes de publication pour les documents de contractualisation quadriannuelle des laboratoires, les demandes ANR, ..

Page 15: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Comment s’approprier Hal

• Extractions automatiques (auteur, labo, établissement)

• Tampons et collections

• Environnements

• Utilisation de l’API

Page 16: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Différentes extractions de Hal• Vue générique (e.g. par discipline); recherches, etc.

• Extractions automatiques:http://hal.ccsd.cnrs.fr/aut/omonthttp://hal.ccsd.cnrs.fr/lab/IAPhttp://hal.ccsd.cnrs.fr/UJFhttp://hal.ccsd.cnrs.fr/CNRShttp://hal.ccsd.cnrs.fr/CDF

• « Collections » validées par des « tampons » http://hal.ccsd.cnrs.fr/LKB

• Environnements de dépôt et de consultation

Page 17: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

« Tampons »

• les tampons permettent à leurs propriétaires de sélectionner certains documents, indépendamment de leur présence dans Hal• ils ont la valeur que leur propriétaire leur donne• ils permettent des validations, soit par un laboratoire soit par institution, soit par journal• la validation peut se faire version par version

Page 18: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

« Collections »

• Des extractions automatiques par laboratoire, par auteur, par tampon, etc. sont possibles• Possibilté de créer des « collections » ou des présentoirs électroniques• Exemple du LKB

Page 19: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Environnements de Hal

Base généraleHAL

(cœur commun de métadonnées)

Interface CNRS

InterfaceTematice

InterfaceDemocrite

InterfaceSHS

InterfaceDemocrite

InterfaceTematice

Interface CNRS

InterfaceSHS

Correspondance des métadonnées

DEPÔT CONSULTATION

Page 20: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Dépôt de liens vers ArXiv

• Il est possible de rendre visible dans Hal un document déjà déposé dans ArXiv• Outil spécial permettant de récupérer des métadonnées, et de les enrichir• Combinaison avec les tampons pour créer des collections

Page 21: La communication scientifique directe et les archives ouvertes Marne la vallée, le 13-06-06 ENPC, ParisTech, Polytechnicum.

Ce que vous pouvez faire avec HAL/TEL

• déposer des thèses• déposer des articles, récents ou anciens, avec ou sans transfert vers ArXiv; versions multiples possibles• déposer des liens vers ArXiv et faire apparaître les articles dans HAL• déposer des listes de références biblio (sans texte intégral)• utiliser des « tampons » pour certifier des documents• faire des « collections » ou « présentoirs électroniques »• extraire des listes de publications pour des chercheurs ou des laboratoires• remplir automatiquement votre fiche CRAC si vous êtes chercheur CNRS• faciliter la confection d’actes de congrès• lancer des épijournaux…