1 science big data

Click here to load reader

Embed Size (px)

Transcript of 1 science big data

  1. 1. 1SCIENCE - PRODUIT
  2. 2. PROBLMES DES BIBLIOTHQUES UNIVERSITAIRES Budgets des bibliothques de plus en plus restreints Big deals et hausse annuelle des cots dabonnement Murs de paiement (Pay walls) frquemment rencontrs lors de recherche darticles Exprience usager archaque ou surcharge
  3. 3. LE LIBRE ACCS (OA) Libre accs = Open Access (OA) Gold Green Hybrid Rapport fait par Science-Mtrix pour la Commission Europenne afin d valuer lvolution de la disponibilit des articles scientifiques en libre accs (2014) Rsultat: plus de 50% des articles scientifiques publis dans des revues avec comit de lecture sont libres daccs
  4. 4. SOLUTIONS ACTUELLES Google Scholar et les autres solutions actuelles de recherche darticles en libres accs ne garantissent pas que les rsultats obtenus sont: Des articles scientifiques Libres daccs Publis dans une revue avec comit de lecture
  5. 5. 1SCIENCE 1science cest donc: Tous les articles scientifiques en libre accs et publis dans des revues avec comit de lecture, en un seul endroit Une option abordable et une expansion de la collection des bibliothques Une exprience usager simple et puissante
  6. 6. 1SCIENCE Mais surtout beaucoup, beaucoup de donnes: Articles Metadonnes Rfrences et Citations Analytics Donnes impliquant dduplication et dsambiguation afin de garantir la qualit et lexactitude des rsultats
  7. 7. 1SCIENCE BIG DATA
  8. 8. DONNES - CARACTRISTIQUES Sans bornes Semi-structures Dupliques Taille inconnue
  9. 9. Type Volume Taille Articles 300M (10M x 30) TBD Meta / Text 300M (10M x 10f x 3v) Titre: 3GB Abs: 30GB PDFs 20M (10M x 2f) 40TB (20M x 2MB) Auteurs 50M (10M x 5) TBD Graph 350M sommets (300M + 50M) 500M arcs (10M x 50M) TBD DONNES - ESTIMATIONS
  10. 10. Type Volume Taille Articles 70M (13M ddup) 1.2TB Rfrences 2G (70M x 30) TBD DONNES - RALIT
  11. 11. DONNES - TRAITEMENT MASHUP
  12. 12. DONNES - TRAITEMENT http://en.wikipedia.org/wiki/DIKW_Pyramid
  13. 13. DONNES - TRAITEMENT Acquisition Extraction Deduplication Qualification Disambiguation Enrichment Knowledge Decision Information KnowledgeData
  14. 14. DFIS TECHNOLOGIQUES Volumtrie des donnes Qualit des donnes Interoprabilit Distribution
  15. 15. Mathieu Lampron VP Produit Mathieu.Lampron@1science.org @MathieuLampron Sbastien Mailhot Directeur du dveloppement logiciel Sebastien.Mailhot@1science.org @sebalas