Trouverl’info seance3

20
Séance 3 Mieux trouver l’information utile sur le web (les outils de la veille) DUT Gestion de l’Information et du Document (IUT Ponsan,Toulouse 3) Formation continue 2010-2011 Françoise Gouzi Quiroz [email protected]

Transcript of Trouverl’info seance3

Page 1: Trouverl’info seance3

Séance 3 Mieux trouver l’information utile sur le web (les outils de la veille)

DUT Gestion de l’Information et du Document (IUT Ponsan,Toulouse 3)

Formation continue 2010-2011Françoise Gouzi Quiroz [email protected]

Page 2: Trouverl’info seance3

Plan du thème 3

•I/Le contexte de la veille sur le web•II/Une méthodologie•III/Panorama des outils gratuits

▫Les flux RSS ou agrégateurs de flux▫Netvibes

•IV/Typologie des agents de surveillance (payants)

•V/Les services de monitoring mots-clés

Page 3: Trouverl’info seance3

I/Le contexte de la veille sur le web

•Volume exponentiel des sources et des outils

•Hétérogénéité, fragmentation de l’info•Renouvellement continuel•Info multilingue•Fiabilité ? (Web social…)•Google (moteur sacré) mais aussi outils

thématiques

Page 4: Trouverl’info seance3

•Recherche automatisée = outils qui vont prendre en charge cette tâche répétitive et sans gde VA (aller voir pour nous « ce qui a changé » sur le web)

•Du plugin au logiciel de surveillance de plusieurs centaine de milliers d’euros

•Critères de choix : besoins, budget, caractère personnel ou professionnel de la veille , nb de personnes impliquées (ex veille emploi, e-réputation, ou mission de veille concurrentielle pour Danone ou Airbus!)

Page 5: Trouverl’info seance3

A quoi ça sert ?

•Aide à la décision stratégique, •à l'innovation •à l'orientation de la recherche •au développement.

Page 6: Trouverl’info seance3

II/Une méthodologie

•Une organisation sans failles•Anticiper•Objectif de la surveillance, sujets

concernés•Eclaircir les besoins avec le décideur•Facteur temps : un calendrier

prévisionnel•Du sourcing (Identification et sélection des

sources)•Automatisation de la surveillance

(paramétrages, filtres mots-clés, équations de recherche pour les moteurs et bdd)

•Collecte, évaluation, diffusion

Page 7: Trouverl’info seance3

III/Panorama des outils gratuits

•Choix des outils /convaincre !•L’automatisation de la collecte passe par 3

options clefs (svt complémentaires):▫L’abonnement à des flux d’information▫La surveillance des modifications sur des

pages/site webs▫Le « monitoring mots-clés » (résultats

reçus rég. suite à une requête sur un moteur ou une bdd)

Page 8: Trouverl’info seance3

A/Les flux RSS ATOM XML

• Really Simple Syndication ou Rich Site Summary repose sur le format XML (dans sa version 2.0)

• Des formats « non RSS » c’est le cas de ATOM• RSS décrit des éléments textuels à l’aide de

balises (titre, date, contenu, auteur) qui pourront être repris par des logiciels spécifiques

• Le lecteur est informé des nvlles informations ou actualités qui lui parviennent en mode push dans son lecteur RSS ou logi. agrégateur (des infos qui peuvent venir de multiples sources)

Page 9: Trouverl’info seance3

Les lecteurs ou agrégateurs de flux RSS ou comment lire les flux d’actualités ?

•Démarche automatiqueIE/Firefox, le navigateur détecte automatiquement les pages XML présentes sur un site et propose différents lecteurs :Netvibes, My Yahoo, Google… intégrés nativement à la plupart des applications 2.0 (cas des CMS, Spip)

•Démarche manuelle : clic droit sur le lien RSS et copier/coller dans le logiciel lecteur, plugin ou log. de messagerie que l’on installera sur son poste Sage, Feedreader, RSSBandit, Feeddemon, RSS Owl, Thunderbird ou Outlook.

Page 10: Trouverl’info seance3

Principales caractéristiques des lecteurs de flux

• service en ligne /logiciel• Intégration navigateur • Catégorisation et regroupement des flux dans des

dossiers• Archivage des flux• Compilation de flux• Tris facilités • Synchronisation • Création de flux spécifiques à partir d’articles choisis• Paramétrage du nb d’articles à afficher• Renommage des intitulés• Recherche d’une occurrence dans les flux• Filtrage des flux entrants par mot-clef• Import d’une collection de flux au format OPML

Page 11: Trouverl’info seance3

Modes d’accès et ergonomie

• présentation classique (des flux avec plusieurs fenêtres, dont l’une présente l’arborescence des dossiers),

• OU

• présentation type “tableau de bord” mise à la mode par Netvibes (le flux n’est qu’un matériau parmi d’autres)

Page 12: Trouverl’info seance3

OPML :LA formule pour stocker et échanger des flux RSS

•les fichiers OPML (Outlined Processor Markup Language) rassemblent en 1 liste structurée différents flux en 1 seul fichier récapitulatifsauvegarde et échange de flux

•Ex: Tic-tOCs est un répertoire thématique de flux RSS spécialisé dans la lecture des sommaires de revues scientifiques

•Voir les répertoires thématiques OPML

Page 13: Trouverl’info seance3

Générer des flux pour la veille

• Soit à partir de pages qui n’en disposent pas• Soit à partir de plrs flux• Soit à partir d’articles sélectionnés dans différents flux• Type d’outils (cas n°1):

Syndic8 (l’annuaire leader de fils RSS) Feed 43 RssMecano (moteur d’extraction RSS à partir de pages web FR

payant) Ponyfish, FeedFire

• Type d’outils(cas n°2) Rssmix Crossfeeds Yahoo!Pipes (la Ferrari) avec 1 compte yahoo

• Type d’outils(cas n°3) Google Reader

Page 14: Trouverl’info seance3

B/Netvibes (outil de diffusion de l’info)

•Agrégateur de flux très utilisé (notamment en France) / techno AJAX “dashboard”

•Interface souple et intuitive•Principe de la page personnalisable où

stocker différents contenus : flux, derniers mails reçus, podcasts, agenda, météo, images, favoris et autres widgets

•Principe : widget (window+gadget) et glisser/déposer

•Autres types d’outils dans cette gamme: iGoogle

Page 15: Trouverl’info seance3

IV/Typologie des agents de surveillance € !

Logiciel permettant de signaler auto les modifications d’une page web

• Surveillance pages, pages liées, sites, pages protégées

• Mode de filtrage : mots-clés, images, liens• Alertes mail• Indications des changements, surlignement des

changements• Statistiques des changements• Délais de notification

Logiciel plus adapté pour surveiller une bdd

Page 16: Trouverl’info seance3

Nombreux outils

Logiciels spécialisés

• Website Watcher• KB Crawl (plus cher)• Webmon, Vigilus

• Gratuits ou peu chers • Monopostes ou en ligne

Modules pour grandes structures

• Digimind• AMI Software• Iscope• Arisem

• Bcp plus coûteux• Client-serveur

Page 17: Trouverl’info seance3

V/Les services de « monitoring » mots-clés

Automatiser une requête sur le web c-a-d recevoir automatiquement et à intervalles réguliers (par mail, sur une page dédiée, sur son lecteur RSS) les nvx résultats d’une recherche sur un moteur, ou bdd

• Choix judicieux des mots clefs ou expressions !!!

• Eviter les termes trop vagues (sinon on est inondé par 1 flot d’informations)

Page 18: Trouverl’info seance3

Quels outils ?

• Métamoteurs « clients » : peu d’acteurs et plus trop actualisés :Copernic (historique) disponible sur le web

• Outils automatisés sur Google (un peu dépassé): Google Alertes (4 types d’alertes proposées Actualités, Web,

Actualités et web, Forums) FeedMySearch (constituer un flux RSS à partir d’une

requête sur Google)

• Outils automatisés sur Yahoo :Yahoo! • La gamme Twitter

Search twitter.com (créer un flux sur 1 requête) Twitt(url)y.com (plus l’url est mentionnée ds 1 twitt plus il

semble intéressant…) TweetMeme.com (tri des url twittés…) Twittley.com (permet de suivre l’actualité anglo qui met à

disposition des flux RSS par catégorie)

Page 19: Trouverl’info seance3

Pour conclurePoints de repère pour l’exploitation de l’information collectée

• Réflexion sur la source (infos à supprimer)

• Alertes à transmettre à différents clients

• Information à conserver pour réutilisation ultérieure

• Information à faire passer chez un expert ou ds 1 circuit de « conversation /échanges » pour validation

• Information à archiver

Page 20: Trouverl’info seance3

Webographie

• http://www.outilsfroids.net/ (Christophe Deschamps, Veilleur /ADBS)

• Sur Google « flux RSS armelle thomas »(powerpoint présenté à l’ADBS en fev .2010)