Trouverl’info seance3
-
Upload
gouzi-francoise -
Category
Education
-
view
349 -
download
0
Transcript of Trouverl’info seance3
Séance 3 Mieux trouver l’information utile sur le web (les outils de la veille)
DUT Gestion de l’Information et du Document (IUT Ponsan,Toulouse 3)
Formation continue 2010-2011Françoise Gouzi Quiroz [email protected]
Plan du thème 3
•I/Le contexte de la veille sur le web•II/Une méthodologie•III/Panorama des outils gratuits
▫Les flux RSS ou agrégateurs de flux▫Netvibes
•IV/Typologie des agents de surveillance (payants)
•V/Les services de monitoring mots-clés
I/Le contexte de la veille sur le web
•Volume exponentiel des sources et des outils
•Hétérogénéité, fragmentation de l’info•Renouvellement continuel•Info multilingue•Fiabilité ? (Web social…)•Google (moteur sacré) mais aussi outils
thématiques
•Recherche automatisée = outils qui vont prendre en charge cette tâche répétitive et sans gde VA (aller voir pour nous « ce qui a changé » sur le web)
•Du plugin au logiciel de surveillance de plusieurs centaine de milliers d’euros
•Critères de choix : besoins, budget, caractère personnel ou professionnel de la veille , nb de personnes impliquées (ex veille emploi, e-réputation, ou mission de veille concurrentielle pour Danone ou Airbus!)
A quoi ça sert ?
•Aide à la décision stratégique, •à l'innovation •à l'orientation de la recherche •au développement.
II/Une méthodologie
•Une organisation sans failles•Anticiper•Objectif de la surveillance, sujets
concernés•Eclaircir les besoins avec le décideur•Facteur temps : un calendrier
prévisionnel•Du sourcing (Identification et sélection des
sources)•Automatisation de la surveillance
(paramétrages, filtres mots-clés, équations de recherche pour les moteurs et bdd)
•Collecte, évaluation, diffusion
III/Panorama des outils gratuits
•Choix des outils /convaincre !•L’automatisation de la collecte passe par 3
options clefs (svt complémentaires):▫L’abonnement à des flux d’information▫La surveillance des modifications sur des
pages/site webs▫Le « monitoring mots-clés » (résultats
reçus rég. suite à une requête sur un moteur ou une bdd)
A/Les flux RSS ATOM XML
• Really Simple Syndication ou Rich Site Summary repose sur le format XML (dans sa version 2.0)
• Des formats « non RSS » c’est le cas de ATOM• RSS décrit des éléments textuels à l’aide de
balises (titre, date, contenu, auteur) qui pourront être repris par des logiciels spécifiques
• Le lecteur est informé des nvlles informations ou actualités qui lui parviennent en mode push dans son lecteur RSS ou logi. agrégateur (des infos qui peuvent venir de multiples sources)
Les lecteurs ou agrégateurs de flux RSS ou comment lire les flux d’actualités ?
•Démarche automatiqueIE/Firefox, le navigateur détecte automatiquement les pages XML présentes sur un site et propose différents lecteurs :Netvibes, My Yahoo, Google… intégrés nativement à la plupart des applications 2.0 (cas des CMS, Spip)
•Démarche manuelle : clic droit sur le lien RSS et copier/coller dans le logiciel lecteur, plugin ou log. de messagerie que l’on installera sur son poste Sage, Feedreader, RSSBandit, Feeddemon, RSS Owl, Thunderbird ou Outlook.
Principales caractéristiques des lecteurs de flux
• service en ligne /logiciel• Intégration navigateur • Catégorisation et regroupement des flux dans des
dossiers• Archivage des flux• Compilation de flux• Tris facilités • Synchronisation • Création de flux spécifiques à partir d’articles choisis• Paramétrage du nb d’articles à afficher• Renommage des intitulés• Recherche d’une occurrence dans les flux• Filtrage des flux entrants par mot-clef• Import d’une collection de flux au format OPML
Modes d’accès et ergonomie
• présentation classique (des flux avec plusieurs fenêtres, dont l’une présente l’arborescence des dossiers),
• OU
• présentation type “tableau de bord” mise à la mode par Netvibes (le flux n’est qu’un matériau parmi d’autres)
OPML :LA formule pour stocker et échanger des flux RSS
•les fichiers OPML (Outlined Processor Markup Language) rassemblent en 1 liste structurée différents flux en 1 seul fichier récapitulatifsauvegarde et échange de flux
•Ex: Tic-tOCs est un répertoire thématique de flux RSS spécialisé dans la lecture des sommaires de revues scientifiques
•Voir les répertoires thématiques OPML
Générer des flux pour la veille
• Soit à partir de pages qui n’en disposent pas• Soit à partir de plrs flux• Soit à partir d’articles sélectionnés dans différents flux• Type d’outils (cas n°1):
Syndic8 (l’annuaire leader de fils RSS) Feed 43 RssMecano (moteur d’extraction RSS à partir de pages web FR
payant) Ponyfish, FeedFire
• Type d’outils(cas n°2) Rssmix Crossfeeds Yahoo!Pipes (la Ferrari) avec 1 compte yahoo
• Type d’outils(cas n°3) Google Reader
B/Netvibes (outil de diffusion de l’info)
•Agrégateur de flux très utilisé (notamment en France) / techno AJAX “dashboard”
•Interface souple et intuitive•Principe de la page personnalisable où
stocker différents contenus : flux, derniers mails reçus, podcasts, agenda, météo, images, favoris et autres widgets
•Principe : widget (window+gadget) et glisser/déposer
•Autres types d’outils dans cette gamme: iGoogle
IV/Typologie des agents de surveillance € !
Logiciel permettant de signaler auto les modifications d’une page web
• Surveillance pages, pages liées, sites, pages protégées
• Mode de filtrage : mots-clés, images, liens• Alertes mail• Indications des changements, surlignement des
changements• Statistiques des changements• Délais de notification
Logiciel plus adapté pour surveiller une bdd
Nombreux outils
Logiciels spécialisés
• Website Watcher• KB Crawl (plus cher)• Webmon, Vigilus
• Gratuits ou peu chers • Monopostes ou en ligne
Modules pour grandes structures
• Digimind• AMI Software• Iscope• Arisem
• Bcp plus coûteux• Client-serveur
V/Les services de « monitoring » mots-clés
Automatiser une requête sur le web c-a-d recevoir automatiquement et à intervalles réguliers (par mail, sur une page dédiée, sur son lecteur RSS) les nvx résultats d’une recherche sur un moteur, ou bdd
• Choix judicieux des mots clefs ou expressions !!!
• Eviter les termes trop vagues (sinon on est inondé par 1 flot d’informations)
Quels outils ?
• Métamoteurs « clients » : peu d’acteurs et plus trop actualisés :Copernic (historique) disponible sur le web
• Outils automatisés sur Google (un peu dépassé): Google Alertes (4 types d’alertes proposées Actualités, Web,
Actualités et web, Forums) FeedMySearch (constituer un flux RSS à partir d’une
requête sur Google)
• Outils automatisés sur Yahoo :Yahoo! • La gamme Twitter
Search twitter.com (créer un flux sur 1 requête) Twitt(url)y.com (plus l’url est mentionnée ds 1 twitt plus il
semble intéressant…) TweetMeme.com (tri des url twittés…) Twittley.com (permet de suivre l’actualité anglo qui met à
disposition des flux RSS par catégorie)
Pour conclurePoints de repère pour l’exploitation de l’information collectée
• Réflexion sur la source (infos à supprimer)
• Alertes à transmettre à différents clients
• Information à conserver pour réutilisation ultérieure
• Information à faire passer chez un expert ou ds 1 circuit de « conversation /échanges » pour validation
• Information à archiver
Webographie
• http://www.outilsfroids.net/ (Christophe Deschamps, Veilleur /ADBS)
• Sur Google « flux RSS armelle thomas »(powerpoint présenté à l’ADBS en fev .2010)