Vous ne pourrez plus vous en passer - blogs

6
O UTIL S D U MOI S P. 26 Veille magazine • Avril - Mai 2005 •32 O UTIL S D U MOI S P. 26 Les outils de capture et de gestion de l’information électronique Vous ne pourrez plus vous en passer ! Ils? Ce sont les assistants personnels de management de l'information web, et plus largement, les outils de capture et de gestion de l'information électronique. En effet, si faire un usage professionnel de l'internet conduit bien sûr à isoler du contenu pertinent, la recherche n'est qu'une étape : reste à optimiser le classement pour un usage ultérieur, phase d'intervention de ces outils. Le concept n'est pas nouveau, puisque dès 1999, I-harvest (disparu depuis) permettait de stoc- ker et d'organiser des ressources web, bientôt suivi par Cogitum ou Surfsaver ; mais depuis deux ans, ces utilitaires se perfectionnent et élargissent leur rayon d'action : ils s'imposent de plus en plus aux "tra- vailleurs du savoir" qui collectent des informations. Voyons donc leurs fonctions clés par l'étude d'un échantillon international de logiciels : américains (Surfsaver et Furl), allemand (ContentSaver), israé- lien (NetSnippets), anglais (Onfolio), russe (MyFavorites)… et français (Egems et Syfacil). Dans cette série, notons que Furl reste malheureusement le seul à fonctionner non seulement sous Windows, mais aussi sous Mac. Ce ne sont ni des gestionnaires de signets (même si cette tâche peut rentrer dans leurs attributions), ni des gestionnaires de fichiers classiques, ni des aspirateurs de sites web (même si certains commencent à capturer des sites entiers d'un simple clic), ni des moteurs d'indexation et de recherche (même s'ils en intègrent un pour la plupart), ni des logiciels documentaires au rabais … Par Armelle Thomas Capturer, organiser, commenter exporter ... L' internaute rencontrant une ressource intéres- sante en cours de navigation choisit générale- ment de l'imprimer, et/ou d'enregistrer la page web au format html, ou d'effectuer un copier- coller de la donnée utile dans un traitement de texte. En effet, le simple ajout de l'URL dans les favoris ne suffit pas à garantir la disponibilité future de la page. Mais ces solutions présentent des inconvénients de taille, notamment l'absence d'"informations sur l'information" (méta-données), la mauvaise copie de certains éléments comme les tableaux, et le repérage ultérieur aléatoire. Nos outils de capture simplifient toutes ces procédures.

Transcript of Vous ne pourrez plus vous en passer - blogs

OUTILSDU MOIS

P.26

Veille magazine • Avril - Mai 2005 •32

OUTILSDU MOIS

P.26

Les outils de capture et de gestion de l’information électronique

Vous ne pourrez plus vousen passer !

Ils?Ce sont les assistants personnels demanagement de l'information web, etplus largement, les outils de capture

et de gestion de l'information électronique. En effet,si faire un usage professionnel de l'internet conduitbien sûr à isoler du contenu pertinent, la recherchen'est qu'une étape : reste à optimiser le classementpour un usage ultérieur, phase d'intervention de cesoutils. Le concept n'est pas nouveau, puisque dès1999, I-harvest (disparu depuis) permettait de stoc-ker et d'organiser des ressources web, bientôt suivipar Cogitum ou Surfsaver ; mais depuis deux ans, cesutilitaires se perfectionnent et élargissent leur rayond'action : ils s'imposent de plus en plus aux "tra-vailleurs du savoir" qui collectent des informations. Voyons donc leurs fonctions clés par l'étude d'unéchantillon international de logiciels : américains(Surfsaver et Furl), allemand (ContentSaver), israé-lien (NetSnippets), anglais (Onfolio), russe(MyFavorites)… et français (Egems et Syfacil). Danscette série, notons que Furl reste malheureusementle seul à fonctionner non seulement sous Windows,mais aussi sous Mac.

Ce ne sont ni des gestionnaires de signets(même si cette tâche peut rentrer dans leursattributions), ni des gestionnaires de fichiersclassiques, ni des aspirateurs de sites web(même si certains commencent à capturerdes sites entiers d'un simple clic), ni desmoteurs d'indexation et de recherche (mêmes'ils en intègrent un pour la plupart), ni deslogiciels documentaires au rabais … Par Armelle Thomas

Capturer, organiser, commenter exporter ...

L'internaute rencontrant une ressource intéres-sante en cours de navigation choisit générale-ment de l'imprimer, et/ou d'enregistrer la

page web au format html, ou d'effectuer un copier-coller de la donnée utile dans un traitement detexte. En effet, le simple ajout de l'URL dans lesfavoris ne suffit pas à garantir la disponibilité futurede la page. Mais ces solutions présentent desinconvénients de taille, notamment l 'absenced'"informations sur l'information" (méta-données), lamauvaise copie de certains éléments comme lestableaux, et le repérage ultérieur aléatoire. Nosoutils de capture simplifient toutes ces procédures.

Veille magazine • Avril - Mai 2005• 33

En aspirant le contenu souhaitéIl peut s'agir d'un éléments d'information (phrase,paragraphe, image, lien, fichier pdf, etc.) ou d'unepage entière. La capture s'effectue soit par un clicdroit, soit via le menu ou la barre d'outils, soit parsimple glisser-déposer. Notons que certains outils serapprochent d'un "aspirateur" web en proposant decapturer non seulement la page web à l'écran, maiségalement les pages liées, voire l'ensemble du site(Content Saver, Onfolio, Surfsaver). D'autres, telsNetSnippets et Content Saver, ont un petit éditeurintégré pour modifier la page, l'annoter, surligner despassages, et permettent d'enregistrer des notes etdes idées en renseignant une fiche vierge.

En permettant de renseigner des champs d'indexationLe titre, l'URL, la date voire l'heure de la capturesont pré-renseignés. Des méta-données plus ou moinscomplètes sont proposées en fonction des outils etdes versions des logiciels (au moins pour les mots-clés et le commentaire). Net Snippets ou Onfoliovont jusqu'à proposer la création de champs supplé-mentaires pour mieux qualifier l'information.

En permettant une navigation et unerecherche aisées dans les contenusstockés.Il suffit de cliquer sur un dossier ou un élément d'in-formation pour voir son contenu s'afficher, commedans Surfsaver. Notons que, malgré de nettes amélio-rations, cet agent, certes peu onéreux (19,95 $),garde une ergonomie moyenne et des fonctionnalitésmal abouties. Certains logiciels permettent un repé-rage visuel supplémentaire pour les dossiers et leséléments d'information à base de drapeaux de cou-leurs, ou d'icônes spécifiques.

En s'intégrant aux navigateurs La plupart, tels Surfsaver ou MyFavorites ne supportent malheureuse-ment qu'Internet Explorer, d'autres sont plus ouverts commeNetSnippets, Onfolio ou Content Saver. Une fois le logiciel installé, unenouvelle icône apparaît : un clic suffit alors à ouvrir un cadre à gauchede l'écran, pour gérer et visualiser ses dossiers, le principe général res-tant un classement arborescent à base de catégories et de sous-catégo-ries. Cette fenêtre dispose d'un menu intégré plus ou moins développé,mais une barre d'outils spécifique est souvent disponible pour garder l'al-ternative plein écran.

Les fonctions de recherche ne sont pas oubliées, avec desmoteurs qui indexent le contenu des dossiers, et permettentdes recherches plein texte et sur champs avec desfonctionnalités d'un niveau souvent correct.

En générant des rapports

Si l'export est globalement géré partous les logiciels de notre échantillon(les modules et formats proposés fai-sant alors la différence), Net Snippetsapparaît l'un des outils les plus perfor-mants pour la diversité des capturespossibles et l'ergonomie générale,mais aussi pour la sophisticationextrême des rapports générés. Cettedernière fonction n'est accessiblequ'avec la version professionnelle à129,95 $, mais signalons que NetSnippets est le seul proposant uneversion gratuite (usage personnel etprofessionnel) non limitée dans letemps et malgré tout très fonction-nelle.

Veille magazine • Avril - Mai 2005 • 34

Des outils qui surfent sur la vague RSS

RSS, vous connaissez ? Ce format de fichier dérivé deXML, qui permet de récupérer le nouveau contenud'un site (articles, actualités) pour peu que l'ondispose d'un lecteur capable d'interpréter cesfichiers. Depuis peu, ces "agrégateurs" d'un nouveaugenre, se téléchargent certes en tant qu'applicationsindépendantes, mais jouent de plus en plus la cartede l'intégration : avec les navigateurs web, les ges-tionnaires de courrier électronique ou les agents d'a-lerte pour la veille. Les outils de capture investissentégalement ce créneau porteur, tels Onfolio etContent Saver. Onfolio automatise même la publica-tion de documents sur un blog ou un serveur web : Sila version personnelle à 29,45 $ intègre le lecteurRSS et les fonctions les plus simples de capture et

d'organisation de l'information, il faut néanmoinspasser à la version professionnelle à 99,95 $ pouraller plus loin (aspiration d'un site, recherche avan-cée, partage des collections, publication automati-sée, , etc.). Content Saver est proposé en une seuleversion à 39,90$.

Les "services web" permettent de travailler en lignesans télécharger de logiciel, contrairement aux outilsvus précédemment. Furl, conçu par l'américain MichaelGiles et racheté depuis par Looksmart, permet ainsidepuis début 2004 de se constituer gratuitement enligne une base d'archives de pages web, organisée endossiers, et exportable. Celle-ci est alimentée au fil desnavigations d'un simple clic sur un bouton inséré sur lenavigateur ("bookmarket"), ou via une barre d'outils spé-cifique à télécharger. Une fiche descriptive pré-rensei-gnée est alors proposée, le champs "clipping" n'étantrempli que si on a préalablement sélectionné une por-tion de texte sur la page.

L'alternative "services web" facilite les notions de par-tage et de "navigation sociale", que Furl exploitent àfond : A moins que la page n'ait un statut privé, elleapparaîtra sur la page d'accueil de Furl dans les "latestentries" avec les entrées les plus populaires du jour. Parailleurs, l'usager peut aussi renvoyer les internautesvers sa page web d'archives "publiques", constituer un filRSS des derniers ajouts, prévoir un envoi quotidien demail. Le système de notation permet de consulter les

entrées les plus populaires et de sophistiquer le tri depertinence lors des recherches sur les bases privées etpubliques.Egalement gratuit jusqu'à 3 Mo de stockage, le récentservice français Syfacil permet d'organiser en ligne ducontenu web et intègre un lecteur RSS. Il joue aussi lacarte de la gestion de fichiers de tous types (prévoiralors du haut débit pour des délais corrects !).

L'alternative "services web"

Veille magazine • Avril - Mai 2005 • 35

De la capture web auknowledge manage-ment…Issus de l'internet, ces outils affichent aujourd'hui denouvelles ambitions : il ne s'agit plus seulement decapturer et d'organiser du contenu web, mais degérer tous types de données électroniques présentessur le poste de travail d'un usager. Dans le cadre d'unprojet particulier, on peut ainsi rassembler des docu-ments dans différents formats dispersés sur son ordi-nateur (pages web, notes, fichiers pdf ou word,mails, graphiques, tableaux ou dessins, photos, tex-tes, images, sons, clips vidéos…) et les agréger dansson logiciel. Des outils comme Net Snippets ou Egems permet-tent pour les formats non reconnus directement decapturer l'écran (en le redimensionnant éventuelle-ment) et le contenu du presse-papier, et de les orga-niser dans le même système arborescent. L'astuce :une barre d'outils toujours présente dans la barredes tâches de windows (Net Snippets) ou une fenêtreflottante qui se réduit à un logo (Egems).

Quant au partage d'informations......il est souvent prévu grâce à plusieurs formats d'ex-ports, soit propriétaires pour s'échanger des docu-ments, des dossiers ou des bases de données complè-tes avec des collègues disposant aussi du logiciel,soit plus communs ou plus ouverts. Pour un travail en réseau, Onfolio propose d'enregist-rer une "collection" sur un répertoire partagé du ser-

veur, plusieurs personnes pouvantalors y contribuer. Un fil RSS peutmême y être associé !Pour se glisser dans la catégoriedes outils de knowledge manage-ment, il ne reste finalement plusqu'à proposer une version serveur.C'est le pari réalisé par la sociétéfrançaise Alogic (lire l’articleFOCUS SUR...) qui développe,

rappelons-le “l'atelier logiciel" Aperto Libro. A côtéde eGems Collector Pro (65,92 € la license), ontrouve aussi Gems Entreprise, développé pour êtreune plate-forme indépendante accessible grâce à unnavigateur standard. Dotés du client EgemsEntreprise Pro, des utilisateurs peuvent simultén-ment récupérer et partager tous types de documents(indépendamment du type de contenu ou des limitesgéographiques). NetSnippets dispose également uneversion serveur, et Syfacil propose sa technologie auxentreprises.Sans aller jusque là, nous conseillons à nos lecteursd'opter au moins pour un assistant personnel et dedécouvrir ainsi un nouveau confort de travail : ali-menter simplement une base de connaissances per-sonnelle toujours à portée de clic.

Armelle Thomas

Les bookmarklets sont des

programmes contenus dans

des liens, c'est à dire des élé-

ments de code java qui se

mettent dans les favoris

comme des URL classiques,

mais qui déclenchent quand

on les appelle une action

particulière, souvent l'ou-

verture d'une fenêtre "pop-

up". L'intérêt est qu'ils ne

nécessitent aucun téléchar-

gement.

Produits cités

Cogitum co-citer (Cogitum) www.cogitum.comContent Saver (Macropool) www.macropool.com Egems (Alogic) www.alogic.fr Furl (Looksmart) www.furl.net

ou www.looksmart.com My Favorites (Arcadia) www.bookmark-manager.netNet Snippets (Net Snippets) www.netsnippets.com Onfolio (Onfolio) www.onfolio.com Surfsaver (AskSam Systems) www.surfsaver.com Syfacil (Com'onSoft) www.syfacil.com

Veille magazine • Avril - Mai 2005 • 36

�� FOCUS SUR •••

AlogicLa conjonction du renseignementet de l’informatique

formatique IBM."En 1999, nousdécidions de rassembler toutnotre savoir-faire dans ledomaine du renseignement,mode opératoire, outils logi-ciels, et ce fut la créationd'Alogic, totalement dédiée àl'acquisition, le traitement,l'exploitation du contenu et dusens." Les effectifs de Alogicsont des effectifs de R&D, 11personnes, mais la société uti-lise toutes les ressources du

groupe COFRAMI, 2000 personnes.Une des spécialités de COFRAMI atoujours été les systèmes de miseà disposition d'information dans lesecteur militaro-industriel, l'inter-prétation de bases de données,l'acquisition de données par lessatellites, jusqu'à la productiond'informations et de connaissan-ces pour le management desentreprises. "Cette renaissance en 1999marque un pas considérable. Avecla compréhension méthodologiquede ce que c'est que partir d'unematière première comme l'infor-mation pour aboutir à un produitmanufacturé de renseignement etd'information pertinente, nousavons réussi à créer des logicielsaccompagnant le mouvement évo-lutif rapide des traitements del'information."

Alogic est l'aboutissementd'une aventure qui a com-mencé en 1968, explique

Robert Guillaumot, Président deAlogic, Vice-président deCOFRAMI. "J'ai alors créé une despremières SSII françaises, enmême temps que nous fondions

une chambresyndicale quis'appelle leS y n t e cInformatique."Cette aventurevenait d'uneconjonction qui

va se révéler payante ultérieure-ment entre un savoir-faire qui estcelui de la production de rensei-gnements : - Robert Guillaumot aété dans le domaine militaire au2ème Bureau de l'Armée, puis undes fondateurs de SVP-, avec l'in-

Alogic est la fin et le débutd'une aventure qui acommencé en 1968. Cettebusiness unit de COFRAMIInforama rassemble tout ceque le groupe sait fairedans le domaine durenseignement. Elle estconstruite autour de deuxlignes de produit, ApertoLibro et E-gems. ApertoLibro a pour objet deproduire des info-gemmes.E-gems rend ces info-gemmes, consommables,compréhensibles,diffusables, exploitablespour les besoins desutilisateurs.

“...nous avons réussi à créer des logiciels accompagnant le mouvementévolutif rapide des traitements de l'information.”

Veille magazine • Avril - Mai 2005• 37

Pour Robert Guillaumot, l'analogie de l'industrie pétrolière est particulièrement éclairante : identi-fication des possibilités de gisement, premier sondage pour vérifier la richesse du contenu, déci-

sion d'exploiter, exploitation de production, stockage. Toute cette partie préliminairenécessite une ligne d'outils dont dispose Alogic. Ensuite, pour l'information brute, il y aune opération de stockage, d'accession, d'extraction, de raffinage, pour fournir au fur età mesure des contenus différents qui peuvent être à nouveau exploités. Cela correspondaux colonnes de raffinage et de distillation. "Nous produisons des info-gemmes, desjoyaux , des diamants d'information qui apparaissent à la fin de ce processus de raffina-ge et de distillation."Dans les deux lignes de produit qui existent chez Alogic, Aperto Libro a pour objet deproduire des info-gemmes. C'est tout le traitement en amont. C'est une colonne de dis-tillation qui aboutit avec les tuyaux qu'il faut, à pouvoir donner à quelqu'un la possibilité

d'exploiter un contenu auquel il accède. Quand on a ces diamants, il va falloir les traiter de tellemanière qu'ils puissent être consommables, compréhensibles, diffusables, exploitables pour lesbesoins des utilisateurs. C'est l'univers de E-gems. Les deux technologies sont des technologies depointe. E-gems est brevetée aux Etats Unis. C'est un produit reconnu et apprécié pour son excel-lence. Principale référence : 750000 élèves de Californie sont équipés de e-gems pour garder,classer, utiliser ultérieurement leurs joyaux. La deuxième référence est Pearson qui a choisi e-gem pour en faire cadeau à toute personne qui achète un ouvrage édité par Pearson.

L’analogie de l’industrie pétrolière• Robert Guillaumot

Collector,produit grand public"Je suis tombé amoureux du pro-duit qui n'a pas d'équivalent, pourgérer l'information. Il est pluspratique que google desktop qui,induit un traitement a posteriori.C'est instantané, pas de manipu-lation contraignante, je l'utilisemême pour l'information des e-mails que je reçois,". confieCharles Nouÿrit chef produitseGems.La ligne E-gems est composée detrois produits, Collector etCollector Pro, Communicator etServer.Collector, produit grand public,s'adresse à toute personne qui abesoin de stocker, archiver, trai-ter de l'information. E-gem, petitdiamant pas intrusif, va collecterexactement ce qui est sélec-tionné et relever automatique-ment les bibliographies. Il a desrépertoires et sous-répertoires

comme sous Windows, où peu-vent être stockées les pépitesd'information. Il fonctionne sousPDF, sous Excel, Internet, n'im-porte quel browser. A l'intérieur,un moteur de recherche permetd'effectuer une deuxième recher-che.Communicator est la même baseque Collector auquel on a rajoutétous les outils nécessaires pouravoir une base sécurisée et pri-véeVous entrez dans votre commu-nauté les gems que vous créez,vous pouvez les partager si vousle souhaitez; vous avez tous lesoutils de communication, instantmessaging, téléphonie sur IP,visioconférence; la transmissionde l'information se fait en peer topeer.Vous pouvez partager des docu-ments en plus des gems. Toutfonctionne en drag and drop,

glisser-déposer. Tout est sécurisé,crypté. Un système garantit quele système envoyé est l'équiva-lent de l'original. Tout fonc-tionne par système d'invitation-validation, pas d'intrusion. Celapermet d'augmenter la producti-vité des communautés de travail,et c'est surtout pratique pourceux qui sont délocalisés. Le sys-tème de prise de contrôle de PCà distance est particulièrementutile aux administrateurs réseau.La version Serveur s'adresse àune très large communauté, pourles très gros groupes et accompa-gne idéalement l'accord récentde Google avec les grandesbibliothèques américaines. Il per-met à des centaines de milliersde personnes, de se connecteravec un login. Collector etCollector pro, sont diffusés uni-quement sur Internet.Mireille Boris