LB Smile GED Open Source

85
Livre blanc ___________________________ GED 2011-2012

description

guide

Transcript of LB Smile GED Open Source

  • Livre blanc ___________________________

    GED 2011-2012

  • WW

    W.S

    MIL

    E.F

    R

    Page 2

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    PREAMBULE

    SMILE

    Smile est une socit dingnieurs experts dans la mise en uvre de solutions open source et lintgration de systmes appuys sur lopen source. Smile est membre de lAPRIL, lassociation pour la promotion et la dfense du logiciel libre, du PLOSS le rseau des entreprises du Logiciel Libre en Ile-de-France et du CNLL le conseil national du logiciel libre.

    Smile compte prs de 600 collaborateurs dans le monde, dont plus de 500 en France (novembre 2011), ce qui en fait le premier intgrateur franais et europen de solutions open source.

    Depuis 2000, environ, Smile mne une action active de veille technologique qui lui permet de dcouvrir les produits les plus prometteurs de lopen source, de les qualifier et de les valuer, de manire proposer ses clients les produits les plus aboutis, les plus robustes et les plus prennes.

    Cette dmarche a donn lieu toute une gamme de livres blancs couvrant diffrents domaines dapplication. La gestion de contenus (2004), les portails (2005), la business intelligence (2006), la virtualisation (2007), la gestion lectronique de documents (2008), les PGIs/ERPs (2008), les VPN open source (2009), les Firewall et Contrle de flux (2009), les Middleware orients messages (2009), lecommerce et les Rseaux Sociaux d'Entreprise (2010) et plus rcemment, le Guide de lopen source et NoSQL (2011). Chacun de ces ouvrages prsente une slection des meilleures solutions open source dans le domaine considr, leurs qualits respectives, ainsi que des retours dexprience oprationnels.

    Au fur et mesure que des solutions open source solides gagnent de nouveaux domaines, Smile sera prsent pour proposer ses clients den bnficier sans risque. Smile apparat dans le paysage informatique franais comme le prestataire intgrateur de choix pour accompagner les plus grandes entreprises dans ladoption des meilleures solutions open source.

    Ces dernires annes, Smile a galement tendu la gamme des services proposs. Depuis 2005, un dpartement consulting accompagne nos clients, tant dans les phases davant-projet, en recherche de solutions, quen accompagnement de projet. Depuis 2000, Smile dispose dun studio graphique, devenu en 2007 Smile Digital agence interactive, proposant outre la cration graphique, une expertise e-marketing, ditoriale, et interfaces riches. Smile dispose aussi dune agence spcialise dans la TMA (support et lexploitation des applications) et dun centre de formation complet, Smile Training. Enfin, Smile est implant Paris, Lille, Lyon, Grenoble, Nantes, Bordeaux, Poitiers, Aix-en-provence et Montpellier. Et prsent

    galement en Espagne, en Suisse, au Benelux, en Ukraine et au Maroc.

  • WW

    W.S

    MIL

    E.F

    R

    Page 3

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    QUELQUES REFERENCES DE

    SMILE

    SMILE est fier davoir contribu, au fil des annes, aux plus grandes ralisations Web franaises et europennes. Vous trouvez ci-dessous quelques clients nous ayant adress leur confiance.

    Gestion documentaire

    Generali, HEC, Serimax, Pierre Audoin Consultant, Alstom Power services, NetasQ, CS informatique, SNCF - Direction du matriel, Mazars, EDF R&D, EDF Nuclaire, Conseil Rgional du Centre, Leroy Merlin, Primagaz, Renault F1, INRIA, Ministre belge de la Communaut Franaise, INRIA, APAVE, UCFF...

    Sites Internet

    EMI Music, Salon de lAgriculture, Mazars, Areva, Socit Gnrale, Gtes de France, Patrice Pichet, Groupama, Eco-Emballage, CFnews, CEA, Prisma Pub, Volia, NRJ, JCDecaux, 01 Informatique, Spie, PSA, Boiron, Larousse, Dassault-Systmes, Action Contre la Faim, BNP Paribas, Air Pays de Loire, Forum des Images, IFP, BHV, ZeMedical, Gallimard, Cheval Mag, Afssaps, Benetaux, Carrefour, AG2R La Mondiale, Groupe Bayard, Association de la Prvention Routire, Secours Catholique, Canson, Veolia, Bouygues Telecom, CNIL

    Portails, Intranets et Systmes dInformation

    HEC, Bouygues Telecom, Prisma, Veolia, Arjowiggins, INA, Primagaz, Croix Rouge, Eurosport, Invivo, Faceo, Chteau de Versailles, Eurosport, Ipsos, VSC Technologies, Sanef, Explorimmo, Bureau Veritas, Rgion Centre, Dassault Systmes, Fondation dAuteuil, INRA, Gaz Electricit de Grenoble, Ville de Niort, Ministre de la Culture, PagesJaunes Annonces

    E-Commerce

    Krys, La Halle, Gibert Joseph, De Dietrich, Adenclassifieds, Macif, Furet du Nord, Gtes de France, Camif Collectivit, GPdis, Projectif, ETS, Bain & Spa, Yves Rocher, Bouygues Immobilier, Nestl, Stanhome, AVF Primdical, CCI, Pompiers de France, Commissariat lEnergie Atomique, Snowleader, Darjeeling

  • WW

    W.S

    MIL

    E.F

    R

    Page 4

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    ERP et Dcisionnel

    Veolia, La Poste, Christian Louboutin, Eveha, SunR, Home Cin Solutions, Pub Audit, Effia, France 24, Publicis, iCasque, Nomadvantage, Gets, Nouvelles Frontires, Anevia, Jus de Fruits de Moora, Espace Loggia, Bureau Veritas, Skyrock, Lafarge, Cadremploi, Meilleurmobile.com, Groupe Vinci, IEDOM (Banque de France), Carrefour, Jardiland, Trsorerie Gnrale du Maroc, Ville de Genve, ESCP, Sofia, Faiveley Transport, INRA, Deloitte, Yves Rocher, ETS, DGAC, Generalitat de Catalunya, Gilbert Joseph, Perouse Mdical

    Infrastructure et Hbergement

    Agence Nationale pour les Chques Vacances, Pierre Audoin Consultants, Rexel, Motor Presse, OSEO, Sport24, Eco-Emballage, Institut Mutualiste Montsouris, ETS, Ionis, Osmoz, SIDEL, Atel Hotels, Cadremploi, SETRAG, Institut Franais du Ptrole, Mutualit Franaise

    Consulter nos rfrences, en ligne, ladresse : http://www.smile.fr/clients.

  • WW

    W.S

    MIL

    E.F

    R

    Page 5

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    CE LIVRE BLANC

    Ce document a pour objectifs de prsenter notre approche de la gestion documentaire, notamment par rapport la gestion de contenu, et de vous apporter une aide au choix d'une solution logicielle pour vos projets.

    Pour cela, nous vous proposons une analyse des rponses apportes par une slection de solutions open source des problmatiques concrtes, ainsi quune approche en termes de mthodes pour vous orienter dans la mise en uvre de votre projet.

    Il ne sagit ni dun rpertoire de solutions, ni dune approche thorique de la gestion de contenu documentaire, mais bien dune confrontation entre la ralit des besoins et le march de la GED (Gestion Electronique de Documents) open source.

    Si les solutions open source rpondent trs bien de nombreux besoins. Le savoir-faire spcifiquement documentaire demeure, avant les outils, le principal enjeu des projets de Gestion Electronique de Documents ou de Gestion de Contenus d'Entreprise (ECM).

    Ainsi, cet ouvrage sefforce de runir :

    une approche gnrale des notions sous-jacentes de la gestion documentaire, fondements mthodologiques des projets de GED

    une description des grandes fonctionnalits attendues pour ce type de projet et de leurs enjeux

    un recensement des principales solutions open source de gestion de contenu documentaire

    une prsentation des meilleurs outils, une valuation de leurs forces, de leurs limites, de leur maturit

    Ce livre blanc est le rsultat de retours dexpriences collectifs. Nous serions trs heureux

    dchanger avec vous sur le sujet.

    Nhsitez pas nous transmettre vos avis et valuations sur les produits prsents dans ce livre blanc. Une seule adresse : [email protected]

  • WW

    W.S

    MIL

    E.F

    R

    Page 6

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Version 1.0

    Paru peu aprs que Smile se soit intress au domaine de la GED open source, notamment avec larrive dune quipe ddie. Nous avons voulu proposer une vision de la gestion documentaire la fois structurante et oprationnelle pour permettre tout un chacun de se faire une opinion et disposer des atouts ncessaires la mise en place de son projet.

    Version 2.0

    Une mise jour importante, ralise entre octobre 2009 et janvier 2010. Mise jour des parties mthodologiques, des retours dexprience de notre ple d'expertise et des volutions du march.

    Dernire version, la 3.0

    La version 3.0 est dans la continuit des prcdentes, elle vise intgrer de nouveaux retours d'exprience et les nouveauts des applications. Nous avons galement modifi la liste des applications concernes. Les volutions concernent notamment :

    lapparition de versions SaaS (Software as a Service) pour la plupart des acteurs du march de lopen source,

    des amliorations de lintgration des applications avec le poste de travail,

    la mise jour des fonctions de chaque solution logicielle par rapport leurs volutions, ainsi que leurs feuilles de route,

    volution du panel des solutions compares : ajout de eXo DMS dans le panel initial et retrait de Freedom ECM du comparatif.

  • WW

    W.S

    MIL

    E.F

    R

    Page 7

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    LOPEN SOURCE EN

    ENTREPRISE

    Gestion documentaire non open source

    De nombreuses solutions existent et apportent leurs lots de fonctions et de rponses aux problmatiques de gestion documentaire.

    Parmi les plus connues dans le domaine non open source, on peut citer Documentum dEMC, FileNet dIBM, SharePoint de Microsoft, Open Text de la socit ponyme, Autonomy ou encore Ever Team du groupe Ever. Il sagit la plupart du temps de solutions haut de gamme, prsentes sur le march de la gestion de contenu depuis plus dune dcennie et ayant intgr au cours du temps de trs nombreuses fonctionnalits, bien au-del de la gestion de contenu documentaire.

    Le march des solutions propritaires de gestion documentaire suit la mme tendance que celui des outils de gestion de contenu Web, il y a quelques annes. Les solutions qui demeurent sont soit sur des marchs de niches et incorporent un savoir-faire mtier important, soit disposent dun positionnement trs haut de gamme, associ une notorit qui leur permet de continuer trouver des clients.

    Sur le fond, il faut comprendre quun diteur vocation exclusivement commerciale na pas que des intrts convergents avec ceux de ses clients. Certes, il volue dans un march concurrentiel, et son produit doit tre meilleur que ses concurrents, mais une fois sa position bien assise, lditeur peut faire lanalyse suivante :

    son produit doit tre ouvert, mais pas trop, pour garder la matrise du client (vendor lock-in)

    son produit doit tre performant, mais pas trop, car laccroissement du nombre de serveurs rime avec laugmentation du nombre de licences vendues

    son produit doit tre robuste, mais complexe, car il faut continuer vendre des prestations de service et du support

    son produit doit tre utile, mais surtout tre attractif. En effet, les dcideurs sont parfois loigns de la ralit du terrain et un produit trs bien packag, mais peu volutif ou ne rpondant pas de faon assez prcise aux attentes oprationnelles, peut alors apparatre comme la meilleure alternative, alors que sa valeur ajoute sera faible finalement

    Nous ne disons pas que les diteurs propritaires seraient machiavliques au point de rendre leurs produits moins bons quils ne pourraient ltre, mais que la priorit stratgique nest pas ncessairement mise sur ces caractristiques.

  • WW

    W.S

    MIL

    E.F

    R

    Page 8

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Lanalyse Magic Quadrant for Enterprise Content Management de 2009 (www.gartner.fr) fait mention de plusieurs tendances importantes par rapport loffre ECM.

    d'une part, le march de la gestion de contenu continue de crotre, alors que nombre de marchs informatiques se contracte

    dautre part, la gestion de contenu est de plus en plus perue comme un lment fondateur de la valeur ajoute des organisations. En consquence de quoi les solutions qui grent leurs actifs numriques (digital assets) doivent tre mieux intgres leur systme dinformation, mieux matrises par les quipes internes et coter moins cher maintenir et faire voluer

    Ce qui fait prcisment les forces des solutions open source.

    Le choix de lopen source

    Lopen source gagne chaque anne de nouveaux domaines dapplication, dans une extraordinaire dynamique. De nouveaux acteurs sont apparus, les diteurs open source et la pertinence de leur business model est aujourdhui dmontre. Les offres de solution sont de plus en plus matures, et sont de vraies alternatives aux solutions historiques, propritaires.

    Voyons quels sont les critres de choix, lis au caractre open source des solutions.

    Les bnfices conomiques sont parmi les premires raisons du choix de solutions open source. Mme si implmenter une solution ne signifie jamais un cot de projet nul, ne serait-ce quen temps de monte en comptence et dimplmentation. De nombreuses tudes constatent que le cot total des projets open source est significativement infrieur sur la dure. Les gains constats pouvant aller de 20 80% en fonction du degr de maturit de lopen source dans le domaine considr.

    Le cot de licence des solutions propritaires est bien entendu le premier facteur voqu : il constitue un investissement initial important, avant mme que ladquation de la solution ne soit prouve. Ceci est accentu par un prix de prestations qui tend tre moins lev dans le domaine de lopen source, car louverture du produit facilite la diffusion de la connaissance. Enfin, le cot de possession (maintenance, volution) tend galement tre moins important.

    Leur volution ne dpend pas de leur rentabilit ou de considrations marketing. Tant quune communaut sy intresse, le produit vivra.

    La diffusion du savoir-faire associ leur implmentation est garantie par des barrires quasi nulles son acquisition (tlchargement et documentation sont libres et accessibles).

    La standardisation, le respect des normes et standards, et louverture sont dans les gnes des dveloppeurs open source, qui cherchent avant tout ne pas rinventer la roue, et mettre en uvre des solutions performantes.

  • WW

    W.S

    MIL

    E.F

    R

    Page 9

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    La possibilit de faire des modifications dans les sources est fondamentale sur le plan thorique, mais risque sur le plan pratique. Ce nest donc pas en ces termes quil faut apprcier louverture, mais plutt dans la capacit accepter des extensions ou sinterfacer avec dautres applications.

    La prennit : la libre disposition des sources est un gage fondamental de prennit. Cela mme si il faut le souligner il nest nullement ncessaire que lentreprise cliente les matrise.

    En matire de prennit, le pire qui puisse arriver une solution open source, est une lente dsaffection de la part des communauts, gnralement au profit dune solution plus prometteuse. Ainsi, il est possible quil faille un jour changer de produit. Mais le phnomne est toujours lent et les utilisateurs ont le temps dorganiser la migration.

    Dans le cas dun diteur open source, il faut souligner aussi que, mme sil tait un jour dfaillant, il reste toujours possible pour une communaut de reprendre en main le produit et ses volutions, cest le principe des licences open source.

    Ainsi au fur et mesure que ces solutions arrivent maturit, le moindre cot nest plus le premier critre de choix. Et ce sont bien les autres qualits de lopen source que nous mettons le plus en avant.

  • WW

    W.S

    MIL

    E.F

    R

    Page 10

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    SOMMAIRE

    PREAMBULE ................................................................................................ 2

    SMILE ................................................................................................................................................................... 2

    QUELQUES REFERENCES DE SMILE ............................................................................................................................... 3

    CE LIVRE BLANC ....................................................................................................................................................... 5

    VERSION 1.0 ................................................................................................................................................. 6

    VERSION 2.0 ................................................................................................................................................. 6

    DERNIERE VERSION, LA 3.0 .............................................................................................................................. 6

    LOPEN SOURCE EN ENTREPRISE .................................................................................................................................. 7

    GESTION DOCUMENTAIRE NON OPEN SOURCE ...................................................................................................... 7

    LE CHOIX DE LOPEN SOURCE............................................................................................................................. 8

    SOMMAIRE .......................................................................................................................................................... 10

    GENERALITES ............................................................................................ 13

    POURQUOI UNE SOLUTION DE GESTION DOCUMENTAIRE ? ............................................................................................. 13

    PRESENTATION DES CONCEPTS ................................................................................................................................. 14

    DOCUMENT ELECTRONIQUE ............................................................................................................................ 14

    CONTENU ................................................................................................................................................... 14

    GESTION DOCUMENTAIRE .............................................................................................................................. 15

    GESTION DE CONTENU WEB ........................................................................................................................... 15

    GESTION DE CONTENU ................................................................................................................................... 16

    GESTION DE CONTENU MULTIMEDIA ................................................................................................................. 16

    WORKFLOW (BPM) ..................................................................................................................................... 17

    ARCHIVAGE RECORD MANAGEMENT (RM) .................................................................................................... 18

    TRAVAIL COLLABORATIF ................................................................................................................................. 18

    MOTEUR DE RECHERCHE ................................................................................................................................ 19

    DE LA GED A LECM ............................................................................................................................................. 19

    LE PERIMETRE DE LA GED .............................................................................................................................. 19

    LE CONCEPT DECM ..................................................................................................................................... 20

    EVOLUTION DES OUTILS ................................................................................................................................. 21

    TRANSLATION DES METHODES ......................................................................................................................... 21

    ENJEUX PRINCIPAUX DE LA GED ............................................................................................................................... 22

    STRUCTURATION DES METADONNEES ............................................................................................................... 23

    REFERENTIEL DE CLASSEMENT ......................................................................................................................... 24

    PRISE EN COMPTE DU CYCLE DE VIE .................................................................................................................. 24

    DEMATERIALISATION ET TRANSFORMATION NUMERIQUE ...................................................................................... 25

  • WW

    W.S

    MIL

    E.F

    R

    Page 11

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    LES SOLUTIONS DE GESTION DOCUMENTAIRE .......................................... 26

    ALFRESCO ............................................................................................................................................................ 26

    NUXEO ................................................................................................................................................................ 29

    EXO DMS ........................................................................................................................................................... 32

    KNOWLEDGE TREE ................................................................................................................................................. 34

    JAHIA .................................................................................................................................................................. 35

    MAARCH ............................................................................................................................................................. 36

    AUTRES SOLUTIONS ............................................................................................................................................... 38

    QUOTERO ................................................................................................................................................... 38

    LOGICALDOC .............................................................................................................................................. 39

    LES FONCTIONNALITES .............................................................................. 41

    METADONNEES .................................................................................................................................................... 41

    GESTION DES VERSIONS .......................................................................................................................................... 46

    RSERVATION (CHECK-IN/CHECK-OUT) ............................................................................................................. 46

    INCREMENTATION DES VERSIONS ..................................................................................................................... 46

    REFERENTIEL DE CLASSEMENT .................................................................................................................................. 47

    TYPES DE REFERENTIELS ................................................................................................................................. 47

    UTILISATION DES REFERENTIELS ....................................................................................................................... 50

    MOTEUR DE RECHERCHE ......................................................................................................................................... 53

    FONCTIONS DE BASE ..................................................................................................................................... 53

    FONCTIONS AVANCEES .................................................................................................................................. 54

    NUMERISATION .................................................................................................................................................... 56

    PILOTAGE DE SCANNER ET PRE INDEXATION ....................................................................................................... 56

    RECONNAISSANCE AUTOMATIQUE ................................................................................................................... 56

    GESTION DES DROITS.............................................................................................................................................. 58

    NIVEAUX DE GESTION .................................................................................................................................... 58

    GESTION DES PROFILS .................................................................................................................................... 58

    ANNUAIRE ET SSO ....................................................................................................................................... 59

    FONCTIONS COLLABORATIVES .................................................................................................................................. 60

    WORKFLOW ......................................................................................................................................................... 61

    WORKFLOW DOCUMENTAIRE .......................................................................................................................... 62

    WORKFLOW METIER OU BPM ........................................................................................................................ 62

    REGLES DE GESTION ............................................................................................................................................... 64

    FONCTIONS DE GESTION ................................................................................................................................ 64

    MOTEUR DE REGLES ...................................................................................................................................... 65

    GESTION DU CYCLE DE VIE ....................................................................................................................................... 67

    POLITIQUE DE CONSERVATION ......................................................................................................................... 67

    ARCHIVAGE ................................................................................................................................................. 67

  • WW

    W.S

    MIL

    E.F

    R

    Page 12

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    FORMAT DE FICHIER ...................................................................................................................................... 68

    ARCHIVAGE NUMERIQUE A VALEUR PROBANTE ................................................................................................... 70

    GESTION DES DOSSIERS ........................................................................................................................................... 71

    NOTIONS RELATIVES A LA GESTION DE DOSSIERS ............................................................................................ 71

    LES OUTILS DE LA GESTION DE DOSSIERS ............................................................................................................ 72

    IMPORT/EXPORT ................................................................................................................................................... 74

    GESTION DES EMAILS ............................................................................................................................................. 75

    INTEGRATION DE LA GED ........................................................................................................................................ 77

    INTEGRATION TECHNIQUE ....................................................................................................................................... 80

    SYNTHESE ................................................................................................. 85

  • WW

    W.S

    MIL

    E.F

    R

    Page 13

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    GENERALITES

    POURQUOI UNE SOLUTION DE

    GESTION DOCUMENTAIRE ?

    La dcision de dployer une solution de gestion documentaire rsulte encore souvent dune crise ou dune tension dans la gestion de linformation ; une situation qui ncessite la mise en place dune organisation plus structure, dune traabilit ou dune meilleure utilisabilit. Linformatique est le plus souvent le meilleur moyen de fournir une rponse adapte.

    Les crises peuvent se manifester de diverses faons : limpossibilit de reconstituer un dossier client complet dans un dlai raisonnable, de retrouver la dernire version dun document lectronique qui a ncessit des jours de travail, etc. Bien quinsidieuse dans notre re hautement numrique, la crise la plus frquente est probablement la perte par dilution . Dilution dune information importante dans un ensemble beaucoup trop vaste. Il y a perte de connaissance ou de mmoire au niveau de lorganisation.

    Les tensions rsultent de difficults chroniques dans lusage des documents ou de temps perdu. Le temps perdu en recherche est le facteur le plus frquemment cit. La rutilisation de documents existants est galement problmatique, lorsque des ensembles documentaires autonomes croissent dans lorganisation ; lefficacit du travail peut alors tre largement dgrade du fait dun manque dorganisation, de traabilit ou simplement de visibilit dans lorganisation documentaire. Il sagit ici de perte de productivit.

    Notons par ailleurs que la gestion documentaire fait partie des processus qualit (ISO 9001, 14001 notamment) et si lutilisation dun logiciel de gestion documentaire nest pas requise pour sy conformer, elle permet de bnficier pleinement de lapplication des normes en matire de gestion documentaire, au-del de la stricte application des critres qualit.

    Le retour sur investissement peut tre complexe calculer pour ce type dapplication. Il dpend de critres souvent immatriels dont lvaluation la plus fine est dans la comparaison avant/aprs, critres qui plus sont souvent difficiles quantifier numriquement. Nanmoins, il sagit encore dune mthode incontournable pour prouver lintrt dun projet et on trouve souvent des critres d'valuation de bon sens et contextuels qui donnent toute satisfaction.

    Ds que cest possible, il est intressant dvaluer des donnes objectives et de fixer des objectifs damlioration pour ce type dapplication. On peut citer par exemple : le temps de traitement des courriers, dans le cas dune GED de correspondance ; le taux de bonne application des normes et procdures, dans le cas dune GED qualit ; le temps de traitement du renouvellement des contrats pour une contrathque ou le taux de doublons dune mme image dans lorganisation pour une application de gestion de mdias

  • WW

    W.S

    MIL

    E.F

    R

    Page 14

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    PRESENTATION DES

    CONCEPTS

    Nous nous efforons ici de positionner la gestion documentaire vis--vis dun certain nombre de domaines ou de notions connexes.

    Les concepts prsents ci-dessous ne reprsentent pas lexhaustivit de lenvironnement de la gestion documentaire, mais nous semblent ncessaires pour bien apprhender nos explications.

    Document lectronique

    La notion de document, si elle ne pose gure de problme dans un univers matriel, doit tre prcise ds lors quil sagit de documents lectroniques, de fichiers.

    Notre approche de la gestion documentaire prend l'acception issue de la norme ISO : Un document est lensemble constitu dun support dinformation et des donnes enregistres

    sur celui-ci, sous une forme en gnrale permanente et lisible par lhomme ou par une

    machine.

    En matire de documents lectroniques, le support est un format de fichier. Un fichier est cr, modifi et rendu lisible par une application. Par exemple, un document .doc est cr, modifi et rendu lisible par lapplication Microsoft Word. Les informations quant elles sont des donnes informatiques comprises dans lenveloppe du fichier.

    Nous verrons plus loin que les applications de GED introduisent la notion dobjet documentaire, qui runit conceptuellement le fichier et les mtadonnes qui lui sont attaches.

    Contenu

    Le terme contenu est employ pour dsigner un composant informatif cohrent. Lobjet documentaire, comme cit plus haut, est un contenu. Le terme sapplique toute information numrique porteuse de sens.

    Les contenus sont, le plus souvent, structurs, c'est--dire constitus dun ensemble de champs dinformation. Dans ce cas, on parle de contenus documentaires ou structurs.

    Il est parfois difficile de faire la diffrence entre un ensemble de contenus et un document lectronique. Cest souvent le contexte dutilisation et les traitements raliss qui permettent de distinguer la nature de linformation et le domaine fonctionnel concern, et de dfinir le meilleur type doutil pour la grer.

  • WW

    W.S

    MIL

    E.F

    R

    Page 15

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Quelques exemples qui peuvent tre considrs comme un document et/ou comme un contenu, pour illustrer notre propos : une brve sur un site dactualit, une revue darticles de presse, une image et sa lgende, une fiche descriptive de produit, une notice de document, un catalogue de produits en format PDF, un module documentaire en format SCORM.

    Gestion documentaire

    Objectif Prendre en charge le stockage, le partage et la restitution de documents lectroniques. Il s'agit majoritairement de systmes grant des fichiers incluant un fond (le contenu informatif) et une forme (lenveloppe de prsentation).

    Priorit Gestion de documents lectroniques.

    Orientation Stockage, partage, recherche.

    Termes

    rencontrs

    GED - Gestion Electronique de Document, EDM(S) - Electronic Document Management (System), DMS Document Management System.

    Gestion de contenu Web

    Objectif Prendre en charge la rdaction, la validation et la mise en ligne de contenus destination de sites web.

    Priorit Mise en ligne dinformation.

    Orientation Diffusion, restitution de contenus structurs et/ou ditoriaux, contribution au second plan.

    Termes

    rencontrs

    WCM - Web Content Management, CMS Content Management System, souvent employ pour dsigner la gestion de contenu Web.

  • WW

    W.S

    MIL

    E.F

    R

    Page 16

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Gestion de contenu

    Objectif Permettre la gestion des contenus numriques, au travers de fonctions de conception, diffusion, utilisation, recherche et archivage.

    On peut considrer la gestion de contenu comme un surensemble pour la GED et le WCM. Les solutions de gestion de contenu incluent le plus souvent des aspects procduraux de workflow (BPM Business Process Management) et de travail collaboratif (Groupware).

    Priorit La gestion de contenu dentreprise (ECM) est le concept le plus rcent de la gestion dinformations numriques, puisquelle adresse la fois linformation structure et non structure, sur lensemble des tapes du cycle de vie des contenus numriques.

    Orientation Gestion des contenus au sens large, c'est--dire l'intgration des outils de GED, de WCM, parfois mme de portail.

    Termes

    rencontrs

    CMS Content Management System, ECM Entreprise Content Management, BPM Business Process Management, EIM - Enterprise Information Management.

    A noter quon rencontre parfois le terme de gestions de contenu dans un sens plus limit, en voulant dire gestions de contenu web du fait de lamalgame historique avec les CMS, prcurseur de ce type doutil, ddi aux sites internet.

    Gestion de contenu multimdia

    Objectif Grer les spcificits des actifs multimdias numriques (les Digital Assets, anglo-saxons) : images, musiques et vidos.

    Priorit Contenus images et sons, navigation et recherche au sein du rfrentiel, gestion spcifique des droits dauteurs.

    Orientation Mtadonnes, navigation, recherche, DRM (digital right management), gestion des volumes importants.

    Termes

    rencontrs

    DAM Digital Asset Management ou gestion des actifs numriques.

  • WW

    W.S

    MIL

    E.F

    R

    Page 17

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Il sagit dune spcialit au sein de la GED. De nombreuses fonctionnalits sont communes quant la catgorisation, la gestion des droits et cycles de vie. Mais si les mtadonnes spcifiques la gestion des droits dauteurs peuvent tre modlises avec nimporte quel outil de GED, certaines fonctionnalits spcifiques sont propres au DAM, manipulation dimages, gestion des droits dauteurs, panier de slection, extraction des imagettes (miniature ou thumbnail), prvisualisation de vidos, gestion des descripteurs EXIF ou IPTC , notamment.

    Workflow (BPM)

    Objectif Permettre de formaliser et de fluidifier des processus, via lenchanement de tches unitaires entre diffrents acteurs.

    Priorit Gestion de processus et de formulaires. Le BPM couvre les besoins dinteractions formelles entre des acteurs de lactivit de lorganisation, quil sagisse dhumains ou de systmes, puisque les processus font souvent interagir les deux.

    Orientation Gestion de tches attaches des profils dutilisateur. Cependant, il sagit le plus souvent doutils qui permettent dorchestrer des webservices produits par diffrentes applications en vue dorganiser des actions unitaires simples pour produire un rsultat complexe.

    On notera que certains outils sont spcialiss par rapport des objets auxquels ils se rapportent : par exemple le Docflow un document.

    Termes

    rencontrs

    BPM Business Process Management, gestion de formulaire, workflow, flux de travail, cycle de vie, instance de processus.

    Il est noter que les processus rencontrs dans l'univers de la gestion documentaire sont trs lis au document. Ils sont exploits des fins d'orchestration de tches de validation ou de publication essentiellement. Cela constitue une petite part de ce qu'il est possible de faire avec un outil de BPM autonome.

  • WW

    W.S

    MIL

    E.F

    R

    Page 18

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Archivage Record Management (RM)

    Objectif Permettre de grer les phases de vie des documents aprs leur priode dutilit (la Dure dUtilit Administrative)

    Priorit La prservation des enregistrements (pices) darchives.

    Orientation Lensemble du processus de gestion archivistique mme de garantir la prise en compte, la scurisation, la fiabilit et la prennit des archives de lorganisation.

    Notons que les applications de RM sont de plus en plus frquemment fondues dans les applications de GED. En effet, il a t dmontr que larchivage est mieux pris en compte, lorsquil est gr ds la cration de la pice darchive (dossier, document).

    Termes

    rencontrs

    SAE systme lectronique darchivage, RM Record Management, archivage, archivistique, gestion du cycle de vie.

    Travail collaboratif

    Objectif Faciliter le travail de groupes de personnes au moyen doutils ddis, souvent de communication ou dinteraction en temps rel (synchrone) ou diffr (asynchrone). Par exemple : email, agenda partag ...

    Priorit Faciliter le travail en quipe.

    Orientation Partage dinformations oprationnelles

    Termes

    rencontrs

    groupware travail en quipe, Chat (messagerie instantane), Blog (mode de communication personnel via des billets thmatiques), Wiki (mode de partage dinformation via la codition de pages), Agenda partag, Document multi-auteurs (comme Google Docs, par exemple, qui permet la collaboration synchrone et asynchrone).

  • WW

    W.S

    MIL

    E.F

    R

    Page 19

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Moteur de recherche

    Objectif Permettre de retrouver une information existante.

    Priorit Indexation ou interrogation de bases de contenu.

    Orientation Lobjectif est de permettre aux utilisateurs de retrouver une information. Les outils de recherche se concentrent, dune part, sur lindexation de ces contenus ou lusage dindex externes dans le cas des mtamoteurs et, dautre part, sur les outils damlioration de la pertinence (adquation de ce qui est cherch, avec ce qui est retourn par le moteur).

    Termes

    rencontrs

    Moteur de recherche, Search Engine, SEO (Search engine optimisation), Findability, Meta moteur, Crawler, Oprateur de recherche.

    DE LA GED A LECM

    On constate depuis quelques annes la prdominance du terme dECM, en remplacement des acronymes DMS et GED.

    Au-del de leffet de mode, cette volution de la gestion documentaire la gestion de contenu dentreprise traduit une certaine ralit.

    Le primtre de la GED

    La Gestion Electronique de Documents traite des documents numriques. A ce titre une solution de GED peut intgrer :

    des outils : de numrisation, de stockage, de circulation, de diffusion et de recherche, notamment

    des spcificits mtiers : application des procdures qualit, gestion du cycle de vie, rgles de gestion, interaction avec des applications mtier, etc.

    des spcificits techniques : transformation de format de fichier, prvisualisation de fichiers multimdias, pages Web, contenus structurs, groupe de travail, etc.

  • WW

    W.S

    MIL

    E.F

    R

    Page 20

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Les applications de GED pures nexistent quasiment plus : elles intgrent presque toujours des fonctions empruntes aux domaines voqus plus haut, ou des domaines mtier.

    Le concept dECM

    La gestion de contenu dentreprise (traduction d'enterprise content management) regroupe les solutions mme de grer l'ensemble des contenus numriques d'une organisation.

    Il s'agit de prendre en compte (acqurir, capturer) les informations lectroniques (structures ou documentaires) pour les grer (stockage, dition, diffusion) en rpondant aux exigences des utilisateurs (ergonomie, fonctionnalit) et aux processus de lorganisation (scurit, fiabilit, processus).

    Bien qu'essentiellement technique, l'ECM intgre donc galement une part importante de mthodes et de modlisation.

    Ce schma vise positionner les domaines de la GED, du WCM et de lECM, les uns par rapport aux autres et vis vis dun certain nombre de domaines connexes.

  • WW

    W.S

    MIL

    E.F

    R

    Page 21

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Notons enfin que la notion de portail dentreprise est frquemment associe celle dECM. Bien que fonctionnellement, les intersections soient faibles, laspect globalisant des solutions dECM ne doit pas masquer la finalit fondamentalement diffrente des deux outils. Exposer les outils/services de lorganisation (portail) versus grer les contenus de lorganisation.

    Notons nanmoins que la capacit pour une solution dECM ou de GED sintgrer un portail est une qualit importante. Notamment, lorsque le service informatique de votre organisation ne souhaite pas agrger dans une seule application lensemble des solutions daccs linformation.

    Evolution des outils

    Les solutions de GED taient initialement orientes vers la gestion de fichiers, puis vers la prise en compte de documents spcifiques, avec une typologie de plus en plus large (mail, formulaire, image, vido). Leur volution naturelle est donc de s'intgrer de mieux en mieux aux processus de gestion documentaire, notamment par une meilleure prise en compte du contexte d'dition et de la structure des fichiers document (MS Word, Open Document, PDF...) qui permettra, demain, de traiter les documents comme une agrgation de contenus.

    Lvolution de la couverture fonctionnelle des solutions de GED tend rsoudre diffrents problmes lis aux usages. Dune part en intgrant la gestion des contenus structurs en parallle de celle des contenus documentaires (on parle parfois de contenu semi structur) et dautre part en permettant la ralisation dactions collaboratives pousses.

    LECM recouvre le primtre de la GED et ltend aux autres contenus dentreprise, notamment les contenus Web (WCM), voire les contenus grs par des applications tierces, on parle alors de fdration.

    Translation des mthodes

    Lvolution dans la gestion des contenus suit deux logiques bien distinctes : dune part, un largissement en termes de contenus grs et, dautre part, une adaptation des mthodes de gestion ces contenus, drives de la gestion documentaire.

    On constate, en effet, que nombre des mthodes de lECM sont issues de la GED. Un contenu est souvent considr comme un fichier (ou un ensemble de fichiers) et les actions quon applique sapparentent celles quun utilisateur est familiaris appliquer sur des documents.

    Deux facteurs expliquent cette translation de mthodes entre GED et ECM : les solutions dECM sont souvent issues des diteurs de GED, mais cest surtout la transposition du paradigme du document papier aux contenus lectroniques qui permet aux utilisateurs de saffranchir dune partie de la complexit porte par la nature des contenus lectroniques.

  • WW

    W.S

    MIL

    E.F

    R

    Page 22

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    On constate que les utilisateurs envisagent plus facilement de grer un contenu considr comme un ensemble cohrent, que les morceaux dun quelque chose qui na pas de forme et dont il est complexe de sapproprier le rendu (la forme).

    En clair, une page de site web est plus facile considrer et manipuler que plusieurs contenus (par exemple, trois images, une bannire de publicit et plusieurs blocs de texte), qui une fois agencs sur lcran, forment une page Web.

    ENJEUX PRINCIPAUX DE LA

    GED

    La gestion documentaire (GED) est un domaine avant tout organisationnel, contrairement la gestion de contenu Web (WCM) qui relve essentiellement de problmatiques techniques.

    Les outils de gestion de contenu Web sorientent vers la diffusion de contenus structurs : leur mise en forme, leur publication, leur facilit daccs par un large public, etc... Alors que les outils de gestion documentaire mettent laccent sur les processus de gestion en amont, comme la possibilit de raliser une indexation riche ou dintgrer des rgles de traitement (workflow, transformation, alertes conditionnelles), par exemple.

  • WW

    W.S

    MIL

    E.F

    R

    Page 23

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    La mise en place dune solution de GED doit donc impliquer les futurs utilisateurs de faon

    importante.

    Nous constatons que le succs des dploiements dapplications de GED repose

    essentiellement sur la bonne utilisation dun certain nombre doutils et de principes dcrits

    ci-dessous.

    Lergonomie de lapplication doit sadapter lusage dune application de gestion, utilise par un nombre important de personnes, au mme titre quune application de messagerie, par exemple.

    Structuration des mtadonnes

    La gestion des documents lectroniques sapparente encore souvent une gestion en aveugle. En labsence de formats ouverts (voir plus loin), le document-fichier est un objet opaque et impntrable pour toutes les applications autres que celle qui la cr, et donc pour lapplication de GED, qui ne connat au dpart du document que son nom (le nom du fichier) et son type (type MIME).

    Les mtadonnes sont les informations associes aux documents grs. Elles servent qualifier les documents, leur apporter une information complmentaire qui soit exploitable. La mtadonne est directement utile en tant quinformation, mais surtout elle est la base des fonctions de recherche, ou de traitements slectifs appliqus aux documents.

    Pour disposer de fonctions avances, un systme de GED doit permettre dassocier aux documents des informations structures exploitables. Cest tout lenjeu des mtadonnes.

    Les mtadonnes typiques incluent, par exemple, le titre, lauteur, la description, la langue et la date de publication.

    Il existe des nomenclatures standards de mtadonnes, notamment le Dublin Core, qui dfinit 15 champs principaux de mtadonnes. Diffrents mtiers disposent de leur propre standard (musique, architecture, sant ou archivistique, par exemple).

    Afin dapprhender un maximum de besoins, les solutions doivent donc grer diffrents jeux (ou sets) de mtadonnes en fonction des types de documents et prvoir un large ventail de types de mtadonnes, information textuelle (champ texte), liste de valeurs issues de tables de rfrences, dates ou nombres sur la base desquels des rgles de gestion pourront tre calcules...

  • WW

    W.S

    MIL

    E.F

    R

    Page 24

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Rfrentiel de classement

    La plupart des solutions de gestion de contenu intgrent un ou plusieurs rfrentiels de classement.

    Ds lors que lon parle dorganisation professionnelle, de mtiers spcifiques et de procdures de gestion documentaire, il est indispensable de disposer dune structure qui serve de colonne vertbrale au systme de gestion documentaire cest le rle du

    rfrentiel de classement. Il s'agit de l'un des outils les plus importants. Les usages qui reposent sur cet outil constituent un facteur non ngligeable dans le choix d'une solution.

    Les outils de GED sont plus ou moins labors, mais permettent a minima de dfinir un plan de classement c'est--dire une arborescence hirarchique par rapport laquelle sont classs les documents. Ils peuvent aller jusqu' permettre de grer des vocabulaires mtiers avec synonyme, liens de proximit smantique, multi-hirarchies et traductions de termes. On parlera alors de thsaurus ou dontologie.

    L'utilit d'un rfrentiel de classement concerne diffrentes fonctions : aide l'indexation, vocabulaires communs (glossaires), recherche avance (avec prise en compte des synonymes, de la proximit smantique, par exemple), ou encore navigation par facettes.

    Prise en compte du cycle de vie

    Pour optimiser la gestion des ressources documentaires, il faut grer leur cycle de vie qui stend de leur cration jusquau-del de leur utilit oprationnelle.

    Un document est dabord conu en mettant en uvre un ensemble de processus avant de pouvoir tre utilis. Par exemple, un contrat est rdig, modifi, valid, imprim, sign puis envoy, souvent sous forme papier. Le cycle de vie inclut toutes ces phases, depuis son laboration jusqu son archivage dfinitif ou sa destruction.

    La gestion du cycle de vie des documents lectroniques doit tre ralise au moins aussi finement que celle des documents papier. En effet, du fait de la facilit de duplication, de transmission et de stockage des documents lectroniques, leur nombre est nettement plus important. Ceci induit diffrents problmes, notamment de traabilit entre versions, de capacit trouver une information prcise ou encore de volume de stockage.

  • WW

    W.S

    MIL

    E.F

    R

    Page 25

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Dmatrialisation et transformation numrique

    Les solutions de GED sont mme de grer diffrents types de documents, quils soient issus dapplications bureautiques ou dun processus de numrisation.

    La numrisation ou dmatrialisation (galement appele dmat ) consiste en la transformation dun document dun support matriel en donnes lectroniques. Il peut sagir par exemple de la numrisation dun document papier vers un document bureautique, dun ensemble de formulaires vers une base de donnes, de la transformation dun film ou dun enregistrement sonore sur bande en fichier multimdia, etc..

    Depuis de nombreuses annes le zro papier est prsent comme un objectif, mme si tous saccordent sur le fait que le zro ne sera probablement jamais atteint. La dmatrialisation permet nanmoins de bnficier des avantages du numrique sur lensemble des contenus dmatrialiss.

    Certaines organisations ont intgr cela et leurs projets de gestion dinformations sorientent vers le tout en un qui permet de bnficier daccs et de modes de gestion unifis pour tous les contenus, quils soient physiques et numriques.

  • WW

    W.S

    MIL

    E.F

    R

    Page 26

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    LES SOLUTIONS DE GESTION

    DOCUMENTAIRE

    ALFRESCO

    Alfresco (www.alfresco.com) est un diteur anglais, fond en 2005 par d'anciens dirigeants de Documentum et Business Object. La socit est aujourd'hui prsente directement en Angleterre, France et aux Etats-Unis.

    Alfresco est une solution crite en JEE qui propose lensemble des fonctionnalits attendues : mtadonnes, types de documents, workflow documentaire et avanc, gestion de catgories, outils de collaboration, recherche, gestion de plusieurs bases indpendantes, gestion de contenu Web.

    Loutil se distingue par diffrents apports :

    une orientation rsolument collaborative la fois au niveau des fonctions et des interfaces

    une architecture fonctionnelle et technique de trs bon niveau, lui permettant de se positionner sur des GED de trs grandes organisations. Alfresco est trs ouvert et les dveloppements se font au moyen dAPIs et doutils, nombreux et bien documents

    les rgles de gestion, directement accessibles aux utilisateurs, leur permettent de dporter une part des amnagements fonctionnels au niveau des gestionnaires et non plus des dveloppeurs ou des administrateurs

    un composant de gestion des contenus web, parallle la gestion documentaire. Ce module est ddi la gestion des contenus Web et non leur distribution sur des serveurs distants

    l'interface Share, en passe de supplanter l'interface historique apporte une interface prte l'emploi pour la collaboration

  • WW

    W.S

    MIL

    E.F

    R

    Page 27

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    les facilits dintgration avec le poste de travail

    un module de Record Management, c'est--dire de gestion darchives, bas sur la norme amricaine DoD 5015.02 (Smile a dvelopp des modules ddis la gestion d'archives, orients sur les rgles europennes - Moreq notamment)

    un framework de conception dinterfaces, souple et puissant : SURF

    des modules techniques avancs, tels que le load balancing ou la gestion de plusieurs instances dans une seule installation (multi tenancy)

    une visibilit trs importante sur la scne internationale, du fait de sa communication, de son activit marketing et du grand nombre de clients

    Alfresco est disponible en deux versions : une version Labs , gratuite, sous licence GPL et une version Entreprise , qui donne accs la garantie de lditeur, aux modules de RM (Record Management) et de clustering intgr ainsi quaux mises jour intermdiaires. Le montant de cette souscription dpend de diffrents facteurs : le niveau de service de support attendu (SLA), les modules mis en uvre et le nombre de processeurs utiliss.

    Notons qu'une distribution complmentaire existe, dnomm Team, qui permet de bnficier d'une version limite et peu volutive ddie essentiellement tester Alfresco.

  • WW

    W.S

    MIL

    E.F

    R

    Page 28

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Cette solution dispose dune forte dynamique de dveloppement, ainsi que dune communaut dutilisateurs et de dveloppeurs importante. On notera lexistence du site Alfresco Forge (http://forge.alfresco.com), qui hberge de nombreux plug-ins.

    La version 3.4, sortie en janvier 2011, intgre de nombreuses amliorations, parmi

    lesquelles nous citerons :

    amliorations notables de linterface collaborative Alfresco Share avec notamment la gestion des droits, des workflows, une notion de datalist (tableur simplifi)

    amlioration du module WCM, avec l'adjonction de Web Quick start

    amlioration des fonctions de Record Management (RM) et des fonctions dInformation Life Cycle (ILM) avec notamment la gestion des supports de stockage diffrentiel

    compatibilit avec CMIS (la norme dinteroprabilit des systmes d'ECM laquelle participe notamment EMC Documentum, Microsoft Sharepoint, Nuxeo...)

    framework de rplication de contenu distribu entre diffrents entrepts de donnes

    amlioration des intgrations avec les portails JAVA, notamment Liferay

  • WW

    W.S

    MIL

    E.F

    R

    Page 29

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    NUXEO

    Nuxeo (www.nuxeo.fr) est une socit franaise, ditrice de la solution de GED open source du mme nom depuis 2001. Nuxeo Enterprise Plateform est le rsultat de la migration en Java de la prcdente version base sur Zope Python. La socit est aujourd'hui prsente en France et aux Etats Unis.

    Nuxeo est une solution complte de gestion de contenu dentreprise : mtadonnes, types de documents, workflow avanc, gestion de catgories, fonctions de collaboration, recherche, gestion de contenu complexe (web, multi fichiers, structurs), gestion multi-bases, etc.

  • WW

    W.S

    MIL

    E.F

    R

    Page 30

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Loutil se distingue par diffrents aspects :

    son diteur de thmes qui permet de personnaliser linterface

    la notion de relations qui permet de raliser des liens typs entre contenus. Le typage est rciproque et permet de lier aussi bien des lments internes Nuxeo quexternes (URL), par exemple est la traduction de / est traduit de ou a pour pice jointe / est la pice jointe de

    une interface standard directement utilisable pour des projets de GED simple et dote dune ergonomie satisfaisante (cliquer-glisser, clic droit, prsentation en onglet)

    la gestion des vocabulaires, qui permet un administrateur fonctionnel de grer les listes de valeurs dans toute lapplication

    la notion de section de publication, qui permet de dcorrler totalement lespace de travail des utilisateurs de ce qui est donn voir aux diffrents publics

    une architecture totalement modulaire qui facilite le dveloppement, la maintenance et la rutilisation de fonctionnalits additionnelles. La qualit technique de la solution lui permet dtre retenue aussi bien par de petites structures, que de grands groupes internationaux, et mme dtre intgre comme brique de gestion documentaire par dautres projets (le Portail-ESUP par exemple)

    loutil admin center qui intgre notamment Nuxeo Studio , outil de configuration, voir ci-dessous. Mais galement depuis peu la Marketplace , sorte de dpt de plugins intgrs et facilement installables

  • WW

    W.S

    MIL

    E.F

    R

    Page 31

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    La version 5.4.2 est sortie en juin 2011 et apporte un lot trs important d'amliorations.

    mise en uvre de la MarketPlace, catalogue en ligne de modules dvelopps par Nuxeo, ses partenaires Galaxy et mme des clients. Parmi les composants disponibles, citons :

    o externalisation du stockage des fichiers grs par le rfrentiel Nuxeo dans Amazon Simple Storage Service (Amazon S3)

    o signature lectronique des pdf au sein de Nuxeo avec vrification du certificat dans le lecteur pdf

    o service smantique d'extraction d'entits nommes (personnes, lieux ou organisations)

    l'intgration renforce dOpenSocial qui supporte OAuth (intgration de gadgets externes dans Nuxeo, utilisation de gadgets Nuxeo dans un container externe tel que iGoogle, avec un meilleur contrle des services utiliss), les containers OpenSocial GWT

    nouveau connecteur WSS (Windows SharePoint Services) permettant, sous MS Windows ou Mac OS X, d'accder au rfrentiel Nuxeo comme s'il s'agissait d'un rpertoire

    drag and drop HTML5 pour importer un ou plusieurs fichiers par glisser-dposer, sans avoir installer de plugin. Avec la fonctionnalit de modification par lot, il est possible de dfinir les mtadonnes de lensemble des fichiers uploader

    navigation par facettes, mcanisme de recherche bas sur des filtres dynamiques avec affichage en vis--vis des rsultats. Ces recherches sont enregistrables

  • WW

    W.S

    MIL

    E.F

    R

    Page 32

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    les listes de contenus et rsultats de recherche incluent dsormais des filtres et des options dexport (RSS, ATOM, CSV, Excel, PDecF). Ces vues sont configurables avec Nuxeo Studio

    la gestion de configurations locales, pour dterminer thmes, vues et types de dossiers/documents utilisables dans un domaine ou un espace de travail

    l'introduction d'outils collaboratifs de blogs, directement dans linterface standard

    l'Admin Center facilite aux abonns le tlchargement de patchs, plugins et l'accs Nuxeo Studio

    lentire compatibilit avec le standard CMIS 1.0. Un connecteur CMIS a t rcemment dvelopp pour interfacer Nuxeo avec HippoCMS, plateforme dEnterprise Content Management (ECM) open source

    Nuxeo courrier, bas sur Nuxeo CMF (Case management Framework) est un outil de gestion de courrier, adapt la prise en compte des flux de courrier entrant et sortant, avec notamment la prise en compte de spcificits de traitement (gestion de bannettes), de procdure (workflow) et des adaptations ergonomiques disponibles.

    EXO DMS

    Exo est un diteur franais fond en 2003 par le franais Benjamin Mestralet, notamment via un financement du DoD (ministre de la dfense amricain). La socit est aujourdhui prsente en France, aux Etats-Unis, au Vietnam, en Ukraine et en Tunisie.

  • WW

    W.S

    MIL

    E.F

    R

    Page 33

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Lapplication initiale, un portail dintgration, a rapidement volu vers la suite eXo Platform, toffe de nombreux modules et briques techniques, couvrant de faon intgre lensemble des besoins dun ECM moderne. Citons la gestion dun portail dintgration (eXo Portal), la gestion de contenu web (eXo WCM), la gestion documentaire (eXo DMS pour Document Management System), la gestion des workflows avec notamment lintgration du projet Bonita et mme un WebOS, sorte de portail en forme de poste de travail ddi fournir une solution de bureau virtuel.

    Diffrentes suites logicielles ont t packages par lditeur pour en faire des offres de type produit fini, citons eXo Collaboration Suite avec email, carnet dadresses, calendrier et messagerie instantane ou eXo Knowledge Suite avec outils de FAQ et de forums.

    Au sein de cette suite, eXo DMS occupe une place centrale, puisquil sagit de la brique destine stocker lensemble des fichiers. Nous ne parlerons, dans ce livre blanc, que de cette brique, en prenant en compte son appartenance un ensemble plus vaste.

    Lapplication eXo DMS dispose de caractristiques trs intressantes, parmi lesquelles nous retenons notamment :

    une interface standard qui intgre nativement les facilits de lexplorateur Windows : cliquer-glisser, raccourcis clavier, affichage selon plusieurs modes

    la base de contenu (JCR) globale pour lensemble des contenus (Web et document) peut tre utilise via Webdav, FTP et CIFS

    lintgration bureautique relativement pousse, avec un plugin spcifique pour MS Office et une intgration Open Office

    la possibilit dadapter, de faon trs importante, les interfaces utilisateurs en fonction de leurs profils. En effet, eXo DMS, comme toutes les applications eXo, se base sur eXo Portal, application de gestion de portail

    La solution eXo DMS se distingue de tous les autres solutions dECM ou de GED dcrites dans ce livre blanc par deux caractristiques importantes :

    il sagit dune partie dun ensemble plus vaste et son usage hors du contexte eXo Platform perd une grande partie de son intrt

    il sagit dune application oriente technique, et non fonctionnelle. Lutilisation dun package fourni par lditeur ou une intgration soigne est ncessaire pour en apprcier la qualit et en tirer pleinement partie

    Pour ces raisons, nous avons choisi de ne pas la faire figurer systmatiquement dans les comparatifs de solution, sa prise en compte hors de la suite eXo Platform rendant la comparaison inquitable.

  • WW

    W.S

    MIL

    E.F

    R

    Page 34

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    KNOWLEDGE TREE

    Knowledge Tree (www.knowledgetree.com) est une solution de GED dveloppe par la socit sud-africaine JamWarehouse.

    Knowledge Tree dispose dun ensemble complet de fonctionnalits et plusieurs modules qui permettent une bonne intgration dans lenvironnement bureautique.

    La version open source de Knowledge Tree intgre lessentiel de loffre, mais plusieurs modules, notamment ceux qui concernent lintgration au poste de travail (hot folder, navigation, intgration MS Office, application de gestion de scanners) sont des modules commercialiss sous licence non open source. La comparaison entre les diffrentes versions est relativement explicite sur le site Internet de lditeur.

    Lapplication est globalement de bonne facture et permet de disposer dune GED simple et efficace. Nous apprcions particulirement plusieurs points :

    une interface standard pure et immdiatement oprationnelle

    une recherche trs avance, qui satisfera les plus exigeants en matire de recherche complexe et en termes de croisement de critres

    des fonctions dadministration, accessibles un administrateur sans comptences techniques particulires, pour lensemble du paramtrage : cration des types de documents, etc.

    des modes de navigation virtuelle implments par dfaut, notamment par type de document

    lergonomie du module intgr MS Office qui permet, contrairement ses concurrents, de grer les mtadonnes depuis la bureautique

  • WW

    W.S

    MIL

    E.F

    R

    Page 35

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    La version 3.7, teste dans le cadre de ce livre blanc, propose plusieurs avances importantes :

    la gestion dune palette complte de type de mtadonne, notamment la date qui manquait

    la refonte technique amliorant considrablement les performances de la solution, notamment via un partenariat avec Zend

    lintgration de deux protocoles rcents : CMIS, permettant dinterroger Knowledge Tree via des webservices normaliss et Open Search permettant de linterroger et dobtenir des rponses de son moteur de recherche via des mthodes normalises

    Notons galement plusieurs nouvelles langues, lEspagnol et le Portugais, en plus du Franais, intgres rcemment la version communautaire.

    JAHIA

    Jahia est une solution intgre de portail web et de gestion de contenu, propose par lditeur du mme nom.

    Elle est distribue sous deux formes : Community Edition et Enterprise Edition. La premire est open source sous licence GPL v2, la seconde est sous licence commerciale, et intgre notamment des fonctions destination des entreprises et organisations comme le support.

    Cette solution rpond principalement aux besoins de gestion de contenus et documentaires Web, ainsi qu une partie des besoins de portail (agrgation), notamment avec le support de la norme JSR 168.

    Jahia permet galement de grer un rfrentiel de fichiers la norme JCR (Jahia intgre notamment un serveur JackRabbit comme support de ses contenus implmentation de rfrence du standard JCR) qui peut tre li aux diffrents contenus publis, le tout avec une bonne intgration lenvironnement bureautique, grce lutilisation daccs Webdav, CIFS et SMB.

    L'intrt des fonctionnalits GED de Jahia rside essentiellement dans lusage qui peut tre fait des contenus documentaires dans un contexte de site Web ou Intranet. En effet, les contenus documentaires grs au sein de la plateforme bnficient d'une intgration complte avec les mcanismes de publication du gestionnaire de contenus (gestion des droits, recherche, indexation, contrles de cohrence, emplacement de publication, ).

  • WW

    W.S

    MIL

    E.F

    R

    Page 36

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    La sortie de la version 6, mi-2009, a marqu un tournant pour Jahia, dune part en termes de modle conomique, passant dune licence ouverte mais propritaire, un modle nettement plus open source : et dautre part, avec lajout de nombreuses nouvelles fonctionnalits.

    Des volutions importantes sont arrives avec la version 6, puis avec la version 6.5 (Juin 2011), notamment autour de la gestion documentaire :

    possibilit d'accs via CIFS, SMB et FTP aux fichiers de la mdiathque

    amlioration des fonctions de recherche sur les documents, possibilit d'enregistrer des requtes

    interface de gestion des fichiers plus claire et plus ergonomique (clic droit notamment)

    possibilit de monter (mapper) des sources documentaires externes Jahia directement dans la mdiathque (par exemple : connecteur Alfresco permettant de monter des dossiers d'un entrept Alfresco afin de les utiliser directement dans Jahia)

    mise en place de rgles automatises sur les contenus (gnration automatique de vignettes lors de dpts d'images, extraction de mtadonnes) pouvant tre adapte des besoins spcifiques (gnration de documents au format pdf par exemple)

    gestion de versions sur les documents au sein du gestionnaire de fichiers (les interfaces de suivi des versions restent toutefois amliorer)

    module de gestion multimedia : outils de modification d'images, vignettage automatis, galerie d'images

    Jahia reste donc avant tout une solution oriente vers la gestion de contenus web. Il est souvent ncessaire de le coupler une GED dentreprise pour prendre en compte des problmatiques de gestion documentaire complexes ; mais les aspects principaux de la gestion de documents sont aujourd'hui bien prsents dans l'outil.

    MAARCH

    Maarch (www.maarch.org), est une solution PHP dveloppe par la socit franaise Maerys. Loffre comporte Maarch Entreprise et Letter Box, application ddie la gestion de courrier.

    Letter Box est une application verticalise qui permet notamment de sinterfacer avec un scanner ou de grer le cycle de vie du courrier dans lentreprise : rception, traitement de la rponse et recherche. Elle est livre avec un ensemble de fonctions et une interface totalement oriente vers la gestion de courrier.

  • WW

    W.S

    MIL

    E.F

    R

    Page 37

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Maarch Entreprise est ddi la conception d'applications. Cette distribution inclut les fonctions ncessaires une GED dentreprise.

    Cette solution nous semble suffisamment intressante pour la retenir dans notre livre blanc, notamment dans certains contextes spcifiques, gestion de courrier et gestion darchives en particulier.

    Notons que la communaut autour de la solution est de petite taille, concentre autour de son diteur.

    Enfin, lorientation framework PHP de la version 3 nous semble combler un manque dans le domaine PHP. Cette orientation permet en effet de disposer dune solution de conception dapplications documentaires pour lentreprise.

  • WW

    W.S

    MIL

    E.F

    R

    Page 38

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    AUTRES SOLUTIONS

    Plusieurs autres solutions de GED existent dans le monde open source. Leur niveau de qualit est variable et, en gnral, ces outils sont comparativement trop limits, par rapport aux solutions phares du march, pour tre recommands dans un contexte dentreprise.

    Ces solutions pourraient nanmoins correspondre des besoins trs spcifiques, dans des contextes technologiques particuliers. Freedom, par exemple, qui a de bons atouts pour raliser des applications mtiers ou Quotero du fait de son dveloppement en .Net.

    On peut galement citer : DocMgr, OpenGED, myDMS et eDMS dont la prennit ou le niveau fonctionnel nous semblent trop faibles.

    Quotero

    Jeune solution en JAVA (la v1.0 date de mars 2009) dite et porte par la socit de service, galement diteur : Core-techs.

    Cette application, mme si elle est encore loin de ce que lon peut attendre d'une GED moderne, prsente une base technologique intressante.

    L'offre est centre sur trois composants : le serveur documentaire, l'interface web d'interrogation et le client lourd. Certains composants sont lis une licence commerciale, la version open source tant limite aux fonctions de bases.

  • WW

    W.S

    MIL

    E.F

    R

    Page 39

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Parmi les fonctionnalits intressantes prsentes, nous citerons : indexation et recherche plein texte, rservation (check-in / check-out), alertes email et RSS, workflows documentaires avec jBPM, liens entre documents, paramtrage graphique des mtadonnes.

    On trouve de plus dans la version commerciale des fonctions intressantes :

    ouverture et modification de documents depuis MS Office et OpenOffice

    drag & drop de documents depuis Windows et Linux via une application cliente

    La communaut autour de la solution semble principalement porte par lditeur. Le caractre open source tant, dans ce cadre, dun intrt plus limit.

    La solution Quotero nest donc intressante que par la technologie sur laquelle elle est dveloppe (.Net). Elle est sur beaucoup daspects bien infrieure aux solutions phares du march.

    LogicalDOC

    LogicalDOC (www.logicaldoc.com), anciennement Contineo, est un outil de gestion documentaire, dit par la socit italienne Logical Objects, ainsi que par quelques dveloppeurs indpendants.

    La solution est distribue sous diffrentes formes, la premire, open source ; alors que la seconde, non libre, ajoute des fonctions et permet de bnficier du support de lditeur.

    Parmi les fonctionnalits proposes, on peut citer : gestion des versions, envoi de document par mail ou par lien gnr, intgration dun webmail, gestion des langues de documents, discussions.

  • WW

    W.S

    MIL

    E.F

    R

    Page 40

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    LogicaDoc propose les fonctionnalits essentielles dun outil de GED ainsi que quelques fonctions intressantes comme une gestion des droits graphiques, via des cases cocher sur une grille.

    Mais lusage de la version open source est limit :

    pas dintgration bureautique, ce qui dnote dailleurs du caractre peu collaboratif de la solution

    les fonctions dimport/export sont absentes

    lauthentification sur un annuaire dentreprise nest disponible que dans la version entreprise

    larchitecture documentaire est trs simple, ce qui limite grandement son extensibilit

    Des modules compltent la version open source, avec quelques fonctions intressantes, parfois indispensables :

    la reconnaissance optique de caractres (OCR) et intgration aux outils de numrisation

    lexploitation des formats AutoCAD et MS Office rcents

    un workflow documentaire, paramtrable via une interface graphique

    des fonctions de traabilit (audit)

    la possibilit dintgrer des mails comme des documents, directement sur le serveur

    Lusage de LogicaDoc est donc rserv des besoins simples et trs orients vers les quelques points forts de la solution. La solution ne bnficie pas suffisamment de la dimension open source de sa distribution (communaut, extension, etc.).

  • WW

    W.S

    MIL

    E.F

    R

    Page 41

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    LES FONCTIONNALITES

    Nous prsentons dans ce chapitre les principales fonctionnalits des solutions de gestion documentaire, et, pour chacune, nous indiquons comment les outils cits prcdemment se positionnent.

    Il sagit de dcrire non seulement la fonction en elle-mme, mais aussi les impacts quelle a dans le contexte dun projet.

    Les meilleures applications de GED open source sont aujourdhui trs abouties et tendent intgrer dautres fonctions que celles historiquement rserves au domaine de la GED. De mme, certaines applications dautres domaines intgrent des fonctions de GED, en relation troite avec les fonctions mtiers.

    Les concepteurs de solutions capitalisent donc sur des expriences acquises dans diffrents domaines : documentation, moteur de recherche, bureautique, numrisation, reprsentation de processus Les fonctions le plus souvent intgres aux solutions de gestion documentaire sont : la collaboration, la gestion de contenus structurs et le workflow.

    Puisque les solutions assurent les fonctions essentielles, cest donc sur leur optimisation et leur sophistication, ainsi que sur la mise disposition de fonctions de haut niveau, que va porter lessentiel de notre attention, en vue du choix dune solution adapte chaque contexte.

    METADONNEES

    Lindexation est une fonction centrale des outils de GED, qui consiste en premier lieu attacher des mtadonnes aux documents et/ou dossiers.

    Types de documents

    Chaque type de document peut tre qualifi par un ensemble de mtadonnes. Chaque document sera donc dot de mtadonnes propres et sera ventuellement associ des rgles de gestion sappuyant sur ces mtadonnes.

    Notons quil peut tre intressant dindexer plusieurs fichiers avec un seul jeu de mtadonnes. La relation entre notice documentaire et fichiers stocks doit donc idalement tre souple pour permettre davoir de zro n fichiers attachs une seule fiche.

  • WW

    W.S

    MIL

    E.F

    R

    Page 42

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Structure des notices

    On appelle notice lensemble de mtadonnes associes un document, le contenu de cette notice est le plus souvent saisi au moyen dun formulaire.

    Il est fondamental que le degr de finesse dans la qualification des documents puisse tre ajust chaque projet. Il faut trouver le bon compromis entre la richesse dinformations, lexploitation qui doit pouvoir en tre faite, et la quantit de travail ou de dveloppement que reprsente lalimentation des mtadonnes.

    En effet, sil est parfois contre-productif dobliger saisir 15 mtadonnes pour un document courant, certaines utilisations peuvent, au contraire, ncessiter des jeux de mtadonnes importants.

    La structure des notices des types de document doit :

    permettre une indexation pertinente, qui reflte prcisment les documents dcrits tout en incitant les contributeurs alimenter

    couvrir lensemble des informations utiles lexploitation. La recherche bien entendu, mais galement les processus et traitements appliqus aux documents tels que les alertes, la traabilit, laffichage

    Attention ne pas tomber dans la surindexation (trop de mtadonnes pour un type de document) ou lindexation libre (nombre insuffisant de contrles) qui entranent soit des cots dindexation trop importants par rapport la valeur ajoute, soit des dfauts dans lexploitation qui peut en tre faite (bruit et silence en recherche, notamment).

    Fonctions relatives aux typages de linformation

    Il sagit des fonctions permettant de fiabiliser lindexation et de raliser des traitements documentaires propres un type de document. Par exemple :

    champs multivalus, c'est--dire permettant de saisir plusieurs valeurs

    rgles de cohrence sur un champ et entre champs. Par exemple un format de date pour un jour, ou un nombre positif pour un prix

    champs calculs permettant de faire dpendre la valeur dun champ dune ou plusieurs autres valeurs ou conditions

    liaisons entre documents et typage de ces associations, par exemple, un courrier qui a pour annexe ou un contrat qui concerne un dossier dsign

    La dfinition et la structuration des types de document constituent une phase fondamentale de la mise en place dune GED. Elle ne doit en aucun cas tre nglige.

  • WW

    W.S

    MIL

    E.F

    R

    Page 43

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Indexation manuelle

    Interface de saisie

    La notice (ou fiche) dcrivant un document est souvent le premier point dentre des utilisateurs. Cest galement ce formulaire qui est le plus utilis par les contributeurs, puisquils devront saisir de linformation.

    Pour ce faire, et dans un souci dergonomie, de fiabilit et de productivit, les solutions de GED doivent faciliter la contribution, directement ou par le biais dune intgration lgre, par exemple :

    copier/coller entre le document lectronique et les mtadonnes. Ceci est particulirement pertinent lorsque le document lectronique est issu dune numrisation et quil est possible de le visualiser sur le mme cran que la fiche dindexation

    aide la saisie, ds que possible, comme par exemple :

    o des listes de contrle qui permettent de fiabiliser le fond (smantique) et la forme (orthographe notamment) de la saisie

    o des cases cocher ou des boutons radio pour les choix multiples

    o des botes de dialogue adaptes aux tables des valeurs de rfrence (listes des choix possibles). Ceci pouvant aller de la simple liste droulante, des interfaces disposant dune recherche avec autocompltion ou dune navigation (abcdaire, arbre) dans les valeurs de rfrence

    o suggestions pour un champ donn (cf Induction de mtadonnes )

    Table de rfrence

    Lobjectif est de proposer, ds que cest possible, des listes de valeurs. Ceci pour limiter les questions que lutilisateur peut se poser lors de la contribution mais galement pour fiabiliser la saisie et ainsi amliorer lusage des mtadonnes.

    Parmi les tables de rfrences, on trouve par exemple :

    les rfrentiels de classement (cf Rfrentiel de classement )

    les listes de valeurs enrichies par la saisie ou fige, par exemple le nom des auteurs des documents (dj prsent dans le systme) ou la liste des services dune organisation

    Lobjectif de ces tables est doffrir des aides la saisie et dapporter des contraintes et contrles lors de celles-ci.

  • WW

    W.S

    MIL

    E.F

    R

    Page 44

    Copyright Smile Open Source Solutions Toute reproduction interdite sans autorisation

    GED : les meilleures solutions open source

    Indexation automatique

    Extraction de mtadonnes

    Il existe plusieurs modes dextraction de mtadonnes.

    Rcupration dinformations

    Chaque fichier informatique est dot dinformations issues du systme de gestion de fichiers. Certaines peuvent tre pertinentes comme mtadonnes : le nom du fichier, les dates de cration et de modification, sa taille, son emplacement

    Les solutions de GED proposent de rcuprer certaines de ces informations. Il est galement possible, notamment dans le cadre dune reprise dhistorique, de les travailler de faon reconstituer une indexation par mot cl, par exemple en dcomposant lemplacement ou la structure dun nom sous forme dune succession de termes qui serviront lindexation.

    Extraction de donnes structures

    Certains formats de fichier disposent dune structure lisible. Cest notamment le cas pour nombre de formats ouverts, ODF par exemple, mais galement des formats MS Office, par le biais de leurs proprits.

    Lorsque ces structures sont connues et documentes, il est possible dutiliser des automates pour extraire les informations pertinentes directement depuis le fichier et les utiliser pour alimenter une fiche dindexation.

    Induction de mtadonnes

    Certaines solutions, les plus labores, permettent de dterminer automatiquement les mtadonnes les plus pertinentes pour indexer un document.

    Ce type dinduction de mtadonnes est souvent ralis par :

    des outils de reconnaissance, qui retrouvent dans un document les chanes de caractres prsentes dans un rfrentiel pouvant tre ajoutes la notice

    des outils statistiques, qui analysent les chanes de caractres les plus prsentes et donc p