Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*,...
-
Upload
cain-martinez -
Category
Documents
-
view
104 -
download
0
Transcript of Réutilisation de corpus et capitalisation danalyses Helka Folch*, Benoit Habert*, David Leray*,...
Réutilisation de corpus et
capitalisation d’analyses
Helka Folch*, Benoit Habert*, David Leray*,
Sylvaine Nugier**, Yasmina Quatrain**, Nirina Rabiaza*
(*) LIMSI-CNRS
(**) SOAD-R&D-EDF SA
1. Problématique de la Fouille de Données Complexes à EDF
Données multi-sources et multi-relationnelles Début de solution : l’analyse secondaire Périmètre de nos travaux
2. Architecture globale
3. Réutilisation de corpus et capitalisation d’analyses
Structuration Une journée dans la vie d’une étude…
4. Conclusion et perspectives (le passage à l’échelle)
Plan
D’après le SBF, un des syndicat de la boulangerie, M. X, boulanger du quartier Q achète son four à l’entreprise Bidule et sa farine à la minoterie Maichin ; par l’enquête « comment être boulanger au 21ième siècle et rester séduisant », on sait qu’il est abonné à « Boulangerie Magazine » dans lequel on trouve souvent la publicité pour Bidule ; sur son site web, M. X nous apprend qu’il fabrique un pain bio et qu’il référence la minoterie Meichin et M. Y qui comme lui produit un pain bio ; à EDF, on sait qu’il a un profil de consommation P et a déménagé l’an dernier
1. Problématique de la Fouille de Données Complexes à EDF
multi-sources
multi-relationnelles
D’après le SBF, un des syndicat de la boulangerie, M. X, boulanger du quartier Q achète son four à l’entreprise Bidule et sa farine à la minoterie Maichin ; par l’enquête « comment être boulanger au 21ième siècle et rester séduisant », on sait qu’il est abonné à « Boulangerie Magazine » dans lequel on trouve souvent la publicité pour Bidule ; sur son site web, M. X nous apprend qu’il fabrique un pain bio et qu’il référence la minoterie Meichin et M. Y qui comme lui produit un pain bio ; à EDF, on sait qu’il a un profil de consommation P et a déménagé l’an dernier
D’après le SBF, un des syndicats de la boulangerie, M. X, boulanger du quartier Q achète son four à l’entreprise Bidule et sa farine à la minoterie Maichin ; par l’enquête « comment être boulanger au 21ième siècle et rester séduisant », on sait qu’il est abonné à « Boulangerie Magazine » dans lequel on trouve souvent la publicité pour Bidule ; sur son site Web, M. X nous apprend qu’il fabrique un pain bio et qu’il référence la minoterie Meichin et M. Y qui comme lui produit un pain bio ; à EDF, on sait qu’il a un profil de consommation P et a déménagé l’an dernier.
Comment tirer le meilleur parti de toutes ces informations
comment stocker
comment analyser
comment faire partager
par « l’enquête comachètedu quartier Q
M. Y.
syndicats
abonné
référence
profil de consommation P e
Maichin
?
M. X.
Meichin
1. Problématique de la Fouille de Données Complexes à EDF
L’analyse secondaire comme définie et pratiquée à EDF« réutiliser des données déjà capitalisées avec des objectifs d’analyse qui ne sont pas ceux pour lesquels elles étaient initialement collectées »
Le recours à l’analyse secondaire est motivé par :
les coûts
les gains méthodologiques apportés
Des précautions méthodologiques…
la mise à disposition des traces du contexte de l’analyse initiale, des stratégies, des hypothèses d’analyse en plus des données brutes.
1. Problématique – Début de solution : l’analyse secondaire
Lancement d’une analyse secondaire sur la problématique « déterminer les motivations, événements déclenchants de la rénovation »
Étude réalisée à partir de 9 analyses primaires dont :
L’appréciation de trois systèmes domotiques
Le retour d’expérience de la rénovation de logements sociaux
La climatisation fixe réversible dans une optique de mesure de la satisfaction
Zoom sur l’analyse primaire « la climatisation fixe réversible »
Segment de marché : les particuliers
Méta-données descriptives : sexe, âge, profession, type de logement
Méta-données issues de l’analyse : remarques du sociologue sur les réticences, les motifs d’investissement dans ce type d’appareil, la gestion de la nouvelle installation.
1. Problématique – l’analyse secondaire, un exemple concret
D’après le SBF, un des syndicat de la boulangerie, M. X, boulanger du quartier Q achète son four à l’entreprise Bidule et sa farine à la minoterie Maichin ; par l’enquête « comment être boulanger au 21ième siècle et rester séduisant », on sait qu’il est abonné à « Boulangerie Magazine » dans lequel on trouve souvent la publicité pour Bidule ; sur son site web, M. X nous apprend qu’il fabrique un pain bio et qu’il référence la minoterie Meichin et M. Y qui comme lui produit un pain bio ; à EDF, on sait qu’il a un profil de consommation P et a déménagé l’an dernier
1. Problématique - Contexte
Les travaux décrits aujourd’hui portent uniquement sur la réutilisation de données contenant du texte
Approche multi-métier : sociologues, « data-miners » et chargés d’étude marketing
Sources de données traitées :
Bases de capitalisation d’entretiens
Forums de discussion
Enquêtes de satisfaction
Absence d’hypothèse de départ…
Absence d’ontologie
1. Problématique – Périmètre de nos travaux
Etude souhaitée : « potentiel d’utilisation de la climatisation réversible auprès des clients d’EDF SA »
Deux analyses primaires
Ecrivains dont Arthur Rimbaud et Charles Baudelaire
Dixit, base de capitalisation d’entretiens construite par le Département d’études de la Branche Commerce
Signalétiques associées : date de naissance, type d’écrits, segment de marché, tarification ...
Stratégies et contextes d’analyse primaire : méthode de constitution des corpus, objectifs des analyses, commanditaires, dates…
• Ecrivains : méthode Benoît Habert, ATALA, Benoît Habert, février 2005
• Dixit : capitalisation d’enquêtes menées à la Branche Commerce, Jean Vidal, 2000 - 2004
1. Problématique – L’exemple de l’ATALA
Transformer
RDF
Dixit
Écrivains
…
Recherche Filtrage Exportation
Importation
Et
Annotation
Alceste
et
Temis
Structuration de données
Analyse et fouille de données complexes
TROIE
ACHILLES
Données Brutes Données Structurées
2. Architecture globale
E : Vous choisiriez le gaz ?P : Oui, je pense. Si je devais faire une installation dans ma propre maison ce serait plutôt vers le gaz que je me dirigerais.E : A cause du coût ?P : Oui voilà.. A cause du coût et de la chaleur. La chaleur n’est pas la même. Peut-être que maintenant les installations sont plus performantes mais..E : En tout cas vous leur demanderiez : s’il n’y a pas une autre chaleur électrique ?P : Oui, j’essaierais de voir s’il n’y a pas une autre solution. Je vois qu’à la maison, en plein hiver les chauffages sont pratiquement mis à fond et on n’a pas l’impression d’avoir chaud. La maison est très bien isolée, ce n’est pas ça.. En plus on a une dalle chauffante, au rez-de-chaussée, qui est allumée en permanence et par rapport à ça, on arrive sans allumer les convecteurs à une température constante de 19°. Ce qui est bien. Dans la journée on éteint les convecteurs puisqu’il n’y a personne et la température de la dalle maintien un minimum de chaleur. C’est surtout sur ce point là que j’insisterais.E : Donc, si nouveau fournisseur, vous lui poseriez quoi, comme question ?P : Je leur demanderais de prouver, par A plus B, que la chaleur électrique est aussi performante que celle au gaz, au niveau confort.
$FILE: Intitule: Structure de l'offre destinée aux clients résidentielsf_DateFinEtude: 07/10/2001ReferenceMKM: STUDEO 13109valmeth: 1 Entretien individuel,2 Table ronde - Entretiens de groupevalmetbis: 1 Entretien individuelintext: Externedemographie: ParticuliersMarcheAff: ParticuliersMarcheseg: Particulierssexe1: femmesexbis: age1: 53agbis: csp: secrétaire de directioncspbis: nombre1: effectif1: stat: propiétairemaison: maisonchiffre_1: principalechauffage: gazenergie1: électricité,gaztarif1: basecodepostal1: 35740Doc_Type: Fiche signalétique d'entretienValeurMethod: Entretien individuellogtab: 1yn: Externesegment: Particuliers
export
3. Structuration : TROIE
entretien_1_1
de type entretien
entretien_brut
/dixit1/data/entretien_brut1.xml
methodologie entretien_individuel
false
particuliers
interne_EDF
segment_de_marche
donnéesGeo36740
données personne
X
femme
sécretaire de direction
X
53
truetruetrue
données logement
donnéesEnergies
électricitégazbasegaz
données_geodonnées_socio
code_postal
données_logement
sexe
age fonctio
n
personnes_au_foyer
enfants_de_moins_de_15_ans
principale
maison
propriétaire
don
nées_energie
bag
_2
energies
_1
puissance
s_tarifs
chau
ffage
entretien_1_1
de type entretien
entretien_brut
/dixit1/data/entretien_brut1.xml/dixit1/data/entretien_brut1.xml
methodologie entretien_individuel
false
particuliers
interne_EDF
segment_de_marche
donnéesGeo3674036740
données personne
XX
femmefemme
sécretaire de directionsécretaire de direction
XX
5353
truetruetruetruetruetrue
données logementdonnées logement
donnéesEnergiesdonnéesEnergies
électricitéélectricitégazgazbasebasegazgaz
données_geodonnées_socio
code_postal
données_logement
sexe
age fonctio
n
personnes_au_foyer
enfants_de_moins_de_15_ans
principale
maison
propriétaire
don
nées_energie
bag
_2
energies
_1
puissance
s_tarifs
chau
ffage
3. Structuration : TROIE
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
Analyste
TEMIS
ALCESTE
TEMIS
ALCESTE
Structuration
Analyse_1.rdf
Analyse_1.rdf
Je suis un analyste moderne
et j’utilise des logiciels d’ADT et
je lis FT
Production des résultats
Export vers des logiciels d’analyse, import des résultats et des interprétations
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdfAnalyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
3. Une journée dans la vie d’une étude… : ACHILLES
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdfAnalyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. Requêtage et filtrage
Analyste
TEMIS
ALCESTE
Structuration
Analyse_1.rdf
Analyse_1.rdf
Analyse_1.rdf
Je suis un analyste moderne
et j’utilise des logiciels d’ADT et
je lis FT
Production des résultats
Export vers des logiciels d’analyse, import des résultats et des interprétations
3. export/import
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdfAnalyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdfAnalyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
Analyste
TEMIS
ALCESTE
Structuration
Analyse_1.rdf
Analyse_1.rdf
Analyse_1.rdf
Je suis un analyste moderne
et j’utilise des logiciels d’ADT et
je lis FT
Production des résultats
Export vers des logiciels d’analyse, import des résultats et des interprétations
3. export/import
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdfAnalyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
Analyste
TEMIS
ALCESTE
Structuration
Analyse_1.rdf
Analyse_1.rdf
Analyse_1.rdf
Je suis un analyste moderne
et j’utilise des logiciels d’ADT et
je lis FT
Production des résultats
Export vers des logiciels d’analyse, import des résultats et des interprétations
3. export/import
Analyste
TEMIS
ALCESTE
Structuration
Analyse_1.rdf
Analyse_1.rdf
Analyse_1.rdf
Je suis un analyste moderne
et j’utilise des logiciels d’ADT et
je lis FT
Production des résultats
Export vers des logiciels d’analyse, import des résultats et des interprétations
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdfAnalyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. export/import
Analyste
TEMIS
ALCESTE
Structuration
Analyse_1.rdf
Analyse_1.rdf
Analyse_1.rdf
Je suis un analyste moderne
et j’utilise des logiciels d’ADT et
je lis FT
Production des résultats
Export vers des logiciels d’analyse, import des résultats et des interprétations
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdfAnalyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. export/import
Analyste
TEMIS
ALCESTE
Structuration
Analyse_1.rdf
Analyse_1.rdf
Analyse_1.rdf
Je suis un analyste moderne
et j’utilise des logiciels d’ADT et
je lis FT
Production des résultats
Export vers des logiciels d’analyse, import des résultats et des interprétations
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
« chaleur »« froid »
(1)
Eventuellement, retour en arrière
Segment de marché = particuliers
Analyste
Je veux les documents ayant trait à la chaleur et au froid
Je veux uniquement les documents reprenant l’avis de particuliers
(2)
(1)
(2)
Validation
Analyse_1.rdfAnalyse_1.rdf
Benoit veut connaître le potentiel d’utilisation
de la climatisation réversible auprès des clients d’EDF SA….
Construction d’un corpus à partir de plusieurs sources par requêtage et filtrage.
3. export/import
Construction de deux prototypes s’appuyant sur XML/RDF
Un modèle conceptuel générique sous forme de triplets
Un langage logique facilitant le requêtage
Des exports plus aisés
Il reste quand même des améliorations à apporter !!!!
Interfaçage avec des bases de données afin de réduire les temps de chargement et de traitement
Passage à l’échelle réaliste
Amélioration de l’ergonomie des deux logiciels de manière à rendre l’utilisation d’XML transparente pour l’utilisateur final
Rendre l’architecture plus adaptée au travail collaboratif (partage des études, accès aux annotations de chacun, possibilité d’enrichir les interprétations)
Réflexion sur la normalisation sémantique des méta-données limitée actuellement à la syntaxe
4. Conclusion et perspectives
Construction de deux prototypes s’appuyant sur XML/RDF
Un modèle conceptuel générique sous forme de triplets
Un langage logique facilitant le requêtage
Des exports plus aisés
Il reste quand même des améliorations à apporter !!!!
Interfaçage avec des bases de données afin de réduire les temps de chargement et de traitement
Passage à l’échelle réaliste
Amélioration de l’ergonomie des deux logiciels de manière à rendre l’utilisation d’XML transparente pour l’utilisateur final
Rendre l’architecture plus adaptée au travail collaboratif (partage des études, accès aux annotations de chacun, possibilité d’enrichir les interprétations)
Réflexion sur la normalisation sémantique des méta-données limitée actuellement à la syntaxe
4. Conclusion et perspectives
Vous pouvez reprendre une activité normale...
Et maintenant...
Remerciements chaleureux à
Brad Pitt
pour son inspiration de tous les instants !