Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un...

22
Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire • La sécurité alimentaire • L’existant • Objectifs du sous-projet et réalisations • Conclusion

Transcript of Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un...

Page 1: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.1e.dot - Sous-projet 1

Sous-projet 1Spécification d’un entrepôt de données

pour la sécurité alimentaire

• La sécurité alimentaire

• L’existant

• Objectifs du sous-projet et réalisations

• Conclusion

Page 2: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.2e.dot - Sous-projet 1

L’analyse des risques• Création de l’OMC en 1994• Accords de Marrakech

– SPS agreement (mesures sanitaires et phytosanitaires)• commerce international de la nourriture, protection de la santé des humains• analyse des risques

• L ’analyse des risques nécessite des données de qualité – systèmes efficaces de collecte d’informations (n’existent pas)– données nécessaires : contaminations initiales de matières premières,

contaminations de produits finis, informations sur l’effet de facteurs, informations sur l’exposition du consommateur

• Le but est de pouvoir– réagir rapidement à une crise– prévenir une crise au lieu de simplement réagir

Page 3: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.3e.dot - Sous-projet 1

Les risques alimentaires

• Risques physico-chimiques– présence de métaux lourds (ou de dioxyne...) dans les

matières premières

• Risques microbiologiques– présence de bactéries pathogènes (ex. Listeria

monocytogenes)• dans les matières premières, les usines, le réfrigérateur du

consommateur

– facteurs qui influencent le comportement des bactéries• température, pH, aW (activité de l’eau)

Page 4: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.4e.dot - Sous-projet 1

Les bases de données existantes• En France

– bases sur les contaminations chimiques (DGCCRF) et les consommations (INSEE)

– bases microbiologiques• spécialisées (charcuterie/CTSCCV)• privées (viande/Bigard) • Dynacard (Danone, integré dans Sym’Previus)

• Dans le monde– bases européennes sur les contaminations (projets)– bases microbiologiques

• Grande-Bretagne (Combase) et Etats-Unis (PMP) : données de croissance sur des milieux de culture

• Nouvelle-Zélande, Australie et Danemark : dédiées à un type de produit (poisson...) ou une bactérie

Page 5: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.5e.dot - Sous-projet 1

Le projet Sym’Previus

• Début en novembre 99 / version 1 en 2004• Outil d’aide à l’expertise en hygiène et sécurité

alimentaire– pour les industriels de l’agro-alimentaire, les instituts

techniques, de recherche et les pouvoirs publics (DGAL)– originalité : résultats sur aliments

• Objectif : combiner– Base de données expérimentales sur aliment– Logiciel de simulation du développement des micro-

organismes

Page 6: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.6e.dot - Sous-projet 1

Les partenaires de Sym’Previus

ADRIAAERIALARILAITCTSCCVENV AlfortINRA/INAPGIP Lille

Laboratoires de recherche

et instituts techniques

BongrainDanoneFromarsac Pernod RicardFromageries BEL

ACTIAUNIR

Ministères RECHERCHEAGRICULTURE (DGAL)

Associationsprofessionnelles+

Pouvoirspublics+Industriels+

Consortium GIS

Page 7: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.7e.dot - Sous-projet 1

Les objectifs de Sym ’Previus• Constituer une base de connaissances qui contient

– des données bibliographiques validées et saisies par des experts

– des données expérimentales acquises dans le cadre du projet– des données industrielles (contamination initiales…)

• Créer des requêtes « consolidées », synthèses du comportement d’un micro-organisme

• Caler les modèles de simulation et confronter les résultats des simulations avec des données expérimentales

• Quel utilisateur : utilisation sous « contrôle » d’expert

Page 8: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.8e.dot - Sous-projet 1

Exemple de données de la base Sym’Previus

Evolution de Escherichia coli 0157:H7 sur matrice viande de boeuf

2.0

3.0

4.0

5.0

6.0

7.0

8.0

9.0

10.0

0 2 4 6 8 10

Temps (jours)

Po

pu

lati

on

(lo

g U

FC

/g)

4°C-Cabedo 1998- rep 1

4°C-Cabedo 1998- rep 2

4°C-Cabedo 1998- rep 3

4°C-Flores 1996- rep 1

4°C-Flores 1996- rep 2

4°C-Hathcox 1996

5°C-Abdul-Raouf 1993

8°C (Données ind)

12°C-Cabedo 1998- rep 1

12°C-Cabedo 1998- rep 2

12°C-Cabedo 1998- rep 3

12°C-Flores 1996- rep 1

12°C-Flores 1996- rep 2

12°C (Données ind)

15°C-Hathcox 1996

20°C-Flores 1996- rep 1

20°C-Flores 1996- rep 2

21°C-Abdul-Raouf 1993

21°C-Abdul-Raouf 1993 (3F) rep 1

21°C-Abdul-Raouf 1993 (3F) rep 2

30°C-Abdul-Raouf 1993

30°C-Abdul-Raouf 1993(3f) rep 1

30°C-Abdul-Raouf 1993(3f) rep 2

30°C-Abdul-Raouf 1993(3f) rep 3

30°C-Abdul-Raouf 1993(3f) rep 4

Page 9: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.9e.dot - Sous-projet 1

Caractéristiques de la base Sym’Previus

• 2 types d’information– niveaux de contamination d’aliments par des germes pathogènes

– impact de différents facteurs (température, process...) sur le comportement des germes (stabilité, croissance, décroissance)

• Sources– plus de 550 articles de la bibliographie internationale, sélectionnés par

des experts en microbiologie

– données industrielles anonymées

• Structure– schéma relationnel (environ 80 tables)

– complexité due à l’hétérogénéité des données • sources d ’information variées

• nombreuses requêtes des membres du groupe de travail qui a validé le schéma

Page 10: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.10e.dot - Sous-projet 1

Quelques caractéristiques des données

1) Données incomplètes

2) Données imprécises• [Zwietering 92] : On products with a low water activity, spore-forming microorganisms can be present (no growth)

• [Augustin 96] : Decimal reduction time of Listeria monocytogenes in skimmed milk at 63.3°C is between [25.8, 28.2] (in sec)

• [Rangasamy,1993] : Le niveau de contamination du lait cru par Bacillus cereus est inférieur à 10 CFU/ml

3) De nature très différentes ne « matchent » pas toujours avec la structure de la BDR

Page 11: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.11e.dot - Sous-projet 1

Stockage structuré en tables :Base de données relationnelle

Stockage faiblement structuré :Graphes conceptuels

Information correspondantà la structure de la BD

Information en margede la structure de la BD

Système d’interrogation unifiée : MIEL

Page 12: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.12e.dot - Sous-projet 1

• RequêteQ = {V, a1, …, an, <an+1, vn+1>, …, <am, vm>}

• RéponseA = {<a1, v1>, …, <an, vn>}

Langage d’interrogation du MIEL

Page 13: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.13e.dot - Sous-projet 1

Données incomplètes et imprécises sous-ensembles flous

1) Interrogation élargie• par l’utilisateur : représentation de préférences pour

les critères de sélection• par le moteur d ’interrogation : relation de similarité

entre valeurs

Res(Whole egg, Egg + salt/sugar) = 0.33

2) Représentation de données imprécises

0

1

Egg yolk Whole egg

MyEggProductPreferences

0,5

Non-ordered discrete domain

60 64 65 70

0

1

Product Temperature

°C

Continuous domain

MIELDonnéesimprécises

Requêtefloue

Page 14: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.14e.dot - Sous-projet 1

Exemple de GC de la base

Page 15: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.15e.dot - Sous-projet 1

Base GC

Q = {V, a1, …, an, <an+1, vn+1>, …, <am, vm>}

Génération de GC requêtes

A1 = {w1, …, wn} A2 = {x1, …, xn}A3 = {y1, …, yn}A4 = {z1, …, zn}

Projection

Interrogation de la base de GC

Page 16: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.16e.dot - Sous-projet 1

Objectifs du sous-projet 1

• Quelques questions auxquelles le sous-projet 1 doit répondre

– quels types de données utiles pour l’entrepôt trouve-t-on sur le Web ?– comment faire cohabiter données trouvées sur le Web et données déjà

stockées ?– quels traitement veut-on faire sur les données provenant du Web

(monitorage) ? Intégration explicite des données aux tables préexistantes ? Interrogation via un schéma global ?

– quelles connaissances relatives à la fiabilité des données ?

Page 17: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.17e.dot - Sous-projet 1

Objectifs du sous-projet 1

• Détail des réalisations– analyse des besoins

• détermination avec experts des manques prioritaires dans la base Sym’Previus• analyse du contenu d’autres bases• identification des éléments que l’on peut trouver sur le Web

– production• liste de spécifications• listes de mots-clés permettant de guider la recherche sur le Web

Page 18: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.18e.dot - Sous-projet 1

Réunion du 27 janvier 2003

• Présentation de l’existant– BD relationnelle– BK graphes conceptuels

• Ce que l’on peut trouver sur le Web– présentation de quelques sites intéressants

• Discussion sur la suite– caractériser les infos intéressantes, caractériser les sites ou pages

intéressants, réfléchir à l’extraction des informations intéressantes

• CR disponible sur le site e.dot

Page 19: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.19e.dot - Sous-projet 1

Réunion du 11 février 2003

présence de Benoît Leporq, IR INRA

• Point sur l’avancement du sous-projet 2• Informations que l’on aimerait ajouter dans l’entrepôt

– informations concernant le pH, l’aw et la teneur en acides gras des aliments

– informations extraites de sites bibliographiques

• Critères de choix ou de rejet d’une page– titre de revues, description du protocole expérimental, noms des

auteurs, noms des bactéries, mots-clés

• Critères de validité des infos– réputation de certains sites, présence de références

bibliographiques, redondance, confrontation

Page 20: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.20e.dot - Sous-projet 1

Documents produits

Liste d’auteurs(1107 noms)

Amaro-Lopez;M.Ammar;M.S.Ammendolia;M.G.Andersen;J.K.Anderson;J.G.

Hiérarchie de germes pathogènes(158 germes + 104 liens)

Lactobacillus>Lactobacillus plantarumListeria>Listeria innocuaListeria>Listeria monocytogenes

Hiérarchie de produits génériques(420 noms + traduction + 414 liens)

Fromage à pâte molle>CamembertPoisson fumé>Carpe fuméeFruits et légumes frais>Betterave

Liste de « synonymes »(604 synonymes)

Poulet: blanc et aile;blanc et aile de pouletFromage frais;Cottage cheeseFromage frais;Mozarella

Page 21: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.21e.dot - Sous-projet 1

Documents produits

Liste des produits

Liste des auteurs

Liste des germes

{"pH", "aw", "acide gras", "acides gras", "fatty acid"}

{cinétique, croissance, décroissance, survie, kinetic, growth, decrease, survival, inactivation}

Combinaisons recherchées

Page 22: Réunion plénière 04/04/2003 p.1 e.dot - Sous-projet 1 Sous-projet 1 Spécification d’un entrepôt de données pour la sécurité alimentaire La sécurité alimentaire.

Réunion plénière 04/04/2003 p.22e.dot - Sous-projet 1

Conclusion

• Des documents permettant le crawling du Web ont été produits

• L’avis d’un expert français financé par l’INRA a pu être recueilli– afin de déterminer le type d’informations utiles pour l’entrepôt

• MAIS– la troisième réunion prévue le 2 avril a été annulée (impossibilité de financer

le déplacement et les honoraires d’un expert Hollandais)=> RETARD