Bulletin de l'AFIA

48
Bulletin N o 103 Association française pour l’Intelligence Artificielle AfIA janvier 2019 N o 103 1

Transcript of Bulletin de l'AFIA

Page 1: Bulletin de l'AFIA

Bulletin No 103Association française pour l’Intelligence Artificielle

AfIA

janvier 2019 No 103 1

Page 2: Bulletin de l'AFIA

PRÉSENTATION DU BULLETINLe Bulletin de l’Association française pour l’Intelligence Artificielle vise à fournir un cadrede discussions et d’échanges au sein de la communauté universitaire et industrielle. Ainsi,toutes les contributions, pour peu qu’elles aient un intérêt général pour l’ensemble des lec-teurs, sont les bienvenues. En particulier, les annonces, les comptes rendus de conférences,les notes de lecture et les articles de débat sont très recherchés. Le Bulletin de l’Af IApublie également des dossiers plus substantiels sur différents thèmes liés à l’IA. Le comitéde rédaction se réserve le droit de ne pas publier des contributions qu’il jugerait contraireà l’esprit du bulletin ou à sa politique éditoriale. En outre, les articles signés, de mêmeque les contributions aux débats, reflètent le point de vue de leurs auteurs et n’engagentqu’eux-mêmes.

ÉditoLes réseaux sociaux constituent un phénomène de société majeur depuis quelques années :

que ce soit pour s’informer, publier une information ou une opinion, ou tout simplement s’expri-mer, les médias sociaux sont omniprésents dans nos vie d’internautes connectés. L’analyse et lacompréhension de ces médias au moyen d’outils informatiques est plus difficile : comment repré-senter cette masse de données brutes ? comment détecter les mouvements d’opinions au seinde ce volume énorme de données ? comment détecter les faux sites, les comptes malveillants ?

Notre domaine scientifique de l’Intelligence Artificielle s’est naturellement tournée vers cesformes d’expression écrite. C’est l’objet du dossier de ce numéro 103 du Bulletin de l’AfIA, pré-paré par Arnaud MARTIN (IRISA). Huit équipes françaises y sont recensées et auto-présententleurs thèmes de recherche et résultats dans ce dossier.

Ce numéro contient également les rubriques traditionnelles de comptes rendus d’événements,avec pour le présent numéro un compte rendu de la journée Perspective et Défis de l’I.A. (PDIA)consacrée au « Véhicule autonome et intelligence artificielle » concocté par Olivier SIMONIN(INSA Lyon), un compte-rendu des Journées Francophones sur les Systèmes Multi-Agents of-fertes par Gauthier PICARD (Mines Saint-Etienne) et un compte rendu de la Nuit de l’Infopréparé par Florence BANNAY (IRIT). Qu’ils en soient remerciés !

Toute l’équipe de rédacteurs du Bulletin de l’AfIA vous souhaite une bonne lecture de cenuméro !

Philippe MORIGNOTRédacteur

janvier 2019 No 103 1

Page 3: Bulletin de l'AFIA

SOMMAIRE

DU BULLETIN DE L’AfIA

3 Dossier « Intelligence artificielle et réseaux sociaux »Édito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4Collecter ne suffit pas : que nous racontent les données? ou pourquoi les médiassociaux constituent un champ d’investigation à long terme... . . . . . . . . . . 4Fouille de graphes complexes. . . . . . . . . . . . . . . . . . . . . . . 7Fouille de graphes enrichis . . . . . . . . . . . . . . . . . . . . . . . . 11Analyse d’activités dans les réseaux sociaux . . . . . . . . . . . . . . . . . 14Analyse des réseaux sociaux pour des applications liées à la santé. . . . . . . . . 17Autodétermination des utilisateurs dans les réseaux siociaux . . . . . . . . . . . 19Recherche en réseaux sociaux dans l’équipe DM2L . . . . . . . . . . . . . . 22LIA : Laboratoire Informatique d’Avignon . . . . . . . . . . . . . . . . . . 25

30 Comptes rendus de journées, événements et conférences26es Journées Francophones sur les Systèmes Multi-Agents (JFSMA 2018) . . . . . 315e journée Perspectives et Défis de l’IA (PDIA 2018) . . . . . . . . . . . . . 33Nuit de l’Info . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

37 Thèses et HDR du trimestreThèses de Doctorat . . . . . . . . . . . . . . . . . . . . . . . . . . 38Habilitations à Diriger les Recherches . . . . . . . . . . . . . . . . . . . 45

janvier 2019 No 103 2

Page 4: Bulletin de l'AFIA

Dossier

« Intelligence artificielleet réseaux sociaux »

Dossier réalisé par

Arnaud MARTINIRISA/DRUIDUniversité de Rennes, CNRS, [email protected]

Page 5: Bulletin de l'AFIA

Édito

Ce dossier regroupe des travaux actuels surles réseaux sociaux et leurs liens avec l’intelli-gence artificielle. Florence SÈDES montre toutd’abord en quoi les médias sociaux constituentun domaine d’applications, source de verrousscientifiques importante. Les travaux de sonéquipe portent essentiellement sur la définitiond’un profil social des utilisateurs de différentsmédias sociaux. Ainsi extraire des informationsissues des réseaux sociaux revient bien souventà faire de la fouille de données sur des graphescomplexes qui permettent de représenter les ré-seaux sociaux. Christine LARGERON montrecomment, dans son équipe, les recherches sesont tournées de la détection de communautésvers la génération de graphes attribués pourvalider les algorithmes développés notammenten considérant la dynamique des réseaux. Il estaussi possible d’enrichir les graphes attribuéspar l’extraction de motifs abstraits sur les ré-seaux tel que le présente Henry SOLDANO.Une autre problématique importante motivéepar la quantité des données sur les réseauxsociaux est l’analyse des activités sur ces ré-seaux. Laurent VERCOUTER et son équipecherchent ainsi à détecter les faux comptes, les

comptes malveillants ou encore les personnesinfluentes sur les réseaux. Jérôme AZÉ et San-dra BRINGAY présentent ensuite les activitésde leur équipe tournées vers l’analyse des ré-seaux sociaux pour des applications liées à lasanté pour lesquelles il est essentiel de consi-dérer la fiabilité des contenus dans l’analysede ceux-ci et de tenir compte de la tempora-lité des données. Toujours motivés par les don-nées, Anne BOYER et l’entreprise Sailendra,ont étudié l’apport de l’algorithme mutual votepour l’autodétermination des utilisateurs dansles réseaux sociaux. Rémy CAZABET et Jean-François BOULICAULT décrivent les activitésde leur équipe qui tournent autour de l’analysede réseaux sociaux, notamment de leur dyna-mique, des multi-graphes attribués et de l’or-ganisation des réseaux complexes. Pour finir cedossier, Jean-François BONASTRE expose lesdifférentes activités de son laboratoire orien-tées autour des réseaux sociaux.

Sans être exhaustif, le présent dossiermontre l’étendue des travaux en intelligenceartificielle en France, motivés par les donnéesissues des réseaux sociaux.

Collecter ne suffit pas : que nous racontent les données ? ou pourquoiles médias sociaux constituent un champ d’investigation à long terme...

IRIT/ SIGUniversité Paul Sabatier Toulouse 3

https://www.irit.fr/ -Equipe-SIG

Florence SÈ[email protected]

La donnée n’est qu’un point de départ !

L’analyse et la gestion des donnéesconcourent à un processus qui tend à les « trai-ter », leur donnant du sens pour qu’en résulte

une information sur laquelle l’humain peut sebaser pour prendre des décisions effectives :analysée, transformée et rendue accessible àl’utilisateur, la donnée doit aussi répondre à desbesoins, profils, audiences diverses. Ainsi com-

janvier 2019 No 103 4

Page 6: Bulletin de l'AFIA

préhensible et « intelligente », la valeur (ajou-tée) de la donnée réside dans l’histoire quecelle-ci raconte.

Les travaux de notre équipe interviennent« des données à la décision » : ils concernentles aspects liés à la gestion, la modélisation,l’analyse et l’exploration des données, dans di-vers contextes, comme base pour la prise dedécision.

La donnée n’est pas inerte : outre les tra-ditionnelles problématiques liées à son évolu-tion (gestion de versions, réification, identitévs égalité, ré-identification, etc.), la dynamiquedes applications et des profils des usagers nousoblige à nous confronter à de nouveaux indica-teurs, tels la notion de température (buzz, ten-dances, etc.), qui traduit l’intérêt de la commu-nauté, ou de ligne de flottaison (niveau de visi-bilité plancher), qui matérialise la limite en deçàde laquelle la pertinence n’est plus de mise.

Les médias sociaux constituent un domained’application, d’expérimentation, un appui à laformalisation et une source de verrous scien-tifiques et technologiques dont nous sommesloin d’atteindre les limites. La gestion, la mo-délisation, l’analyse, la fouille et l’explorationde cet écosystème numérique ont été mises enavant dans différentes contributions : à partirde l’analyse de la dynamique des réseaux so-ciaux, par exemple pour la détection de com-munautés, sont étudiés les processus de diffu-sion de l’information, polémique, buzz, spam,fake, etc. La détection de rôle (influence so-ciale, autorité, propagande) induit différentsmodes de coordination ou de régulation pouret par ces réseaux.

La contribution initiale de notre équipe ré-side dans une construction du profil de l’utili-sateur, appelé profil social, à partir de médiassociaux en ligne (Online Social Media - OSM).Le processus CoBSP (Community Based SocialProfile) a été proposé dans l’objectif d’extraireles informations les plus pertinentes caractéri-

sant un profil utilisateur, en se basant sur sonréseau égocentrique et ses communautés.

La caractéristique dynamique des OSMévoquée plus tôt induit l’intégration de critèrestemporels dans le processus de construction duprofil, selon une approche de détection des inté-rêts et d’enrichissement temporel dudit profil.

Cette approche utilise non seulement le ré-seau égocentrique et les « communautés » dechaque utilisateur, mais aussi des informationscomme les documents et les « tags » parta-gés et/ou annotés. Les expérimentations surles réseaux de co-auteurs de publications scien-tifiques DBLP et Mendeley et sur Deliciousont montré l’efficacité de la contribution pourconstruire un profil social de l’utilisateur perti-nent et à jour. Ces travaux, appliqués dans unedémarche générique, ont également été mis enœuvre sur la base des archives ouvertes HALvue comme un réseau de co-auteurs à grandeéchelle : réseau de mots-clés, thèmes, institu-tions, communautés, équipes, usages, etc. Cesrésultats permettent de suivre les évolutionsthématiques de toute communauté (campagneélectorale, scientifiques, femmes vs hommes,etc.) et peuvent être utilisés par des méca-nismes de recommandation (d’auteurs, d’ar-ticles, de communautés, etc.).

Le jeu de données de HAL, avec 300000 articles, plus d’un million de noticesméta-données ainsi que les données d’usage(avec textes, auteurs, affiliations, figures, or-ganismes, expérimentations), a servi de base ànos évaluations.

Le modèle social générique de profil utilisa-teur issu de ces travaux est susceptible d’êtreréutilisé dans différents domaines d’application,comme processus de dérivation des élémentsdu profil social de l’utilisateur, non pas à partirdes individus autour de l’utilisateur, mais à par-tir des communautés autour de lui, dans uneportion de son réseau social (réseau égocen-trique).

janvier 2019 No 103 5

Page 7: Bulletin de l'AFIA

Profil utilisateur vs profil social ?

Intégrer des critères temporels dans le pro-cessus de construction du profil de l’utilisateurs’est imposé comme une évidence compte tenudes usages. Le poids « temporel », qui reflètela pertinence d’un intérêt à un instant donné,est calculé, d’une part, à partir de la pertinencedes individus du réseau égocentrique de l’utili-sateur en prenant en compte « la fraîcheur »de leurs liens avec l’utilisateur et, d’autre part,à partir de la pertinence des informations qu’ilspartagent en prenant en compte la « fraîcheur »de ces informations.

Les expérimentations effectuées dans deuxréseaux de publications scientifiques, DBLP etMendeley, ont montré la pertinence de la pro-position sur cette vérité-terrain.

Une comparaison des performances du mo-dèle générique déjà testé sur les réseaux men-tionnés auparavant a été menée avec la base dedonnées sociales Delicious, qui a aussi servi dejeu de données pour proposer une approche dedétection des intérêts et d’enrichissement tem-porel du profil utilisateur. Cette approche uti-lise non seulement le réseau égocentrique et lescommunautés de chaque utilisateur, mais aussides informations comme les documents (méta-données classiques) et les tags (métadonnéessociales) partagés et/ou annotés par les utili-sateurs. L’aspect temporel a été introduit afind’enrichir périodiquement chaque profil utilisa-teur.

De par leur démarche générique, ces tra-vaux peuvent être mis en œuvre et expérimen-tés sur différents types de réseaux/données, parexemple pour un processus continu sur les ar-chives ouvertes HAL : les résultats visés sontles évolutions de thématiques de recherchedes chercheurs, des équipes, des communautésscientifiques, etc., mais aussi des mécanismesde recommandation en ligne (d’auteurs, d’ar-ticles, etc.).

Des domaines d’applications variés : ré-seaux sociaux mobiles, Social IoT, ges-tion de risques, qualité de l’informa-tion...

Les domaines d’application de ces travaux,en lien avec les évolutions des infrastructures,depuis les Réseaux Sociaux Mobiles (véhicu-laires, etc.) jusqu’à l’IoT social reflètent les re-cherches en cours autour de la confiance etde la « privacité », comme les récentes polé-miques autour de l’application STRAVA. Parmiceux-ci, la gestion de crise (alerte, organisa-tion des ressources, diffusion, etc.) nous per-met de valoriser nos savoir-faire en gestion deBig Data et en métriques de Qualité de l’In-formation. En effet, la popularité des médiassociaux en ligne (OSM) est fortement liée à laqualité du contenu généré par l’utilisateur et àla protection de la vie privée des utilisateurs. Ense basant sur la définition de la qualité de l’in-formation, comme son aptitude à être exploi-tée, la facilité d’utilisation des OSM soulève denombreux problèmes en termes de qualité del’information qui impacte les performances desapplications exploitant ces OSM (individus malintentionnés (i.e. « spammeurs ») qui les uti-lisent pour disséminer de fausses informationset/ou des informations indésirables telles queles contenus commerciaux illégaux). La propa-gation et la diffusion de telles informations (les« spams ») entraînent d’énormes problèmes af-fectant la qualité des services proposés parles OSM. La majorité d’entre eux (Facebook,Twitter, etc.) étant quotidiennement attaquéspar quantité d’utilisateurs mal intentionnés, lestechniques de filtrage adoptées, nécessitantplusieurs semaines voire plusieurs mois pour fil-trer l’information ainsi bruitée, s’avèrent inef-ficaces. Plusieurs défis doivent être surmon-tés pour réaliser une méthode de filtrage : (i)données de masse ; (ii) vie privée et sécurité ;(iii) hétérogénéité des structures dans les ré-seaux sociaux ; (iv) diversité des formats, sé-

janvier 2019 No 103 6

Page 8: Bulletin de l'AFIA

mantiques, granularité, etc. des contenus géné-rés par les utilisateurs ; (v) subjectivité vs ob-jectivité.

Notre travail s’inscrit dans le cadre del’amélioration de la qualité des contenus entermes de messages partagés et de profils desutilisateurs des OSM en abordant en détail lesdéfis susmentionnés. Le spam social étant leproblème le plus récurrent, nous avons proposédeux approches génériques pour détecter et fil-trer le contenu spam : i) la première approcheconsiste à le détecter dans un flux en tempsréel (par exemple les tweets) ; ii) la secondeapproche est dédiée au traitement d’un grandvolume des données relatives aux profils utilisa-teurs des spammeurs (par exemple, les comptesTwitter). Pour le contenu, nous introduisonsune approche d’apprentissage non superviséequi permet le filtrage en temps réel des tweetsspams dans laquelle la fonction de classificationest adaptée automatiquement. La fonction de

classification, entraînée de manière itérative, nerequiert pas de collection de données annotéesmanuellement.

Dans la deuxième approche, nous traitonsle problème de classification des profils utili-sateurs dans le contexte d’une collection dedonnées à grande échelle. Nous proposons defaire une recherche dans un espace réduit deprofils utilisateurs (une communauté d’utilisa-teurs) au lieu de traiter chaque profil d’utili-sateur. Chaque profil appartenant à cet espaceréduit est analysé pour prédire sa classe à l’aided’un modèle de classification binaire.

Les expériences menées sur Twitter ontmontré que le modèle de classification collec-tive non supervisé proposé est capable de gé-nérer une fonction efficace de classification bi-naire des tweets en temps réel qui s’adapte àl’évolution des stratégies des spammeurs so-ciaux sur Twitter.

Fouille de graphes complexes

Laboratoire Hubert CurienUniversité de Saint-Etienne

https:// laboratoirehubertcurien.univ-st-etienne.fr/

Christine [email protected]

La thématique Data Intelligence du La-boratoire Hubert Curien

Au sein du Laboratoire Hubert Curien(UMR CNRS 5516), la thématique Data Intel-ligence aborde les problématiques de machinelearning dont l’objectif est d’apprendre auto-matiquement des modèles à partir de données,et de fouille de données dont le but est d’ex-traire de l’information pertinente de grands vo-lumes de données. Ces problématiques sont ex-trêmement porteuses aujourd’hui en raison deleurs nombreuses applications, et s’inscriventdans des thèmes plus larges comme le big data

ou la science des données. En machine lear-ning, il s’agit notamment de développer de nou-veaux algorithmes de representation learning,de transfer learning/domain adaptation, d’ap-prentissage multi-vues, adaptés notamment aucontexte de la détection d’anomalies et defraude, de concevoir de nouvelles fonctions depertes à optimiser, adaptées à des contextestrès déséquilibrés et non indépendants et iden-tiquement distribués, ou encore de dériver desgaranties théoriques sur les algorithmes dé-veloppés. En fouille de données, les travauxportent plus particulièrement sur le traitementde données complexes et hétérogènes (docu-

janvier 2019 No 103 7

Page 9: Bulletin de l'AFIA

ments multimédias, XML, Tweets, images, sé-quences vidéos, graphes, réseaux sociaux) etvisent à construire des modèles et des espacesde représentation adaptés, et à élaborer desméthodes de découvertes de motifs à partir deces données. Une partie de ces recherches s’at-tache à exploiter simultanément ces différentstypes de données, notamment relationnelles ettextuelles, ou textuelles et image, dans le butde traiter plus efficacement des tâches clas-siques de fouille de données comme le classe-ment supervisé ou non, ou encore d’améliorerles performances de systèmes de recommanda-tion ou de recherche d’information.

Un type de données complexes : lesgraphes attribués

Parmi les données complexes particulière-ment étudiées au sein de la thématique figurentles réseaux d’information, largement utilisés cesdernières années pour modéliser et simuler di-vers types de systèmes : sociaux, biologiques,informatiques, etc. Dans le cadre de nos tra-vaux, nous nous sommes plus particulièrementintéressés aux graphes attribués où les som-mets du graphe représentent les entités dusystème, les liens correspondent à leurs rela-tions et où un vecteur d’attributs est associéà chaque sommet pour décrire ses caractéris-tiques. Ainsi par exemple, dans un réseau deco-publications scientifiques, chaque sommetcorrespond à un auteur auquel est associé unvecteur construit à partir du contenu de ses pu-blications et il existe un lien entre deux auteurss’ils ont écrit au moins un article ensemble.

De la détection de communautés...

La prise en compte de ces attributs en plusdes informations relationnelles nous a conduit àrevisiter les indicateurs classiques de caractéri-sation des sommets du graphe tels que les me-sures de centralité [2]. Elle nous a aussi amené

à étendre les méthodes de détection de com-munautés. L’objectif de la détection de com-munautés est de créer une partition des som-mets de telle sorte que les sommets au seind’une même communauté soient fortement re-liés entre eux et faiblement connectés au restedu réseau. En intégrant les attributs qui les dé-crivent, il s’agit en plus de placer dans un mêmegroupe les sommets qui ont également approxi-mativement les mêmes caractéristiques. Ainsi,on peut dire que la tâche consiste à résoudre àla fois un problème de classement non superviséet de détection de communautés. Pour ce faire,nous avons tout d’abord introduit un nouveaucritère de qualité d’une partition d’éléments re-présentés dans un espace réel. Ce critère, ap-pelé QInertia car il est basé sur l’inertie, pré-sente plusieurs propriétés intéressantes, d’unepart il est borné et d’autre part il conserve lamême valeur quelle que soit la transformationaffine appliquée aux vecteurs représentant leséléments. Une des applications immédiates ducritère QInertia a été d’étendre l’algorithme deLouvain, un des algorithmes les plus efficacesà ce jour pour détecter des communautés dansun graphe. En itérant une phase de migrationet de fusion, ILouvain, reprend le même pro-cessus glouton que Louvain mais il vise à opti-miser une combinaison linéaire de QInertia et dela modularité alors que Louvain considère uni-quement ce dernier critère. Comme Louvain,un des avantages de ILouvain est que l’optimi-sation repose sur une approche locale [5].

... à la génération de graphes attribués

Lors de ces recherches, nous avons étéconfrontés au manque de benchmark et de jeuxde données réelles avec vérité terrain nous per-mettant d’évaluer nos algorithmes. Pour y re-médier, nous avons donc développé un géné-rateur de réseaux dynamiques attribués avecstructure communautaire [7, 4]. Ce générateur,est disponible sous licence libre GNU GPL V3.0

janvier 2019 No 103 8

Page 10: Bulletin de l'AFIA

sur le site du Laboratoire Hubert Curien. Deuxtypes d’opérations, contrôlables à l’aide de pa-ramètres par l’utilisateur, permettent de gui-der l’évolution du réseau, d’une part des micro-opérations appliquées sur les liens et les som-mets du graphe et d’autre part des macro-opérations appliquées sur les communautés.De plus, la génération est menée de façon àproduire des graphes respectant les proprié-tés classiques des réseaux réels telles que l’at-tachement préférentiel ou l’homophilie. Ainsi,à partir d’un ensemble de paramètres fixéspar l’utilisateur, tels que le nombre de som-mets, le nombre minimum de liens dans et horsde la communauté, le nombre de communau-tés, etc., le logiciel produit une séquence degraphes, avec pour chaque graphe la partitiondes sommets en communautés et les attributsréels caractérisant chacun des sommets. Deplus, une version graphique permet de visualiserl’évolution du réseau et de sa structure com-munautaire au cours du temps, ou bien chacundes graphes le composant. L’interface afficheégalement différents indicateurs pour contrôlerles propriétés vérifiées par le graphe comme parexemple la modularité, le coefficient de cluste-ring et l’inertie intra-classe pour sa structurecommunautaire ou encore la distribution desdegrés pour l’attachement préférentiel.

... ou encore à l’étude de graphes dyna-miques incomplets

Nous nous nous sommes aussi intéressés àla détection de communautés dans des graphesdynamiques lorsque la structure du graphe estpartiellement connue ; ce qui dans la pratiqueest le plus souvent le cas lorsque toutes lesinteractions entre les entités du réseau nepeuvent pas être observées. Nous avons notam-ment comparé des méthodes prévues pour lesgraphes dynamiques et basées sur la décom-position de tenseurs, et des méthodes conçuespour traiter un graphe simple mais que nous

avons adaptées au cas dynamique soit en fu-sionnant les données des graphes d’entrée lorsdu prétraitement, soit en fusionnant les par-titions générées sur chacun d’eux en post-traitement. Nos résultats expérimentaux ontmontré que ces secondes approches sont suffi-santes lorsque la structure communautaire estclairement définie mais que les méthodes ca-pables de gérer les graphes dynamiques sontplus performantes lorsque cette structure estplus complexe [3].

Nous poursuivons actuellement l’étude deplusieurs familles de modèles bien adaptés pourla détection de communautés ou la prédictionde liens. En particulier, en collaboration avecle LIG, dans le cadre de la thèse d’A. DU-LAC, nous étudions le comportement de mo-dèles probabilistes dits mixed-membership vis-à-vis de l’homophilie et de l’attachement préfé-rentiel. Nous avons notamment démontré qu’ilssatisfont l’homophilie avec la similarité natu-relle qui les sous-tend. Pour l’attachement pré-férentiel la situation est plus contrastée : cesmodèles ne satisfont pas l’attachement préfé-rentiel global. En revanche, le respect de l’at-tachement préférentiel local est possible se-lon que l’appartenance aux classes latentes eststricte ou partielle et, dans ce dernier cas si ladistribution sur les classes latentes est burstyou non [6].

Avec le LIRIS, dans le cadre du projet Net-work Embedding with Dynamic soutenu par laFédération Informatique de Lyon, nous nousintéressons aussi aux méthodes de projectionde graphe dans un espace réel (embedding degraphes), étudions leurs capacités à préservercertaines propriétés du graphe ou sa structure,et nous poursuivrons ces travaux dans le cadredu projet ACADEMICS soutenu par l’IDEXLyon.

janvier 2019 No 103 9

Page 11: Bulletin de l'AFIA

Exploitation des données relationnelles pourla recherche d’information ou la recomman-dation

Enfin, nous avons aussi exploité les infor-mations relationnelles pour améliorer les per-formances de systèmes de recommandation oude recherche d’information. Ainsi, par exemple,dans le cadre du projet NeoTex (Explorationde documents Textuels d’un domaine par unNéophyte), un des chantiers d’usage d’ISTEX,nous avons conçu un système dont le but estd’assister la recherche documentaire d’un néo-phyte qui souhaite explorer la littérature d’undomaine scientifique. À partir d’une requêtecomposée de quelques mots-clés fournis parl’utilisateur, ce système permet de classer lesarticles scientifiques de la base ISTEX en te-nant compte non seulement de leur contenumais aussi de scores calculés sur le graphe decitations des articles de cette base ainsi quedes mesures externes. Nos expérimentationsont confirmé l’apport de ces mesures par rap-port à une recherche basée uniquement sur lecontenu [1].

Ces différents travaux ont été menés avecdes membres du projet Data mining and In-formation retrieval : B. AUDEH, M. BEIGBE-DER, O. BENYAHIA, D. COMBE, M. GÉRY,B. JEUDY, P.N. MOUGEL, des collègues duLIG : A. DULAC, E. GAUSSIER, du Liris :R. CAZABET, E. EGYED- ZSIGMOND, R.VAUDAINE, et de l’Université d’Alberta : O.ZAÏANE.

Références

[1] Bissan Audeh, Michel Beigbeder, andChristine Largeron. A machine learning sys-tem for assisting neophyte researchers indigital libraries. In 14th IAPR InternationalConference on Document Analysis and Re-cognition, ICDAR 2017, Kyoto, Japan, No-vember 9-15, 2017, pages 317–323, 2017.

[2] Oualid Benyahia and Christine Largeron.Centrality for graphs with numerical at-tributes. In Proceedings of the 2015IEEE/ACM International Conference onAdvances in Social Networks Analysis andMining, ASONAM 2015, Paris, France, Au-gust 25-28, 2015, pages 1348–1353, 2015.

[3] Oualid Benyahia, Christine Largeron, andBaptiste Jeudy. Community detection indynamic graphs with missing edges. In11th International Conference on ResearchChallenges in Information Science, RCIS2017, Brighton, United Kingdom, May 10-12, 2017, pages 372–381, 2017.

[4] Oualid Benyahia, Christine Largeron, Bap-tiste Jeudy, and Osmar R. Zaïane. Dan-cer : Dynamic attributed network withcommunity structure generator. In Ma-chine Learning and Knowledge Discovery inDatabases - European Conference, ECMLPKDD 2016, Riva del Garda, Italy, Sep-tember 19-23, 2016, Proceedings, Part III,pages 41–44, 2016.

[5] David Combe, Christine Largeron, MathiasGéry, and Elöd Egyed-Zsigmond. I-louvain :An attributed graph clustering method.In Advances in Intelligent Data AnalysisXIV - 14th International Symposium, IDA2015, Saint Etienne, France, October 22-24, 2015, Proceedings, pages 181–192,2015.

[6] Adrien Dulac, Éric Gaussier, and ChristineLargeron. A study of stochastic mixedmembership models for link prediction insocial networks. In 2017 IEEE InternationalConference on Data Science and AdvancedAnalytics, DSAA 2017, Tokyo, Japan, Oc-tober 19-21, 2017, pages 706–715, 2017.

[7] Christine Largeron, Pierre-Nicolas Mougel,Oualid Benyahia, and Osmar R. Zaïane.Dancer : dynamic attributed networks withcommunity structure generation. Knowl.Inf. Syst., 53(1) :109–151, 2017.

janvier 2019 No 103 10

Page 12: Bulletin de l'AFIA

Fouille de graphes enrichis

LIPNUniversité Paris 13

https:// lipn.univ-paris13.fr/

Henry [email protected]

Des réseaux aux réseaux enrichis

Les données structurées sous forme degraphes sont des objets devenus proéminentsces dernières années, en particulier en sciencesde la vie (réseaux biologiques) et sur internet(réseaux sociaux en ligne), auxquels s’ajoutentles réseaux sociaux à proprement parler, ob-jets d’étude de la sociologie. L’étude de cesobjets s’est longtemps limitée à des questionspurement topologiques, mesurant des indiceset modélisant ces réseaux pour identifier leurscaractéristiques, leur structure, en extraire descommunautés. Les informations complémen-taires éventuelles concernant les sommets etles liens étant utilisées a posteriori. Depuisquelques années cependant il y a un intérêtaccru pour les réseaux enrichis : réseaux attri-bués dans lesquels les sommets ou les liens sontétiquetés par des descriptions, réseaux mul-tiplexes lorsque les liens qui relient les som-mets sont de différentes natures, réseaux multi-modaux lorsque les sommets sont de différentstypes, réseaux orientés lorsque les liens sontdes arcs, réseaux géographiques dont les som-mets sont localisés sur un espace physique.Ces différents enrichissements peuvent être deplus combinés en un réseau hétérogène. Ceciconduit d’une part techniquement à adapter etétendre les méthodes existantes spécifiques auxréseaux, d’autre part à importer les techniquesprovenant de l’apprentissage et de la fouille dedonnées, en considérant que le réseau est unestructure des données que l’on examine. Nousallons de ce fait vers la possibilité d’exploiter dela manière la plus large la nature relationnelledes données.

Dans l’équipe, nous avons récemment dé-veloppé différentes approches méthodologiquesconcernant l’apprentissage et la fouille de don-nées sur les réseaux sociaux multiplexes ou at-tribués. En particulier, nous nous sommes in-téressés à la détection de communautés [4]ainsi qu’à l’énumération et à la sélection demotifs portant sur les attributs, via la réduc-tion de sous-graphes à des sous-graphes noyauxou core subgraphs en anglais. Nous nous in-téressons, formellement et d’un point vue al-gorithmique et expérimental, à l’extension deces méthodes de détection de communauté etd’énumération de motifs aux réseaux enrichis.Chaque aspect du réseau requiert une manièreparticulière de l’aborder, que ce soit pour l’ana-lyser, le construire, le réviser, en extraire descommunautés ou des sous-graphes noyaux. Enparticulier nous nous intéresserons aux types etaux rôles des différents éléments constituant unréseau hétérogène.

La fouille de motifs abstraits dans lesgraphes attribués

Avant de présenter le cœur de notre projetsur l’extraction de motifs multiples dans les ré-seaux hétérogènes, il est nécessaire de présen-ter brièvement quelques éléments méthodolo-giques :

- La notion de sous-graphe noyau d’ungraphe : la partie essentielle d’un graphematérialisée par le plus grand sous-graphedont les sommets satisfont une certaine pro-priété [1]. Ces sommets constituent le noyaudu graphe. Il s’agit d’une généralisation duk-noyau proposé par SEIDMAN dans lequel

janvier 2019 No 103 11

Page 13: Bulletin de l'AFIA

tous les sommets doivent avoir un degré aumoins k .

- La notion demotif fermé : on suppose qu’ona un ensemble d’objets chacun décrit dansun langage partiellement ordonné par le mo-tif le plus spécifique de ce langage qui ap-paraît dans l’objet. Le cas le plus connu estcelui des itemsets : chaque objet est décritpar un sous-ensemble d’items, par exempleabc , et le motif ab apparaît dans l’objet carab est inclus dans la description abc de l’ob-jet. Un motif est dit fermé si c’est le motif leplus spécifique parmi tous les motifs ayantla même extension, c’est-à-dire apparaissantdans le même sous-ensemble d’objets. Enénumérant les motifs fermés on évite d’avoirplusieurs motifs ayant même extension et onon réduit ainsi l’ensemble des solutions. Ilexiste des algorithmes efficaces d’énuméra-tion de motifs fermés [2].

Nous avons développé une méthodologied’énumération et sélection de motifs dans lesgraphes attribués, qui énumère des motifs fer-més, mais au sens d’un opérateur de fermeturedifférent, on parle alors de fermés abstraits,permettant une plus grande réduction de l’en-semble des motifs solutions. En pratique, lorsde l’énumération on calcule l’extension d’unmotif donné, c’est-à-dire un sous-ensemble desommets, puis on réduit ce sous-ensemble àson noyau, et on cherche le motif le plus spéci-fique commun aux sommets du noyau [7]. Enfinaprès avoir énuméré ces motifs parfois nom-breux, on peut les ordonner selon une mesured’intérêt. Nous avons ainsi proposé de mesurerà quel point ces motifs pouvaient être inatten-dus. Pour cela, on a recours à la simulation :si on considère un sous-graphe de x sommetsquelle est en moyenne la taille du noyau ? unmotif sera jugé d’autant plus intéressant queson sous-graphe noyau a une taille s’écartantde l’attendu.

Énumérer et sélectionner des motifsmultiples dans un réseau hétérogène

Le réseau hétérogène le plus simple est unréseau bimodal, les arêtes reliant, par exemple,des acteurs aux films dans lesquels ils ont joué.Les sommets étant de deux natures différentes,ils sont décrits dans deux langages différents,ce qui pose la question de ce qu’est un mo-tif dans ce cas. Considérons alors un bimotifcomme constitué de deux parties, l’une sélec-tionnant des acteurs et l’autre les films. L’ex-tension d’un bimotif est alors elle même unepaire constituée d’un sous-ensemble d’acteurset d’un sous-ensemble de films. Des travauxrécents ayant défini une notion de noyau spéci-fique aux réseaux bimodaux [3], on peut alorsréduire l’extension d’un bimotif à son noyau.On a alors tous les éléments pour définir et énu-mérer les bimotifs fermés abstraits d’un réseaubimodal. Cette idée peut-être étendue à dessituations où les sommets sont de même na-ture mais où le noyau est constitué de sommetspouvant avoir deux rôles différents. C’est le casdu noyau hub-autorité HA pour les graphes di-rigés que nous avons proposé récemment [9]pour analyser un réseau de conseil entre avo-cats étudié par Emmanuel LAZEGA [6]. L’idéeinitiale proposée par Jon KLEINBERG [5] etconcrétisée dans ce noyau, est d’ordonner lessommets selon deux indices inter-dépendants,un haut d’indice d’autorité correspondant àun degré entrant élevé provenant de sommetsayant un indice Hub élevé, eux-même ayant undegré sortant élevé vers des sommets avec unindice autorité élevé. Dans ce cas on a un seullangage, mais on définira des motifs différents,voire opposés, pour chacun des deux rôles. Cecipermet par exemple d’observer le sous-graphehub-autorité des avocats de Boston demandantconseil à des avocats de Providence [8].

Notre projet en cours est d’étendre cetteidée de motifs multiples associés à des typeset des rôles différents de sommets mais aussi

janvier 2019 No 103 12

Page 14: Bulletin de l'AFIA

d’arêtes, par exemple si on s’intéresse à desréseaux multiples. Ceci suppose de développerde nouveaux noyaux adaptés à cette diversitéde rôles et d’en tirer les conséquences algo-rithmiques en termes d’énumération et d’or-donnancement de motifs. L’idée générale estde déployer une méthodologie permettant aisé-ment de s’adapter à des graphes enrichis de dif-férentes natures. Toute structure relationnelledoit ainsi pouvoir être abordée en abstrayantce qui est observé de manière à en avoir uneperception simplifiée, idée d’abstraction qui estnaturelle et a un long passé en intelligence ar-tificielle.

Références

[1] Vladimir Batagelj and Matjaz Zaversnik.Fast algorithms for determining (gene-ralized) core groups in social networks.Adv. Data Analysis and Classification,5(2) :129–145, 2011.

[2] Mario Boley, Tamás Horváth, Axel Poigné,and Stefan Wrobel. Listing closed sets ofstrongly accessible set systems with appli-cations to data mining. Theor. Comput.Sci., 411(3) :691–700, 2010.

[3] Monika Cerinsek and Vladimir Batagelj.Generalized two-mode cores. Social Net-works, 42 :80 – 87, 2015.

[4] Issam Falih, Nistor Grozavu, Rushed Ka-nawati, and Younès Bennani. Communitydetection in attributed network. In WWW

(Companion Volume), pages 1299–1306.ACM, 2018.

[5] Jon M Kleinberg. Authoritative sources ina hyperlinked environment. Journal of theACM (JACM), 46(5) :604–632, 1999.

[6] Emmanuel Lazega. The collegial pheno-menon : The social mechanisms of coope-ration among peers in a corporate law part-nership. Oxford University Press, 2001.

[7] Henry Soldano, Guillaume Santini, and Do-minique Bouthinon. Motifs abstraits etsous-communautés dans les réseaux at-tribués. Revue d’Intelligence Artificielle,30(4) :441–468, 2016.

[8] Henry Soldano, Guillaume Santini, Domi-nique Bouthinon, Sophie Bary, and Em-manuel Lazega. Bi-pattern mining of twomode and directed networks. In Pierre-Antoine Champin, Fabien L. Gandon, Mou-nia Lalmas, and Panagiotis G. Ipeirotis, edi-tors, Companion of the The Web Confe-rence 2018 on The Web Conference 2018,WWW 2018, Lyon , France, April 23-27,2018, pages 1287–1294. ACM, 2018.

[9] Henry Soldano, Guillaume Santini, Domi-nique Bouthinon, and Emmanuel Lazega.Hub-authority cores and attributed directednetwork mining. In 29th IEEE InternationalConference on Tools with Artificial Intelli-gence, ICTAI 2017, Boston, MA, USA, No-vember 6-8, 2017, pages 1120–1127. IEEEComputer Society, 2017.

janvier 2019 No 103 13

Page 15: Bulletin de l'AFIA

Analyse d’activités dans les réseaux sociaux

LITISINSA Rouen Normandie

www.litislab.eu

Laurent [email protected]

Chercheurs impliqués

- Nour EL MAWASS, Paul HONEINE, Ni-colas MALANDAIN, Alexandre PAUCHET,Julien SAUNIER, Zaher YAMAK (LITIS)

- Guillaume GADEK (Airbus/LITIS)- Stephan BRUNESSAUX, Khaled KHELIF(Airbus)

Introduction

Le développement des médias sociaux enligne, en constante croissance depuis une quin-zaine d’années, a considérablement intensifiéet accéléré les échanges d’informations entreindividus. Ce phénomène est une formidableavancée pour un accès à l’information quasi-ment en temps réel et sans contrainte géogra-phique. Mais il s’accompagne aussi de dangersliés à la diffusion de fausses informations (fakenews), de spams ou de cyber-attaques dont lecontrôle ou la vérification des sources est im-possible à réaliser humainement étant donné lamasse d’informations et leur vitesse de diffu-sion.

Les équipes MIND (Multi-agent, Interac-tion, Décision) et App (Apprentissage) du LI-TIS, en collaboration avec Airbus Defence andSpace, se sont intéressées à ce problème dansle cadre de plusieurs projets visant à utiliserdes méthodes issues de l’intelligence artificiellepour l’analyse d’activités dans les médias so-ciaux (principalement Twitter et Wikipedia).Trois de ces projets sont ici décrits visant res-pectivement à détecter les faux comptes, lescomptes ayant un comportement de spammerset l’existence de groupes d’influence.

Détection de faux comptes sur Wikipe-dia

Dans le cadre de la thèse de Zaher YA-MAK [3] soutenue en février 2018, nous noussommes intéressés à la détection et la carac-térisation de faux comptes créés par un mêmeutilisateur, appelés sockpuppets, sur Wikipedia.Les sockpuppets sont fréquemment créés dansle but de manipuler l’information de cette ency-clopédie en donnant l’impression qu’une modi-fication est poussée et approuvée par plusieurscomptes.

Nous avons proposé un processus, nomméSocksCatch, pour détecter ces faux comptespuis rapprocher ceux créés par un même uti-lisateur. La figure ci-dessous illustre ce pro-cessus en trois phases. La première phase apour objectif la sélection et le prétraitementdes données. La deuxième phase a pour objectifla détection des comptes sockpuppets à l’aided’un algorithme d’apprentissage automatique.La troisième phase a pour objectif le regrou-pement des comptes sockpuppets créés par unmême utilisateur à l’aide d’un algorithme dedétection de communauté.

janvier 2019 No 103 14

Page 16: Bulletin de l'AFIA

Une étude expérimentale sur 10 000comptes issus du site Wikipedia anglophonenous a permis de comparer six algorithmesd’apprentissage automatique pour la phase dedétection des sockpuppets et de montrer queSocksCatch, avec les caractéristiques de des-cription de comptes que nous avons proposées,détecte 91% des sockpuppets avec un algo-rithme de forêt aléatoire. Nous avons égale-ment comparé cinq algorithmes de détection decommunauté pour la phase de regroupement,et montré que les sockpuppets regroupés parSocksCatch et les groupes réels sont similairesà 87%, selon les mesures de comparaison desclusters : variation de l’information normalisée(NVI) et de l’information mutuelle normalisée(NMI).

À court terme, nous allons poursuivre ledéveloppement de SocksCatch dans deux di-rections : une exploitation en ligne avec desdonnées provenant en temps réel de l’activitéd’un média social et une détection et un re-groupement des sockpuppets automatisé, etune adaptation à d’autres médias sociaux queWikipedia.

Détection adaptative des comptes mal-veillants sur les réseaux sociaux numé-riques

Le spam sur les réseaux sociaux (dit spamsocial) est un problème actif et récent. La plu-part des systèmes de détection proposés dans lalittérature sont basés sur l’apprentissage statis-tique supervisé et ont une conception rigide quine prend pas en compte les signaux dynamiquesdu réseau social et le changement constantdans la nature du spam. Ceci limite la duréede vie et l’adaptabilité du système de détectionconçu. Contrairement à une tâche de classifi-cation classique, il s’agit ici d’un adversaire quis’adapte aux filtres de détection en changeantde caractéristiques et en créant constammentde nouvelles méthodes de camouflage.

La thèse de Nour EL MAWASS s’intéresseà ce problème en proposant d’augmenter lacomplexité du modèle de détection pour y in-tégrer des signaux dynamiques liés aux applica-tions utilisées, et de les exploiter pour conce-voir un système capable de s’adapter automa-tiquement aux changements dans les caracté-ristiques du spam. Nous avons dans un premiertemps proposé d’utiliser une approche probabi-liste graphique (fondée sur les Markov RandomField) pour modéliser la tâche de détection descomptes malveillants[1]. Le modèle graphique,établi à partir de la similarité entre les comptes,permet de raisonner globalement sur la tâchede classification. Contrairement à une classifi-cation au niveau individuel, la classe attribuéeà un compte ne dépend pas seulement de sescaractéristiques mais aussi des caractéristiquesdes autres comptes classifiés. Nous partons desa priori calculés individuellement sur chaquecompte en utilisant des classifieurs superviséstraditionnels. Notre modèle utilise ensuite unepropagation de croyance sur le graphe d’utili-sateurs pour calculer l’a posteriori de chaquecompte, corrigeant ainsi les erreurs de classi-fication. Nous avons montré une améliorationdes meilleures performances de classifieurs is-sus de l’état de l’art.

Détection et identification de groupesd’influence dans les médias sociaux

La thèse de Guillaume GADEK [2] vise àreconnaître des opinions, détecter des influen-ceurs, et identifier des groupes d’influence dansles médias sociaux et en particulier sur Twitter.Ce travail se décompose en 3 grandes problé-matiques : analyse des messages publiés, ca-ractérisation des différents utilisateurs et iden-tification des groupes sociaux.

La première problématique concerne l’ana-lyse des opinions portées par les messages émissur Twitter. La reconnaissance d’opinion dansdes tweets est un défi scientifique : les textes

janvier 2019 No 103 15

Page 17: Bulletin de l'AFIA

sont courts, les sujets implicites et l’ortho-graphe inventive. Nous cherchons ici à dé-terminer efficacement l’orientation (positive,négative ou neutre) des tweets envers unecible donnée. Une méthode novatrice basée surles contextonymes et contextosets a été uti-lisée afin de désambiguïser le contenu impli-cite et améliorer les classifieurs d’opinion. Lescontextosets sont extraits d’un graphe de co-occurrence des mots, et permettent de repré-senter le sens d’un mot en fonction de ses motsenvironnants en contexte d’utilisation. Cetteméthode a été évaluée sur le corpus de tweetsannotés SemEval2016.

Le second axe de ce travail concerne l’ana-lyse des profils utilisateurs, membres d’un ré-seau social. Les utilisateurs sont ainsi caracté-risés par 1) l’impact qu’ils peuvent avoir parleurs messages émis et 2) par leur comporte-ment. Ainsi, une mesure de l’impact d’un utili-sateur a été proposée, ainsi que la constructionde profils utilisateurs, permettant d’analyser lecomportement d’une grande population. Enfin,une méthode permettant d’étiqueter automati-quement le rôle adopté par un utilisateur selonsa position dans le graphe social a été propo-sée.

Dans le troisième aspect traité dans ces

travaux, nous soutenons l’hypothèse que lescommunautés recherchées sur les réseaux so-ciaux devraient être topiquement cohérentes.Un modèle de représentation de l’interactionentre utilisateurs sur Twitter a donc été pro-posé, ainsi qu’un ensemble de métriques per-mettant d’évaluer la cohésion des communau-tés détectées. Ces éléments ont été utilisés lorsd’une analyse détaillée sur un grand jeu de don-nées de tweets.

Références[1] N. El Mawass, P. Honeine, and L. Ver-

couter. Supervised classification of socialspammers using a similarity-based markovrandom field approach. In 5th multidisci-plinary international social networks confe-rence, 2018.

[2] G. Gadek, A. Pauchet, N. Malandain,K. Khelif, L. Vercouter, and S. Brunessaux.Topical cohesion of communities on twit-ter. Procedia Computer Science, 112 :584–593, 2017.

[3] Z. Yamak, J. Saunier, and L. Vercou-ter. Sockscatch : Automatic detection andgrouping of sockpuppets in social media.Knowledge-Based Systems, 149 :124–142,2018.

janvier 2019 No 103 16

Page 18: Bulletin de l'AFIA

Analyse des réseaux sociaux pour des applications liées à la santé

LIRMM - ADVANSECNRS - Université de Montpellier

www.lirmm.fr/ recherche/equipes/advanse

LIRMM - ADVANSECNRS - Université de Montpellier, Université Paul Valéry

Montpellierwww.lirmm.fr/ recherche/equipes/advanse

Jérôme AZÉ[email protected]

Sandra [email protected]

Introduction

Depuis sa création en 2014, dans lecontexte des Sciences des Données, l’équipeprojet ADVANSE (Advanced ANalytics forData SciencE), s’intéresse aux approches d’ex-traction de connaissances dans les donnéescomplexes : structurées, semi-structurées, mul-tidimensionnelles, qualitatives, quantitatives,textuelles, spatio-temporelles, approximatives,bruitées, etc. Ses travaux allient, de manièrecomplémentaire, des approches de fouille dedonnées, d’apprentissage automatique et de vi-sualisation analytique (Visual Analytics).

Un axe de recherche important dansl’équipe consiste à combiner ces différentes ap-proches pour analyser des réseaux sociaux pourdifférentes applications du domaine de la santé.Notre objectif a tout d’abord été d’extraire dela connaissance à partir des données hétéro-gènes des médias sociaux de santé et notam-ment à partir de la structure des réseaux etdes textes. L’originalité a été de prendre encompte les données produites directement parles patients dans le processus d’extraction deconnaissances. Généralement, seules les don-nées médicales produites par les professionnelsde santé sont étudiées. Or, nous avons mon-tré qu’il est très intéressant d’intégrer les don-nées produites par les patients. Ces données parnature même hétérogènes, incertaines et enta-chées d’erreurs sont difficiles à traiter. Nousavons donc développé de nouvelles ressources

et méthodes dédiées aux réseaux sociaux pourle domaine de la santé.

Analyse semi-automatique des contenus

Nous avons mis en relation des connais-sances avérées et des connaissances cocons-truites par les internautes. Pour cela, dansle cadre d’une collaboration avec l’ICM etl’IMAG, nous avons exploré des méthodes su-pervisées, semi-supervisées et non superviséespour décrire les productions des patients se-lon différentes dimensions (qui, quand, où etcomment ?). Ces méthodes se sont avérées ef-ficaces grâce à la construction originale et au-tomatique d’une ressource mettant en relationle vocabulaire des patients et celui des profes-sionnels de santé. Au cours du projet SIFR,cette ressource a été intégrée dans le portailBioportal qui permet d’annoter des textes avecdes concepts médicaux [5]. Cette ressourcea été utilisée pour comparer les productionsdes patientes dans les médias sociaux et lesconnaissances avérées issues des questionnairesde qualité de vie utilisés par les professionnelsde santé dans les essais cliniques [6].

Nous avons également croisé ces carac-téristiques avec d’autres dimensions liées aurisque, à l’incertitude, et aux sentiments, etc.Nous avons produit un nouveau lexique dédiéà l’analyse de polarités et d’émotions en fran-çais [2] qui a permis de positionner l’équipe en

janvier 2019 No 103 17

Page 19: Bulletin de l'AFIA

première place sur une des tâches du challengeDEFT 2015.

Dernièrement, dans le cadre du projet#AIDS en collaboration avec le LERASS-CERIC, nous avons proposé un nouveau mo-dèle de classification des textes des médias so-ciaux basé sur une architecture de Deep Lear-ning efficace et une visualisation originale etinteractive appelée MultiStream [3]. Cette ap-proche a été utilisée pour explorer les messagesdu site Sida Info Service, et identifier les ac-teurs et les thèmes clés pour la compréhensiondes prises de risque. Cette approche a égale-ment été adaptée pour traiter la volumétrie desTweets dans le cadre de l’analyse de la cam-pagne de publicité SmearForSmear [4] pour laprévention du cancer du col utérin.

Fiabilité des contenus

L’équipe s’est également intéressée à la fia-bilité des connaissances issues du Web Social.S’il est difficile d’empêcher les internautes deconsulter des informations non pertinentes ounon fiables dans les médias sociaux, il est pos-sible, en revanche, de concevoir des outils pourmettre en évidence des informations de qua-lité dans ces médias. Nous avons proposé dif-férentes approches notamment basées sur lastructure en graphe des réseaux pour détecterautomatiquement le rôle (expert, non expert)et la confiance que l’on peut accorder aux in-ternautes dans les médias sociaux selon les thé-matiques et au cours du temps [1].

Analyse temporelle des réseaux sociaux

Par ailleurs, les aspects temporels ont éga-lement été étudiés pour capturer l’évolution dethématiques au cours du temps et de l’histoiredes patients. Ainsi, nous avons, par exemple,pu mettre en avant des sujets d’interroga-tion des patients associés à des états d’es-prit et à un événement de leur histoire médi-cale, jusqu’alors méconnus des professionnels

de santé [7]. Ces travaux sont menés dansle cadre du projet DontDoIt sur la détectiondes personnes à risque suicidaires en collabo-ration avec le département des Urgences Psy-chiatrique du CHU de Montpellier. Nous avonscombiné différentes méthodes pour capter leschangements brusques ou plus insidieux (e.g.votes entre différents classifieurs, détection deconcepts drift, active learning pour prendre encompte les réactions des experts en charge dumonitoring, etc.).

Conclusion

Dans cet article, nous avons présenté dif-férentes méthodes développées dans l’équipeADVANSE pour monitorer de manière globalela santé des populations via l’analyse des don-nées des réseaux sociaux. Ces données sont ex-trêmement variables du point de vue inter etintra-individu. Les fouiller afin de mieux les in-terpréter et obtenir des modèles prédictifs per-mettant de déclencher efficacement des alertesrestent des questions de recherche d’actua-lité. Les défis consistent ici à déterminer, pourchaque application, les caractéristiques perti-nentes à repérer dans les textes des messagesou dans les comportements repérables dans legraphe des interactions dans les réseaux so-ciaux afin de produire des modèles robustes surces données particulières (hétérogènes, volumi-neuses, etc.). Ici, les questions éthiques et juri-diques seront centrales (e.g. vie privée, consen-tement).

Références

[1] Amine Abdaoui, Jérôme Azé, Sandra Brin-gay, and Pascal Poncelet. Collaborativecontent-based method for estimating userreputation in online forums. In Web Infor-mation Systems Engineering - WISE 2015 -16th International Conference, Miami, FL,USA, November 1-3, 2015, Proceedings,Part II, pages 292–299, 2015.

janvier 2019 No 103 18

Page 20: Bulletin de l'AFIA

[2] Amine Abdaoui, Jérôme Azé, Sandra Brin-gay, and Pascal Poncelet. FEEL : a frenchexpanded emotion lexicon. Language Re-sources and Evaluation, 51(3) :833–855,2017.

[3] E. Cuenca, A. Sallaberry, F. Y. WANG, andP. Poncelet. Multistream : A multiresolu-tion streamgraph approach to explore hie-rarchical time series. IEEE Transactionson Visualization and Computer Graphics,2018.

[4] Philippe Lenoir, Bilel Moulahi, JérômeAzé, Sandra Bringay, Gregoire Mercier,and François Carbonnel. Raising aware-ness about cervical cancer using twitter :Content analysis of the 2015 #smearfors-mear campaign. J Med Internet Res,19(10) :e344, Oct 2017.

[5] Mike Donald Tapi Nzali, Jérôme Azé, San-dra Bringay, Christian Lavergne, CarolineMollevi, and Thomas Optiz. Reconciliationof patient/doctor vocabulary in a struc-tured resource. Health Informatics Jour-nal, 0(0) :1460458217751014, 0. PMID :29332530.

[6] Donald Mike Tapi Nzali, Sandra Bringay,Christian Lavergne, Caroline Mollevi, andThomas Opitz. What patients can tell us :Topic analysis for social media on breastcancer. JMIR Med Inform, 5(3) :e23, Jul2017.

[7] Mia Johnson Vioulès, Bilel Moulahi, Jé-rôme Azé, and Sandra Bringay. Detec-tion of suicide-related posts in twitter datastreams. IBM Journal of Research and De-velopment, 62(1) :7, 2018.

Autodétermination des utilisateurs dans les réseaux siociaux

LORIA/KIWIUniversité de Lorraine

kiwi.loria.fr

Anne [email protected]

Membres

- Charif HAYDAR, responsable Recherche etInnovation de l’entreprise Sailendra SAS, ex-doctorant de KIW

Thématique générale de l’équipe

L’activité de recherche de l’équipe KIWI(Knowledge, Information & Web Intelligence)du laboratoire LORIA (UMR 7503) s’inscritdans le domaine de l’apprentissage automa-tique et de la fouille de données. En parti-culier, elle concerne la modélisation explica-tive, prédictive et prescriptive du comporte-ment d’un utilisateur en interaction avec unsystème numérique, à partir de l’analyse au-

tomatique des traces numériques collectées.Il s’agit par exemple de déterminer les fac-teurs qui expliquent le comportement observéd’un utilisateur à un moment donné, de pré-dire quel devrait être le comportement fu-tur d’un utilisateur en fonction des observa-tions réalisées, ou de définir quelle(s) action(s)ou séquence(s) d’actions recommander à unutilisateur pour atteindre un objectif donné.La modélisation d’un comportement utilisa-teur permet donc de le comprendre, d’identi-fier des comportements-type, de rapprocher lesdifférents utilisateurs sur leur comportement(détermination de communautés), de prédireles comportements futurs des utilisateurs envue d’une personnalisation ou de recomman-

janvier 2019 No 103 19

Page 21: Bulletin de l'AFIA

dations, etc. Pour atteindre ces objectifs, l’ap-proche retenue dans KIWI est à base de tracesnumériques. Ces traces concernent des obser-vés (l’objet d’étude), par exemple les utilisa-teurs, en lien avec des objets (ou items) re-latifs au phénomène, par exemple des conte-nus en ligne, des produits d’un catalogue devente, etc. Nous faisons l’hypothèse impliciteque les traces collectées sont représentativesdu phénomène à modéliser.

Initiés dans le domaine applicatif du e-commerce et des systèmes de recommanda-tion, les travaux de KIWI trouvent de nom-breux domaines d’applications (e-santé, hé-ritage culturel, analyse des politiques pu-bliques, etc.) et se focalisent depuis environcinq ans sur le domaine de l’éducation (notam-ment sur les Learning Analytics ou Analyse desdonnées de l’apprentissage).

Les traces exploitées peuvent être detoute nature (logs, textes, clickstream, au-dio, données d’eye trackers, etc.), du mo-ment qu’elles peuvent être collectées, stockéeset exploitées sous un format numérique. Celaconduit à considérer des données complexes,multisources, multiéchelles, incertaines, brui-tées, etc. pour modéliser le comportement d’unutilisateur. Ces traces, bien que présentes entrès gros volume, sont présentes en relative-ment faible nombre pour chaque observé (utili-sateur ou objet). Ainsi les algorithmes proposésdoivent prendre en compte le paradoxe dû à lafois la parcimonie des données à l’échelle indi-viduelle, et la massivité des données à l’échelleglobale.

Parmi les sources de données possibles, fi-gurent les réseaux sociaux. Les données col-lectées sont les traces laissées par les utili-sateurs au travers des actions qu’ils entre-prennent pour consulter, commenter, ou parta-ger des contenus, établir des liens sociaux avecd’autre utilisateurs. L’extraction de connais-sance à partir de ces données permet de mo-

déliser des comportements sociaux, d’améliorerl’expérience d’utilisateurs, d’anticiper certainsdangers ou attaques, de prédire des compor-tements, voire de les influencer. C’est pour-quoi depuis plusieurs années, KIWI a consi-déré différentes problématiques comme la dé-tection de communautés dans les réseaux so-ciaux (thèse d’I. ESSLIMANI), la détection deleaders ou d’utilisateurs représentatifs (HDRd’A. BRUN), la propagation de la confiancedans les réseaux sociaux (thèse de C. HAY-DAR).

Dans la suite de cet article, nous allons nouscentrer sur un aspect spécifique des travauxmenés dans l’équipe KIWI : la détection au-tomatique de communautés dans les réseauxsociaux et l’identification des patterns compor-tementaux qui les caractérisent, au travers d’untravail mené dans le contexte des systèmes derecommandation avec Charif HAYDAR, anciendoctorant de KIWI et actuellement ingénieurde recherche dans la société Sailendra.

Description des travaux

Ce travail repose sur l’exploitation du clus-tering. Le clustering n’est certes pas une tech-nique propre à la modélisation de comporte-ment mais il représente un outil important pourla modélisation de comportement collectif [4].Il permet notamment de détecter les commu-nautés et les patterns comportementaux qui lesidentifient, ce qui permet par la suite, de trou-ver un équilibre entre besoin de personnalisa-tion et nécessité d’ouverture pour éviter la sclé-rose des communautés. Plusieurs approchesexistent pour accomplir une tâche de cluste-ring, comme le clustering hiérarchique, les K-means, ou le clustering à base de densité [2].On peut définir un algorithme de clusteringcomme un moyen de regrouper des vecteursdans un espace multidimensionnel en fonctionde la proximité entre eux [2].

Dans le domaine de la recommandation

janvier 2019 No 103 20

Page 22: Bulletin de l'AFIA

comme dans beaucoup d’autres, l’entrée del’algorithme est une matrice qui représenteles préférences observées des utilisateurs pourles items proposés. Par exemple, les lignesde la matrice représentent les utilisateurs quel’on souhaite segmenter, et les colonnes repré-sentent les produits (ou items) du catalogue.Chaque valeur de la matrice représente l’intérêtprononcé d’un utilisateur à l’égard d’un item.Puisqu’on est souvent face à d’immenses ca-talogues, et que l’utilisateur ne peut consulterl’ensemble du catalogue, beaucoup de valeursrestent inconnues. La matrice est très creuse(de 95 à 99% de données manquantes le plussouvent), ce qui impacte la qualité de cluste-ring, et encourage à trouver des algorithmesadaptés à ce type de matrice. De même, l’in-tensité d’utilisation des réseaux sociaux et doncla quantité des actions tracées varie largementsuivant les utilisateurs ou les communautés.Il est donc intéressant de disposer d’un algo-rithme de clustering capable de s’adapter à dif-férentes densités de données disponibles. L’al-gorithme Mutual Vote (MV) [1] est un algo-rithme de clustering conçu pour s’adapter aumanque de données, et à la variance de densitéde données dans un espace multidimensionnel.De plus, les algorithmes à base de prototype(K-means) sont bons pour trouver des clustersà format spécifique. Les algorithmes sensibles àla densité sont capables de détecter différentesformes de clusters, sauf qu’il faut les paramé-trer à une valeur fixe de granularité, ce qui lesrend incapables de détecter les clusters de gra-nularités différentes [3].

Considérons que chaque utilisateur est re-présenté par un vecteur, qui contient l’en-semble des données disponibles sur l’utilisa-teur. L’idée de l’algorithme MV est d’asso-cier à chaque vecteur une liste de priorités quicontient les vecteurs (autres utilisateurs) qu’ilaimerait inviter à rejoindre son cluster. Un sys-tème de négociation à base de la logique sub-

jective se met en place pour gérer le regroupe-ment des vecteurs pour former les clusters.

Pour commencer, MV calcule les distancesentre le vecteur actif et l’ensemble des vec-teurs disponibles. Nous utilisons la distance deJaccard pour gérer la différence potentielle detaille entre les vecteurs. Les vecteurs dont ladistance est inférieure à un seuil donné s sontconsidérés comme membres de la liste des prio-rité (s est souvent fixé à la moyenne moins unécart-type des distances). La volonté d’un vec-teur d’inviter un vecteur de sa liste de prio-rité à son cluster n’est pas la même pour tousles membres de la liste. Une fonction de map-ping est utilisée pour convertir les distances enprobabilités de façon que plus la distance estpetite plus la probabilité est élevée. Concrète-ment, ces probabilités expriment à quel pointle vecteur actif aimerait être en un seul clus-ter avec chacun de membre de sa liste de prio-rité. La logique subjective (LS) est utilisée pourgérer les probabilités. LS est une extension dela logique probabiliste qui associe un proprié-taire à chaque probabilité et l’appelle opinion.L’intérêt de la logique subjective réside dans sacapacité à agréger des opinions venant de diffé-rents propriétaires. La négociation commencepar l’envoi par chaque vecteur d’une invitationau premier membre de sa liste de priorité. Le ré-cepteur donne un avis favorable seulement si ledemandeur figure à la tête de sa liste de prio-rité (la liste de récepteur), sinon il rejette lademande. Si la demande est acceptée, les deuxvecteurs forment désormais un cluster, et leurslistes de priorités sont agrégées par la fonctiond’agrégation de la logique subjective, ce quichange l’ordre des priorités. Les vecteurs quiveulent rejoindre le cluster doivent désormaisnégocier avec les deux membres de cluster àla fois. Ainsi, l’opération continue jusqu’à cequ’aucune négociation ne soit possible (aucuncluster n’a plus envie de se fusionner avec unautre).

janvier 2019 No 103 21

Page 23: Bulletin de l'AFIA

MV a été testé sur de données réelles d’unCRM pour regrouper les clients en fonction deleurs domaines d’intérêt, dans le contexte dessystèmes de recommandation. L’objectif étaitde pouvoir proposer des produits d’ouverture is-sus de la communauté, et de trouver des clientspotentiels pour un produit ou une gamme deproduits. Selon nos expérimentations, MV s’estmontré supérieur à K-means et à DBSCAN(l’algorithme à base de densité le plus répanduqui a servi de baseline) en termes de précisionet de qualité d’étiquetage.

Références[1] A. Boyer C. Haydar. A new statistical den-

sity clustering algorithm based on mutual

vote and subjective logic applied to recom-mender systems. pages 59–66, 2017.

[2] V Kumar PN Tan, M Steinbach. Data mi-ning cluster analysis : basic concepts andalgorithms. 2013.

[3] J. Cao S. Zhou, A. Zhou. A data-partitioning-based dbscan algorithm. Jour-nal of computer research and development,37(10) :1153–1159, 2000.

[4] Y. A. Wendong. Social media user partitio-ning based on ensemble clustering. pages1–6, 2016.

Recherche en réseaux sociaux dans l’équipe DM2L

LIRIS/DM2LUniversité Lyon 1

https://projet.liris.cnrs.fr/dm2l/

LIRIS/DM2LINSA

https://projet.liris.cnrs.fr/dm2l/

Rémy [email protected]

Jean-François BOULICAUT

Thème général de l’équipe

L’équipe DM2L se positionne sur les as-pects théoriques de la fouille de données etde l’apprentissage statistique, avec notammentune expertise sur la fouille de motifs souscontraintes, la fouille de graphes, la détectionde communautés, les techniques de cocluste-ring, les réseaux bayésiens, les méthodes en-semblistes et la sélection de variables.

Description des travaux en lien avec lesréseaux sociaux.

Nous travaillons depuis de nombreuses an-nées sur les aspects méthodologiques et al-gorithmiques de la découverte de motifs sous

contraintes et nous avons notamment étudiéla découverte d’ensembles de nœuds a prioriintéressants dans des graphes qui pouvaientêtre dynamiques [11, 6], attribués [13, 10] (surles nœuds ou les relations encodées) ou lesdeux [7, 12]. Naturellement, ce type de travailest souvent validé qualitativement et quanti-tativement sur des graphes d’interactions so-ciales. Récemment, l’un de nos axes princi-paux d’étude de réseaux sociaux repose surl’Exceptional contextual subgraph mining, pro-blème consistant à découvrir dans un graphedonné des sous-graphes exceptionnels, c’est-à-dire différant sensiblement du reste du graphe,à la fois en terme de topologie mais égalementen terme de propriétés des composantes du

janvier 2019 No 103 22

Page 24: Bulletin de l'AFIA

graphe (nœuds, liens). L’équipe a notammentproposé un algorithme passant à l’échelle [9],dont l’efficacité a été montrée par l’applicationà des données géolocalisées extraites de plate-formes de réseaux sociaux [2] et des donnéesde déplacements en vélos en libre service [3].

L’équipe a une forte expertise dans l’analysede la dynamique de réseaux sociaux. Récem-ment, elle a proposé la méthode DSC (Disco-vering Similarities Change, [1]) qui, appliquéeà des réseaux de covotation, permet de mettreen évidence l’évolution de groupes de votantspouvant être reconnus comme les membres deformations politiques en évolution. Nous avonsaussi travaillé à la détection d’événements dansles plateformes de réseaux sociaux, en utilisantdes séries temporelles [8] et des méthodes dedétection de communautés [5]. Une des fa-cettes intéressantes de la dynamique des ré-seaux sociaux concerne la détection de com-munautés dynamiques avec des contributionssur l’état de l’art [15] mais aussi le développe-ment de méthodes originales [4].

Projets marquants

Le projet ANR BITUNAM qui a débutéen septembre 2018 propose de transposer lesoutils et techniques d’analyse des réseaux so-ciaux aux réseaux de transactions financièresen crypto-monnaies, en particulier Bitcoin. Ilest mené en collaboration avec des socio-économistes (Jérôme BLANC, Marie FARE,Laboratoire Triangle, Université de Lyon), avecpour objectif de caractériser la nature des tran-sactions, des acteurs et donc de ces mon-naies elles-même. Les objectifs sont notam-ment d’utiliser la détection de communautéspour ré-identifier les adresses d’un même utili-sateur afin de construire un réseau de transac-tion entre acteurs et non plus seulement entreadresses anonymes, puis d’identifier les acteursclefs, les phénomènes de diffusion, la structuredu réseau, etc. Ce projet va continuer des tra-

vaux préliminaires de l’équipe sur le sujet [14].L’équipe est également impliquée dans le

projet IDEX Breakthrough Academics DataScience & Machine Learning for Complex andDynamical Models. L’un des deux objectifs dece projet est la compréhension quantitativesdes systèmes sociaux, et en particulier des ré-seaux sociaux, et leur description dynamique, àpartir des traces numériques de relations so-ciales et économiques. L’équipe DM2L seraparticulièrement impliquée sur des méthodesmêlant avancées récentes en machine learninget en analyse de réseaux. Les sujets de l’équipeseront plus particulièrement l’étude de sys-tèmes à base de réseaux de neurones profondsintégrant des connaissances et des contraintesmétiers, et le développement de méthodes ba-sée sur le plongement de graphes dans des es-paces en faible dimension (network embedding)pour la détection de structures mésosocopiqueset d’anomalies dans des réseaux dynamiques.

Enfin, plusieurs doctorants de l’équipe tra-vaillent également sur des sujets fortementorienté sur l’analyse de réseaux sociaux :

- Découverte automatique de l’organisationdes réseaux complexes. Aujourd’hui, plu-sieurs modèles statistiques de réseauxpeuvent être utilisés pour comprendre sonorganisation (Communautés, Assortativité,Organisation, Spatiale, Hiérarchique, etc.),mais chacun de ces modèles entraîné sur ungraphe en donnera une interprétation diffé-rente. Nous cherchons à trouver, pour ungraphe donné, le modèle le plus à mêmede l’expliquer selon les principes du rasoird’Occam, ainsi qu’à combiner ces modèlesafin d’expliquer plus précisément les fac-teurs sous-jacents à la structure d’un réseaudonné.

- Analyse de multi-graphes attribués dyna-miques : application aux réseaux sociauxet réseaux d’entreprise. L’objectif de cettethèse en collaboration avec le Data R&D

janvier 2019 No 103 23

Page 25: Bulletin de l'AFIA

Institute de EMLyon Business School estde développer de nouveaux outils théoriquespour l’analyse de données massives hétéro-gènes et structurées, dans un contexte d’ap-plications business (marketing quantitatif,etc.)

Références[1] Adnene Belfodil, Sylvie Cazalens, Phi-

lippe Lamarre, and Marc Plantevit. Flashpoints : Discovering exceptional pairwisebehaviors in vote or rating data. In JointEuropean Conference on Machine Lear-ning and Knowledge Discovery in Data-bases, pages 442–458. Springer, 2017.

[2] Ahmed Anes Bendimerad, Marc Plante-vit, and Céline Robardet. Unsupervisedexceptional attributed sub-graph miningin urban data. In Data Mining (ICDM),2016 IEEE 16th International Conferenceon, pages 21–30. IEEE, 2016.

[3] Anes Bendimerad, Rémy Cazabet, MarcPlantevit, and Céline Robardet. Contex-tual subgraph discovery with mobility mo-dels. In International Workshop on Com-plex Networks and their Applications,pages 477–489. Springer, 2017.

[4] Souâad Boudebza, Rémy Cazabet, Fai-çal Azouaou, and Omar Nouali. Olcpm :An online framework for detecting over-lapping communities in dynamic socialnetworks. Computer Communications,123 :36–51, 2018.

[5] Rémy Cazabet, Hideaki Takeda, MasahiroHamasaki, and Frédéric Amblard. Usingdynamic community detection to identifytrends in user-generated content. SocialNetwork Analysis and Mining, 2(4) :361–371, 2012.

[6] Loïc Cerf, Tran Bao Nhan Nguyen, andJean-François Boulicaut. Mining constrai-ned cross-graph cliques in dynamic net-

works. In Inductive Databases andConstraint-Based Data Mining., pages199–228. 2010.

[7] Elise Desmier, Marc Plantevit, CélineRobardet, and Jean-François Boulicaut.Trend mining in dynamic attributedgraphs. In European Conference on Ma-chine Learning and Principles and Practiceof Knowledge Discovery in Databases,pages 654–669. Springer, 2013.

[8] Pierre Houdyer, Albrecht Zimmerman,Mehdi Kaytoue, Marc Plantevit, JosephMitchell, and Céline Robardet. Gazouille :Detecting and illustrating local eventsfrom geolocalized social media streams.In Joint European Conference on MachineLearning and Knowledge Discovery in Da-tabases, pages 276–280. Springer, 2015.

[9] Mehdi Kaytoue, Marc Plantevit, AlbrechtZimmermann, Anes Bendimerad, and Cé-line Robardet. Exceptional contextualsubgraph mining. Machine Learning,106(8) :1171–1211, 2017.

[10] Nicolas Mougel, Christophe Rigotti, MarcPlantevit, and Olivier Gandrillon. Findingmaximal homogeneous clique sets. Know-ledge and Information Systems, 35(1) :1–30, 2013.

[11] Kim Ngan Tan Nguyen, Loïc Cerf, MarcPlantevit, and Jean-François Boulicaut.Discovering descriptive rules in relationaldynamic graphs. Intelligent Data Analysis,17(1) :49–69, 2013.

[12] Gunce Keziban Orman, Vincent Labatut,Marc Plantevit, and Jean-François Bouli-caut. Interpreting communities based onthe evolution of a dynamic attributed net-work. Social Network Analysis and Mi-ning, 5(1) :1–22, 2015.

[13] Adriana Prado, Marc Plantevit, Céline Ro-bardet, and Jean-François Boulicaut. Mi-ning graph topological patterns : Fin-

janvier 2019 No 103 24

Page 26: Bulletin de l'AFIA

ding co-variations among vertex descrip-tors. IEEE Transactions on Data andKnowledge Engineering, 25(9) :2090–2104, 2013.

[14] Cazabet Remy, Baccour Rym, and LatapyMatthieu. Tracking bitcoin users activityusing community detection on a network

of weak signals. In International Workshopon Complex Networks and their Applica-tions, pages 166–177. Springer, 2017.

[15] Giulio Rossetti and Rémy Cazabet. Com-munity discovery in dynamic networks :A survey. ACM Computing Surveys(CSUR), 51(2) :35, 2018.

LIA : Laboratoire Informatique d’Avignon

LIAUniversité d’Avignon et des Pays de Vaucluse

lia.univ-avignon.fr

Jean-François [email protected]

Chercheurs impliqués :

- Jean-François BONASTRE, PR- Richard DUFOUR, MCF- Rachid EL-AZOUZI, PR- Rosa FIGUEIREDO, MCF- Corinne FREDOUILLE, MCF HDR- Serigne GUEYE, MCF HDR- Majed HADDAD, MCF- Yezekael HAYEL, MCF HDR- Stéphane HUET, MCF- Bassam JABAIAM, MCF- Tania JIMENEZ, IR- Pierre JOURLIN, MCF- Vincent LABATUT, MCF- Fabrice LEFEVRE, PR- Georges LINARES, PR- Driss MATROUF, MCF HDR- Mohamed MORCHID, MCF- Mickael ROUVIER, MCF- Éric SAN-JUAN, MCF- Juan-Manuel TORRES MORENO, MCFHDR

- Rénato DE MORI, PR émérite- Marc EL BEZE, PR émérite- Pierre-Michel BOUSQUET, PRAG- Eitan ALTMAN, DR INRIA associé- Didier JOSSELIN, DR CNRS associé

Présentation générale

Le LIA est une équipe d’accueil (EA 4128)créée en 1987 à l’Université d’Avignon et desPays de Vaucluse. Son activité de rechercheest actuellement organisée en trois axes thé-matiques : Langage, Optimisation & rechercheopérationnelle, et Réseaux informatiques. Destravaux relatifs à l’IA appliquée aux réseauxsociaux apparaissent dans le cadre de chacund’entre eux. Pour le langage, il s’agit essentiel-lement de l’étude des contenus échangés sur lesmédias sociaux et de l’extraction de connais-sances issus de flux multimédia, audio et/ouvidéo. Dans le domaine de l’optimisation, le LIAs’intéresse à la résolution de problèmes définissur des graphes, tels que leur partitionnement,qui ont de multiples applications dans l’analysede réseaux sociaux. Enfin, dans le domaine desréseaux informatiques, le LIA manie des outilsrelatifs à la théorie des jeux, qui sont notam-ment utilisés pour étudier des processus se dé-roulant sur les réseaux sociaux.

Deux axes transversaux ont récemment étéadjoints à ces thèmes, afin de favoriser leséchanges à l’intérieur (et à l’extérieur) du labo-ratoire : Société numérique et Systèmes com-plexes. Le premier est relatif aux liens entrete-

janvier 2019 No 103 25

Page 27: Bulletin de l'AFIA

nus par le LIA avec un ensemble de laboratoiresde SHS, via la FR 3621 Agorantic (Culture, Pa-trimoines, et Sociétés Numériques). Ce type decollaboration a permis de lancer plusieurs tra-vaux portant sur l’analyse de réseaux sociauxau sens large, aussi bien en-ligne que hors-ligne.Le deuxième axe comporte une activité de re-cherche sur l’extraction et l’analyse de réseauxcomplexes, qui incluent notamment les réseauxsociaux. Le LIA est également partie prenantedu LABEX BLRI (Brain and Langage Rese-rach Institute) et de l’institut de convergenceILCB (Institute of Language, Communicationand the Brain), dans lesquels sont menés destravaux concernant les réseaux sociaux en as-sociation avec des neurologues et des psycho-cogniticiens.

RI & TALN

Un certain nombre de travaux récents me-nés dans les axes Langage et Société numé-rique ont porté sur la recherche d’informationet/ou le traitement du langage naturel dans lecontexte des réseaux sociaux. Trois types d’ap-proches non-mutuellement exclusives peuventêtre identifiés : l’extraction de réseaux sociaux(au sens sociologique) à partir de donnéesbrutes ; l’utilisation de réseaux sociaux commemodèles pour résoudre des problèmes de plushaut niveau ; et l’exploitation de contenus pu-bliés sur les média sociaux de type Twitter.

L’extraction de réseaux d’interactions so-ciales est une tâche particulièrement pertinentedans le cadre de nos collaborations au sein de laFR Agorantic, car l’objet réseau social consti-tue une passerelle naturelle entre informatiqueet sciences sociales. Un travail en cours impli-quant des politistes et historiens vise ainsi àidentifier des évènements dans des articles depresse, billets de blogs, notices biographiques,et autres textes, afin d’en extraire des réseauxde coparticipation à ces évènements. Le butest à la fois d’étudier le réseau social en soi,

mais également de l’utiliser pour répondre à desquestions disciplinaires, notamment relatives àla façon dont le Web joue le rôle de miroir dé-formant sur l’activité des élus [9].

La FR Agorantic a financé le doctorat deX. BOST, qui a permis de développer une ac-tivité relative au résumé automatique de sé-ries télévisées [3]. En plus des descripteurs vi-déos classiques, l’originalité de la méthode pro-posée est de s’appuyer sur une représentationde l’intrigue prenant la forme d’un réseau so-cial de personnages. Il s’agit d’un graphe dy-namique extrait en analysant les dialogues aumoyen d’une méthode baptisée lissage narratif,et permettant de tenir compte des spécifici-tés du médium. Dans le cadre de la thèse d’E.PAPÉGNIES [14] (en cours), nous proposonsune méthode à base de réseaux conversation-nels pour identifier des situations d’abus sur desmessageries en ligne. Ces travaux montrent quel’évolution de la structure de la conversationest plus révélatrice que sa teneur pour détecterces situations.

Le LIA a participé au projet ANR Imagi-web (Analyse de la dynamique des images sur leWeb 2.0), porté par ERIC (Université LumièreLyon 2). Son objectif était d’étudier commentle Web construit, diffuse, et affecte l’image demarque. Le rôle du LIA a été de préparer uncorpus de tweets et de l’analyser pour identifierles opinions et leur évolution. Dans le cadre dela thèse de J.-V. COSSU, nous avons proposéune méthode semi-supervisée d’annotation destweets, utilisant l’active learning [4], et une ap-proche à base de Partial Least Squares PathModeling (PLS-PM) pour leur exploitation [6].Nous avons également mené plusieurs travauxponctuels relatifs à la classification de tweets etde tweetos : prédiction d’influence sur la basedes données du challenge Replab (CLEF 2014)[5] ; estimation du lieu de publication via uneméthode de type LDA (Latent Dirichlet Allo-cation) [12] ; prédiction de retweet [11].

janvier 2019 No 103 26

Page 28: Bulletin de l'AFIA

Le projet ANR GaFes (Galerie des festi-vals), qui est porté par le LIA, vise au déve-loppement d’approches pluridisciplinaires pourle traitement de données culturelles. Outre leLIA, il implique également le Centre NorbertElias (Sciences de l’information et de la com-munication), l’institut Eurecom, la société Syl-labs et le cabinet d’enquêtes GECE. Le pro-jet concerne l’analyse et la ré-éditorialisationdes traces que les festivals culturels laissentsur Internet, et tout particulièrement les mé-dia sociaux. Le LIA intervient notamment surdes problèmes de structuration, visualisation etexploitation des données hétérogènes collec-tées [16]. Les données extraites constituent unterrain d’enquête numérique pour des analysessociologiques consacrées à l’étude des publicsdes festivals et des nouvelles pratiques festiva-lières. Le corpus collecté est aussi le supportde tâches des campagnes d’évaluation CLEF2017 et 2018 (Cultural Microblog Contextua-lization).

Jeux évolutionnaires

Une bonne partie de l’activité dans les axesRéseaux et Systèmes complexes porte sur lesjeux évolutionnaires, notamment ceux ayantlieu sur des graphes modélisant des réseaux so-ciaux.

Congas (Dynamics and Coevolution inMulti-Level Strategic Interaction Games) étaitun projet FP7 visant à développer des modèleset outils fondés sur la théorie des jeux pour ana-lyser, prédire, et contrôler des systèmes com-plexes multi-niveaux. Il regroupait des parte-naires prestigieux (TuDelft, CREATENET, IN-RIA, University of Pisa, Technion, Imperial Col-lege London), parmi lesquels le LIA a joué unrôle important en élaborant des outils basés surles jeux évolutionnaires et multirésolution, etintégrant des concepts de théorie des graphes,mécanique statistique, contrôle et optimisa-tion. Nous avons notamment étudié les dyna-

miques de réplication dans une population d’in-dividus organisée sous la forme de communau-tés avec différents niveaux d’interactions [2],et montré l’impact de cette structure d’inter-action sur les dynamiques de réplication et lastabilité des équilibres.

L’étude de ces processus dynamiques deprise de décision a été poursuivie dans destravaux plus récents, avec comme objectif decomprendre les stratégies optimales de publi-cation dans les réseaux sociaux lorsque plu-sieurs générateurs de contenu sont en com-pétition [17]. Nous avons étudié l’impact deces stratégies individuelles sur la diversité decontenu proposée aux usagers. Des outils issusde l’approximation stochastique sont utiliséspour modéliser le comportement des sourcesde contenu en fonction de la popularité descontenus postés sur les réseaux sociaux. Enfin,dans un travail récent [20], nous avons étudiéun modèle stochastique de dynamique d’opi-nion dans les réseaux sociaux, et l’impact dela structure de communautés sur les solutionsquasi-stationnaires de ces dynamiques. Nousavons également proposé des modèles d’inspi-ration biologique pour prédire l’évolution de lapopularité de vidéos sur YouTube [19], et unmodèle à base de marche aléatoire pour étu-dier le mécanisme de recommandation sur lamême plate-forme web-sociale [15].

Analyse de graphes

Un certain nombre de travaux récents me-nés dans le cadre des axes Optimisation,Systèmes complexes et Société numériqueconcernent le développement d’outils pourl’analyse de graphes modélisant notammentdes systèmes sociaux, au sens large. On peutdistinguer ici deux types de travaux : ceux cher-chant à caractériser des nœuds de façon indi-viduelle, et ceux visant à partitionner le graphepour identifier et exploiter sa structure de com-munautés.

janvier 2019 No 103 27

Page 29: Bulletin de l'AFIA

Plusieurs travaux ponctuels ont été menéspour développer des mesures de centralité no-dales. La mesure pour réseaux multiplexes (i.e.,à plusieurs couches) définie dans [18] est ba-sée sur un modèle de diffusion d’opinion dansplusieurs médias sociaux simultanément. La gé-néralisation de la mesure de rectitude propo-sée dans [8], qui s’applique aux réseaux spa-tiaux, est issue d’une collaboration avec lesgéographes de la FR Agorantic.

Une partie de notre activité actuelle portesur la description de réseaux complexes à un ni-veau intermédiaire, via l’analyse de leur struc-ture de communautés. Nous proposons pourcela une approche consistant à rechercher desmotifs séquentiels fréquents dans des réseauxdynamiques à attributs (i.e., dont les nœudssont décrits de façon individuelle) [13], avecapplication à différents réseaux sociaux. Nousavons également défini une méthode non su-pervisée permettant de caractériser la positiond’un nœud relativement à la structure de com-munautés, qui s’est révélée efficace pour dé-tecter certains types d’utilisateurs abusifs surTwitter [7].

Enfin, un travail en cours dans le cadrede la thèse de N. ARINIK porte sur le par-titionnement de graphes signés (i.e., chaquelien est décrit par poids, pouvant être néga-tif). Ce type de graphe permet de représen-ter des systèmes contenant des relations an-tagonistes. Nous explorons plusieurs variantesdu concept d’équilibre structurel, en les adap-tant à plusieurs cas d’application tels que ladescription du comportement des députés eu-ropéens [1] ou la détection de corruption dansles marchés publics. Nous formulons ces tâchesde partitionnement sous la forme de problèmesd’optimisation, et proposons des méthodes derésolution efficaces [10].

Références[1] Nejat Arinik, Rosa Figueiredo, and

Vincent Labatut. Signed graph analysisfor the interpretation of voting behavior.In i-KNOW/SNANDIG, 2017.

[2] Nesrine Ben Khalifa, Rachid El-Azouzi,Yezekael Hayel, and Issam Mabrouki. Evo-lutionary games in interacting communi-ties. Dyn. Games Appl., 7(2) :131–156,2016.

[3] Xavier Bost, Vincent Labatut, SerigneGueye, and Georges Linarès. Extractionand analysis of dynamic conversationalnetworks from tv series. In Social Net-work Based Big Data Analysis and Appli-cations, pages 55–84. 2018.

[4] Jean-Valère Cossu, Killian Janod, Emma-nuel Ferreira, Julien Gaillard, and MarcEl Bèze. NLP-based classifiers to genera-lize experts assessments in e-reputation.In CLEF, pages 340–351, 2015.

[5] Jean-Valère Cossu, Vincent Labatut, andNicolas Dugué. A review of features forthe discrimination of twitter users. Soc.Netw. Anal. Min., 6(1) :25, 2016.

[6] Jean-Valère Cossu, Eric Sanjuan, Juan-Manuel Torres-Moreno, and MarcEl Bèze. Automatic classification andPLS-PM modeling for profiling reputationof corporate entities on twitter. In NLDB,volume 9103, pages 282–289, 2015.

[7] Nicolas Dugué, Vincent Labatut, and An-thony Perez. A community role approachto assess social capitalists visibility in thetwitter network. Soc. Netw. Anal. Min.,5 :26, 2015.

[8] Vincent Labatut. Continuous averagestraightness in spatial graphs. J. ComplexNetw., 6(2) :269–296, 2018.

[9] Vincent Labatut and Guillaume Marrel. Lavisibilité politique en ligne : Contribution à

janvier 2019 No 103 28

Page 30: Bulletin de l'AFIA

la mesure de l’e-reputation politique d’unmaire urbain. In Conférence Big Data etvisibilité en ligne, 2017.

[10] Mario Levorato, Lucia Drummond, YuriFrota, and Rosa Figueiredo. An ILS al-gorithm to evaluate structural balance insigned social networks. In SAC, pages1117–1122, 2015.

[11] Mohamed Morchid, Richard Dufour,Pierre-Michel Bousquet, Georges Linarès,and Juan-Manuel Torres-Moreno. Featureselection using PCA for massive retweetdetection. Pattern Recogn. Lett., 49 :33–39, 2014.

[12] Mohamed Morchid, Yonathan Portilla, Di-dier Josselin, Richard Dufour, Eitan Alt-man, Marc El Bèze, Jean-Valère Cossu,Georges Linarès, and Alexandre Reiffers.An author-topic based approach to clustertweets and mine their location. In SpatialStat., volume 27, pages 26–29, 2015.

[13] Günce Keziban Orman, Vincent Labatut,Marc Plantevit, and Jean-François Bouli-caut. Interpreting communities based onthe evolution of a dynamic attributed net-work. Soc. Netw. Anal. Min., 5 :20, 2015.

[14] Etienne Papegnies, Vincent Labatut, Ri-chard Dufour, and Georges Linarès.Graph-based features for automatic onlineabuse detection. In SLSP, pages 70–81,2017.

[15] Yonathan Portilla, Alexandre Reiffers, Ei-tan Altman, and Rachid El-Azouzi. Astudy of YouTube recommendation graphbased on measurements and stochastictools. In BDSN, pages 430–435, 2015.

[16] Mathias Quillot, Cassandre Ollivier, Ri-chard Dufour, and Vincent Labatut. Ex-ploring temporal analysis of tweet contentfrom cultural events. In SLSP, pages 82–93, 2017.

[17] Alexandre Reiffers, Yezekael Hayel, andEitan Altman. Posting behaviour dyna-mics and active filtering for content di-versity in social networks. IEEE T. SignalInf. Process. Netw., 3(2), 2017.

[18] Alexandre Reiffers and Vincent Labatut.Opinion-based centrality in multiplex net-works : A convex optimization approach.Netw. Sci., 5(2) :213–234, 2017.

[19] Cédric Richier, Eitan Altman, Rachid El-Azouzi, Tania Jimenez, Georges Lina-rès, and Yonathan Portilla. Bio-inspiredmodels for characterizing youtube view-count. In ASONAM, pages 297–305,2014.

[20] Vineeth Varma, Yezekael Hayel, andConstantin Morarescu. Continuous timeopinion dynamics of agents with multi-leveled opinions and binary actions. InIEEE Infocom, 2018.

janvier 2019 No 103 29

Page 31: Bulletin de l'AFIA

Comptes rendus de journées,événements et conférences

Page 32: Bulletin de l'AFIA

26èmes Journées Francophones sur les Systèmes Multi-Agents(JFSMA 2018)

Par

Gauthier PICARDLaboratoire Hubert CurienUMR CNRS 5516Mines Saint-ÉtienneInstitut Henri [email protected]

Christophe LANGFEMTO-ST/DEODISUniversité de Franche-Comté[email protected]

Nicolas [email protected]

La 26e édition des « Journées Francophonessur les Systèmes Multi-Agents », présidées parGauthier PICARD (Mines-Saint-Étienne) a étéorganisée à Métabief par Christophe LANG(Université de Franche-Comté) et Nicolas MA-RILLEAU (IRD), du 10 au 12 octobre 2018.Cet événement a reçu le soutien de l’AfIA, dela région Bourgogne Franche-Comté, du labo-ratoire FEMTO-ST, de l’IRD et de l’universitéBourgogne Franche-Comté.

Nourri de pluridisciplinarité, le paradigmemultiagent fournit un cadre conceptuel pourl’étude et la conception de systèmes dont ladynamique globale est le fruit d’entités au-tonomes (les agents) qui interagissent dansun environnement commun. Depuis 1993, lesJournées Francophones sur les Systèmes Multi-Agents (JFSMA) réunissent chaque année,trois jours durant, des chercheurs qui étudient,utilisent et font évoluer ce paradigme pouradresser des problématiques issues de domainesliés à l’informatique (intelligence et vie artifi-cielle, génie logiciel, robotique collective, etc.)et aux sciences humaines et naturelles (écono-

mie, sociologie, éthologie, etc.). Les JFSMAconstituent ainsi un rendez-vous scientifiqueprivilégié, placé sous le signe de l’échange etde l’ouverture.

Programme Journée 1 (10/10/18)

9h30. « Ouverture des journées », par Gau-thier PICARD

10h00. Session « simulation multiagents : tra-fic et modèles de comportements »

10h00. « Situations accidentogènes dans lesgénérateurs de trafic routier », par PhilippeMATHIEU, Antoine NONGAILLARD et Be-renice REFFET

10h40. « Simulation du comportement laté-ral des véhicules fondée sur une approcheà base de forces », par Julien SAUNIER

11h20. « Modélisation du changement de voiede véhicules autonomes à différents ni-veaux d’abstraction », par Jérémy SOBIE-RAJ, Guillaume HUTZLER, Hanna KLAU-DEL et Lydie NOUVELIÈRE

12h15. Pause déjeuner14h00. Session « Résolution collective de pro-

blème et optimisation multiagents »14h00. « Planification de vidage d’images sa-

tellitaires par systèmes multiagents auto-adaptatifs », par Timothée JAMMOT, ElsyKADDOUM et Serge RAINJONNEAU

14h15. « DeciMaxSum : Décimer pour ré-soudre des DCOP cycliques plus effica-cement », par Jesus CERQUIDES, RémiEMONET, Gauthier PICARD et Juan An-tonio RODRIGUEZ AGUILAR

14h30. « Optimisation sous contraintes distri-buée : une introduction au domaine », parGauthier PICARD

15h00. Pause café15h30. Session « Négociation multiagents »

janvier 2019 No 103 31

Page 33: Bulletin de l'AFIA

15h30. « Négociation bilatérale par conces-sion : un état de l’art », par MaximeMORGE

16h10. « MoCaNA, un agent de négocia-tion automatique utilisant la recherche ar-borescente de Monte-Carlo », par CedricBURON, Sylvain DUCTOR, Zahia GUES-SOUM et Olivier ROUSSEL

16h50. «Négociation multiagent one-to-manyet mécanismes de coordination pour la ges-tion de la satisfaction des utilisateurs d’unservice », par Amro NAJJAR, Gauthier PI-CARD, Yazan MUALLA et Kamal SINGH

17h00. Réunion de la communauté18h30. Fin de la journée

Programme Journée 2 (11/10/18)

9h00. « Protocoles de population optimaux enespace », par Janna BURMAN (UniversitéParis-Sud), conérencière invitée

10h00. Pause café10h30. Session « Interactions et coopération »10h30. « Une approche passive pour réduire

les coûts de traitement des interactionsentre agents », par Nicolas DIOT, FabriceBOUQUET et Christophe LANG

10h45. « Un modèle de norme intégrant lesconditions spatio-temporelles », par SitrakaOliva RAHARIVELO et Jean-Pierre MÜL-LER

11h25. « Gestion d’intentions multiples pouragents ambiants coopératifs », par ArthurCASALS, Assia BELBACHIR, Amal ELFALLAH SEGHROUCHNI et Anarosa AlvesFranco BRANDÃO

11h40. « Modélisations de l’interaction polli-nisateurs/palmiers à l’aide d’approches dé-terministes et multiagents. Application surl’estimation du taux de nouaison », par YvesDUMONT, Jean-Christophe SOULIÉ et Fa-bien MICHEL

12h00. Pause déjeuner13h00. Session « Auto-organisation et ap-

proches ascendantes »13h00. « Recrutement et auto-organisation :

Vers un modèle multiagent complet d’unecolonie d’abeilles », par Jeremy RIVIERE,Cedric ALAUX, Yves LE CONTE, YvesLAYEC, Andre LOZAC’H, Vincent RODINet Frank SINGHOFF

13h40. « Découverte d’équilibres dynamiquesglobaux par coopération locale et sans fonc-tion d’évaluation », par Sébastien MAI-GNAN et Carole BERNON

14h20. «Modèle et performance d’une gestionlocale autonome des conflits dans le traficaérien », par Augustin DEGAS, Elsy KAD-DOUM, Françoise ADREIT, Marie-PierreGLEIZES et Arcady RANTRUA

14h45. Evénement social17h00. Session « Démonstrations »18h30. Fin de la journée

Programme Journée 3 (12/10/18)

9h00. « Enabling decentralised decision-making in AI – an agent environments pers-pective », par Kostas STATHIS (Royal Hol-loway, University of London), conférencierinvité

10h00. Pause café10h30. Session « Simulation multiagents :

couplage et multi-niveaux »10h30. « Modélisation multiagents pour la

gestion individuelle et collective d’une mala-die infectieuse », par Stéphane KREBS, Sé-bastien PICAULT et Pauline EZANNO

10h45. « Modèle de couplage multiagent poursimulations individu centrées », par KhadimNDIAYE, Flavien BALBO, Jean-Paul JA-MONT et Michel OCCELLO

11h25. « Co-simulation à base d’outils mul-tiagents : un cas d’étude avec NetLogo »,par Thomas PARIS, Laurent CIARLETTAet Vincent CHEVRIER

11h40. « Couplage de simulations multiagentspour la conception de politiques urbaines »,

janvier 2019 No 103 32

Page 34: Bulletin de l'AFIA

par Simon PAGEAUD, Veronique DES-LANDRES, Vassilissa LEHOUX et SalimaHASSAS

12h00. Clôture des journées

Résumé des interventions

Cette année le comité de programme a reçu52 soumissions parmi lesquelles ont été sélec-tionnées 11 présentations longues, 9 présenta-tions courtes, et 6 démonstrations, pour nousproposer un programme scientifique riche etvarié. Les verrous affrontés dans plusieurs deces articles sont ceux de la complexité, du pas-sage à l’échelle, et de la dynamique de l’envi-ronnement. Les modèles et méthodes qui sontproposés, plaçant au centre les notions de dis-tribution et de décentralisation des décisionsdes agents, abordent de manière renouveléedes techniques de simulation individu-centrée,de résolution collective de problèmes, de né-gociation multiagents, d’interaction, et d’auto-organisation.

L’excellent travail sélectionné par le comitéde programme (« MoCaNA, un agent de négo-ciation automatique utilisant la recherche ar-borescente de Monte-Carlo » par Cedric BU-RON, Sylvain DUCTOR, Zahia GUESSOUMet Olivier ROUSSEL) recevra le prix du meilleurarticle des journées financé par l’AfIA. Les

meilleurs articles sélectionnés par le comité deprogramme feront également l’objet d’un nu-méro spécial de la Revue d’Intelligence Artifi-cielle (https://ria.revuesonline.com/).

ConclusionCette année est également marquée par

l’émergence ou la confirmation de champsd’applications pour lesquels les apports des sys-tèmes multiagents sont notables, comme l’In-ternet des objets, le trafic routier, les véhiculesautonomes, ou bien la simulation de systèmescomplexes. Ces domaines applicatifs sont au-tant d’arguments en faveur d’une approchemultiagents de la conception et de contrôlede systèmes où la décentralisation des déci-sions est un pré-requis ou une exigence. La pré-sence de démonstrations lors de ces journéestémoignent également de la maturité techno-logique des contributions francophones.

Les actes de ces journées ont été publiéschez Cépaduès [1].

Références[1] G. Picard, C. Lang, and N. Marilleau, edi-

tors. Journées Francophones sur les Sys-tèmes Multi-Agents (JFSMA’18) - Dis-tribution et décentralisation. Cépaduès,2018.

5e journée Perspectives et Défis de l’IA (PDIA 2018)

Par

Olivier SIMONINCITI/ ChromaINSA Lyon, [email protected]

L’AfIA a organisé sa cinquième journéePDIA (Perspectives et Défis de l’IA) sur lethème « véhicule autonome et intelligence ar-tificielle » le 11 octobre 2018, à l’UniversitéParis-Descartes.

Résumé de la thématique

On parle beaucoup de véhicule autonome,sans toujours faire la connexion avec l’IA. Onparle encore plus d’IA, mais sans forcément

janvier 2019 No 103 33

Page 35: Bulletin de l'AFIA

penser à toutes les possibilités pour les vé-hicules autonomes. Les défis sont nombreux,parmi lesquels la sûreté et la validation des al-gorithmes embarqués, la perception et la lo-calisation, l’interaction avec l’humain, la prisede décision temps réel, la navigation en traficdense, etc. Ainsi, la journée PDIA 2018 visaità dresser un panorama de ces enjeux au traversd’exposés et de tables rondes.

Participation

La journée a attiré plus de 75 personnes(inscrites). Huit présentations invitées étaientproposées, ainsi que deux tables rondes. Lajournée a débuté par un mot de bienvenue deF. DARDEL, Président de l’Université Paris-Descartes, qui nous accueillait gracieusementdans l’amphithéâtre Fourrier.

La journée a donné lieu à de nombreuxéchanges entre le public et les intervenants,mais également lors des tables rondes. Nousavons recueillis lors de la journée, et après, denombreux messages de remerciements pour laqualité des exposés et des échanges.

Conférenciers invités et tables rondes

9h00. « L’IA au service du transport auto-nome : défis, limites et opportunités », parPatrice AKNIN, (IRT SystemX).L’IA recouvre une myriade de domaines ettechnologies dont les niveaux de pénétrationdans l’industrie sont contrastés. Nous expo-sons les avancées et promesses de l’IA pourle transport autonome dont chacun perçoitle potentiel de rupture, surtout si couplée àd’autres évolutions des modèles de mobilité,électrique, connectée ou encore partagée.

9h30. « Systèmes multi-agents pour la simula-tion et la modélisation du trafic », par Phi-lippe MATHIEU, (Université Lille).Avec l’avènement du véhicule autonome etla mutation que va connaître le secteur au-tomobile, la simulation de trafic routier a

pris un nouvel essor. Nous montrons com-ment une approche à base d’agents peutêtre utilisée pour modéliser un trafic routierferroviaire ou fluvial, et comment elle peutservir de base au test du véhicule autonome.

10h30. « Le défi de la validation en sécuritéde l’IA pour la perception et la décision enconduite autonome de train », par PhilippeDAVID, (SNCF).Après une présentation de notre approchede la détection, nous montrons la néces-sité d’une intelligence artificielle décision-nelle dont le niveau de sécurité est dé-montrable. Au-delà des exigences juridiques,nous montrons la nécessaire diminution dela sensibilité structurelle de l’architecture dusystème de décision face aux exigences nonclairement définies de sécurité.

11h00. « Validation et vérification du logicielpour les systèmes autonomes », par FélixIngrand, (CNRS, Toulouse).L’application des techniques de validation etde la vérification (V&V) aux systèmes au-tonomes, qui recourent à des fonctions dé-cisionnelles, pose de nouveaux challenges,tant pour la V&V des fonctions de baseet de leur intégration, que pour des fonc-tions décisionnelles où l’on distinguera lesapproches basées sur des modèles explicitesvs appris

11h30. « Table ronde Validation/vérificationdans les différents secteurs », par PhilippeDAVID (SNCF), Félix INGRAND (LAAS),Alai PIPERNO (UTAC-CERAM) et animéepar Philippe MATHIEU.

14h00. « Validation des systèmes de conduiteautonomes », par Xavier DELACHE, (Sous-directeur des études et de la prospective,DGITM).

14h30. « Les aspects éthiques du déploiementdu véhicule autonome », par Ebru BURCUDOGAN, (VEDECOM).Les aspects éthiques du véhicule autonome

janvier 2019 No 103 34

Page 36: Bulletin de l'AFIA

(VA) peuvent avoir un impact dispropor-tionné sur leur acceptabilité par le grand pu-blic, et engendrer le scepticisme. Il ne fautnéanmoins pas réduire les questions éthiquesaux situations de dilemmes. Nous exposonsles conséquences du déploiement du VA etdes nouvelles mobilités pour la société engénéral.

15h00. « IA intégrée / à intégrer au sein dessystèmes robotiques militaires pour l’auto-nomie », par Bruno STEUX, Jean-FrançoisMASSOL, Bruno RICAUD (Nexter Sys-tems).Nous présentons la mobilité autonome etdes briques d’intelligence artificielle inté-grées dans les produits robotiques dévelop-pés chez Nexter. Nous ouvrons notre dis-cours sur la mutation des conflits et nous ex-posons les implications sur les besoins tech-nologiques futurs.

15h30. « Navigation sociale des véhicules au-tonomes », par Anne SPALANZANI, (Uni-

versité Grenoble Alpes, INRIA).Le problème central est de garantir la sécu-rité de tous les véhicules autonomes qui sedéplacent dans un espace dynamique peupléd’humains, et de s’assurer de l’acceptabilitédes usagers. Nous proposons des stratégiesintégrant perception et prédiction de l’étatde l’environnement mais aussi conventionssociales et anticipation des intentions deshumains.

16h30. « Table ronde Plates-formes d’inté-gration et relations avec l’humain », parEbru BURCU DOGAN (VEDECOM), Jé-rome LEMAIRE (DGA) et Olivier SIMONIN(INSA Lyon), et animée par Yves DEMA-ZEAU.

Organisation

La journée était organisée conjointementpar Yves DEMAZEAU et Olivier SIMONIN,avec le soutien du bureau de l’AfIA.

Nuit de l’Info

Par

Florence BANNAYIRIT/ Équipe ADRIAUniversité Toulouse [email protected]

La Nuit de l’Info 2018 a eu lieu de 16h39à 8h05 dans la nuit du 6 au 7 décembre sur lethème de L’assistance numérique d’un explora-teur en conditions extrêmes. L’AfIA a proposépour la 4e année un défi Mettez de l’IA dansvotre moteur. Le principe de la Nuit de l’Infoest très simple : Le jeudi 6, au coucher du So-leil, 16h39, en séance plénière : les organisa-teurs remettent un sujet (le même pour toutela France) aux participants. Les étudiants s’or-ganisent en groupes (sur un ou plusieurs sites) :ils développent un projet (informatique, marke-ting, rédactionnel, etc.) tout en ciblant un ou

plusieurs défis. Le vendredi 7, au lever du Soleil,08h05, les développements sont figés. Le ven-dredi matin, pendant que les étudiants dormentdes jurys se réunissent (un jury par défi) et exa-minent les travaux réalisés par les différenteséquipes durant la nuit.

La compétition

Le défi qu’a proposé l’AfIA s’intitulait Met-tez de l’intelligence dans votre moteur : « Vousmettrez en œuvre une ou plusieurs méthodesd’intelligence artificielle (IA) dans votre pro-jet et vous indiquerez en quoi ces méthodesrendent votre réalisation plus performante oupertinente. Vous pouvez faire appel à des tech-niques classiques, en cours de développementou futuristes. L’équipe qui aura mis le plus en

janvier 2019 No 103 35

Page 37: Bulletin de l'AFIA

avant les avantages de l’utilisation de l’IA dansson projet remportera ce défi ». Les réponsesdevaient inclure :

- une description des problématiques IA ren-contrées dans le projet ;

- une explication de l’intégration de l’IA dansl’application (description de ce qui a été réa-lisé qui relève de l’IA ou de ce qui aurait puêtre fait avec des outils d’IA) ;

- une analyse des avantages et inconvénientsde cette intégration.

La récompense est un montant de 400eassorti d’invitations à présenter une démonstra-tion lors de la compétition organisée par l’AfIAau sein de la Plate-Forme IA 2019 à Toulouse.

Les équipes

Parmi les douze équipes inscrites pour rele-ver ce défi, cinq ont réussi à remettre à tempsun projet : GIFCOMS, ISITCOM-Shadow-Brokers2, ISIT’COM-Techno-Knights, Lord ofthe Ping et MLG.

Jury

Le jury était composé de Florence BAN-NAY (coordinatrice), Anne-Gwenn BOSSER,Philippe MORIGNOT et Sylvie SAGET. Lesprojets ont été jugés sur cinq critères : fonc-tionnement (est-ce que la proposition peut êtremise en œuvre ?), innovation, qualité de l’IA,spectre IA couvert, qualité des explications.

Les résultats

Nous avons eu du mal à départager les deuxmeilleures équipes : l’équipe Lord of the Pinga finalement été déclarée vainqueur pour le re-cul de ses explications et recevra un prix de

200e. Néanmoins vu la qualité des résultatsde l’équipe MLG, elle recevra la même sommede 200e. Le classement final est le suivant :

1. Lord of the Ping a développé un chatbot sar-castique avec détection de serpent par ap-prentissage. L’équipe est allée jusqu’au boutde deux implémentations utilisant de l’IA.Elle a bien expliqué les problèmes et les li-mites des approches utilisées.

2. MLG a construit un site web permettant desaisir des données, de visualiser les courbescorrespondantes et de donner les positionsdes robots. Le jury a apprécié les résultatsprésentés au travers de vidéos qui montrentdeux applications (robots de rangement etgéolocalisation) mais aurait aimé une expli-cation globale.

3. ISITCOM_Techno_Knights propose dedévelopper une montre connectée avec descapteurs de température (peau, air), rythmecardiaque, respiration. L’idée novatrice estde se servir des données captées pour détec-ter l’état psychologique par apprentissageafin d’envoyer une alerte adaptée. Le jurya jugé l’idée intéressante et réalisable maisdéplore l’absence des détails techniques IAet concrets d’implémentation.

4. ISITCOM_Shadow_Brokers2 et5. GIFCOMS : le premier propose un sys-

tème de capteurs permettant de détecter lesdangers de nuit, le deuxième présente uneplateforme intelligente de survie basée surl’Internet of thing. Le point de vue IA estpeu développé dans les deux projets qu’ontsoumis ces équipes.

Merci à tous les participants pour le travailfourni et rendez-vous l’année prochaine pour unnouveau défi de l’AfIA !

janvier 2019 No 103 36

Page 38: Bulletin de l'AFIA

Thèses et HDR du trimestre

Si vous êtes au courant de la programmation desoutenances de thèses ou HDR en Intelligence Ar-tificielle cette année, vous pouvez nous les signaleren écrivant à [email protected].

Page 39: Bulletin de l'AFIA

Thèses de Doctorat

Mohammed Yacine TALEB« Optimizing Distributed In-memory Sto-rage Systems Fault-tolerance, Performance,Energy Efficiency »Supervision : Gabriel ANTONIU

Toni CORTESLe 02/10/2018, à l’Université de Rennes,Ecole normale superieure

Joseph EHOUNOU« Algorithmes de graphes pour la decouvertede la topologie d’un reseau energetique parla connaissance de ses flots »Supervision : Dominique BARTHLe 02/10/2018, à l’Université de Paris Sa-clay

Aline HUFSCHMITT« Decomposition des jeux dans le domainedu General Game Playing. »Supervision : Nicolas JOUANDEAU

Jean noel VITTAUTLe 04/10/2018, à l’Université de Paris 8

Juan carlos Munoz FERNANDEZ« A generic and extensible requirements en-gineering framework for self adaptative soft-ware systems. »Supervision : Camille SALINESI

Raul Mazo PENAGabriel TAMURA

Le 08/10/2018, à l’Université de Paris 1

Gabrielle PARIS« Resolution of some optimisation problemson graphs and combinatorial games »Supervision : Eric DUCHENE

Paul DORBECLe 09/10/2018, à l’Université de Lyon

Elinirina Irena ROBINSON« Filtering and uncertainty propagation me-thods for model-based prognosis »Supervision : Tarek RAISSILe 10/10/2018, au CNAM, Paris

Mikael MONET« Combined complexity of probabilisticquery evaluation »Supervision : Pierre SENELLARTLe 12/10/2018, à l’Université de Paris Sa-clay

Damien LIGIER« Functional encryption applied to privacy-preserving classification : practical use, per-formances and security »Supervision : Caroline FONTAINELe 15/10/2018, à l’École nationale super-ieure Mines-Telecom Atlantique BretagnePays de la Loire

Clement GAUTRAIS« Signatures : detecting and characteri-zing complex recurrent behavior in sequen-tial data »Supervision : Alexandre TERMIERLe 16/10/2018, à l’Université de Rennes 1

Nicolas AUDEBERT« Classification de donnees massives de te-ledetection »Supervision : Sebastien LEFEVRE

Bertrand Honore Henri LeSAUXLe 17/10/2018, à l’Université de Lorient

Quentin DELMEE« Resolution exacte de problemes de loca-lisation de services bi-objectifs en variablesmixtes »Supervision : Xavier GANDIBLEUX

Anthony PRZYBYLSKILe 19/10/2018, à l’Université de Nantes

janvier 2019 No 103 38

Page 40: Bulletin de l'AFIA

Anil GOYAL« Un cadre PAC-Bayesien pour l’apprentis-sage multivues »Supervision : Massih reza AMINI

Emilie MORVANTLe 23/10/2018, à l’Université de Lyon

Vinicius Ferraris pignataro MAZZEI« Detection de changement par fusiond’images de teledetection de resolutions etmodalites differentes »Supervision : Marie CHABERT

Nicolas DOBIGEONLe 26/10/2018, à l’INP, Toulouse

Jessie CARBONNEL« L’analyse formelle de concepts : un cadrestructurel pour l’etude de la variabilite de fa-milles de logiciels »Supervision : Marianne HUCHARDLe 29/10/2018, à l’Université de Montpel-lier

Amina ANNANE« Utilisation des ressources de connais-sances externes pour ameliorer l’alignementd’ontologies biomedicales »Supervision : Zohra BELLAHSENE

Faical AZOUAOULe 29/10/2018, à l’Université de Montpel-lier

Khaled MAAFA« Jeux et treillis, aspects algorithmiques »Supervision : Lhouari NOURINE

Mohammed said RADJEFLe 29/10/2018, à l’Université de ClermontAuvergne

Yann BARSAMIAN« Pic-Vert : une implementation de la me-thode particulaire pour architectures multi-coeurs »Supervision : Eric VIOLARDLe 31/10/2018, à l’Université de Stras-bourg

Mahieddine DELLABANI« Methodes formelles pour les systemes dis-tribues temps-reel »Supervision : Saddek BENSALEMLe 31/10/2018, à l’Université de GrenobleAlpes

Thomas MEYSSONNIER« Vers des systemes et outils de notationet de composition pour la musique electroa-coustique »Supervision : Myriam Desainte CATHE-RINELe 02/11/2018, à l’Université de Bordeaux

Romain RINCE« Behavior Recognition on Noisy Data-streams Constrained by Complex PriorKnowledge »Supervision : Philippe LERAY

Romain KERVARCLe 07/11/2018, à l’Université de Nantes

Gabin PERSONENI« Apport des ontologies de domaine pourl’extraction de connaissances a partir dedonnees biomedicales Contribution of do-main ontologies for knowledge discovery inbiomedical data »Supervision : Marie dominique DEVIGNES

Adrien COULETLe 09/11/2018, à l’Université de Lorraine

Laurent LUCIEN« Contribution a une modelisation globalede la collaboration dans les systemes multi-agents : Application aux entites mobiles in-telligentes »Supervision : Laurent PHILIPPE

Christophe LANGNicolas MARILLEAU

Le 09/11/2018, à l’Université de Bour-gogne Franche-Comte

janvier 2019 No 103 39

Page 41: Bulletin de l'AFIA

Yann HODE« Contribution a l’interpretation d’images etverification de la consistance d’un graphe »Supervision : Aline DERUYVERLe 12/11/2018, à l’Université de Stras-bourg

Anne MORVAN« Contributions to unsupervised learningfrom massive high-dimensional data streams: structuring, hashing and clustering »Supervision : Jamal ATIFLe 12/11/2018, à l’Université de ParisSciences et Lettres

Lydia Ould OUALI« Modele de negociation collaborative basesur la relation interpersonnelle de domi-nance »Supervision : Nicolas SABOURETLe 12/11/2018, à l’Université de Paris Sa-clay

Firas abdulmajeed Al QASEER« Politiques de planification tenant comptede criteres de duree de production et deconsommation d’energie pour la gestion en-vironnementale. interpretation de donneesobjectives et subjectives pour le manage-ment environnemental dans les systemes in-dustriels »Supervision : Denis GIENLe 15/11/2018, à l’Université de ClermontAuvergne

Olivier SANS« Methodes a intervalles et strategies deparcours d’arbre pour l’optimisation glo-bale »Supervision : Gilles TROMBETTONILe 19/11/2018, à l’Université de Montpel-lier

Fadoua CHAKCHOUK« Contribution a la robustesse dans les CSPsDistribues par replication locale »Supervision : Rene MANDIAULe 19/11/2018, à l’Université de Valen-ciennes

Mounir CHADLI« Analyse des systemes temps-reel de pointde vue ordonnancement »Supervision : Axel LEGAYLe 21/11/2018, à l’Université de Rennes 1

Guillaume GADEK« Detection d’opinions, d’acteurs-cles et decommunautes thematiques dans les mediassociaux »Supervision : Alexandre PAUCHET

Laurent VERCOUTERNicolas MALANDAIN

Le 22/11/2018, à l’Université de Norman-die

Ahmad MAZYAD« Optimisation de profils numeriques a l’aided’algorithme a essaim »Supervision : Cyril FONLUPTLe 22/11/2018, à l’Université de Littoral

Boukaye boubacar TRAORE« Modelisation des informations et extrac-tion des connaissances pour la gestion descrises »Supervision : Bernard Kamsu FOGUEM

Fana TANGARALe 23/11/2018, à l’INP, Toulouse

Wissam SIBLINI« Apprentissage multi label interactif : com-paraisons d’approches et nouvelles proposi-tions »Supervision : Pascale Kuntz COSPERECLe 23/11/2018, à l’Université de Nantes

janvier 2019 No 103 40

Page 42: Bulletin de l'AFIA

Qing XU« Modeliser les changements mineurs et ma-jeurs d’individus en interactions : applicationa la conversion a l’agriculture biologique »Supervision : Guillaume DEFFUANTLe 26/11/2018, à l’Université de ClermontAuvergne

Tarek BENKHELIF« Publication de donnees personnelles res-pectueuse de la vie privee. : une demarchefondee sur le co-clustering. »Supervision : Marc GELGON

Guillaume RASCHIALe 27/11/2018, à l’Université de Nantes

Liyang XIAO« Contributions a la planification et a l’op-timisation dans le systeme de sante mo-derne »Supervision : Amir Hajjam el HASSANI

Mahjoub DRIDILe 27/11/2018, à l’Université de Bour-gogne Franche-Comte

Maxime BUCHER« Apprentissage et exploitation de represen-tations semantiques pour la classification etla recherche d’images »Supervision : Frederic JURIELe 27/11/2018, à l’Université de Norman-die

Lynda KHIALI« Fouille de donnees a partir de series tem-porelles dimages satellites »Supervision : Maguelonne TEISSEIRE

Dino IENCOLe 28/11/2018, à l’Université de Montpel-lier

El mehdi KHALFI« Les identites au centre de la mise en uvrede comportements dans le cadre de collec-tifs multi-agents : application au Web desObjets »Supervision : Jean Paul JAMONT

Michel OCCELLOLe 28/11/2018, à l’Université de GrenobleAlpes

Abdeldjalil RAMOUL« Systeme de planification en mixed-initiative pour l’assistance a la gestion dessystemes informatises complexes »Supervision : Sylvie PESTY

Damien PELLIERLe 28/11/2018, à l’Université de GrenobleAlpes

Yacine ABBOUD« Fouille de motifs : entre accessibilite etrobustesse »Supervision : Anne BOYER

Armelle BRUNLe 28/11/2018, à l’Université de Lorraine

Wen SUN« Algorithmes heuristiques pour des pro-blemes de coloration de graphes »Supervision : Jin Kao HAO

Alexandre CAMINADALe 29/11/2018, à l’Université de Angers

Gregoire PICHON« On the use of low-rank arithmetic to re-duce the complexity of parallel sparse linearsolvers based on direct factorization tech-niques »Supervision : Pierre RAMET

Mathieu FAVERGELe 29/11/2018, à l’Université de Bordeaux

janvier 2019 No 103 41

Page 43: Bulletin de l'AFIA

Rachel BAWDEN« Going beyond the sentence : ContextualMachine Translation of Dialogue »Supervision : Sophie ROSSETLe 29/11/2018, à l’Université de Paris Sa-clay

Lucas BOCZKOWSKI« SEARCH AND BROADCAST IN A STO-CHASTIC ENVIRONMENT, A BIOLOGI-CAL PERSPECTIVE. »Supervision : Amos KORMAN

Iordanis KERENIDISLe 30/11/2018, à l’Université de SorbonneParis Cite

Vera SHALAEVA« Arbre de decision temporel multi-operateur »Supervision : Ahlame DOUZAL

Gilles BISSONLe 30/11/2018, à l’Université de GrenobleAlpes

Jieying CHEN« Extraction de connaissances a partir determinologies en logique de description »Supervision : Philippe DAGUELe 30/11/2018, à l’Université de Paris Sa-clay

Nizar MHADHBI« Fouilles de graphes et application aux re-seaux sociaux »Supervision : Lakhdar SAISLe 03/12/2018, à l’Université de Artois

Belen Baez MIRANDA« Generation de recits a partir de donneesambiantes »Supervision : Francois PORTET

Catherine GARBAYLe 03/12/2018, à l’Université de GrenobleAlpes

Julien FRADIN« Graphes complexes en biologie : pro-blemes, algorithmes et evaluations »Supervision : Guillaume FERTINLe 04/12/2018, à l’Université de Nantes

Khaled BELAHCENE« Explications pour l’agregation des prefe-rences - une contribution a l’aide a la deci-sion responsable »Supervision : Vincent MOUSSEAULe 05/12/2018, à l’Université de Paris Sa-clay

Nadira Boudjani NADIRA« Aide a la construction et l’evaluation despreuves mathematiques deductives par lessystemes d’argumentation »Supervision : Souhila KACILe 05/12/2018, à l’Université de Montpel-lier

Alexis CORNET« Algorithmes et resultats de complexitepour des problemes de graphes aveccontraintes additionnelles. »Supervision : Christian LAFORESTLe 05/12/2018, à l’Université de ClermontAuvergne

Indira lisa MEDROUK« Reseaux profonds pour la classification desopinions multilingue. »Supervision : Jacqueline SIGNORINI

Anna Pappa DELBANOLe 06/12/2018, à l’Université de Paris 8

Jeremy DECERLE« Contribution a l’optimisation de la plani-fication des tournees de soins pour l’hospi-talisation a domicile »Supervision : Olivier GRUNDER

Amir Hajjam el HASSANIOussama BARAKAT

Le 06/12/2018, à l’Université de Bour-gogne Franche-Comte

janvier 2019 No 103 42

Page 44: Bulletin de l'AFIA

Celia CHATEL« Modeles de classification en classes em-pietantes, cas des modeles arbores »Supervision : Francois BRUCKER

Pascal PREALe 07/12/2018, à l’Université de Aix-Marseille

Silvio Domingos CARDOSO« MAISA - Maintenance of semantic anno-tations »Supervision : Chantal REYNAUDLe 07/12/2018, à l’Université de Paris Sa-clay

Hong Phong PHAM« Studies on Optimal Colorful Structures inVertex-Colored Graphs »Supervision : Yannis MANOUSSAKISLe 07/12/2018, à l’Université de Paris Sa-clay

Sebastien DELECRAZ« Approches jointes texte/image pourla comprehension multimodale de docu-ments »Supervision : Frederic BECHET

Benoit FAVRELe 10/12/2018, à l’Université de Aix-Marseille

Feda ALMUHISEN« Exploitation de l’analyse formelle deconcepts et de l’extraction de motifs pourl’analyse de trajectoires d’objets mobiles »Supervision : Mohamed QUAFAFOU

Nicolas DURANDLe 10/12/2018, à l’Université de Aix-Marseille

William SCHUELLER« Controle actif de la croissance de la com-plexite dans les Language Games »Supervision : Pierre Yves OUDEYERLe 10/12/2018, à l’Université de Bordeaux

Vanel steve Siyou FOTSO« Extraction de connaissances de seriestemporelles cycliques et incertaines : appli-cation a l’analyse de la locomotion en Fau-teuil Roulant Manuel »Supervision : Engelbert Mephu NGUIFOLe 11/12/2018, à l’Université de ClermontAuvergne

Florent BONNIER« Algorithmes paralleles pour le suivi de par-ticules »Supervision : Nahid Emad PETITON

Xavier JUVIGNYLe 12/12/2018, à l’Université de Paris Sa-clay

Jose luis Vilchis MEDINA« MODELISATION DES SYSTEMES RE-SILIENTS EN LOGIQUE NON MONO-TONE APPLICATION A DRONE SO-LAIRE »Supervision : Pierre SIEGEL

Andrei DONCESCULe 12/12/2018, à l’Université de Aix-Marseille

Adeline GRANET« Extraction d’information dans des docu-ments manuscrits anciens »Supervision : Emmanuel MORIN

Harold MOUCHERESolen QUINIOU

Le 12/12/2018, à l’Université de Nantes

Yves MOCQUARD« Analyse probabiliste de protocoles de po-pulation »Supervision : Bruno SERICOLALe 13/12/2018, à l’Université de Rennes 1

janvier 2019 No 103 43

Page 45: Bulletin de l'AFIA

Jean Charles VIALATTE« On Convolution of Graph Signals andDeep Learning on Graph Domains »Supervision : Gilles COPPINLe 13/12/2018, à l’École nationale super-ieure Mines-Telecom Atlantique BretagnePays de la Loire

Clement DELGRANGE« Apprentissage base sur l’usage en interac-tion humaine avec un assistant adaptatif »Supervision : Peter DOMINEYLe 13/12/2018, à l’Université de Lyon

Konstantinos CHATZILYGEROUDIS« Apprentissage micro-data pour l’adapta-tion en robotique Micro-Data Reinforce-ment Learning for Adaptive Robots »Supervision : Jean baptiste MOURETLe 14/12/2018, à l’Université de Lorraine

Elena EPURE« Automatically Modeling Conversationsas Processes of Interrelated Speech Inten-tions »Supervision : Camille SALINESILe 14/12/2018, à l’Université de Paris 1

Simon MOURA« Apprentissage multi-cibles : theorie et ap-plications »Supervision : Massih Reza AMINILe 17/12/2018, à l’Université de GrenobleAlpes

Oriane DERMY« Prediction du mouvement humain pourla robotique collaborative: du geste accom-pagne au mouvement corps entier. Pre-diction of human movement for collabora-tive robotics: from accompanied gesture towhole-body movement. »Supervision : Francois CHARPILLET

Serena IVALDILe 17/12/2018, à l’Université de Lorraine

Guilhem CHERON« Modelisation structuree et reconnaissancedes actions humaines dans les videos »Supervision : Ivan LAPTEV

Cordelia SCHMIDLe 17/12/2018, à l’Université de ParisSciences et Lettres

Ye XIA« Combinaison d’heuristiques pour optimi-ser et dimensionner le placement d’applica-tions IoT dans le Fog »Supervision : Frederic DESPREZLe 17/12/2018, à l’Université de GrenobleAlpes

Valentina ZANTEDESCHI« A Unified View of Local Learning: Theoryand Algorithms for Enhancing Linear Mo-dels »Supervision : Marc SEBBANLe 18/12/2018, à l’Université de Lyon

Marwa Hadj salah ELLOUMI« Desambiguisation lexicale de l’arabe pouret par la traduction automatique »Supervision : Herve BLANCHON

Mounir ZRIGUILe 18/12/2018, à l’Université de GrenobleAlpes

Florian GOLEMO« comment dresser votre robot - nouveauxenvironnements de formation robotique etnouvelles methodes de transfert de strate-gies du simulateur au vrai robot »Supervision : Pierre Yves OUDEYERLe 19/12/2018, à l’Université de Bordeaux

Nicolas Galvez RAMIREZ« Un cadre pour la generation autonome destrategies dans la satisfiabilite modulo destheories »Supervision : Frederic SAUBION

Eric MONFROYLe 19/12/2018, à l’Université de Angers

janvier 2019 No 103 44

Page 46: Bulletin de l'AFIA

Mohammad Noorani BAKERALLY« Technologies du Web semantique pour lagestion d donnees liees temps reel dans lesvilles intelligentes. »Supervision : Olivier BOISSIERLe 20/12/2018, à l’Université de Saint-Etienne, EMSE

Giulia De SANTIS« Modeling and recognizing network scan-ning activities with finite mixture modelsand hidden markov models »Supervision : Olivier FESTOR

Abdelkader LAHMADILe 20/12/2018, à l’Université de Lorraine

Noura HERRADI« Representation semantique multilingue,multiculturelle et temporelle des relations in-terpersonnelles, appliquee a une prothese dememoire »Supervision : Elisabeth METAISLe 20/12/2018, au CNAM, Paris

Jean Ogier du TERRAIL« Reseaux de Neurones ConvolutionnelsProfonds pour la detection de petits vehi-cules en Imagerie Aerienne. »Supervision : Frederic JURIELe 20/12/2018, à l’Université de Norman-die

Nathalie CHARBEL« Representation semantique de corpus dedocuments heterogenes pour une nouvellestrategie de recherche d’information : appli-cation au domaine du Batiment »Supervision : Christian SALLABERRYLe 21/12/2018, à l’Université de Pau

Habilitations à Diriger les Recherches

Nous n’avons pas reçu de notificationd’HDR pour ce trimestre. Si vous êtes au cou-rant d’une soutenance, merci de nous avertir.

janvier 2019 No 103 45

Page 47: Bulletin de l'AFIA

À PROPOS DE

L’AfIA

L’objet de l’Af IA, Association Loi 1901 sans butlucratif, est de promouvoir et de favoriser le dévelop-pement de l’Intelligence Artificielle (IA) sous ses diffé-rentes formes, de regrouper et de faire croître la com-munauté française en IA, et, à la hauteur des forces deses membres, d’en assurer la visibilité.

L’Af IA anime la communauté par l’organisationde grands rendez-vous annuels. L’Af IA organise ainsichaque année une semaine de l’IA, la Plate-forme IA(PFIA 2017 Caen, PFIA 2018 Nancy) au sein de laquellese tiennent la Conférence Nationale d’Intelligence Arti-ficielle (CNIA), les Rencontres des Jeunes Chercheursen IA (CNIA) et la Conférence sur les Applications Pra-tiques de l’IA (APIA) ainsi que des conférences théma-tiques qui peuvent évoluer d’une année à l’autre sansrécurrence obligée.

C’est ainsi que du 2 au 6 juillet 2018 à Nancy,lors de son édition 2018, la Plate-Forme IA hébergea,outre les 21e CNIA, 16e CNIA et 4e APIA, les 29es

IC et les 13es JFPDA. Y étaient également program-mées une compétition d’intégration verticale DriveTo-Gaether ainsi que six journées communes organiséesavec d’autres associations ou institutions.

Forte du soutien de ses 514 adhérents à jour de leurcotisation, l’Af IA assure :

- Le maintien d’un Site Web dédié à l’IA, reproduisantégalement les Brèves de l’IA,

- Une journée recherche annuelle sur les Perspectiveset Défis en IA (PDIA 2017),

- Une journée industrielle annuelle ou Forum Industrielen IA (FIIA 2017),

- La remise annuelle d’un Prix de Thèse de Doctoraten IA,

- Le soutien à plusieurs Collèges, actuellement aunombre de 4, ayant leur propre activité :

- Collège Industriel (depuis janvier 2016),- Collège Science de l’Ingénierie des Connais-

sances (depuis avril 2016),- Collège Systèmes Multi-Agents et Agents Ar-tificiels (depuis octobre 2016),

- Collège Représentation et Raisonnement (de-puis avril 2017)

- La parution trimestrielle des Bulletins de l’Af IA, enaccès libre à tous depuis le site web,

- Un lien entre adhérents sur les réseaux sociaux Lin-kedIn, Facebook et Twitter,

- Le parrainage scientifique et financier de confé-rences et d’écoles d’été en IA,

- La diffusion mensuelle de Brèves sur les actualitésde l’IA en France ([email protected]),

- La réponse aux consultations officielles ou offi-cieuses (OPECST, MESRI, MINEF, ANR, etc.),

- La réponse aux questions de la presse écrite et de lapresse orale, également sur internet.

L’Af IA organise aussi mensuellement des Jour-nées communes avec d’autres Associations (en 2018 :EGC&IA avec EGC, Droit&IA avec la SLC, TAL&IAavec ATALA) et avec d’autres institutions (en 2018 : IApour l’Education avec la MEN/DEN, Éthique&IA avecle COERLE, Rob&IA avec le GdR Robotique).

Enfin, l’Af IA contribue à la participation de sesmembres aux grands événements de l’IA. Ainsi, lesmembres de l’Af IA, pour leur inscription à PFIA 2018,bénéficieront d’une réduction équivalente à deux fois lecoût de leur adhésion à l’Af IA, leur permettant d’assis-ter à PFIA 2018 sur 5 jours au tarif de 95,00e !

Rejoignez-vous vous aussi et adhérez à l’Af IA pourcontribuer au développement de l’IA en France. L’adhé-sion peut être individuelle ou, à partir de cinq adhérents,être réalisée au titre de personne morale (institution,laboratoire, entreprise). Pour adhérer, il suffit de vousrendre sur le site des adhésions de l’Af IA.

Merci également de susciter de telles adhésions endiffusant ce document autour de vous !

janvier 2019 No 103 46

Page 48: Bulletin de l'AFIA

CONSEIL D’ADMINISTRATION

Yves DEMAZEAU, présidentÉlise BONZON, vice-présidentCatherine FARON-ZUCKER, trésorièreSandra BRINGAY, secrétaireDominique LONGIN, rédacteurArnaud MARTIN, webmestre

Membres :Carole ADAM, Emmanuel ADAM, Patrick AL-BERT, Florence BANNAY, Alain BERGER, Fré-déric MARIS, Juliette MATTIOLI, EngelbertMEPHU NGUIFO, Davy MONTICOLO, PhilippeMORIGNOT, Bruno PATIN, Gauthier PICARD,Olivier SIMONIN, Serena VILLATA

LABORATOIRES ET SOCIÉTÉSADHÉRANT COMMEPERSONNES MORALES

Ardans, Berger Levrault, CRIL, CRIStAL, Dassault Aviation, GRETTIA, GREYC, Huawei, I3S,IBM, INRIA Sophia Antipolis Mediterranee, IRIT, ISAE-SUPAERO, Lab-STICC, LAMSADE, LE-RIA, LGI2P, LHC, LIG, LIMICS, LIMSI, LIP6, LIPADE, LIRIS, LIRMM, LITIS, MaIAGE, NaverLabs, MaiAGE, Renault, Thales, Veolia.

COMITÉ DE RÉDACTION

Emmanuel ADAMRé[email protected]

Claire LEFÈVRERé[email protected]

Dominique LONGINRédacteur en [email protected]

Philippe MORIGNOTRé[email protected]

Pour contacter l’AfIAPrésidentYves DEMAZEAUL.I.G./C.N.R.S., Maison Jean Kuntz-mann110, avenue de la Chimie, B.P. 5338041 Grenoble cedex 9Tél. : +33 (0)4 76 51 46 [email protected]

Serveur WEBhttp://www.afia.asso.fr

Adhésions, liens avec les adhérentsCatherine [email protected]

Calendrier de parution du Bulletin de l’AfIA

Hiver Printemps Été Automne

Réception des contributions 15/12 15/03 15/06 15/09

Sortie 31/01 30/04 31/07 31/10

janvier 2019 No 103 47