Etat De Lart De La Recherche En Ligne

29
Etat de l’art de la recherche en ligne Geli MENG 1

description

 

Transcript of Etat De Lart De La Recherche En Ligne

Page 1: Etat De Lart De La Recherche En Ligne

Etat de l’art de la recherche en ligne

Geli MENG

1

Page 2: Etat De Lart De La Recherche En Ligne

Plan

1. Introduction1) Définition2) Comment ca marche?

2. DéveloppementA. Principaux moteurs de rechercheB. Exemple des différents moteur de recherche en

ligne1) Meta moteur2) Optimation des résultats de la classification3) Moteur de recherche pour les demandes particulières 4) Moteur de recherche pour les sociaux bookmarking5) Google Search Wiki

C. Les recommandation

3. Conclusion4. Références 2

Page 3: Etat De Lart De La Recherche En Ligne

Un moteur de recherche est un logiciel permettant de

retrouver des ressources (pages web, forums Usenet,

images, vidéo, fichiers, etc.) associées à des mots quelconques.

3

1.Introduction 1). Définition

Page 4: Etat De Lart De La Recherche En Ligne

Outil de recherche sur le web constitué de « robots », encore appelés bots, spiders, crawlers ou agents qui parcourent les sites à intervalles réguliers et de façon automatique (sans intervention humaine, ce qui les distingue des annuaires) pour découvrir de nouvelles adresses (URL). Ils suivent les liens hypertextes (qui relient les pages les unes aux autres) rencontrés sur chaque page atteinte. Chaque page identifiée est alors indexée dans une base de données, accessible ensuite par les internautes à partir de mots-clés.

Plus précisément sur 3 étapes:1. l’exploration2. l’indexation3. la recherche

1.Introduction 2). Comment ça marche?

4

Page 5: Etat De Lart De La Recherche En Ligne

1. L’exploration : le web est systématiquement explore par un robot

d’indexation suivant récursivement tous les hyperliens qu’il trouve et

récupérant les ressources jugées intéressante. L’exploration est lancée

depuis une ressource pivot, comme une page d’annuaire web. Un

moteur de recherche est d’abord un outil d’indexation, qu’il dispose d’une technologie de collecte de documents a distance sur

les sites web via un outil que l’on n appelé robot.

5

Comment ça marche sur 3 étapes

Page 6: Etat De Lart De La Recherche En Ligne

6

2. L’indexation : l’indexation des ressources récupérées consiste à

extraire les mots considères comme significatifs du corpus à

explorer. Les mots extraits sont enregistres dans une base

de donne organisée comme un gigantesque

dictionnaire inverse qui permet de retrouver rapidement dans quel

chapitre de l’ouvrage se situe un terme significatif donne.

Page 7: Etat De Lart De La Recherche En Ligne

7

3. La recherche : la recherche correspond a la partie requête du

moteur qui restitue les resultats.les résultats que l’on effectue sur un

moteur de recherche (résultats naturels) vont apparaitre par

ordre de pertinence selon le moteur qui mesure le taux de

pertinence et de popularité de chaque résultat.

Page 8: Etat De Lart De La Recherche En Ligne

1. le correcteur orthographique : il permet de corriger les erreurs introduite dans les mots de la requêtée et s’assurer que la pertinence d’un mot sera bien prise en compte sous sa forme.

2. le lemmatiseur : il permet de réduire les mots recherches a leur lemme et ainsi d’étendre leur portée de recherche.

3. l’anti dictionnaire : utilise pour supprimer a la fois dans l’index et dans les requêtes tous les mots vides (comme de ,le ,la) qui sont non discriminants et perturbent le score de recherche en introduisant du bruit.

Source : Wikipédia

8

Aussi il y a des modules complémentaires

Page 9: Etat De Lart De La Recherche En Ligne

Google, Yahoo, Live de Microsoft

La part de marché de Google aux Etats-Unis continue de croître inexorablement, de 67,25 % en mars à 67,9 % pour avril selon Hitwise. Yahoo et Microsoft connaissent quant à eux un léger recul. Le premier passe de 20,29 % à 20,28 % d'un mois sur l'autre contre 6,65 % à 6,26 % pour Microsoft. Quatrième moteur de recherche, Ask.com augmente ses parts de 0,8 % et passe à 4,17 %. Les secteurs du tourisme, des loisirs, des finances, du sport et des jeux en ligne ont connu une augmentation à deux chiffres de leurs visiteurs en provenance des moteurs entre avril 2007 et avril 2008.

Source : JDN

9

2.Développement A. Principaux moteurs de recherche

Page 10: Etat De Lart De La Recherche En Ligne

Les top 5 moteurs de recherche

Source : Médiamétrie - Observatoire des Usages Internet -xitimontor10

Page 11: Etat De Lart De La Recherche En Ligne

1) Meta moteur2) Optimation des résultats de la

classification3) Des moteur de recherche pour les

demandes particulières4) Moteur de recherche pour les

sociaux bookmarkings5) Google SearchWiki

2.Développement B. Exemples des différents moteurs de recherche

11

Page 12: Etat De Lart De La Recherche En Ligne

www.searche.com: C’est un moteur de recherche en ligne qui combine tous les résultats de moteur de recherche comme Google, Yahoo wikipedia, MSN, ask, open directory etc. Parmi les résultats on peut voir les sites web, vidéo, blog,et download.il est un moteur de moteur.

www.findforward.com: Il permet aux utilisateurs de choisir leur propre méthode de recherche avec un simple menu déroulant. il utilise principalement les sources de Google est aussi les sources d’autre moteur de recherche comme MSN ,Yahoo ,Ask, Technorati blog line et ainsi de suite.

Polymeta: C’est un moteur de recherche très pertinent ,il combine Google Yahoo Ask Youtube Myspace Flickr Webshot Icerocket Technorati etc. Dans le page de résultats trouve on peut voir trois principales rubriques : 1.le cote gauche qui défini les différents catégories, le cote centrée sont des ressources et des liens webpage, le cote droit présente des images.

Ex : Je tape « Xbox 360 » comme mot-clé, et voici les résultats.

1)Meta moteur

12

Page 13: Etat De Lart De La Recherche En Ligne

13

Search.com

Page 14: Etat De Lart De La Recherche En Ligne

14

Find forward

Page 15: Etat De Lart De La Recherche En Ligne

15

PolyMeta

Page 16: Etat De Lart De La Recherche En Ligne

• Clusty: www.clusty.com Il est a la base d’un moteur de recherche

intégré , qui interroge plusieurs moteur de recherche,

mais il nous sort pas une longue liste de résultats

mais des résultats après sa catégorisation.• Mooter : www.mooter.com

2) Optimation des résultats de la classification

16

Page 17: Etat De Lart De La Recherche En Ligne

Clusty

17

Page 18: Etat De Lart De La Recherche En Ligne

Mooter

18

Page 19: Etat De Lart De La Recherche En Ligne

www. Metaglossary.com

C’est un moteur de recherche spécialisé dans la

définition, concept, et des thèmes spécialisés.

3) Moteurs de recherche pour les demandes particulières

19

Page 20: Etat De Lart De La Recherche En Ligne

MetaGlossary

20

Page 21: Etat De Lart De La Recherche En Ligne

Voir aussi:Ms.Dewey : www.msdewey.com S’il y a une très jolie demoiselle qui vous

accompagner à trouver des informations en ligne, ce serait très sympa, voila ms dewey, elle-même va vous parler et faire des gestes pour attirer votre attention et aussi vous parler pour vous aider à effectuer une recherche. L’idée est originale par le biais de flash. Si on lui répond pas pour un petit moment, elle va même vers l’écran pour vous réveiller.

21

Page 22: Etat De Lart De La Recherche En Ligne

22

Ms.Dewey

Page 23: Etat De Lart De La Recherche En Ligne

• Le concept de social bookmarking• Infopirate.org/social-bookmark-Search : un

moteur de recherche qui interroge tous les systèmes de bookmark comme del.icio .us, blinklist,blogmark ,diig.

4) Moteurs de recherche pour les sociaux bookmarking

23

Page 24: Etat De Lart De La Recherche En Ligne

Le concept de social bookmarkingDéfinition :Le social bookmarking est une façon pour les

internautes de stocker, classer, chercher et partage leurs liens favoris.

Dans un système ou réseau de bookmaking social, les utilisateurs enregistrent des listes de ressources web

qu’ils trouvent utiles, ces listes sont accessibles aux

utilisateurs d’un réseau ou site web. D’autres utilisateurs ayant les mêmes

centres d’intérêt peuvent consulter les liens par sujet catégorie étiquette

ou même de façon aléatoire. 24

Page 25: Etat De Lart De La Recherche En Ligne

Qu’est-ce que c’est SearchWiki ?

C’est une manière de personnaliser les résultats de recherche fournis par Google.

"We don’t close any doors. We constantly evaluate signals" that are incorporated into the search results algorithm. "Search is adapting to the Internet as it becomes a more participatory medium. Now you have people telling us specific things about how they’d like to see their search results."

Source : Google officiel blog

5)Google SearchWiki

26

Page 26: Etat De Lart De La Recherche En Ligne

Google SearchWiki

27

Page 27: Etat De Lart De La Recherche En Ligne

Comment structurer le contenu en fonction de moteur de recherche?

• Soigner les éléments du code source : URL, balise titre, balise méta.

• Choisir une écriture lisible et conviviale et produire du contenu original avec la bonne discription(meta discription dans le code source).

• Eviter d’ utiliser des url trop longue.

2.Développement C. Recommandations

28

Page 28: Etat De Lart De La Recherche En Ligne

Sortons-nous un peu de Google et Yahoo,

l’univers de recherche et des référencement en

ligne est très riche .

3.Conclusion

29

Page 29: Etat De Lart De La Recherche En Ligne

30

4.Références

http://www.polymeta.comhttp://novovision.fr/?Google-SearchWiki-le-vertige-d-unhttp://www.webrankinfo.com/http://googleblog.blogspot.com/http://www.journaldunet.com/http://www.xiti.com/fr/Solutions/Gratuit.aspxhttp://clusty.com/http://www.mooter.com/http://www.metaglossary.com/