Évaluer l'intégralité du web

40
Évaluer l'intégralité du web (sans pour autant s'appeler Google)

Transcript of Évaluer l'intégralité du web

Page 1: Évaluer l'intégralité du web

Évaluer l'intégralité du web(sans pour autant s'appeler Google)

Page 2: Évaluer l'intégralité du web

@Majestic

Le GRAND moteur de recherche spécialisé

Sur Twitter, 500 millions de tweets sont envoyés en moyenne chaque jour.

Pendant le même temps, Majestic recense 7 milliards d'adresses URL, dont 3 milliards représentent des adresses créées récemment.

Page 3: Évaluer l'intégralité du web

@Majestic

Une montagne de données recueillies

Page 4: Évaluer l'intégralité du web

@Majestic

Une montagne de données recueillies

Page 5: Évaluer l'intégralité du web

@Majestic

Une montagne de données recueillies

Page 6: Évaluer l'intégralité du web

@Majestic

ANALYSE des liens pour créer les données CF/TF

Trust Flow thématique exploitant l'algorithme de dépérissement (decay algorithm).

???

Page 7: Évaluer l'intégralité du web

@Majestic

Exploiter de préférenceun ensemble de données universelles

• Chaque signal est infime• Peut engendrer une

erreur ou opinion sur le plan individuel

• À grande échelle, la marge d'erreur diminue

• L'indice de confiance augmente

http://info.majestic.com/universal

Page 8: Évaluer l'intégralité du web

@Majestic

Jon M. Kleinberg, Cornell University 1999

Hub

Hub

Hub

Site officiel

Site officiel

Site officiel

Site officiel

Site officielSite officiel

Site officiel Site officielSite officiel

Google Penguin a écarté les hubs !

Graphique de connaissances

Page 9: Évaluer l'intégralité du web

@Majestic

La partie fastidieuse qui suitdans la recherche

Récupération d'informations à l'ère « Zeta ».1.Collecte de données2.Regroupement de données3.Indexation de données4.Mise en correspondance de données

Page 10: Évaluer l'intégralité du web

@Majestic

Les groupes améliorent la recherche

• Trouver un renseignement

• Trouver un proche• Trouver un client• Tout trouver

Libr

ary

of C

ongr

ess c

irca

1940

Recherche : info.majestic.com/groupresearch

Page 11: Évaluer l'intégralité du web

@Majestic

Quel intérêt à classifier le Web ?

• La classification du Web par thèmes permet d'éviter le spam :

• http://maj.to/1yZOdW5 (article TrustRank)http://maj.to/1Bb1lHu (article Stanford)

Page 12: Évaluer l'intégralité du web

@Majestic

Classification par type de données

• IP/TLD au niveau national

• Recherche d'images• Recherche de vidéos• Listes locales• Cartes• Voyage

Page 13: Évaluer l'intégralité du web

@Majestic

Approches dans ladéfinition des thèmes

Page 14: Évaluer l'intégralité du web

@Majestic

Approches dans ladéfinition des thèmes

Page 15: Évaluer l'intégralité du web

@Majestic

Comment nous classifions le Web

• Le contenu s'articule en groupes

• Les mots clés s'insèrent dans des groupes

Page 16: Évaluer l'intégralité du web

@Majestic

Nous repérons et ANALYSONS les liens

Trust Flow thématique via l'algorithme de dépérissement (decay algorithm).

???

Page 17: Évaluer l'intégralité du web

@Majestic

MIT=référence

Source : Labs.majestic.com

Référence

Actualités Arts et société

Spam ?Référence

Réseau de liens issus de MIT.edu

Page 18: Évaluer l'intégralité du web

@Majestic

MIT=Référence/éducation

Page 19: Évaluer l'intégralité du web

@Majestic

800 thèmesau sein de15 grandes catégories

Page 20: Évaluer l'intégralité du web

@Majestic

Le Trust Flow thématique : un outil puissant

• Permet une analyse plus fine que par ex. l'outil PageRank• Mise à jour en continu• Contexte et influence mesurables à grande échelle• Suivi au niveau des pages ET sur l'ensemble du site• 800 thèmes• Possibilité de comparer tous les types de données en ligne

pour cerner des personnes, des pages, des sites, des images ou des modules complémentaires

Page 21: Évaluer l'intégralité du web

@Majestic

Cas d'utilisation

• Déjà utilisé dans la recherche• Recherche d'acteurs influents• Vérification de la solvabilité financière• Comparaison de différents canaux média• Enrichissement de liens• Évaluation de profils d'entreprises

Page 22: Évaluer l'intégralité du web

@Majestic

Comment SEObserver exploite les données Majestic

Page 23: Évaluer l'intégralité du web

@Majestic

TrustFlow: le nouveau PageRank ?

• Qui dit PageRank dit Toolbar Pagerank• Nouvelle monnaie du web pour l’achat/vente de

backlinks et évaluation de domaines.• Est-ce bien ou pas ?

• Case study serrurier paris ;)

@mohandh_

Page 24: Évaluer l'intégralité du web

@Majestic

Page 25: Évaluer l'intégralité du web

@Majestic

Case study serrurier paris

• Gros mot-clé concurrentiel• Impossible de ranker au-delà d’une certaine

place• Analyse des backlinks du 1er

• Gros TF, réseau russe.• Récupération des BLs des concurrents créés

en temps réel.

@mohandh_

Page 26: Évaluer l'intégralité du web

@Majestic

Page 27: Évaluer l'intégralité du web

@Majestic

Page 28: Évaluer l'intégralité du web

@Majestic

Page 29: Évaluer l'intégralité du web

@Majestic

Page 30: Évaluer l'intégralité du web

@Majestic

TopicalTrustFlow : parfait pour la détection du spam élaboré

• Le TTF vu par un consultant SEO• Permet de vérifier la cohérence d’un site avec

la thématique.• Obtenir un BL dans le bon TTF est très dur

Page 31: Évaluer l'intégralité du web

@Majestic

Les changements et la répartition, un indice

• Sarenza.com

Page 32: Évaluer l'intégralité du web

@Majestic

• serrurier-paris-express.com

Page 33: Évaluer l'intégralité du web

@Majestic

• serrurier-paris-artisan.fr

Page 34: Évaluer l'intégralité du web

@Majestic

Page 35: Évaluer l'intégralité du web

@Majestic

Page 36: Évaluer l'intégralité du web

@Majestic

Page 37: Évaluer l'intégralité du web

@Majestic

Page 38: Évaluer l'intégralité du web

@Majestic

Page 39: Évaluer l'intégralité du web

@Majestic

Page 40: Évaluer l'intégralité du web

@Majestic

Une démo ?

[email protected]• Ou @512banque