Cours de référencement / SOE thodologie de référencement et avenir du...
Transcript of Cours de référencement / SOE thodologie de référencement et avenir du...
1
1
Cours de référencement / SOE
Image : Source
Cours distribué sous licence Creative Commons,
selon les conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
2
Présentation du module de formation
1. Pourquoi le SEO ?
• Quelques mots-clés
2. Balayage des thèmes et chapitres du cours
3
Intérêt pour le e-commerce
4
L’avenir de l’immobilier
• Internet : LE nouveau monde– Plus de 21 milliards de pages.
• … Sans compter intranets, extranets, undernet, deep net..• L’internet est le réseau de communication dont la pénétration aura connu la
progression la plus forte et la plus rapide dans l’histoire. Il a été vingt fois plus vite que le téléphone, dix fois plus que la radio et trois fois plus vite que la télévision1.
L’avenir de l’immobilier ……. est sur internet,
• Immobilier virtuel : – au lieu d’avoir « une boutique bien placée en ville », il faut désormais
apparaître en bonne position des réponses obtenues par les internautes sur un moteur de recherche.
– mais le positionnement sur cet immobilier virtuel est :1. concurrentiel.2. contrôlé par un nombre réduit d’acteurs (Google … et les autres).3. éphémère,
– Pour • Une entreprise : un enjeu vital.• Un professionnel : des compétences très demandées
1) Comment le web change le monde, l’Alchimie des multitudes
5
Pourquoi le SEO ?
– Référencement naturel (≠liens sponsorisés) : positionner son site en 1ère
page des moteurs de recherche• pour des mots-clés stratégiques ou pour la « longue traine »• winners takes all : trois premiers résultats, première page ..
– SEO = Search Engine Optimization : de quoi s’agit-il ?a) Audit // Conception // Mise en ligne et déclaration // Optimisation et
Positionnement // Suivib) Pas « one shot » mais un processus continu, totalement lié au Web
Analytics (=analyse du trafic sur un site)
c) Comprendre le fonctionnement des moteurs de recherche : crawl, indexation, algorithme de ranking et recherche
6
Quelques mots-clés• Publicité
– Search engine marketing • Social media optimization • Paid inclusion • Pay per click • AdWords • Affiliate marketing • Conversion funnel / entonnoir de conversion • Conversion optimization
• Algorithme de ranking– PageRank • TrustRank • SERP Rank • Web harvesting
• Optimisation pour les moteurs de recherche– White / Black hat SEO : Doorway page, cloaking, Page hijacking, Landing page
optimization, Keyword stuffing, Link farm, Spam de moteur de recherche • Spamdexing • Web scraping • Scraper site • Link farm • Google bombing
• Linking – Off-page optimization • Link exchange • Backlink • Rel=Nofollow • Noindex • Meta
elements • Meta Tags • Sitemap • Landing page optimization • Détermination et placement sur mots-clés
– Keyword density / optimization / research / tracking • Long tail• Autres
– Geo targeting • Stop words (mots vides) • Poison words • Online identity management • Online reputation management • Win-loss analytics • Web analytics
2
7
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents2. La fréquentation d’un site : les fondamentaux3. Dans la peau d’un moteur de recherche : le
PageRank4. Web Analytics et liens commerciaux5. Optimisation du référencement
– “Onpage”– “Onsite”– “Offsite”
6. Trouver et optimiser les mots-clés7. Méthodologie de référencement et avenir du
SEO8
Questions ?
Rémi BACHELETEnseignant-chercheur, Ecole Centrale de Lille
9
1- Origine du SEO, historique de
Image : Source
Cours distribué sous licence Creative Commons,
selon les conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
10
Origine du SEO
1. Les premiers moteurs de recherche
• Les algorithmes d’indexation
2. Google … et ses concurrents
11
Histoire du SEO• Au début du web, pas de moteurs de recherche, mais des engins
spécialisés (the Wanderer mesure la taille du web), Gopher est un protocole de classement) ou des indexeurs basiques (Archie indexe les fichiers disponibles en ftp).
• Premier moteur de recherche : Aliweb en 1993, il établi le principe de fonctionnement qui est toujours d’actualité :1. On déclare ("to submit") l’adresse d’une page = son URL (Uniform Resource
Locator commencant par http:// )2. Le moteur envoie un "crawler" (ou “spider”) télécharger la page. La page est
stockée sur le serveur du moteur de recherche…3. … où elle est traitée par un indexeur pour en extraire les informations (mots-
clés, liens) et les interpréter (importance, répétition…).4. périodiquement, le "crawler" revient sur la page pour actualiser les informations.
• Au milieu des années 1990, le problème de l'indexation des sites web pour les rendre plus faciles à trouver émerge, car la visibilité d’un site devient un facteur de plus en plus important : le SEO (« Search Engine Optimization ») émerge en tant que champ de compétences– Selon Danny Sullivan, apparition du terme Search Engine Optimization vers
1997
12
Premiers algorithmes d’indexationAliweb requiert des fichiers "index", qui sont placés spécialement par les
webmestres et qui y déclarent l'adresse de leur pages, les mots-clés associés …– Mais ensuite les moteurs de recherche se basent sur des mots-clés
insérés dans le code des pages � Ce sont les étiquettes méta ou « meta tag » (meta parce qu’il
s’agit de donner de l’information … sur de l’information).– Mais on est confrontés aux limites de l’utilisation des meta tags
comme indicateurs de la pertinence des pages :• Les webmestres y mettent des mots-clés sans rapport avec le contenu
réel du site dans le but d'attirer du trafic = "spamdexing", "black hat"• .. résultat : à cette époque, trouver la bonne page web est une
aventure…� Les premiers moteurs de recherche sont facilement manipulés et
discrédités mais de nouveaux algorithmes d’indexation, plus difficiles à tromper sont développés…
� La course entre les moteurs de recherche et les webmasters qui veulent manipuler les résultats de recherche pour attirer du trafic s'engage…
3
13
Google : les débuts• Des étudiants de Stanford, Larry Page et Sergey Brin développent
"backrub," un moteur de recherche basé sur un algorithme d’indexation baptisé PageRank– PageRank = nom de l'inventeur, Larry Page
• L'algorithme calcule un indice basé sur les liens entrants :– PR(page X) = Σ PR(des pages qui donnent un lien vers X)
• Le principe n'est pas nouveau– Utilisé en recherche : citation index. On mesure l'importance d'un article
au nombre de fois qu'il est cité dans d'autres articles.– Le moteur de recherche Inktomi utilise déjà ce principe– … et déjà des webmestres ont développé des manières de le manipuler
pour tricher (link farms)
• Google est fondé en 1998.– Le moteur de recherche est :
• Dépouillé (page légère)• Simple (recherche "et" par défaut)• Rapide
… et il devient très rapidement populaire (en quelques semaines)
14
15
Google, les chiffres :
– Un index de plus de 24 milliards de pages (2007)
– 23 000 employés dans le monde (2010)
– Plus de 110 sites régionaux, de 130 interfaces linguistiques
– La marque la plus populaire au monde[1]
– Plus de 3 milliards de requêtes et 16 millions de visiteurs uniques par mois (2007)
– Slogan « Don't be evil »• Eric E. Schmidt, directeur• Sergey Brin, directeur technique• Larry E. Page, directeur produits
16
Le chiffre d'affaires de Google.
Les bénéfices nets
22 milliards de dollars de liquidités au 30 septembre 2009
Source le Monde 16.10.09
17
Google sur le marché des recherches
• En mai 2009, dans le monde– 68,6 %, – devant Yahoo! (9 %) – Baidu (8,7% - chinois).
• 85% à 90% de parts de trafic en Europe• Sur le marché américain 65 %
– 19,6 % pour Yahoo! – 8,4 % pour Microsoft.
Source : ComScore
18
Mais Google, c’est plus qu'un moteur de recherche…
Google Earth, Analytics, Webmasters Tools, Gmail, Youtube, Picasa …– Le modèle opposé à celui de Microsoft : on est
prisonnier de MS contre son gré, essentiellement à travers l’absence d’alternative et la non-interopérabilité
• En plus, on est obligé de payer ….
– avec Google, on devient dépendant … en choisissant d’utiliser des applications innovantes ..
• ..et gratuites… (ce « gratuit » ne l’est bien sûr pas réellement, il fait
partie du modèle économique).
4
19
Politique d'acquisition de technologies
• Deja => Google Groups• Picasa => Picasa• Keyhole, Inc => Google Earth• Urchin Software, Measure Map, Trendalyzer => Google Analytics• Android => Android• Phatbits => Google Desktop• YouTube => YouTube (1.6MM$)• FeedBurner => Google Reader• Upstartle, Zenter, Tonic Systems, 2Web Technologies => Google
Documents• JotSpot => Google Sites• Marratech => Google Talk
Contrairement à MS, qui acheta souvent ses concurrents pour les éliminer, Google les valorise
Source
20
Analyse du succès de Google
• Le bon timing• Une philosophie : « Google attitude », Googleplex• Rupture technologique : Brin et Page ont des doctorats en en
mathématiques.. et les ont valorisés
• Rapidité, simplicité• Pages de résultats dépouillées (sans publicité au début)
• Une parfaite compréhension de la culture du Web – Gratuité– Affinités avec l'Opensource– Innovation constante
21Image : Source 22
Les concurrents de Google
• Yahoo! Search, ≈ Microsoft Live Search / Bing• Les outsiders : Exalead, Ask.com• Les annuaires et moteurs thématiques /
régionaux– DMOZ– Une myriade de "micro" moteurs expérimentaux…
• De nouveaux venus ? – Mais le « ticket d'entrée » n'est-il pas aujourd'hui
devenu énorme ?
23
Google comme étalon universel
• Dans beaucoup de pays, le référencement naturel est devenu une « chasse au classement Google »
24
Google Universal Search
• Depuis mai 2007, une recherche sur Google propose sur sa search engine results page (SERP) des résultats mixant :
• Certes – des Pages web– Des liens sponsorisés
– Mais aussi• Actualités, • Images, • Livres• Cartes • Blogs• Vidéos• Définitions (define:)
� Avec Universal Search, des contenus auparavant séparés sont présentés simultanément
� Résultat : - encore plus de candidats à la première page+ Des stratégies alternatives pour y figurer
• Une évolution incessante : nouvelles versions régulièrement
5
25
Google, les vulnérabilités
• Modèle économique = le gratuit + les effets d’échelle– Un CA dépendant à 99% du marché des liens sponsorisés => fraude aux
clics sur les pubs Adwords– Rentabilité difficile de Youtube et de nombreux autres services …– Risque de dispersion, manque de cohérence (Android vs. Chrome OS
etc..)• Microsoft et Yahoo! ont lancé, en juillet 2009 un partenariat destiné à
concurrencer Google dans la recherche sur Internet.– Microsoft, avec Bing, fournit la technologie – Yahoo! la vente d'espaces publicitaires
Questions sur :– L’abus de monopole (par exemple les pages des filiales de Google sont
souvent fort bien classée dans les SERP.. De Google)– La privatisation du patrimoine culturel (scannerisation de bibliothèques
entières par Google Books, impact de Google News sur la presse en ligne)
26
Google, les concurrents de demain
• Des alternatives à la manière d’accéder au web et à la recherche « façon Google » se développent à travers le « web social ».– Facebook, Twitter : les informations « pertinentes » sont proposées par
les « amis », pas par un moteur de recherche.– Le temps passé sur le net est plus centré sur les interactions sociales
proposées par ces services
• Cette approche consistant à « monétiser le réseau social » pose de plus en plus de questions sur le respect de la vie privée des utilisateurs
– Google : Gmail + Google agenda + mémorisation des recherches de chaque compte pendant plusieurs mois voir p23)
– Facebook : les informations du profil, photos etc … sont cédées à Facebook (cf. le contrat d’utilisation)
27
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents2. La fréquentation d’un site : les fondamentaux3. Dans la peau d’un moteur de recherche : le
PageRank4. Web Analytics et liens commerciaux5. Optimisation du référencement
– “Onpage”– “Onsite”– “Offsite”
6. Trouver et optimiser les mots-clés7. Méthodologie de référencement et avenir du
SEO28
Questions ?
Rémi BACHELETEnseignant-chercheur, Ecole Centrale de Lille
29
2- La fréquentation d’un site : les
fondamentaux
Image : Source
Cours distribué sous licence
Creative Commons, selon les
conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
30
La fréquentation d’un site : les fondamentaux
1. Les trois piliers du trafic
– Les accès directs
– Les moteurs de recherche
– Les sites référents
2. Les autres manières de capter du trafic
6
31
Les trois piliers du trafic
(modulo les erreurs méthodologiques : cookie effacé, accès à partir une autre machine…)
32
1/ Les accès directs
• Ceux qui mettent en marque-page votre site et y reviennent directement�Votre site fourni une réponse à leur besoin !
• Que faut-il analyser ?– Qui revient, selon quelle fréquence, quelles
pages, quel CA…– But : comprendre qui sont ces « clients
fidèles »
33
2/ Les moteurs de recherche
• Ce référencement naturel … est le but de cette formation�Votre site est bien référencé !
• Que faut-il analyser ?– Quels mots clés, taux de rebond, quelle
fidélisation ensuite, première visite ?– taux de transformation = apport réel à l’objectif du
site (cliquer sur des pubs, vendre, contribuer…)
34
3/ Netlinking : Les sites référents
• Ces sites vous recommandent …– Ou vous détestent, mais le résultat est le même…
– Lien fort avec le ranking de votre site� Sauf si rel=nofollow
– Il peut aussi s’agir des liens sponsorisés que vous achetez… (cf. chapitre 4 « Web Analytics et liens commerciaux »).
• Que faut-il analyser ?– Ranking et autres liens de la page qui vous « linke »
– Raison de la citation, mots-clés des liens, CA apporté…
35
Quelques exemples de sites
• À partir de Google Analytics– Site fortement dépendant de la recherche– Blog en développement– Portail spécialisé– Site de projet d'élèves de Centrale– Site de cours en licence libre
36
Le référencement à l’international
• La présence à l’international demande :• Avant tout une réflexion sur un marché, une chaine
logistique, un environnement juridique … différents• Un top level name (.fr, .de, .ru) TLD local peut être
utile (Une déclaration idoine sous Google Outils pour les Webmasters est également utile, mais un site multilingue est à déconseiller).
• Une vitesse de consultation adaptée (hébergement dans le pays ?).
7
37
Autres manières de capter du trafic
Elles sont multiples..– Campagnes Email
– Affiliation• Afficher des produits en échange d'une commission sur les
ventes
– Cadeaux à des bloggeurs influents – Comparateur / Comparison Engine
– Nouveaux vecteurs = réseaux sociaux, community management
• Facebook • Twitter • …
Image : Source 38
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents2. La fréquentation d’un site : les fondamentaux3. Dans la peau d’un moteur de recherche : le
PageRank4. Web Analytics et liens commerciaux5. Optimisation du référencement
– “Onpage”– “Onsite”– “Offsite”
6. Trouver et optimiser les mots-clés7. Méthodologie de référencement et avenir du
SEO
39
Questions ?
Rémi BACHELETEnseignant-chercheur, Ecole Centrale de Lille
40
3- Dans la peau d’un moteur de
recherche : le PageRank
Cours distribué sous licence
Creative Commons, selon les
conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
Image : Source
41
Les algorithmes de classement des pages
1. Le PageRank
• Modalités de calcul
• Fiabilité : Le TrustRank
• Réponse à une requête : Le SERP Rank
42
Le PageRank• « Vote » d’une page pour une
autre– PR (C) > PR (E), même avec
moins de liens !
• Échelle logarithmique 0-10– La barre d’outils Google permet
d’en visualiser une approximation– Avoir un PR de 3-4 c’est déjà
beaucoup
• Un processus de calcul récursif– Pour éviter que le PR →∞, il faut
un amortissement = Damping factor (typ. 85% - ici il est de 90%).
Image : Source Wikimedia Commons
8
43
Ranking : études de cas
• http://freemind.sourceforge.net/wiki/index.php/Main_Page• http://freemind.sourceforge.net/wiki/index.php/Talk:Main_Page• https://sourceforge.net/projects/freemind/files/freemind-unstable/
• http://www.google.fr/search?hl=fr&q=achat+fleurs
44
Le TrustRank• Méthode semi-automatique pour détecter les pages de spam =
classification "spam ou pas spam" (Trust = confiance).• Principe : une page « propre » ne propose pas de liens vers des pages
de spam (Le terme TrustRank vient de Yahoo!).
1. Amorçage : établir une liste de pages « propres » de référence– Après une analyse « humaine ». – On n’a pas forcément besoin d’une grande liste (p.e 200 sites).
2. Suivi récursif des liens de la liste d’amorçage3. Degré de confiance que l'on peut attribuer à la page : un indice
– Plus les liens sont forts avec des pages de référence, plus leur degré de confiance est élevé
– C’est le TrustRank (ou TR), indice entre 0 (=spam) et 1 (=page de référence)
• Le TrustRank peut être utilisé :– pour filtrer l'index d'un moteur de recherche, – pour classer les résultats d'une recherche.
45
L’algorithme du PR : un secret bien gardé
Un nombre important de facteurs est pris en compte dans le PageRank.
– Ces facteurs sont très nombreux (plus de 200 d'après Google).
– Leur nature et leur pondération sont secrets pour limiter les chances de manipulations (et la concurrence des autres moteurs de recherche).
– Le terme "PageRank" est une marque déposée et a été l’objet de brevets, à commencer par (U.S. Patent 6,285,999). Le brevet appartient à Stanford Universityet Google en a l’usage exclusif.
– Beaucoup de spéculations sur ce sujet, voyons quelques-uns des paramètres connus…
Quelques-uns des 200 paramètres du calcul du ranking
1. Sur la page (« onpage »)
– Ancienneté / Fréquence d’actualisation– Texte = visible sur la page / Code = Meta tags = non visibles sur la page
2. Sur le site (« onsite »)
– Lien internes, arborescence (« Breadcrumbs »)– Paramétrage sur Google outils pour les webmasters (Sitemap..)
3. Hors du site (« offsite »)
– Liens entrants en partie visibles via link:http://fr.wikipedia.org• Leur PageRank, Âge, TrustRank de la page• Social bookmaking, tweets…
• Google utilise t-il les données qu’il stocke sur le comportement des internautes pour le calcul du PageRank ?– Temps passé sur le site, statistiques renvoyées par la barre d’outil google,
annotations sidewiki, citations d’URL dans gmail, requêtes avec l’URL du site, marque-pages Google, âge/sexe/localisation des internautes, leurs recherches précédentes …. les licences de ces services précisent souvent que non..
46
47
Le SERP Rank
C’est l’ordre de présentation des liens lorsque l’on entre des mots-clés dans un moteur de recherche
�La page de résultats présente une liste ordonnée de liens vers des pages/images/vidéos, associés à des textes courts (snippets)
• Le SERP Rank est fonction du PageRank, mais aussi de facteurs liés aux mots-clés.– Voir le chapitre 6 sur les mots-clés et leur mise en
valeur– SERP = Search Engine Results Page
48
La Google Dance
• Période durant laquelle Google met à jour le classement des pages référencées.– On la remarque par certains éléments :
• Nouveau PageRank • Variation de position d'une page sur un mot clé, • Variation du nombre de pages indexées d’un site.
• La Google Dance n'existe plus ! Le processus d’actualisation est désormais continu.
9
49
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents2. La fréquentation d’un site : les fondamentaux3. Dans la peau d’un moteur de recherche : le
PageRank4. Web Analytics et liens commerciaux5. Optimisation du référencement
– “Onpage”– “Onsite”– “Offsite”
6. Trouver et optimiser les mots-clés7. Méthodologie de référencement et avenir du
SEO
Questions ?
• Plus d’informations sur les lien-retours/backlinks
• Mathématiquement, le PageRank est la probabilité stationnaire d'une chaîne de Markov, c'est-à-dire un vecteur de Perron-Frobenius de la matrice d'adjacence du graphe du Web[1],[2]
50
Rémi BACHELETEnseignant-chercheur, Ecole Centrale de Lille
51
4- Liens commerciaux et Web
Analytics
Cours distribué sous licence
Creative Commons, selon les
conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
Image : Source 52
Le référencement commercial
1. Le marketing par les moteurs de recherche
2. Les liens sponsorisés
• Avantages/inconvénients
• Enchères
• Limites du référencement commercial
Chapitre 1/2
53
Les deux grands types de facturation de la publicité sur
internet
1. Paiement au clic Pay Per Click (CPC = Cost Per Clic)
� Le plus fréquent
2. Paiement à l'impression Pay Per Impression = à l’affichage(CPV = Cost Per View)
� Totalement dominant jusqu’aux années 2002+
54
Référencement organique vs. liens sponsorisés
Image : www.finalsite.com
Résultats organiques
Liens sponsorisés
Liens sponsorisés
10
55
Les liens sponsorisés, c'est…
• Des millions de recherches par jour• Une publicité ciblée : ils correspondent à la
demande de l'internaute à ce moment-là– Sont souvent plus suivis que les liens naturels (80% ?)– 55% des achats en ligne démarrent à partir d'une recherche
(Source: Internetstats.com)
• Un retour sur investissement calculable au centime près…
56
Avantages / inconvénients des liens sponsorisés :
• Avantages :– Réactivité = opérationnel en 15 Minutes
– Paiement au clic donc : • Plus d’argent = plus de trafic• On se fixe le coût maximum acceptable, le budget..
– Des services de web analytics associés permettent de suivre le retour sur investissement.
• Inconvénient– Dépendance : arrêt du trafic si arrêt des campagnes
(contrairement au référencement naturel, on n’a pas d'effet durable).
57
La vente aux enchères du prix par clic
Origine de l’image : http://www.oxatis.com 58
Lecture des pages web
Image : http://www.useit.com
59
Gestion des campagnes
• À partir d’un budget donné, on pourra prendre 2 régies publicitaires :
• Search sur Google Adwords, • Yahoo Search / Microsoft Adcenter.
– Pour chaque campagne :• Étude sémantique/marketing...
– Quelle est la valeur des mots-clés ? Leur prix d'achat acceptable ?• Rédaction des annonces/groupes d’annonces• Mise en place et suivi des enchères
• …et optimiser le budget publicitaire– Piloter les campagnes en fonction :
• Des objectifs à atteindre : fréquentation, conversion… • Du retour sur investissement (ROI)
– Attention • Valider la mise en place des trackings avant le lancer
60
Retour sur investissement
• Combien ça coûte ?• Cout Par Clic fonction des enchères
• Combien ça rapporte ?• Nombre de recherches de votre mot-clé
X % de clics vers votre site (p.e. 2%)
X taux de conversion (achat/visites)
X votre marge sur l’achat effectué
• Attention à faire de la veille : – Pour noël 2008, un jeu à succès “Harry Potter Game”
n'avait pas de gros revendeurs référencés dans les résultats de recherche …
– CA = millions !!
11
61
Limites du référencement commercial
• Crédibilité de la publicité– De moins en moins importante.. 10% des consommateurs
feraient confiance à la publicité– Deux catégories de liens sponsorisés contextuels
• Liés aux mots-clés tapés sur un moteur de recherche : nous venons d’étudier Google AdWords
• Mais il est également possible d’acheter des mots-clés affiché par des sites web (ou gmail) et liés au contenu de la page vue : pegoogle AdSense
• Mais une grande partie des internautes tenteraient de bloquer les publicités– Avant : des logiciels payants adsubstract
– Maintenant : des extensions gratuites adblock sous Firefox
• Les liens sponsorisés contextuels ont un meilleur taux de conversion que la publicité traditionnelle– 6 fois meilleur qu'une publicité "image" classique
62
Les outils du Web Analytics
1. Google Analytics
2. Google Webmasters Tools
– Ou : Google outils pour les webmasters
Chapitre 2/2
63
� Suivre la provenance des visiteurs�Améliorer la conception et le contenu du site� Optimiser les campagnes marketing� Comparer les indicateurs / benchmarking�Alertes automatiques / personnalisées
• Quels mots clés attirent les prospects qui dépensent le plus ?
• Quelle variante de l’annonce a déclenché le plus de clics entrants ?• Page de destination la plus rentable ?• Abandons : Quels éléments poussent les visiteurs à abandonner leur
navigation ?• Y-a-t-il un problème technique sur mon site ?
Origine de la page : http://www.oxatis.com
Google Analytics
64Origine de l’image : http://www.oxatis.com
65Origine de l’image : http://www.oxatis.com
Alertes automatiques
66Origine de l’image : watchingwebsites
12
67
Entonnoir de conversion
Origine de l’image : http://www.oxatis.com 68
Google webmasters tools
• Permet de suivre – L’indexation de son site
• Soumettre une sitemap• Connaître la dernière date de passage du googlebot• Liste des erreurs, liens morts etc.. détectés par le robot
– Positionnement du site sur les 10 principaux mots-clés/expressions-clés
– Impressions = nombre de recherche où la SERP affiche le site– Clic = nombre de clics amenant au site
– Liste des sites donnant des backlinks• Plus exhaustive qu’une recherche link:http://monsite.com
• Autres outils utiles• Google guidelines liste de bonnes pratiques conseillées. • Yahoo! Site Explorer est analogue à GWT
69
Nouveaux outils de mesure
Origine de l’image : http://www.alenty.com/xwiki/bin/view/Demo/ExpositionPublicitaire 70
Questions ?
• Plus d’informations sur Google Outils pour les webmasters (Google Webmaster Tools)
• Fonction "Analyser comme Googlebot" de Google Outils pour les webmasters
• Voir aussi Introduction à l’étude d’impact• Radian6 est un outil automatisant la veille
sur la Toile. indexe de multiples sources : blogs, titres de presse, réseaux sociaux..
71
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents2. La fréquentation d’un site : les fondamentaux3. Dans la peau d’un moteur de recherche : le
PageRank4. Web Analytics et liens commerciaux5. Optimisation du référencement
– “Onpage”– “Onsite”– “Offsite”
6. Trouver et optimiser les mots-clés7. Méthodologie de référencement et avenir du
SEO72
Questions ?
Rémi BACHELETEnseignant-chercheur, Ecole Centrale de Lille
13
73
5- Cours de référencement :
optimisation
Image : Source
Cours distribué sous licence
Creative Commons, selon les
conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
74
Optimisation “Onpage”
1. Texte : visible sur la page
2. Code : non visible sur la page
Chapitre 1/3
75
Choix du titre de la page
• Le titre est :– L’« image de marque » qui apparaît sur le snipet de la page de
résultats de recherche. • C’est le texte du lien, • Le reste de la description étant le meta tag meta name="description" .. ou sinon les premiers mots de
la page, sa date..
– Le mot-clé le plus fort pour le robot indexeur
• Entre 7 et 10 mots– Éviter les termes « tarte à la crème » ( "page", "bienvenue"…)
– Un titre propre à chaque page
• Le titre doit reprendre les mots clés importants– Il donne un résumé de la page (éviter les pages multi thèmes)
– De plus en plus détaillé quand on descend dans l’arborescence du site
– Pas de titres/pages multilingues
76
Rédaction du texte
• Voir le chapitre sur les mots-clés• Le cloaking (texte caché visible pour le robot indexeur, mais
invisible par le lecteur) a suscité beaucoup de tentatives pour leurrer les moteurs de recherche
– Techniques : Meta tags, identification des images, texte blanc sur fond blanc, caché derrière une image, balise <div>, noframes, noscript, display:none ..
⇒ Les robots détectent de plus en plus les données cachées,
⇒ Ils baissent le TrustRank des pages
77
Le code : Meta Tags
Meta = des “données sur les données”<HEAD>
<TITLE>titre de la page</TITLE><META name="description" content="description du contenu, snipet"><META name="keywords" content="mots clés séparés par des espaces">
</HEAD>
• Pour un indexeur on considère par ordre d’importance 1. <TITLE>titre de la page</TITLE>
2. META name="description
3. META name="keywords
• <meta name="robots" content="valeurs"> – all : Le robot indexe tout (= défaut)– none : Le robot n'indexe rien du tout
– noindex : Votre page n'est pas indexée mais les liens sont suivis– nofollow pour toute une page ou comme attribut de lien : voir diapo
suivante
78
rel="nofollow"
– Permet au webmestre de spécifier que ce lien ne doit pas compter dans le PageRank
– Balise inventée en 2005, notamment par un "responsable antispam" de Google
– Les autres moteurs de recherche se sont ralliés au système– Devrait plutôt s'appeler rel="nopagerank" , car le lien est suivi
par les indexeurs – L’utilisation de cette balise a donné lieu à des tentatives de
manipulation (pageRank sculpting)
• Prévient le spamdexing, notamment pour les sites – Ouverts aux commentaires
• Forums de discussion, commentaires de blogs
– De crowdsourcing• Wikis…
14
L’optimisation de page multivariables
Ou Multivariate landing page optimization
• On teste divers éléments visibles d’une page – x Images différentes, y dispositions du texte, z
formulations– On obtient x*y*z combinaisons possibles– On évalue leur taux de conversion– Google Website Optimizer
79 80
Optimisation “Onsite”
1. Structure du site2. Fichiers spéciaux
– Robots.txt,
– Sitemap.xml
3. Choix techniques
Chapitre 2/3
81
Eventail d'opérations d'optimisation d’un site
• Règle des "3C" : – Contenu – Code – Conception,
82
Structure du site
– Ergonomie = Facilité de lecture du site pour un internaute
• Plan du site• Navigation
– Breadcrumbs France > Normandie > Calvados > Deauville
– Facilité de lecture du site pour un indexeur• Fonction "Analyser comme Googlebot"
– Intérêt des CMS pour mettre à jour la structure
• Wordpress, Joomla, Magento…
Fichiers spéciaux
• Robots.txt– Spécifie aux robots indexeurs le comportement
qu’il doivent adopter• Indexer ou pas, suivre les liens etc..
• Sitemap.xml– Cartes des pages du site à visiter
• Fichier d’identification– Pour valider par Google qu’on est bien le
responsable d’un site.
83 84
Choix techniques
• Réécriture d'URL– http://www.discounteo.com/tv-video/televiseur/tv-lcd
• Cas du Flash– Désormais indexé par Google dans certains
cas.
• Cas des sites dynamiques– Facteurs pénalisants et de leurs solutions
(frames, formulaires, AJAX, JavaScript, sessions, contenus dupliqués, etc.)
15
85
Extensions Firefox utiles pour auditer un site
– Barre d’outils google • PageRank
– Firebug• Vérifie l’exécution du code, notamment pour les
outils de web analytics en java
– IE tab• Aspect de la page sous IE
– .. et beaucoup d'autres…
Le plus important …
86
87
Contenu = le texte visible par le lecteur, mais aussi les médias (images, vidéo), la facilité de navigation, l’ergonomie/affordance, l’interactivité, au global l’expérience du site..
Symptômes d’une faiblesse de contenu : • Taux de rebond = les internautes ne restent pas sur le site• % élevé de nouveaux visiteurs = pas de retour• Peu d’entrées directes (pas de mémorisation du site en
marque-pages)• …
CONTENT IS KING« le contenu c’est ce qui compte
avant tout »
88
Optimisation “Offsite” / Netlinking
• Le site dans l’écosystème du web
• Backlinks
• Social bookmarking
Chapitre 3/3
CONTENT IS KING
LINKS ARE QUEEN
90
Les backlinks
• Les liens vers votre site sont le facteur le plus important du référencement naturel– Sauf via des sites de spam, de TrustRank
faible…
• Ces liens sont plus efficaces s’ils viennent de sites
• Couvrant le même domaine• À fort PageRank
– Échange de liens• Plus efficace s'ils ne sont pas directement
réciproques
16
91
Efficacité des liens
Les mots-clés dans les liens sont plus ou moins pondérés– Moins efficace :
• Cours de référencement <a href=“article1783.html”>ici</a>.
– Efficace : • on y propose un <a href=“article1783.html”> cours de référencement </a>.
– Encore plus efficace :• on y parle de la <a href=“cours-referencement.html” title=“cours de
référencement ”> cours de référencement </a>.
92
Le Netlinking
• Rechercher des partenaires pour augmenter le ranking du site. – Cet aspect prend de plus en plus d’importance, la gestion des
partenariats est un élément clé pour ce poste. – Les fonctions du référenceur s’approchent ici de celles de
community manager.• Types de liens :
– liens de ressources : pointent vers des ressources utiles– Liens réciproques : p.e. le site A pointe vers B, qui pointe vers A en
échange. Des annuaires d’échanges de liens peuvent aider à la mise en contact.
– Spam de liens : p.e. p.e. Un robot insère des commentaires dans les site web 2.0 pour augmenter le PageRank d’un site (blogs, wikis..). Stratégie neutralisée par les balises nofollow.
– Liens internes : p.e. toutes les pages du site affichent un lien vers la page principale.
93
Les annuaires
• Un référencement dans un bon annuaire compte plus qu'une myriades de pages mineures.
• Yahoo directory• DMOZ
– Obstacles: • Difficile de se faire accepter
– Gérés par des opérateurs humains, souvent des volontaires (DMOZ)
– Formulaires complexes, délais …
• Attention aux faux annuaires / spamdexing
94
La déclaration aux moteurs de recherche
• Ajouter l'URL de votre site à Google
– Seule la page de premier niveau d'un site est à soumettre (« to submit »)
– Il n'est pas nécessaire d'indiquer les liens mis à jour ou obsolètes. Les liens désactivés disparaissent au cours de l'exploration suivante
– Voir aussi dans le chapitre "outils" • … Google webmasters tools.
95
Référencement et Web 2.0
96
Synthèse : White Hat ou Black Hat ?
White Hat : Contenu de qualité, site agréable et pertinent pour l'utilisateur
� Optimisation des mots-clés raisonnable
� Stratégie de netlinking honnête (=non rémunérée)
� Ne pas exiger de résultats immédiats (effet sandbox)
� Rien à cacher
Rien qui cherche à tromper l’internaute ou les moteurs de recherche
Black Hat : Manipuler les moteurs de recherche… au risque du bannissement des résultats de recherche
� Occultage (transmettre une page différente au moteur de recherche et au visiteur)
� Texte caché (Cloaking)
� Répéter abusivement un mot-clé, mots-clés sans rapport avec le contenu réel (Keyword stuffing)
� Pages en double / contenu copié-collé d’autres sites (Scraper site)
� Achat abusifs de noms de domaine (Cybersquatting, Domain spam)
� Utilisation ciblée des balises nofollow(PageRank sculpting).
� Globalement, le spamdexingVoir également le lexique en fin de cours...
Image : Source
17
97
Questions ?
98
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents2. La fréquentation d’un site : les fondamentaux3. Dans la peau d’un moteur de recherche : le
PageRank4. Web Analytics et liens commerciaux5. Optimisation du référencement
– “Onpage”– “Onsite”– “Offsite”
6. Trouver et optimiser les mots-clés7. Méthodologie de référencement et avenir du
SEO
99
Questions ?
Rémi BACHELETEnseignant-chercheur, Ecole Centrale de Lille
100
6- Cours de référencement : mots-
clés et écriture de page
Image : Source
Cours distribué sous licence Creative Commons,
selon les conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
101
Trouver et optimiser les mots-clés
1. L’audit de mots-clés• Déterminer ses objectifs• Se mettre à la place du client
2. Outils de recherche de mots-clés• Google Trends• Les mots-clés « lourds » .. et la longue traine
3. Placement efficace des mots-clés
102
L’audit de mots-clés, pourquoi ?
� Pas de SEO possible sans un travail fin sur les mots-clés– Le ranking n’a aucun sens dans l’absolu
Seul compte la SERP, le résultat d’une recherche sur les mots-clés entréspar les prospects (= les personnes auxquelles le site s’adresse).– Attirer n’importe quel trafic ne sert à rien dans 95% des cas
» coût de la bande passante » fort taux de rebond = internautes déçus» voire sanction (retrait des résultats de recherche = baisse de ranking Google SearchWiki)..
– Le design/audit/veille de mots-clé permet de repenser/recadrer un site
� Objectif de l’audit de mots-clés - la sélection de mots ou groupes de mots selon deux considérations :1. L’adéquation aux objectifs du site (pe conversion) 2. La concurrence
• est-il réellement possible de conquérir une bonne place sur ce mot-clé ?
18
103
Un préalable : fixer l’objectif
Qu’est-ce qui est attendu du site ?– Plus de clients ?– Plus de clients certes, mais à quelle phase du cycle d’achat ?
• Trois visites avant un achat, chacune avec des questions différentes..
1. « Peut-on lire les blu-ray sur un ordinateur ? »2. « Le modèle PCXXX lit-il les blu-ray ? »3. « Acheter modèle PCXXX avec option blu-ray »
– Une certaine réputation / image de marque ?– Positionnement sur des catégories de clientèle spécifiques ?
– Une clientèle « branchée » n’utilisera pas les mêmes mots-clés, que les jeunes, les seniors etc…
– Plus de visites ?• Viser des mots-clés à fort trafic et faible concurrence
104
Dans la tête .. du client qui recherche ce que vous proposez
Image – Source : Ell iance, Search Engine Land, Oct. 23, 2007
Étapes : 1. Quelles questions l’internaute se
pose t-il ? 2. .. Et donc : quelles recherches
tape-t-il ?3. Compiler les mots et phrases-clés
correspondantes, chercher les variantes, le nombre de recherches …
4. Les prioriser et les trier.
Le processus est analogue à celui présenté dans ma formation au brainstorming.
105
Outils de recherche de mots-clés
• Dictionnaire des synonymes (ou maj-F7 sous MS Office)
• Sites spécialisés Google – Trends
• http://www.google.com/trends• Voir ci-après
– Générateur de mots clés• https://adwords.google.com/select/KeywordToolExternal
� Étude des prix des enchères pour l’achat de mots-clés
– Wonder Wheel• http://www.googlewonderwheel.com/
• Microsoft’s adCenter Labs keyword forecast• http://adlab.msn.com/Keyword-Forecast/
106
Google Trends (1/2)
Recherche-source
107
Google Trends (2/2)
108
Générateur de mots clés Google
Site-source
19
109
Google Wonder wheel
Recherche-source 110
Nombre de mots clés saisis sur les moteurs de recherche
• 1 seul mot : 13 % (donc requête contenant plus d’un mot : 87% : = 6 fois plus)
– 2 mots : 28 %– 3 mots : 27%– de 3 à 5 mots : 52 %– de 4 à 10 mots : 31 %
(source : rankstat.com, chiffres arrondis)
111Image : Source 112
La longue traîne
– …. et la longue traîne (Long Tail) : Une recherche typique est de 3 mots
• Suivre les accès au site (Web analytics) :– La plupart des recherches des internautes accédant au
site vient :• Des combinaisons et permutations de mots-clés• De mots-clés qui sont dans le texte, mais paraissaient peu
importants• De variantes (pluriel, fautes d’orthographe, coquilles…)
• Pour une variante, le trafic est faible, mais la quantité de combinaisons est telle qu’elle pèse aussi lourd que les mots-clés « star ».
113
Exemple de longue traine de mots-clés
114
Étudier les mots-clés « lourds »
• Pour chaque page d’entrée, étude – interne = Google Analytics– externe = Trends, Google Wheel
• On en apprendra plus :– sur ce qui se passe dans la tête des prospects– sur le fonctionnement réel du site– …
• On quantifiera rigoureusement pour confirmer ou infirmer un positionnement visé
– Attention à ne pas tirer de conclusions hâtives sur des effectifs faibles
20
115
Rédaction et placement efficace des mots-clés
• Typographie – <h1 class=“header”>titre avec mots-clés importants</h1>, idem h2,
h3…– Ou en <b> gras </b> …
• Mots-clés importants en tête de page... et de phrase– Moins efficace : “de nombreux domaines sont concernés (bla bla bla bla
bla bla bla bla) par la gestion de projet.”– Plus efficace : “la gestion de projet comprend de nombreux domaines,
dont…”• Répéter sans abuser, mais quand même …
– Efficace : “la gestion de projet a évolué depuis 1970. Les outils de gestion de projet sont notamment…”
• Mettre les mots-clés liés à proximité les uns des autres– Moins efficace : “la gestion est un point majeur des projets”– Plus efficace : ““la gestion de projet est un point majeur ”
• Mettre les mots-clés dans le nom du site– Plus efficace : http://gestiondeprojet.com
116
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents2. La fréquentation d’un site : les fondamentaux3. Dans la peau d’un moteur de recherche : le
PageRank4. Web Analytics et liens commerciaux5. Optimisation du référencement
– “Onpage”– “Onsite”– “Offsite”
6. Trouver et optimiser les mots-clés7. Méthodologie de référencement et avenir du
SEO
117
Questions ?
Rémi BACHELETEnseignant-chercheur, Ecole Centrale de Lille
118
7- Cours de référencement :
méthodologie et synthèse
Cours distribué sous licence
Creative Commons, selon les
conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
Image : Source
119
Méthodologie de référencement
Chapitre 1/2
120
Stratégies de référencementMéthodologie
1. Audit • Évaluer les sites concurrents, élaborer une stratégie,
examiner les mots-clés, trouver sa valeur ajoutée
2. Conception• Développer le site, l’optimiser
3. Référencement• Soumission, netlinking…
4. Optimisation / Suivi• Un processus continu de web analytics, de mise à jour et
d’amélioration
21
121Image : Source 122
En conclusion…
1. Les huit commandements du SEO
– Quels critères pour savoir qu’on a réussi ?
2. Avenir du SEO
3. Lexique
Chapitre 2/2
Les huit commandements du SEO
1. Le ranking n’est pas une fin en soi, il faut savoir ce que l’on souhaite en faire
2. Connaître et surveiller ses concurrents3. Concevoir ses pages et son site avec soin « dans la
peau d’un robot indexeur » : mots-clés, titres etc…4. Mais se rappeler que « content is king »5. Links are queen : établir une politique de liens6. Embaucher des experts.. ou travailler dur7. Pas de résultats garantis ou stables : un suivi
permanent8. Ne pas dépenser tout son temps/budget à concevoir
un site, il faut des ressources pour le référencement et le suivi
123 124
Qu’est-ce que la réussite ?• On a réussit lorsque :
1. Les gens viennent sur le site (Référencement, netlinking …).2. Restent pour le consulter (Taux de rebond) 3. Agissent de la manière attendue = conversion
Taux de conversion = – taux de conversion online = Achat en ligne, inscription, abonnement
à une newsletter, téléchargement…– … + taux de conversion offline = recherche du magasin le plus
proche appels téléphoniques, fréquentation d’un magasin, achat…4. Sont fidélisés = Mettent l'adresse du site dans leurs favoris, reviennent,
s’abonnent (Mise à jour de l'information, pull/push, RSS...). 5. Le recommandent à leurs connaissances (Social bookmarking, marketing
viral...).
• Le facteur principal de promotion d'un site est son utilité, son contenu, content is King
Le référencement est donc nécessaire mais pas suffisant.
125
Avenir
• Internet mobile, géolocalisation• Image search optimization, recherche de vidéos• Social media optimization, marketing viral sur
Facebook (1.7 MM$ en 2011, selon Emarketer)
• Mondes virtuels, microsites,.
• La fin du ranking ?– « Ranking is dead » thèse de Bruce Clay en 2008, à
propos des SERP de plus en plus adaptées à l’internaute (géotargetting, historique des consultations…)
126
Pour en savoir plus
• Références développées sur le site
• Essentiellement wikipédia en anglais
– http://fr.wikipedia.org/wiki/Web_Analytics
• Olivier Andrieu Présentation du 22 octobre 2007 - Skooiz Montréal
– http://www.abondance.com
22
127
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents2. La fréquentation d’un site : les fondamentaux3. Dans la peau d’un moteur de recherche : le
PageRank4. Web Analytics et liens commerciaux5. Optimisation du référencement
– “Onpage”– “Onsite”– “Offsite”
6. Trouver et optimiser les mots-clés7. Méthodologie de référencement et avenir du
SEO
Lexique
• Spamdexing : tromper les moteurs de recherche sur la qualité d'une page ou d'un site afin d'obtenir, pour un mot-clef donné, un bon classement dans les résultats des moteurs. Par exemple : – Link farm (ferme de liens) un groupe de sites web donnant des
liens les uns vers les autres, souvent créés par un automate– Cloaking (occultage) : présenter des résultats différents selon le
logiciel utilisé pour afficher la page: une page anodine pour un navigateur web, une page optimisée, remplie de mots-clefs, réservée aux robots des moteurs
• Google bombing (bombardement Google) exploite le poids accordé au texte d’un hyperlien. Si plusieurs sites utilisent le même texte pour pointer sur la même cible il devient possible de le faire apparaître en tête de la SERP (p.e. « fils à papa » renvoyait en premier résultat le site Web de Jean Sarkozy.).
128
129
Questions ?
Rémi BACHELETEnseignant-chercheur, Ecole Centrale de Lille