Cours referencement origine

23
Utilisation ou copie interdites sans citation Rémi Bachelet janvier 15 1 École Centrale de Lille Cité Scientifique - BP 48 F-59651 Villeneuve d’Ascq Cedex Origine du SEO, historique de Google Image : Source Cours distribué sous licence Creative Commons, selon les conditions suivantes : Source des images indiquées au-dessous ou en cliquant sur l’image Mise à jour du 29 janvier 2015 Rémi Bachelet Dernière version de ce cours de cours de référencement / SEO

Transcript of Cours referencement origine

Page 1: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 1

École Centrale de Lille

Cité Scientifique - BP 48 F-59651 Villeneuve d’Ascq Cedex

Origine du SEO, historique de

Google

Image : Source

Cours distribué sous licence Creative Commons,

selon les conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image

Mise à jour du 29 janvier 2015

Rémi Bachelet

Dernière version de ce cours de

cours de référencement / SEO

Page 2: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 2

Comment utiliser ce

cours :

1. Mettre les diapos en format plein écran en cliquant sur

2. Faire défiler l’animation en cliquant sur les diapositives(attention : cliquer sur une image ou un lien ouvre la page web correspondante)

Page 3: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 3

Origine du SEO

1. Les premiers moteurs de recherche

• Les algorithmes d’indexation

2. Google … et ses concurrents

Page 4: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 4

Histoire du SEO

• Au début du web, pas de moteurs de recherche, mais des engins spécialisés (the Wanderer mesure la taille du web), Gopher est un protocole de classement) ou des indexeurs basiques (Archie indexe les fichiers disponibles en ftp).

• Premier moteur de recherche : Aliweb en 1993, il établi le principe de fonctionnement qui est toujours d’actualité :1. On déclare ("to submit") l’adresse d’une page = son URL (Uniform Resource

Locator commencant par http:// )

2. Le moteur envoie un "crawler" (ou “spider”) télécharger la page. La page est stockée sur le serveur du moteur de recherche…

3. … où elle est traitée par un indexeur pour en extraire les informations (mots-clés, liens) et les interpréter (importance, répétition…).

4. périodiquement, le "crawler" revient sur la page pour actualiser les informations (20% du trafic d’internet vient des moteurs de recherche).

• Au milieu des années 1990, le problème de l'indexation des sites web pour les rendre plus faciles à trouver émerge, car la visibilité d’un site devient un facteur de plus en plus important : le SEO (« Search EngineOptimization ») émerge en tant que champ de compétences– Selon Danny Sullivan, apparition du terme Search Engine Optimization vers

1997

Page 5: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 5

Premiers algorithmes d’indexation

Aliweb requiert des fichiers "index", qui sont placés spécialement par les webmestres et qui y déclarent l'adresse de leur pages, les mots-clés associés …

– Mais ensuite les moteurs de recherche se basent sur des mots-clés insérés dans le code des pages

Ce sont les étiquettes méta ou « meta tag » (meta parce qu’il s’agit de donner de l’information … sur de l’information).

– Mais on est confrontés aux limites de l’utilisation des meta tags comme indicateurs de la pertinence des pages :

• Les webmestres y mettent des mots-clés sans rapport avec le contenu réel du site dans le but d'attirer du trafic = "spamdexing", "black hat"

• .. résultat : à cette époque, trouver la bonne page web est une aventure…

Les premiers moteurs de recherche sont facilement manipulés et discrédités mais de nouveaux algorithmes d’indexation, plus difficiles à tromper sont développés…

La course entre les moteurs de recherche et les webmasters qui veulent manipuler les résultats de recherche pour attirer du trafic s'engage…

Page 6: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 6

Google : les débuts

• Des étudiants de Stanford, Larry Page et Sergey Brin développent "backrub," un moteur de recherche basé sur un algorithme d’indexation baptisé PageRank– PageRank = nom de l'inventeur, Larry Page

• L'algorithme calcule un indice basé sur les liens entrants :– PR(page X) = PR(des pages qui donnent un lien vers X)

• Le principe n'est pas nouveau– Utilisé en recherche : citation index. On mesure l'importance d'un article

au nombre de fois qu'il est cité dans d'autres articles.

– Le moteur de recherche Inktomi utilise déjà ce principe

– … et déjà des webmestres ont développé des manières de le manipuler pour tricher (link farms)

• Google est fondé en 1998.– Le moteur de recherche est :

• Dépouillé (page légère)

• Simple (recherche "et" par défaut)

• Rapide

… et il devient très rapidement populaire (en quelques semaines et aux dépens d’Alta Vista)

Page 7: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 7

Page 8: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 8

Google, les chiffres :

– Un index de plus de 24 milliards de pages (2007)

– 23 000 employés dans le monde (2010)

– Plus de 110 sites régionaux, de 130 interfaces

linguistiques

– La marque la plus populaire au monde[1]

– Plus de 3 milliards de requêtes et 16 millions de

visiteurs uniques par mois (2007)

– Slogan « Don't be evil »

• Eric E. Schmidt, directeur

• Sergey Brin, directeur technique

• Larry E. Page, directeur produits

Page 9: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 9

Le chiffre d'affaires de Google.

Les bénéfices nets

22 milliards de

dollars de

liquidités au 30

septembre 2009

Source le Monde 16.10.09

Page 10: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 10

Google sur le marché des

recherches

• En mai 2009, dans le monde

– 68,6 %,

– devant Yahoo! (9 %)

– Baidu (8,7% - chinois).

• 85% à 90% de parts de trafic en Europe

• Sur le marché américain 65 %

– 19,6 % pour Yahoo!

– 8,4 % pour Microsoft. Source : ComScore

Page 11: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 11

Mais Google, c’est plus qu'un

moteur de recherche…

Google Earth, Analytics, Webmasters Tools,

Gmail, Youtube, Picasa …

– Le modèle opposé à celui de Microsoft : on est

prisonnier de MS contre son gré, essentiellement à

travers l’absence d’alternative et la non-

interopérabilité

• En plus, on est obligé de payer ….

– avec Google, on devient dépendant … en choisissant

d’utiliser des applications innovantes ..

• ..et gratuites… (ce « gratuit » ne l’est bien sûr pas réellement, il fait

partie du modèle économique).

Page 12: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 12

Politique d'acquisition de

technologies

• Deja => Google Groups

• Picasa => Picasa

• Keyhole, Inc => Google Earth

• Urchin Software, Measure Map, Trendalyzer => Google Analytics

• Android => Android

• Phatbits => Google Desktop

• YouTube => YouTube (1.6MM$)

• FeedBurner => Google Reader

• Upstartle, Zenter, Tonic Systems, 2Web Technologies => Google Documents

• JotSpot => Google Sites

• Marratech => Google Talk

Contrairement à MS, qui acheta souvent ses concurrents pour les éliminer, Google les valorise

Source

Page 13: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 13

Analyse du succès de Google

• Le bon timing

• Une philosophie : « Google attitude », Googleplex

• Rupture technologique : Brin et Page ont des doctorats en en mathématiques.. et les ont valorisés

• Rapidité, simplicité

• Pages de résultats dépouillées (sans publicité au début)

• Une parfaite compréhension de la culture du Web – Gratuité

– Affinités avec l'Opensource

– Innovation constante

Page 15: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 15

Les concurrents de Google

• Yahoo! Search,

≈ Microsoft Live Search / Bing

• Les outsiders : Exalead, Ask.com

• Les annuaires et moteurs thématiques / régionaux– DMOZ

– Une myriade de "micro" moteurs expérimentaux…

• De nouveaux venus ? – Mais le « ticket d'entrée » n'est-il pas aujourd'hui

devenu énorme ?

Page 16: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 16

Google comme étalon universel

• Dans beaucoup de pays, le référencement

naturel est devenu une « chasse au classement

Google »

Page 17: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 17

Google Universal Search

• Depuis mai 2007, une recherche sur Google propose sur sa search engine results page (SERP) des résultats mixant :

• Certes – des Pages web

– Des liens sponsorisés

– Mais aussi• Actualités,

• Images,

• Livres

• Cartes

• Blogs

• Vidéos

• Définitions (define:)

Avec Universal Search, des contenus auparavant séparés sont présentés simultanément

Résultat : - encore plus de candidats à la première page

+ Des stratégies alternatives pour y figurer

• Une évolution incessante : nouvelles versions régulièrement

Page 18: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 18

Google, les vulnérabilités

• Modèle économique = le gratuit + les effets d’échelle– Un CA dépendant à 99% du marché des liens sponsorisés => fraude aux

clics sur les pubs Adwords

– Rentabilité difficile de Youtube et de nombreux autres services …

– Risque de dispersion, manque de cohérence (Android vs. Chrome OS etc..)

• Microsoft et Yahoo! ont lancé, en juillet 2009 un partenariat destiné à concurrencer Google dans la recherche sur Internet.– Microsoft, avec Bing, fournit la technologie

– Yahoo! la vente d'espaces publicitaires

Questions sur :– L’abus de monopole (par exemple les pages des filiales de Google sont

souvent fort bien classée dans les SERP.. De Google)

– La privatisation du patrimoine culturel (scannerisation de bibliothèques entières par Google Books, impact de Google News sur la presse en ligne)

Page 19: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 19

Google, les concurrents de

demain

• Des alternatives à la manière d’accéder au web et à la recherche « façon Google » se développent à travers le « web social ».– Facebook, Twitter : les informations « pertinentes » sont proposées par

les « amis », pas par un moteur de recherche.

– Le temps passé sur le net est plus centré sur les interactions sociales proposées par ces services

• Cette approche consistant à « monétiser le réseau social » pose de plus en plus de questions sur le respect de la vie privée des utilisateurs

– Google : Gmail + Google agenda + mémorisation des recherches sous IP pendant plusieurs mois)

– Facebook : les informations du profil, photos etc … sont cédées à Facebook (cf. le contrat d’utilisation)

Page 20: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 20

Les thèmes et chapitres du cours

1. Origine du SEO, Google … et ses concurrents

2. La fréquentation d’un site : les fondamentaux

3. Dans la peau d’un moteur de recherche : le PageRank

4. Web Analytics et liens commerciaux

5. Optimisation du référencement– “Onpage”

– “Onsite”

– “Offsite”

6. Trouver et optimiser les mots-clés

7. Méthodologie de référencement et avenir du SEO

Page 21: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 21

Questions ?

Page 22: Cours referencement origine

Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 22

Rémi BACHELET

Enseignant-chercheur,

Ecole Centrale de Lille

Mes principaux cours à CentraleGestion de projet, sociologie des organisations, recueil, analyse et traitement de données, prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de résolution de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki, formation au coaching pédagogique et à l'encadrement, référencement et SEO