SEO Campus 2016 Oncrawl Open Source Log Analysis

29
#seocamp L’analyse de logs pour tous et gratuitement Par @FrancoisGoube, fondateur @Oncrawl

Transcript of SEO Campus 2016 Oncrawl Open Source Log Analysis

Page 1: SEO Campus 2016 Oncrawl Open Source Log Analysis

#seocamp

L’analyse de logs pour tous et gratuitement

Par @FrancoisGoube, fondateur @Oncrawl

Page 2: SEO Campus 2016 Oncrawl Open Source Log Analysis

+10 years SEO experienceSerial entrepreneurBusiness AngelMembre du CA SeoCampAdministrateur Frenchtech

Page 3: SEO Campus 2016 Oncrawl Open Source Log Analysis

Je vous aide A retenir l’important

#LogsOnCrawl

Page 4: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Au programme1. Pourquoi faire de l’analyse de logs et surtout pour qui ?2. Quelles données et quels outils pour bien démarrer l’analyse de logs

?3. Comment avoir mon propre analyseur de logs sans débourser un

centime ?4. Etude de cas5. Entrez dans la matrice et voir plus loin que les logs et le crawl.6. (Jeu et Q&A)

Page 5: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Logs Serveur : Kezako ?

Serveurs

Internet

Page 6: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

A quoi ressemblent des logs ?Un serveur web enregistre toutes les requètes qu’il reçoit. Ce sont les logs serveurs

En général:/var/log/httpd sous apache

Ils permettent : D’identifier le trafic SEO De voir ce que fait le GoogleBot

Page 7: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Pour qui ? Pour tous !!!

Audit : o Diagnostic des pages utiles / inutileso Zones que Google crawleo Zones que Google ne connait pas

Monitoring :o Alerteso Suivi des mise en productions / Optimisationso Attaques

Page 8: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Bien démarrer sur l’analyse de logs Savoir où sont vos logs et comment y accéder S’assurer d’avoir l’ensemble des logs Procéder à des tests de complétude et de validité des données :

1. Compter les hits de Google et comparer avec la search console

2. Compter les visites depuis Google et comparer avec Analytics

Attention aux systèmes de cache !!!

-$ grep “Googlebot” access.log | wc -l

-$ grep “google.fr” access.log | wc -l

Page 9: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Pourquoi utiliser ses logs ? Know what Google did!

Quelles pages sont crawlées par Google Bot Quelles sont mes pages actives ? Google rencontre-t-il des erreurs ?

Car Google cherche à optimiser ses ressources de crawl

Optimisez les ressources de Google vers vos “MONEY PAGES”

Page 10: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Pourquoi utiliser ses logs ? Savoir ce

que Google fait

Pour comprendre l’impact SEO

Page 11: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Ne pas attendre un message dans GWT

Suivez les status codes en temps réel Recevez des alertes Contrôlez vos MEP

Alertes utiles : Augmentation anormale des 404 Baisse du nombre de pages recevant du Trafic SEO …

Page 12: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Savoir ce que Google Crawl et Positionne

Moins vos pages sont populaires et moins Google les regarde

Page 13: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Quelles pages ont le plus de valeur pour Google ?

Découvrez vos pages Actives

Page 14: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Quelles pages ont le plus de valeur pour Google ? Google n’interprète pas forcément votre site comme vous

le voudriez !

Page 15: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

La clé est dans le croisement des données

A partir des données de crawl… Control du balisage HTML Qualité des meta Analyse du contenu (near duplicates, nb de mots…) Popularité des pages (Inrank)

… et des données de logs

Vous ouvrez la boite noire de l’algo de Google! Pages orphelines Pages actives / famille Zones inconnues de Google Impact de vos optimisations sur le GoogleBot

Page 16: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Quels outils Outils Open Source

Kibana Kibana by Oncrawl Logalize Graylog

Outils SaaS Oncrawl Advanced Logs.io Kelo.gs Qbox Available on Github

Page 17: SEO Campus 2016 Oncrawl Open Source Log Analysis

www.oncrawl.com

Et Moi ? Comment fabriquer son Analyseur de logs gratuitement ?

Page 18: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Les indicateurs de base Nombre de pages uniques crawlées par Google Fréquence de crawl par groupe de pages Monitoring des status codes (200, 3xx, 4xx,…) Nombre de pages actives / inactives

Accrochez vos ceintures !!!

Page 19: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Prenons le cas d’un site hebergé en Mutualisé…

Hypothèse : Vous avez un site hebergé chez OVH Vous avez bien paramétré vos logs pour qu’ils soient distincts

par host Nous allons voir

Comment récupérer les fichiers de logs depuis OVH, Créer une machine virtuelle sur votre poste et utiliser Docker, Déployer Oncrawl ELK, Ingérer les logs Utiliser Oncrawl ELK pour analyser vos logs.

Page 20: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Fetch the logs!1. Ouvrez un navigateur web2. Loguez vous sur OVH3. A partir de l’OVH Web console, cliquez sur hébergement

et sur le nom de domaine que vous souhaitez analyser4. Accédez à vos logs depuis le lien

http://logs.ovh.net/YOURDOMAIN/5. Choisissez une période d’un mois

https://logs.ovh.net/YOURDOMAIN/logs-MM-YYYY/

6. Téléchargez chaque journée de logs(e.g. https://logs.ovh.net/YOURDOMAIN/logs-MM-YYYY/YOURDOMAIN-DD-MM-YYYY.log.gz)

Page 21: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Préparez vos logs Controlons ce que nous récupérons d’OVH

Nous permet de renommer l’ensemble des fichiers en .log

Nous permet de lire les 10 premières lignes de logs pour contrôle

Page 22: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Utilisons Docker Compose Setup de Docker

Récupération des containers Téléchargez OnCrawl ELK, et Dézippez le sur votre

machine Dans un terminal tapez :

Si vous n’avez jamais utilisé Docker, télécharger ceci :https://www.docker.com/products/docker-toolbox, Et installez Docker Toolbox Suivez ce tutoriel : https://docs.docker.com/mac/step_one/

Page 23: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Up and Running? Si tout va bien, vous devriez avoir ceci

Vous n’avez plus qu’à copier les logs récupérés :cp path/clean/and/filtered/log/files/my-virtual-host-*.log path/to/oncrawl-elk/logs/apache/

Logstash devrait faire tourner le container oncrawlelk_logstash_1 container, Parser vos logs et les envoyer à oncrawlelk_elsaticsearch_1 container.

Page 24: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

RDV sur http://localhost:9000

Page 25: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Etude de cas : Exemple de 5 usages Suivi de la santé de mon site Etat des lieux de ma structure de site Détection des problèmes de maillage interne Impact SEO de mon contenu Temps de chargement, status codes et Googlebot

Page 26: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

Voir plus loin que les logs Détecter des tendances

Bots Users

Rajouter des données business CA / Panier moyen Revenus pub

Penser votre business et vos données en remontant de la vente au first click.

Page 27: SEO Campus 2016 Oncrawl Open Source Log Analysis

www.oncrawl.comwww.oncrawl.com

2 mois Pro Gratuits

Code : SEOCAMP16

MERCI

Page 28: SEO Campus 2016 Oncrawl Open Source Log Analysis

@OnCrawl – SEOCAMP 2016

3 questions Quelles sont les deux tests à réaliser pour

s’assurer de bien démarrer avec ses logs ?

Oncrawl Open source log analyzer est un fork de Elastic Search, Logstache et … ?

Comment s’appelle ce personnage ?

Page 29: SEO Campus 2016 Oncrawl Open Source Log Analysis

1. CRAWLNos robots parcourent votre site comme Google peut le

faire et nous récupérons tout votre code HTML et l’ensemble des données SEO de votre site web.

Découvrez comment Google interprète votre site web

Votre contact:

[email protected]+33 652 19 97 57

Follow us :