Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

of 44/44
Oxalide © 2016 – Documents confidentiels Jérémy Smadja Industrialisation du monitoring
  • date post

    10-Jan-2017
  • Category

    Technology

  • view

    466
  • download

    1

Embed Size (px)

Transcript of Paris monitoring - 27012016 - Smart Monitoring chez Oxalide

  • Oxalide 2016 Documents confidentiels

    Jrmy Smadja

    Industrialisation du monitoring

  • Qui sommes nous ?

    2

    Conseil Infogrance Hbergement

    Depuis 15 ans

    70 collaborateurs

    Bureaux au centre de Paris

    Chiffre dAffaires > 10M

  • Oxalide 2013 Documents confidentiels

    The History

  • Lhistorique de lindustrialisation du monitoring

    4

    2000

    Oxalide

    Conseil

    Dveloppement

    2004 Scripting

    BASH, check HTTP

    Alerting SMS

    2005

    Mon

    Nagios

    Cacti

    Script BASH

    LDAP

    2006Oxacheck

    RTG

    2008

    Centreon

    Host/Svc Tmpl

    Scalabilit

    Ticket mon

    2014

    CLAPI

    Infrana

    2016 - ?

  • Centreon

    5

    HOSTS SERVICES

    4703 166447

    SERVICE TEMPLATE

    1318

    POLLERS

    21

    RRD Size RRD Count

    415 GB 491433

  • Infrana & Co.

    6

  • Oxalide 2013 Documents confidentiels

    Chef, Oui Chef !

  • Processus Chef - CLAPIMonitoring automatis

    8

  • Schma globalMonitoring automatis

    9

  • Exemple JSONMonitoring automatis

    10

    "monitoring": { "notification_period": "24x7", "notification_options": "d,u,r", "contact_groups": "Oxalide", "host_groups": "_Team_3",

    "linux.sys.load": "!50,50,50!70,70,70",

    "http_externe": [ {

    "site": 9gag.fr", "uri": "/", "pattern": "NSFW", "htaccess": "no:no", "port": "80"

    } ]

    }

  • Win / FailMonitoring automatis

    11

    WIN FAIL

    Administration plus rare Production abti

    Autonomie de la production Ticket monitoring plus complexe

    Moins de ticket monitoring Astreinte toujours pnible

    Uniformisation du monitoring

    Moins doubli

  • Oxalide 2013 Documents confidentiels

    Les temps changent

  • Ce temps est rvolu

    13

    On Premise vs Public Cloud

  • Ce temps est rvolu

    14

    On Premise vs Public Cloud

    AWS Auto-Scalling

  • Ce temps est rvolu

    15

    On Premise vs Public Cloud

    AWS Auto-Scalling

    Docker

  • Ce temps est rvolu

    16

    On Premise vs Public Cloud

    AWS Auto-Scalling

    Docker

    DevOPS

  • Oxalide 2013 Documents confidentiels

    Smart-Monitoring

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    18

    Remettre son monitoring en question :

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    19

    Remettre son monitoring en question :

    Dterminer le bon fonctionnement de votre application

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    20

    Remettre son monitoring en question :

    Dterminer le bon fonctionnement de votre application

    Intervention immdiate ncessaire ?

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    21

    Remettre son monitoring en question :

    Dterminer le bon fonctionnement de votre application

    Intervention immdiate ncessaire ?

    Ouai a load et alors ?? Tas un problme !?!?

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    22

    Remettre son monitoring en question :

    Dterminer le bon fonctionnement de votre application

    Intervention immdiate ncessaire ?

    Ouai a load et alors ?? Tas un problme !?!?

    Monitoring saisonnier

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    23

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    24

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

    Rflchir aux mtriques pertinentes :

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    25

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

    Rflchir aux mtriques pertinentes :

    Temps de rponse du site internet

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    26

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

    Rflchir aux mtriques pertinentes :

    Temps de rponse du site internet

    Bon fonctionne du processus dachat

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    27

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

    Rflchir aux mtriques pertinentes :

    Temps de rponse du site internet

    Bon fonctionne du processus dachat

    Temps de traitement dun batch

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    28

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

    Rflchir aux mtriques pertinentes :

    Temps de rponse du site internet

    Bon fonctionne du processus dachat

    Temps de traitement dun batch

    Espace disque ? :o

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    29

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

    Rflchir aux mtriques pertinentes :

    Temps de rponse du site internet

    => Check HTTP

    Bon fonctionne du processus dachat

    Temps de traitement dun batch

    Espace disque ? :o

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    30

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

    Rflchir aux mtriques pertinentes :

    Temps de rponse du site internet

    => Check HTTP

    Bon fonctionne du processus dachat

    => Cucumber, CasperJS, Selenium

    Temps de traitement dun batch

    Espace disque ? :o

  • LE BUSINESSSSSSSSSS !Smart-monitoring

    31

    Lcher prise sur les anciennes sondes : RAM, inodes

    augmenter les seuils, supprimer lalerting

    Rflchir aux mtriques pertinentes :

    Temps de rponse du site internet

    => Check HTTP

    Bon fonctionne du processus dachat

    => Cucumber, CasperJS, Selenium

    Temps de traitement dun batch

    => we need your help!

    Espace disque ? :o

  • Oxalide 2013 Documents confidentiels

    Next-Step

  • Next-Step

    33

    Tout ce que nous devons dcider, c'est que faire du temps qui nous est imparti.

    by ???

  • Rsum des besoinsNext-Step

    34

    Configuration dynamique

    Scalable

    Granularit fine

    Modularit des composants

    Systme dalerting intelligent

    Lindustrialisation apporte lefficience et le dynamisme, le monitoring doit suivre le rythme.

  • Notre monde idalNext-Step

    35

  • DatabasesNext-Step

    36

    graphite

  • Alerting SystemNext-Step

    37

    https://docs.influxdata.com

  • User InterfaceNext-Step

    38

    http://grafana.org/

    https://www.centreon.com

  • AgentNext-Step

    39

    http://prometheus.io/from prometheus_client import start_http_server, Summaryimport ("github.com/prometheus/client_golang/prometheus")package io.prometheus.client;

    avg(rate(rpc_durations_microseconds_count[5m])) by (job, service)

  • External Monitoring SystemNext-Step

    40

    http://newrelic.com/

  • MigrationNext-Step

    41

    Lexistant doit co-exister.

  • MigrationNext-Step

    42

    Lexistant doit co-exister.

    Les architectures modulaires permettent lagilit.

  • MigrationNext-Step

    43

    Lexistant doit co-exister.

    Les architectures modulaires permettent lagilit.

    Lindustrialisation permet ladoption rapide dune nouvelle solution.

  • Oxalide 2013 Documents confidentiels

    Merci

    On recrute ;)