2. Problématique
● Problème de disponibilité et capacité limitée
● Dispersion des données : SaaS, BI
● Stockage inadapté : MySQL
● Accès contraignant, problèmes de sécurité
3. ● Collecter les logs de manière centralisée
● Stockage durable et évolutif
● Les rendre accessibles
● Initialiser la plate-forme Big data viadeo
Objectifs
5. Mise en œuvre : Indexation
● Rejouer n jours ou n minutes
● Proche du temps réel
● Idempotent
● Sources et formats hétérogènes
6. Mise en œuvre : Indexation
● Job MapReduce Hadoop natif
● TransportClient embarqué
● Indexation par lots
● Une configuration logstash "classique"
https://gist.github.com/deverton/2970285
7. Mise en œuvre : Métriques
● 17 nœuds Hadoop mutualisés
● 2 serveurs ES dédiés
● 30 mappers
● 260M / 3h de traitement pour 7 jours de logs
● 340K / 30s de traitement pour 8 minutes de logs
8. Mise en œuvre : Kibana
Kibana 3 tombe à pic !
● Maintenu au sein d'ElasticSearch
● Très rapidement fonctionnel
● Adaptable à des formats hétérogènes
● Fabriqué avec AngularJS