4. 4
DataStax délivre une plateforme de la base de données
Apache Cassandra, conçue spécifiquement pour les
besoins en Performance et Disponibilité exigés par les
applications d’Internet des Objets, Web ou Mobiles, en
offrant aux entreprises une base de données Sécurisée
toujours disponible, qui reste Simple à administrer même
pour des déploiements à grande échelle, dans un seul ou
de Multiples Data Centers et dans le Cloud.
15. Performance et Montée en Charge
Cassandra fonctionne aussi bien pour des petits que pour des déploiements énormes!
Déploiement Cassandra chez Apple
• 75 000+ noeuds
• 10’s petabytes de données
• Millions ops/second
• Plus gros cluster à 1000+ noeuds
Apple Inc.: Cassandra at Apple for Massive Scale
Video https://www.youtube.com/watch?v=Bc4ql9TDzyg
From Cassandra Summit, London, December
2014
19. Cloud & Cloud Hybride
• DataStax Enterprise et Cassandra sont disponibles en multi-data center et dans le cloud (Amazon
AWS, Google Cloud et Microsoft Azure)
• Les données écrites dans n’importe quel noeud sont aussi automatiquement et de manière
transparente écrites sur tous les autres noeuds dans les autres data centers sans ETL
Data Centre 1
Data Centre 2
Public Cloud
22. Ecriture et attente de la
réponse d’un des noeuds
Ecriture ‘B’
B A A
Temps
A A A
Cohérence ajustable
23. R + W < N
La lecture attend la réponse
d’un des noeuds
B A A
B A A
A A A
Ecriture et attente de la réponse
d’un des noeuds
Temps
Cohérence ajustable
24. 24
R + W = N
B B A
B A
A A A
B
Ecriture et attente de la
réponse de deux noeuds
La lecture attend la
réponse d’un des noeuds
Temps
Cohérence ajustable
25. 25
R + W > N
B A
B A
A A A
B
B
Ecriture et attente de la réponse
de deux noeuds
La lecture attend la
réponse de deux noeuds
Temps
Cohérence ajustable
26. 26
R = W = QUORUM
B A
B A
A A A
B
B
Temps
QUORUM = (N / 2) + 1
Cohérence ajustable
44. OpsCenter - La visualisation de votre Cluster
Monitoring
● Visualisation des noeuds
● Métriques & Alertes *
● Activité des noeuds
● Temps Réel
Opérations
● Configuration
● Opération sur les noeuds
● Opération de masse
● Re-équilibrage *
● Sauvegarde / Restauration *
● Point In Time Recovery *
• Visuel, interface utilisateur Web.
• Tâches d’installation, de configuration, et d’administration avec de simples clics
• Support visuel des Services de Gestion Automatique DataStax
• API REST permettant de scripter toutes les fonctions de OpsCenter
• Fonctionne sur tout type de terminal (tablette, etc.)
• Historique des métriques *
• Accès sécurisé *
* Seulement dans Datastax Enterprise
45. DataStax Enterprise
In-Memory
Option de base de données en mémoire
pour le stockage en RAM et non plus sur
disque de certaines données pour un
accès encore plus rapide.
Search
Fonctionnaliés de recherche sur des
données Cassandra via Apache Solr.
Fonctionnalités avancées et performante
sur de gros volumes.
Analytics
Intégration de frameworks analytiques
tels que Spark et Hadoop pour des
analyses temps-réel ou en mode
batch.
Support
Support 24x7 avec des hot-fixes et
des revues de performance.
Visual Admin
Un outil visuel “DataStax OpsCenter”
pour la supervision et l’administration
d’un cluster Cassandra et DataStax.
Management Services
Services d’administration automatique et
suivi des performances.
Cassandra Certified
Une version de Apache Cassandra certifiée, supportée et prête pour
l’entreprise.
Security
Fonctionalités de sécurité d’entreprise
comme le chiffrement des données sur
disques, des traces d’audit et une
authentification externe via Kerberos,
LDAP/Active Directory
Puissance pour le Développement
Robustesse et Support
pour la Production
49. Spark Use Cases
49
Load data from various
sources
Analytics (join, aggregate, transform, …)
Sanitize, validate, normalize data
Schema migration,
Data conversion
52. Confidential 52
Vérification du déploiement
• DataStax OpsCenter http://clustername.westeurope.cloudapp.azure.com:8443/opscenter/
• Azure Resources Explorer http://resources.azure.com
• Groupe de ressource dans portail Azure http://portal.azure.com
53. Confidential 53
Tests de performances
Outil de stress test
http://docs.datastax.com/en/cassandra/2.1/cassandra/tools/toolsCStress_t.html
• 1 Millions INSERT : cassandra-stress write n=1000000 -node 10.0.0.22
• 200 000 SELECT : cassandra-stress read n=200000 -node 10.0.0.22
54. Confidential 54
Windows et Driver C#
• Cassandra 2.2 disponible pour Windows
http://www.luketillman.com/developing-with-cassandra-on-windows/
• Support Windows pour DataStax Enterprise 5.0 (Q1 2015)
• Driver C# DataStax
• GitHub https://github.com/datastax/csharp-driver
• Nuget https://www.nuget.org/packages/CassandraCSharpDriver/
• Documentation http://docs.datastax.com/en/developer/csharp-driver/2.7/csharp-driver/whatsNew2.html
55. Confidential 55
Recherche, DSE Search et Apache Solr
• Mapping Cassandra / Solr
dsetool create_core killrvideo.videos generateResources=true
• Indexation temps réel
• Recherche via API REST ou via requêtes CQL
• Documentation DSE Search
http://docs.datastax.com/en/datastax_enterprise/4.8/datastax_enterprise/srch/srchOverview.html
SELECT * FROM videos where solr_query='{"q":"description:cassandra"}';
SELECT * FROM videos where solr_query='{"q":"tags:music","facet":{"field":"tags"}}';
56. Confidential 56
Analytique et Apache Spark
• Connecteur Cassandra/Spark sur GitHub https://github.com/datastax/spark-cassandra-connector
• Intégration et Support de Spark dans DataStax entreprise
• Interface d’administration
• Spark Shell, Spark Job et serveur JDBC/ODBC (SparkSQL)
57. Notebook Zeppelin
Confidential 57
Code Spark depuis un navigateur
Exemple Cassandra https://github.com/doanduyhai/incubator-zeppelin
Interpréteur CQL disponible
63. Cassandra – La Base de Données Distribuée leader
Bordeaux
Paris
Marseille
C *
C *
C *C *
Toujours Disponible
Distribution géographique
Performance reconnue
Extensibilité prédictible
Simplicité Opérationnelle
Séries Temporelles
63