La solution Hitachi Content Platform (HCP, anciennement nommé Hitachi Content Archive Platform - HCAP) a fortement évoluée depuis 2006. D’une solution orientée principalement Archivage à Valeur Probatoire, HCP est devenu une solution Cloud Storage, tout en conservant ses fonctionnels guidés par l’intégrité, la conservation, la pérennité et la gestion des rétentions sur les données et les métadonnées.
1. Hitachi Content Platform
File & Content
Solutions
La solution Hitachi Content Platform (HCP, anciennement nommé Hitachi
Content Archive Platform - HCAP) a fortement évoluée depuis le
partenariat et l’acquisition de la société Archivas (2006). D’une solution
orientée principalement Archivage à Valeur Probatoire, HCP est devenu
une solution Cloud Storage, tout en conservant ses fonctionnels guidés
par l’intégrité, la conservation, la pérennité et la gestion des rétentions
sur les données et les métadonnées.
Hitachi Content Platform reste un produit embarquant un espace de
stockage de données, mais cette valeur passe au second plan au regard de
ses capacités avancées. Aujourd’hui, HCP se propose de répondre aux
nouvelles préoccupations de partages de fichiers et d’archivage (probant
ou non), dans un cadre moderne d’automatisation de gérance par
politiques.
Cette gouvernance contemporaine doit certes prendre en compte des aspects de volume sur disques
et du nombre de données brutes, mais aussi de simplicité d’utilisation, de mobilité, d’accès universel
multi-supports, d’indexation, de recherche et de partage de la multiplicité des connaissances. Au
travers de la solution HCP, Hitachi Data Systems s’adresse à de nouveaux acteurs de l’IT. Il ne s’agit
pas uniquement de répondre aux besoins de flexibilité de consolidation et de volume important avec
une intelligence d’infrastructure, mais bel et bien de toucher l’interopérabilité applicative, la gestion
du risque, la gestion de contenus et, surtout, le décisionnel sur l’information, son enrichissement et
l’amélioration de production et d’échange au plus près des utilisateurs.
Conception
Innovante
Avec Hitachi Content Platform, la représentation de stockage Objet vient
supplanter le concept classique de stockage de fichiers via un NAS. HCP propose
un système de fichiers Objet. Il s’agit du regroupement de la gestion classique de
fichiers et de répertoires, avec une gestion de métadonnées dite Métier.
A titre d’exemple, une photo de vacances est la donnée source inscrite dans un
fichier au format RAW ou JPEG ; les métadonnées sont la description du visuel, les
notes ou les coordonnées GPS associées. Ces métadonnées sont des
compléments d’information sur le contenu de la donnée et son environnement.
Elles sont créées avec la source, comme l’ajout des coordonnées GPS, ou à
posteriori, comme l’ajout d’annotation par l’utilisateur ou un traitement
numérique. L’association Donnée et Métadonnée forme donc la base de l’Objet.
A cette association, il est permis d’ajouter des Métadonnées dites de nature Politique. Une Politique est la
description, par exemple, du niveau de sécurisation, de l’historisation des versions, du type d’empreinte (SHA)
utilisée, pour garantir l’intégrité, etc. L’objet est entier et indépendant du support physique. Il porte donc
l’ensemble de ses informations quand il est dupliqué, contrôlé, répliqué, accédé ou supprimé. A ce fonctionnel
avancé, HCP intègre des optimisations sur l’espace de stockage (compression, SIS) et le placement intelligent
des fichiers jusqu’à un Cloud Public du marché ou des volumes externes disques ou bandes non Hitachi.
Ce sont ces valeurs que la solution Hitachi Content Platform porte, étend et délivre en respectant
l’indépendance des sources, via une neutralité fonctionnelle, favorisant la réversibilité et l’interopérabilité.
La solution HCP est aussi déclinée en offre verticale spécialisée, afin d’adresser des besoins
métier précis, telle que la corrélation et l’analyse de contenu, souvent adressé sous le label
Big Data. Avec sa capacité intégrée d’indexation, HCP propose un fonctionnel de traitement
quantitatif et qualitatif de contenus extrêmement puissant. Le support de Swift vient
compléter l’offre HCP sur le marché du Stockage Objet dans les solutions OpenStack.
2. Hitachi Content Platform, principales innovations
Multi Tenants & Namespaces – Topologie multi sites
Un Tenant est un Environnement Virtuel déterminé par un quota de stockage, des accès
privés et une gestion privée de ses Namespaces. Un Namespace est un Espace Virtuel
désigné par un quota de stockage, des accès privés et des politiques du Tenant propriétaire.
Ces deux désignations Tenant & Namespace sont dissociées de l’administration générale du
HCP. Il s’agit d’une sécurisation avancée. Un Tenant est disjoint des autres Tenants, mais
aussi de l’administration. Comme un Namespace est disjoint des autres Namespaces du
même Tenant, mais aussi des autres Tenants. Cette mécanique permet un cloisonnement
étanche entre les zones d’enregistrement et de consultation des Objets. La sécurisation
s’applique à tous les niveaux, même quand il s’agit de réaliser des recherches sur les
contenus. Elle se prolonge dans une architecture géographiquement répartie via des
topologies réparties Global Namespace.
Cloud Storage & Object Storage
Le Cloud est un concept et désigne une capacité de service IT à la demande, incluant un
paiement éventuel. Ce processus implique un échange sécurisé, simple, mesurable et, si
possible, indépendant de toute contrainte technique propriétaire. La solution HCP intègre
de base un échange standardisé via HTTPs (API RESTful, S3, WebDAV, Swift), afin de faciliter
un accès universel et non propriétaire. A cela est ajoutée une capacité de facturation, via
des métriques de consommation exprimées en nombre d’objets, bande passante, volume,
performance, SLA et service annexe (Versioning, indexation, réplication, etc.). L’accès Web
est privilégié, mais les accès CIFS, NFS et SMTP sont possibles sur une même destination.
Archivage Technique et Probatoire
L’archivage est dans la genèse de la solution HCP. Cette capacité est intégrée comme une
Politique sur la donnée. Par exemple, l’élément granulaire d’une rétention, qui caractérise
l’archive, est sur la donnée (fichier), mais il est permis de définir des Classes d’Archive, afin
d’automatiser des associations entre de multiples données et leur gestion au sein d’une
politique Write-Once-Read-Many (WORM) plus globale, orientée Coffre-fort Electronique.
Pour un HCP, la principale différence entre une valeur technique et une valeur probatoire
réside dans la modification possible de la Politique de conservation. Dans le cas du
probatoire, la Politique de base est stricte et ne supporte pas de modification ou de
suppression du contenu jusqu’à la fin de rétention. Les autres services sont communs.
Scale-Out, Scale-Up & Distributed-Scale
L’évolutivité du HCP s’applique principalement sur 3 classes : 2 matérielles et 1 logicielle.
Ces organisations distinctes permettent d’augmenter : la puissance de traitement, la
volumétrie de stockage physique et le fonctionnel embarqué. Les 80Po du HCP donnent un
accès au marché Big Data. Cette capacité est complétée par les Nodes HCP-S pour délivrer
jusqu’à 400Po, avec une protection bloc basée sur une technologie dite Erasure Coding.
La puissance de traitement est désignée par les CPU. Un HCP est un GRID physique en
Cluster haute disponibilité, c’est-à-dire composé de Nodes agrégés (Serveurs ou Blade
Serveurs Hitachi) et dédiés au traitement des flux et la gestion des données/métadonnées.
Les volumétries des données et des systèmes sont disposées sur une ou plusieurs baies de
stockage Hitachi liées aux serveurs Hitachi. La sécurisation des volumes est assurée via des
architectures en réplication 3DC, 4DC et 5DC, en Actif/Passif et Actif/Actif multiple.
Le fonctionnel embarqué est constitué de base du système d’Objets (jusqu’à 64 milliards),
de tous les services et du pilotage des ressources physiques (CPU et disques). Parmi ses
capacités, il y a, entre autres, la répartition automatique des données, leur déplacement
par classe de stockage, dont la technologie Spin Down, et leur sécurisation.