Infrastructure

Infrastructure2018-06-05T22:36:25+00:00

Parce qu’elle est vitale dans les projets Big Data, nous vous aidons à développer et à mettre en œuvre l’infrastructure de données appropriée et compatible avec votre environnement informatique existant.

Nos compétences couvrent les étapes clés du design et de l’architecture tels que la surveillance, le diagnostic et le reporting, en passant par le déploiement, la configuration et la sécurisation. Notre expertise s’étend sur une multitude de technologies et de distributions Big Data.

Nous avons à de multiples reprises sécurisé avec Kerberos les distributions d’Hortonworks, de Cloudera et de MapR et avons l’expérience de mener des ateliers réunissant plusieurs acteurs de votre organisation en vue d’intégrer les plateformes Big Data avec des technologies comme l’Active Directory, FreeIPA, MIT Kerberos et OpenLDAP.

Architecture

Reprise de l’existant

Audit de l’existant, détermination de la vision stratégique de l’offre de service Big Data, élaboration des stratégies de montée de version, de passage en haute disponibilité, de sécurisation des clusters, … Préparation au changement de technologies en phase d’obsolescence, conduite du changement et fédération des équipes impliquées transverses à l’entreprise.

Capacity planning

Audit de capacity planning consistant à cartographier les ressources du systèmes, validation et optimisation des configurations. Étude anticipée des usages du cluster, création d’une empreinte de performance avec tests de résistance et montée en charge, définition des axes d’optimisation.

Sécurité

Authentification forte

Sécurisation des accès aux différents processus des services via une authentification forte assurée par le protocol Kerberos. Intégration avec les annuaires OpenLDAP et Active Directory de l’entreprise.

Indentité

Définition des utilisateurs nominatif et applicatifs, stockage vers un ou plusieurs annuaire LDAP/AD, gestion de l’appartenance des utilisateurs à des groupes.

Chiffrement des flux

Sécurisation des communications inter et intra-noeuds des services supportés via SSL/TLS.

Périmètre de protection

Déploiement de pare-feu par blocage complet ou sélectif, de proxy HTTP et d’authentifications alternatives à Kerberos et isolation réseau.

Exploitation

Supervision & monitoring

Déploiement de logiciels de gestion et de provisionnement de cluster Hadoop (Ambari et Cloudera Manager) et de solutions de surveillance personnalisées utilisant des logiciels standards de la supervision d’infrastructure tels que Nagios et Shinken. Développement de solutions curatives automatiquement ordonnancées par les logiciels de supervision.

Backup & réplication

Convergence des règles clientes et des impératifs des systèmes Big Data : orchestration des sauvegarde de configuration, logs applicatifs et métadonnées, planification de la réplication des données HDFS et HBase.

Intégration

Arrimages des outils existants avec les plateformes Big Data: applications métiers, ETL, outils de reporting, postes clients, environnement de dévelopement (IDE), …

Haute disponibilité

Déploiement de systèmes résiliants à la panne, analyse et anticipation des points critiques, conception de schémas d’architecture illustrant les dépendances et leurs impacts en situation d’échec.