Big Data

CodaLab – Concours de Data Science

CodaLab Competition est une plateforme servant à l’exécution de code dans le domaine de la Data Science. Elle se présente sous la forme d’une interface web sur laquelle un utilisateur peut soumettre du code ou des résultats et se comparer aux autres. Voyons ensemble comment fonctionne et comment installer CodaLab On-Premise. […]

Par |2018-12-17T16:54:35+00:00December 17th, 2018|Big Data, Data Science|0 commentaire

Les principaux avantages de GraphQL comme alternative au REST

GraphQL est basé sur une idée simple, déplacer l'assemblage d'une requête du serveur vers le client. Ce dernier voit l'ensemble du schéma fortement typé au lieu d'une multitude de services REST et construit la requête souhaitée en fonction de ses besoins. Ma première application web en REST, SPAs pour Single Page Application comme cela fût [...]

Par |2018-11-27T09:59:22+00:00November 27th, 2018|Big Data, Data Science|0 commentaire

Prise de contrôle d’un cluster Hadoop avec Apache Ambari

Nous avons récemment migré un large cluster Hadoop de production installé “manuellement” vers Apache Ambari. Nous avons nommé cette opération “Ambari Takeover”. C’est un processus à risque et nous allons détailler pourquoi nous avions besoin de réaliser cette opération et comment nous l’avons fait. […]

Par |2018-11-22T13:47:28+00:00November 20th, 2018|Big Data|0 commentaire

Gestion des identités utilisateurs sur clusters Big Data

La sécurisation d'un cluster Big Data implique l'intégration ou le déploiement de services spécifiques pour stocker les utilisateurs. Certains utilisateurs sont spécifiques à un cluster lorsque d'autres sont partagés entre tous les clusters. Il n'est pas toujours clair de savoir comment ces différents services s'articulent et s'ils doivent être partagés entre plusieurs clusters. Aussi, quelle [...]

Par |2018-11-08T12:33:44+00:00November 8th, 2018|Big Data, Cyber security|0 commentaire

Apache Flink: passé, présent et futur

Apache Flink est une petite pépite méritant beaucoup plus d’attention. Plongeons nous dans son passé, son état actuel et le futur vers lequel il se dirige avec les keytones et présentations de la Flink Forward 2018. […]

Par |2018-11-15T11:08:44+00:00November 5th, 2018|Big Data, Data Engineering|0 commentaire

Déploiement d’un cluster Flink sécurisé sur Kubernetes

Le déploiement sécurisé d’une application Flink dans Kubernetes offre deux options. En supposant que votre Kubernetes est sécurisé, vous pouvez compter sur la plateforme sous-jacente ou utiliser les solutions natives de Flink pour sécuriser votre application de l’intérieur. Notez que ces deux solutions ne sont pas mutuellement exclusives. […]

Par |2019-02-08T12:20:25+00:00October 8th, 2018|Big Data, Cyber security|0 commentaire

Migration de cluster et de traitements entre Hadoop 2 et 3

La migration de Hadoop 2 vers Hadoop 3 est un sujet brûlant. Comment mettre à niveau vos clusters, quelles fonctionnalités présentes dans la nouvelle version peuvent résoudre les problèmes actuels et apporter de nouvelles opportunités, comment vos traitements actuels sont-ils impactés, quelle stratégie de migration est la plus appropriée pour votre entreprise ? […]

Par |2019-02-08T10:25:26+00:00July 25th, 2018|Big Data|0 commentaire

Remède à l’aveuglement de Kafka

Il est difficile de visualiser pour les développeurs, opérateurs et manageurs, ce qui se cache à l’intérieur des entrailles de Kafka. Cet article parle d’une nouvelle interface graphique bientôt disponible. L’interface fut présentée par George Vettcaden, VP Management product chez Hortonworks, en avant première lors de la conférence du DataWorks Summit de Juin 2018 à [...]

Par |2019-02-08T09:57:02+00:00June 20th, 2018|Big Data, DataWorks Summit 2018|0 commentaire

Exécuter des workloads d’entreprise dans le Cloud avec Cloudbreak

Cet article se base sur la conférence de Peter Darvasi et Richard Doktorics “Running Enterprise Workloads in the Cloud” au DataWorks Summit 2018 à Berlin. Il présentera l’outil de déploiement automatique d’Hortonworks pour le Cloud: Cloudbreak, décrira et commentera certaines fonctionnalités expliquées par Peter et Richard, et donnera des recommandations personnelles sur quand et pourquoi [...]

Par |2019-02-07T17:12:05+00:00May 28th, 2018|Big Data, DataWorks Summit 2018|1 Comment