Loading...
Accueil2018-11-05T13:37:49+00:00

Big Data

Data Engineering

Chaîne d’alimentation, préparation de la  donnée, Data Lake, gouvernance des données

Data Science

Écriture d’algorithmes, Spark, Machine Learning, exploration, statistiques, Python, R

Data Streaming

Bus de messages, indicateur clef de performance (ICP), détection de seuil, requêtes sur fenêtre de temps, comportements intelligents

DataViz

Visualisation, Notebooks

Dernières Publications

CodaLab – Concours de Data Science

By |December 17th, 2018|Categories: Big Data, Data Science|Tags: , , , , |

CodaLab Competition est une plateforme servant à l’exécution de code dans le domaine de la Data Science. Elle se présente sous la forme d’une interface web sur laquelle un utilisateur peut soumettre du code ou [...]

Les modules natifs Node.js avec N-API

By |December 12th, 2018|Categories: Node.js|Tags: |

Que sont les modules natifs pour Node.js et comment les créer? Les addons C/C++ sont une fonctionnalité utile et puissante du runtime Node.js. Explorons-les depuis leurs fonctionnement, jusqu’à leur développement et publication. Exécuter du JavaScript [...]

Microsoft annonce Cloud Native Application Bundles

By |December 4th, 2018|Categories: Conteneur, DevOps|Tags: , , , |

Lors de la DockerCon EU 2018 à Barcelone, Matt Butcher, ingénieur principal chez Microsoft et inventeur de Helm, a présenté CNAB, Cloud Native Application Bundles, un format de packaging pour applications distribuées, ainsi que Duffle, [...]

Les principaux avantages de GraphQL comme alternative au REST

By |November 27th, 2018|Categories: Big Data, Data Science|Tags: , , , , , |

GraphQL est basé sur une idée simple, déplacer l'assemblage d'une requête du serveur vers le client. Ce dernier voit l'ensemble du schéma fortement typé au lieu d'une multitude de services REST et construit la requête [...]

Prise de contrôle d’un cluster Hadoop avec Apache Ambari

By |November 20th, 2018|Categories: Big Data|Tags: |

Nous avons récemment migré un large cluster Hadoop de production installé “manuellement” vers Apache Ambari. Nous avons nommé cette opération “Ambari Takeover”. C’est un processus à risque et nous allons détailler pourquoi nous avions besoin de [...]

Node.js CSV version 4 – réécriture et performances

By |November 19th, 2018|Categories: Node.js|Tags: , , |

Nous publions aujourd'hui une nouvelle version majeure du projet CSV Parser pour Node.js. La version 4 est une réécriture complète du projet axée sur la performance. Il comporte également de nouvelles fonctionnalités, ainsi que des [...]

Gestion des identités utilisateurs sur clusters Big Data

By |November 8th, 2018|Categories: Big Data, Cyber security|Tags: , , , , , |

La sécurisation d'un cluster Big Data implique l'intégration ou le déploiement de services spécifiques pour stocker les utilisateurs. Certains utilisateurs sont spécifiques à un cluster lorsque d'autres sont partagés entre tous les clusters. Il n'est [...]

Apache Flink: passé, présent et futur

By |November 5th, 2018|Categories: Big Data, Data Engineering|Tags: , , , , , |

Apache Flink est une petite pépite méritant beaucoup plus d’attention. Plongeons nous dans son passé, son état actuel et le futur vers lequel il se dirige avec les keytones et présentations de la Flink Forward 2018. [...]