Loading...
Accueil 2017-11-14T16:07:54+00:00

Big Data

Data Engineering

Chaîne d’alimentation, préparation de la  donnée, data lake, data gouvernance

Data Science

Écriture d’algorithmes, Spark, machine learning, exploration, statistiques, python, R

Data Streaming

Bus de messages, indicateur clef de performance (ICP), détection de seuil, requêtes sur fenêtre de temps, comportements intelligents

DataViz

Visualisation, notebooks

Dernières Publications

Namespace réseau sans Docker

By | July 6th, 2016|Categories: Blog, Hack|Tags: |

Imaginons le cas suivant: Je suis connecté à plusieurs réseaux (wlan0, eth0, usb0). Je veux choisir le réseau que je vais utiliser au lancement de mon application. Mon application ne permet pas de choisir une [...]

Node CSV version 0.2.1

By | July 26th, 2012|Categories: Uncategorized|

Faisant suite a l’annonce de la version 0.2.0 du parser CSV pour Node.js début octobre, aujourd’hui sort la nouvelle version 0.2.1. Il s’agit essentiellement d’une distribution corrigeant des bugs. Toutefois, quelques fonctionnalités intéressantes ont trouvé [...]

Installation sous OSX en mode pseudo-distribué

By | December 1st, 2010|Categories: Uncategorized|

Le système d’exploitation choisi est OSX mais la procédure n’est pas si différente pour tout environnement Unix car l’essentiel des logiciels sont téléchargés depuis Internet, décompressés et paramétrés manuellement. Seuls quelques paquets sont installés par [...]

Stockage et traitement massif avec Hadoop

By | November 26th, 2010|Categories: Uncategorized|

Apache Hadoop est un système pour construire des infrastructures de stockage partagé et d’analyse adaptées à des volumes larges (plusieurs terabytes ou petabytes). Les clusters Hadoop sont utilisés par un large éventail de projets R&D [...]