Loading...
Accueil2018-06-06T08:32:04+00:00

Big Data

Data Engineering

Chaîne d’alimentation, préparation de la  donnée, data lake, data gouvernance

Data Science

Écriture d’algorithmes, Spark, machine learning, exploration, statistiques, python, R

Data Streaming

Bus de messages, indicateur clef de performance (ICP), détection de seuil, requêtes sur fenêtre de temps, comportements intelligents

DataViz

Visualisation, notebooks

Dernières Publications

Machines KVM pour Vagrant sur Archlinux

By |September 19th, 2018|Categories: DevOps|Tags: , , , |

Vagrant supporte différent providers pour gérer la virtualisation. Dans un environnement Linux, il est possible d’améliorer considérablement les performances des VMs en utilisant le provider libvirt et l’hyperviseur KVM. […]

Lando: résumé de conversation en Deep Learning

By |September 18th, 2018|Categories: Conteneur, Data Science|Tags: , , , , , , , , , , |

Lando: Les derniers maîtres des mots Lando est une application de résumé de réunion qui utilise les technologies de Speech To Text pour transcrire de l’audio en écrit et les technologies de Deep Learning pour [...]

Migration de cluster et de traitements entre Hadoop 2 et 3

By |July 25th, 2018|Categories: Big Data|Tags: , , , |

La migration de Hadoop 2 vers Hadoop 3 est un sujet brûlant. Comment mettre à niveau vos clusters, quelles fonctionnalités présentes dans la nouvelle version peuvent résoudre les problèmes actuels et apporter de nouvelles opportunités, [...]

Deep learning sur YARN: lancer Tensorflow et ses amis sur des clusters Hadoop

By |July 24th, 2018|Categories: Data Science, DataWorks Summit 2018|Tags: , , , |

Avec l'arrivée de Hadoop 3, YARN offre plus de possibilités dans la gestion des ressources. Il est désormais possible de lancer des traitement de Deep Learning sur des GPUs dans des espaces dédiés du cluster. [...]

Remède à l’aveuglement de Kafka

By |June 20th, 2018|Categories: Big Data, DataWorks Summit 2018|Tags: , , , |

Il est difficile de visualiser pour les développeurs, opérateurs et manageurs, ce qui se cache à l’intérieur des entrailles de Kafka. Cet article parle d’une nouvelle interface graphique bientôt disponible. L’interface fut présenté par George [...]

Environnement de développement CoreOS avec Vagrant et VirtualBox

By |June 20th, 2018|Categories: Conteneur, DevOps|Tags: , , , |

Suivre les instructions de CoreOS sur la façon de configurer un environnement de développement dans VirtualBox n’a pas bien fonctionné pour moi. Voici les étapes que j’ai suivies pour que Container Linux fonctionne avec Vagrant. [...]

Ingestion de Data Lake, quelques bonnes pratiques

By |June 18th, 2018|Categories: Data Engineering, DevOps|Tags: , , , , , , , |

La création d’un Data Lake demande de la rigueur et de l’expérience. Voici plusieurs bonnes pratiques autour de l’ingestion des données en batch et en flux continue que nous recommendons et mettons en place lorsque [...]

DataWorks Summit 2018 – Quelques jours à Berlin

By |June 5th, 2018|Categories: DataWorks Summit 2018|Tags: , , , |

L’équipe Adaltas s’est rendu au complet à la conférence DataWorks Summit 2018 qui a eu lieu à Berlin les 18 et 19 avril. A cette occasion, nous avons compilé une série d’articles sur les présentations [...]