Loading...
Accueil2018-10-14T11:26:56+00:00

Big Data

Data Engineering

Chaîne d’alimentation, préparation de la  donnée, data lake, data gouvernance

Data Science

Écriture d’algorithmes, Spark, machine learning, exploration, statistiques, python, R

Data Streaming

Bus de messages, indicateur clef de performance (ICP), détection de seuil, requêtes sur fenêtre de temps, comportements intelligents

DataViz

Visualisation, notebooks

Dernières Publications

Ingestion de Data Lake, quelques bonnes pratiques

By |June 18th, 2018|Categories: Data Engineering, DevOps|Tags: , , , , , , , |

La création d’un Data Lake demande de la rigueur et de l’expérience. Voici plusieurs bonnes pratiques autour de l’ingestion des données en batch et en flux continue que nous recommendons et mettons en place lorsque [...]

DataWorks Summit 2018 – Quelques jours à Berlin

By |June 5th, 2018|Categories: DataWorks Summit 2018|Tags: , , , |

L’équipe Adaltas s’est rendu au complet à la conférence DataWorks Summit 2018 qui a eu lieu à Berlin les 18 et 19 avril. A cette occasion, nous avons compilé une série d’articles sur les présentations [...]

Accélérer vos requêtes avec les vues matérialisées dans Apache Hive

By |May 31st, 2018|Categories: Data Engineering, DataWorks Summit 2018|

Jesus Camacho Rodriguez a organisé une présentation “Accelerating query processing with materialized views in Apache Hive” sur une nouvelle fonctionnalité à venir dans Apache Hive 3.0 : les vues matérialisées. Cet article va décrire le [...]

YARN et la distribution de GPU pour le machine learning

By |May 30th, 2018|Categories: Data Science, DataWorks Summit 2018|Tags: , , |

Dans cet article nous verrons les principes fondamentaux du Machine Learning et les outils actuellement utilisés pour executer ce type d’algorithmes, puis nous expliquerons comment un gestionnaire de ressource tel que YARN peut s’avérer utile [...]

Apache Metron dans le monde réel

By |May 29th, 2018|Categories: Cyber security, DataWorks Summit 2018, Évènements|Tags: , , |

Apache Metron est une plateforme d’analyse et de stockage spécialisé dans la sécurité informatique. La conférence a été présentée par Dave Russell, ingénieur en chef des solutions – EMEA + APAC chez Hortonworks au Dataworks [...]

Apache Hadoop YARN 3.0 – État de l’art

By |May 29th, 2018|Categories: Data Engineering, DataWorks Summit 2018|

Cet article couvre la présentation “Apache Hadoop YARN: state of the union” (YARN état de l’art) par Wangda Tan d’Hortonworks lors de la conférence DataWorks Summit 2018 Berlin (anciennement Hadoop [...]

Exécuter des workloads d’entreprise dans le Cloud avec Cloudbreak

By |May 28th, 2018|Categories: Big Data, DataWorks Summit 2018|Tags: , , , |

Cet article se base sur la conférence de Peter Darvasi et Richard Doktorics “Running Enterprise Workloads in the Cloud” au DataWorks Summit 2018 à Berlin. Il présentera l’outil de déploiement automatique d’Hortonworks pour le Cloud: [...]