Spark MLlib

Apache Spark MLlib est une bibliothèque d'apprentissage automatique qui s'exécute sur Spark core. Il prend en charge l'informatique distribuée et est scalable verticalement et horizontalement. Il propose des API pour Java, Scala, Python, R et SQL.

Il fournit des outils tels que :

  • Algorithmes ML: algorithmes d'apprentissage courants tels que classification, régression, clustering et filtrage collaboratif
  • Featurization: extraction et sélection de variables, transformation, réduction de dimensionnalité
  • Pipelines: outils de construction, d'évaluation et de tuning de pipelines ML
  • Persistance: sauvegarde et chargement d'algorithmes, de modèles et de pipelines
  • Utilitaires: algèbre linéaire, statistiques, manipulations des données, etc.

Articles associés

Canada - Maroc - France

International locations

10 rue de la Kasbah
2393 Rabbat
Canada

Nous sommes une équipe passionnée par l'Open Source, le Big Data et les technologies associées telles que le Cloud, le Data Engineering, la Data Science le DevOps…

Nous fournissons à nos clients un savoir faire reconnu sur la manière d'utiliser les technologies pour convertir leurs cas d'usage en projets exploités en production, sur la façon de réduire les coûts et d'accélérer les livraisons de nouvelles fonctionnalités.

Si vous appréciez la qualité de nos publications, nous vous invitons à nous contacter en vue de coopérer ensemble.