Formation Spark MLlib et Scala

Inscrivez-vous



Inscrivez-vous à la formation Spark MLlib et Scala

>

Formation Spark MLlib et Scala – En Distanciel


Apache Spark est une infrastructure de traitement de données qui peut effectuer rapidement des tâches de traitement sur de très grands ensembles de données et peut également distribuer des tâches de traitement de données sur plusieurs ordinateurs, soit seul, soit en tandem avec d'autres outils informatiques distribués. Il s'agit d'un moteur d'analyse unifié ultra-rapide pour le Big Data et le Machine Learning

MLLib est une bibliothèque Spark de base qui fournit de nombreux utilitaires très pratiques pour les tâches de Machine Learning suivantes : la classification, la régression, le clustering, la modélisation, la décomposition de valeur singulière (SVD) et l'analyse des composants principaux (PCA), et enfin l'hypothèse de test et de calcul des exemples de statistiques

1 490 790 HT ( Net de taxe car « exonérée de TVA — Art. 261.4.4 a du CGI »)Ajouter au panier


Attestation du Mini Master :

  • Attestation de réussite « Certified Associate ML developper for Apache Spark 2.4 – with Python and Scala » (*)

Session en distanciel :

  • Dates (**) :
    Session 1 : 07-08,14-15 Aout 2021
    Session 2 : 23-24,30-31 Octobre 2021
  • Nombre de jours : 4 jours ( 7H/J)
  • Horaire :  9h00-12h30 13h30-17h00
  • Paris : +33.(0)1.82.88.30.68

(*) Ces Attestations sont délivrées suite à des examens dispensés par ITAB ACADEMY.

(**) Dates prévisionnelles : Ces dates seront confirmées dans l'Email de convocation au plus tard 5 jours avant le début de la formation.


S'inscrire à la formation.

Apache Spark est un moteur de traitement de données très rapide dédié au Big Data. Cela permet d’effectuer un traitement de larges volumes de données de manière distribuée (cluster computing). Par ailleurs, Spark MLlib est la librairie de Machine Learning de Apache Spark. Tous les algorithmes machine learning de cette librairie sont optimisés pour le calcul en parallèle sur un cluster Spark. Cette formation de 4 jours introduit Spark et Spark SQL. De plus, ça explique la bibliothèque SPARK MLlib avec de vrais cas d'utilisation d'apprentissage automatique en utilisant scala et/ou python.

  • Formateur Machine Learning et Statistique: Ingénieur et consultant statisticien, lauréat de l’Institut National de Statistique et d’Economie Appliquée (INSEA), le formateur a ainsi un doctorat en Statistique. Notre formateur a plus de 13 ans d’expérience dans le domaine professionnel (secteur privé et public), avec une expertise en matière de traitement et modélisation des données et une bonne connaissance des secteurs économiques. Il a animé plusieurs formations de Machine Learning, dans le cadre de plusieurs groupes de travail et au profit des étudiants universitaires et des grands comptes tel que : Orange.


  • Formateur Machine Learning avec Spark: Ingénieur et consultant BIG DATA, le formateur a un doctorat en informatique de l’ENSIAS en partenariat avec l’université de Quebec. Il est au même temps professeur universitaire à l’INPT. Il a cumulé plus de 13 ans d’expérience dans le domaine professionnel, ainsi il était consultant et chef de projet dans une grande multinationale ou il a travaillé pour le compte de plusieurs clients francophones/anglophones à savoir : Schneider, Ciba, Pfizer, Solvay, Boehringer Ingelhem etc. Notre formateur possède plusieurs certifications en BIG DATA et SPARK. Il a aussi animé plusieurs formation BIG DATA, Machine Learning et datascience pour des grands comptes tel que: Orange, Altran, PhoneGroup, Avito, Xhub, Lydec…

Description de la formation

Le métier de Data Scientist est avant tout une vocation, qui se traduit par la pratique de traitement de données de différentes natures, à l’aide d’algorithmes adaptés, afin de répondre à des challenges de décision. Ainsi, au sein d’une équipe Data, vous serez en charge de choisir le modèle le plus performant, parmi une palette d’algorithmes : supervisés, non supervisés ou encore réseaux de neurones profonds (Deep Learning). L’importance de ce type particulier d’algorithmes, réside dans leur pouvoir à permettre à des machines d’agir sans être explicitement programmés et c’est exactement, la maîtrise de ces algorithmes, qui ont permis d’industrialiser des voitures automnes, de tirer profit de la reconnaissance vocale, d’effectuer des recherches Web efficaces et de construire une connaissance considérablement améliorée du génome humain.

Le Machine Learning fait appel en fait, à plusieurs compétences interdisciplinaires, telle que la statistique, l’algèbre linéaire, l’optimisation et l’informatique, pour développer des systèmes automatisés, capables de passer au crible de grands volumes de données, afin de prendre des décisions, tout en minimisant l’intervention humaine. En tant que domaines d’application, le Machine Learning est désormais incroyablement omniprésent, avec des applications allant de l’intelligence d’affaires à la sécurité des pays, de l’analyse des interactions biochimiques à la surveillance structurelle du vieillissement des ponts, etc.

Dans le même ordre d’idées, les responsables de cette formation ont conçu le mini master Machine Learning, afin de faire bénéficier les stagiaires d’une formation complète et qui répond aux standards internationaux. Le premier résultat escompté est de bien vous outiller, afin de maîtriser les techniques de Machine Learning les plus efficaces, dans l’objectif d’exercer à les mettre en œuvre et à les faire fonctionner par vous-même. Plus important encore, vous découvrirez non seulement les fondements théoriques de l’apprentissage, mais vous acquerrez également le savoir-faire pratique nécessaire pour appliquer efficacement les techniques présentées, à de nouveaux problèmes dans le cadre des situations réelles.

Ensuite, la formation vise à présenter les détails nécessaires pour appréhender efficacement le Machine Learning et pour la construction de la connaissance, sur la base des données qui peuvent être de plusieurs natures. Les sujets traités comprennent entre autres :

  • L’apprentissage supervisé (algorithmes paramétriques/non paramétriques) ;
  • L’apprentissage non supervisé (clustering, réduction de la dimension, systèmes de recommandation) ;
  • Les bonnes pratiques en Machine Learning (théorie de biais/variance, processus d’innovation et IA).
  • La formation s’appuiera également sur de nombreuses études de cas et applications, de sorte à pouvoir appliquer les algorithmes à de nouveaux problèmes telle que la classification d’un texte.

La formation de certification Machine Learning est conçu par des consultants experts pour faire de vous un praticien certifié Machine Learning. Le mini master Machine Learning a pour objectifs:

  • Apprendre à programmer avec Scala
  • Comprendre les principes fondamentaux de la librairie Spark MLlib
  • Apprendre à créer des modèles d'apprentissage automatique avec SparkMLlib
  • Méthodes mobilisées:

    Les apprenants se connecteront à une classe virtuelle animée par un formateur. Le cours étant interactif, des échanges entre le formateur et les apprenants auront lieux selon les séquences établies dans le programme de formation. Afin de concrétiser la théorie, le formateur mettra en place des travaux pratiques individuels et des étude de cas concrets.


  • Moyens pédagogiques :

    • Plateforme Zoom (vidéo et partage d’écran)
    • Documents de supports de formation projetés (Diaporama PowerPoint )
    • Mise à disposition en ligne de documents supports (ZOOM et Google Classroom)
    • Vidéo animées et schéma explicatifs
    • Accès à un environnement interactif pour réaliser les travaux pratiques
    • Accès en illimité à la plateforme Google Classroom pour les supports de cours

  • Modalités d'évaluations:

    Un questionnaire d'évaluation des acquis vous sera dispensé au début et en fin de formation afin de mesurer votre niveau et votre progression. De plus, un questionnaire de satisfaction à chaud (en fin de la formation) puis à froid (2 mois après la formation).

Nos formations sont accessibles selon les modalités suivantes:


  1. Inter-entreprises: groupes de stagiaires provenant de différentes entreprises
  2. Intra-entreprise: groupes de stagiaire de la même entreprise

Plusieurs modes de financement vous permettent d’accéder à nos formations en tant que salarié via votre entreprise ou en tant que particulier. Nos conseillers sont à votre disposition à fin de vous expliquer les différents options.
Nous nous engageons à répondre à vos demandes d'informations et à vous adresser un devis sous 5 jours ouvrés.
De votre côté :

  • vous devez vous assurer de nous envoyer le devis signé dans les plus bref délais.
  • ou
  • un paiement d'un acompte de 25% du prix de la formation HT(*) à payer sur ce site dans la boutique en ligne

L’annulation d’une séance de formation de votre part est possible, à condition de le faire au moins 10 jours calendaires avant la date prévisionnelle de la formation (Passé ce délai seul le report est possible).
(*) Net de taxe car « exonérée de TVA — Art. 261.4.4 a du CGI »

Le marché de l'analyse Big Data est en croissance à travers le monde et ce modèle de croissance forte se traduit par une excellente opportunité pour tous les professionnels de l'informatique. Les responsables du recrutement recherchent des professionnels certifiés Big Data Hadoop et Spark. Notre formation à la certification Big Data et Hadoop et Spark vous aide à saisir cette opportunité et à accélérer votre carrière. Notre cours Big Data Hadoop et Spark peut être suivi par des professionnels comme par des novices. Il est le mieux adapté pour:


  • Passionnés de Big Data
  • Développeurs logiciels, chefs de projet
  • Architectes logiciels
  • Consultant BI
  • Ingénieurs de données
  • Data Analyst
  • Data scientist
  • DBA et professionnels de la base de données
  • Ingénieurs en informatique
  • Diplômés cherchant à construire une carrière dans le domaine du Big Data

Il n'y a pas de prérequis pour la formation Mini Master Machine Learning ou data science avec R, Scikit Learn avec Python et Spark avec Python ou Scala. Cependant, une connaissance préalable de la programmation, Statistique sera utile mais n'est pas obligatoire. De plus, pour parfaire vos compétences, Itabacademy propose le cours gratuit "python for data science" à suivre à votre rythme lorsque vous vous inscrivez au cours Mini Master Machine Learning ou data science avec R, Scikit Learn avec Python et Spark avec Python ou Scala.

Nos formations peuvent être accessibles aux personnes en situation de handicap. Chaque situation étant unique, nous vous demandons de préciser à l’inscription votre besoin en termes d'aménagement. Nous pourrons ainsi confirmer l’ensemble des possibilités d’accueil et vous permettre de suivre la formation dans les meilleures conditions . Pour toutes informations complémentaires, nous vous prions de contacter : notre référent handicap :
Mr Abdelmonir BOUAZZAOUI

  • Email : Abdelmonir@itabacademy.fr
  • Téléphone +33620606642
    ou
    Notre partenaire AGEFIPH(*) Ile-de-France :
  • M. Bastian GIESBERGER : b-giesberger@agefiph.asso.fr
  • M. M’Ballo SECK : m-seck@agefiph.asso.fr site internet www.agefiph.fr
  • Téléphone: +33608111009
  • Email : rhf-idf@agefiph.asso.fr
    Le centre de ressources numériques : https://rhf-agefiph.defi-metiers.fr
    (*)L’AGEFIPH est une association de gestion du fonds pour l'insertion des personnes handicapées.

    • Développer une idée claire de ce qu’implique l’apprentissage des modèles à partir des données ;
    • Maitriser les concepts d’une grande variété d’algorithmes de Machine Learning ;
    • Modéliser des données classiques et complexes et appliquer les algorithmes à un problème réel ;
    • Extraire de la connaissance sur la base des algorithmes et résultats issus de vos données ;
    • Etre capable d’évaluer les modèles générés à partir des données ;
    • Choisir entre plusieurs approches et entrainer des modèles ;
    • Optimiser les modèles en prenant compte des résultats escomptés (précision, fiabilité, exactitude, etc.).

    Comme vous le savez, de nos jours, de nombreuses organisations manifestent de l'intérêt pour le Big Data et adoptent Hadoop et Spark dans le cadre de leur stratégie de solution, la demande d'emplois dans le Big Data et Spark augmente rapidement. Il est donc grand temps de poursuivre votre carrière dans le domaine du Big Data et de l'analyse avec notre formation qui prépare à la certification Hadoop et Spark avec Python et Scala.

    Programme détaillé de la formation Spark MLlib et Scala

    Scala- Part 1

    • 1. Introduction
    • 2. Hello word
    • 3. Expressions
    • 4. Values
    • 5. Variables
    • 6.Blocks
    • 7. Conditional expressions
    • 8. Pattern matching
    • 9. While loop
    • 10. For loop

    Scala- Part 2

    • 1. Break statement
    • 2. Comments
    • 3. Functions
    • 4. Methods
    • 5. Classes & Objects
    • 6. Traits
    • 7. Arrays
    • 8. Strings
    • 9. Scala collections
    • 10. Functions collections
    • 11. Tuple

    SPARK Introduction

    • 1. Pourquoi avons-nous besoin de SPARK?
    • 2. Qu'est-ce que SPARK?
    • 3. Spark Composants
    • 4. Catégories de composants SPARK
    • 5. SPARK Architecture
    • 6. Qu'est-ce que SPARK SQL?
    • 7. Architecture de SPARK SQL
    • 8. Histoire des RDDs, DATAFRAMES et DATASETS
    • 9. Nouvelle API SPARK 2.0
    • 10. SPARK MLLIB Définition
    • 11. MLlib pour Dataframes ou RDD’s
    • 12. MlLib par rapport aux autres bibliothèques ML
    • 13. Concepts MLlib de haut niveau
    • 14. Data ingestion & exploration
    • 15. Construire une régression linéaire simple
    • 16. Training & testing dataset
    • 17. Préparation des fonctionnalités avec des transformateurs
    • 18. Utilisation d'estimateurs pour créer des modèles
    • 19. Créer des pipelines
    • 20. Construire le modèle en utilisant toutes les fonctionnalités
    • 21. Évaluation des modèles
    • 22. Sauvegarde et chargement de modèles
    • 23. Conclusion

    Examples of machine learning algorithms with MLLIB

    • Introduction to Scala
    • Classification
    • Arbres de décision
    • Forêts aléatoires
    • Flux de travail typique de machine learning
    • Exploration de données et extraction de fonctionnalités
    • Utilisation du package Spark ML
    • Charger les données d'un fichier dans un DataFrame
    • Statistiques sommaires
    • Échantillonnage stratifié
    • Extraction de caractéristiques et pipelining
    • Former le modèle
    • Prévisions et évaluation du modèle
    • Enregistrer le modèle
    • Résumé

    Date de création: 22/12/2020 | Date de la dernière modification: 16/02/2022

    4
    Jours de formation
    28
    Heures de formation

    A l'issue de cette formation, un certificat attestant votre participation vous sera transmis.
    pmp  29-07

    Pour certaines formations un certificat vous sera remis si vous réussissez l'examen.
    (voir les certifications disponibles pour cette formation)

    Ce que nos clients disent de nous

    Moulay Youssef Smaili
    Moulay Youssef Smaili
    30. Novembre, 2019.
    Ayant suivi la formation Big data & Machine learning durant la dernière session (octobre-novemvre 2019), je tiens à remercier les formateurs Dr Abdoullah et Dr Amine pour la qualité de la formation, leur pédagogie et leur gentillesse. Je vous souhaite une très bonne continuation et à très bientôt inchallah. Youssef.
    AK I
    AK I
    20. Octobre, 2019.
    Any big data course in itself is interesting, but thanks to a well designed organization of the material, the hands-on labs and moderators able to deliver knowledge and expertise in a shareable mode instead of a I-give/you-take mode, made it excellent. The staff was professionally great in doing exactly what it is suppose to do and with a genuine smile. I thank you for a job well done.
    Benjamin Ekia
    Benjamin Ekia
    20. Octobre, 2019.
    ITAB Academy centre avec des formateurs au point sur les différentes formations mon expérience au sein de cette établissement était très riche.
    alfousseyni.keita.@yahoo.com Keita
    alfousseyni.keita.@yahoo.com Keita
    20. Octobre, 2019.
    Tout d'abord, je dois avouer que le local est très propice pour l'apprentissage. J'ai fait la formation big data et Machine Learning et je dois avouer que le formateur est très compétant et il sait de quoi il parle et cela est largement suffisant.

    Quelques références

    1 490 790 HT ( Net de taxe car « exonérée de TVA — Art. 261.4.4 a du CGI »)Ajouter au panier