Big Data avec Apache Spark 2.4.4

Affiche
Intervenants
Presentation & Déroulement
Programme
Matérials & Pre-requis
Tarifs

Intervenants

  • Pr. Hicham HAJJI, IAV, Rabat, Morocco
  • Pr. Hassan BADIR, ENSA Tangier, Morocco

Présentation

  • Au marge de la conférence INTIS 2019, une formation sur le Big Data et Spark est organisée afin de présenter les concepts fondamentaux autour de la plateforme Spark (Version 2.4,4), et de montrer comment une architecture basée sur Spark peut résoudre des problématiques avancés liées au Big Data. Des démonstrations avec Spark 2.4.4 seront assurées lors de cette formation. Cette formation est ouverte aux ingénieurs et doctorants souhaitant acquérir des techniques avancées pour la gestion de données massives dans le cadre de leurs entreprises et travaux de recherche.

Déroulement

  • 9h: Accueil & Inscription
  • 9h30: Formation
  • 12h30: Déjeuner
  • 13h30: Formation
  • 17h: Pause Café
  • 17h30: Remise des certificats

Programme / Agenda

    La formation prévoit de faire un tour d’horizon de la technologie Spark et de montrer comment elles peuvent résoudre les problématiques de gestion de données massives.
  • - Spark Core et RDD : Nous présenterons les concepts de base de la plateforme Spark. Ainsi un tour d’horizon sera fait autour de termes comme RDD, actions, transformations, Job, Stage … Un intérêt particulier sera porté sur l’abstraction RDD Resilient Distributed Dataset qui a été la première abstraction à être proposée pour réaliser les calculs parallèles avec Spark.
  • Spark SQL - DataFrame et DataSet : Cette partie portera sur deux nouvelles abstractions proposées par Spark pour le traitement Big Data : Dataframe et le DataSet. Dans le cadre de cette partie, une analyse détaillée des deux APIs accompagnant ces abstractions est présentée, ainsi que l’architecture du module Spark SQL
  • - Modèle d'exécution de Spark : Nous allons présenter le modèle d’exécution de Spark, ses composantes, ses interactions, et comment comprendre le cycle de vie requête Spark en utilisant l’API RDD. Les techniques d’optimisations présentés dans cette partie sont notamment le Partitionnement et le Shuffling
  • - Spark et Machine learning : Il sera présenté dans cette partie l’utilisation du Machine learning dans Spark avec l’utilisation du Module Spark MLlib qui se base sur l’utilisation de Dataframe comme backend API. Quelques algorithmes ML comme la régression, Decision Tree et Random Forest seront abordés dans cette partie.

Materiels necessaires

  • PC avec reseau
  • autres

niveau et pre-requis

  • Notion en programmation
  • Notion en Base de données

Tarifs

  • 750 Dhs pour la formation
  • 1500 Dhs Formation et Conférence INTIS

R FOR DATA SCIENCE

Intervenants
Presentation
Programme
matérials
Pre-requis
Réferences

Intervenants

  • Pr. Hicham HAJJI, IAV Rabat, Morocco
  • Pr. Said LAHSSINI
  • hicham Mharzi Alaoui

Présentation

    R s’impose comme un des langages pour la science des données. Les possibilités qu’il offre pour l’acquisition, l’analyse, la modélisation, la présentation et la diffusion en font aujourd’hui un choix incontournable en sciences de données. La clarté et l’accessibilité de sa syntaxe, son caractère open source et sa capacité à s’intégrer à des infrastructures techniques robustes en font un choix de prédilection. L’objectif principal de cette formation est de donner un avant-gout sur l’apport de R en sciences de données avec une attention particulière à la question des données massives. A travers des cas pratiques, le point sera mis sur les différents maillons de la démarche synoptique en sciences de données : acquisition, préparation, exploration, visualisation, modélisation et communication. Les participants auront la possibilité de se familiariser avec l’environnement de développement de R, la logique du langage et de certaines packages incontournables pour les sciences de données.

Programme / Agenda

  • à communiquer

Materiels necessaires

  • PC avec reseau
  • autres

niveau et pre-requis

  • Notion en programmation
  • Notion en Base de données
  • TBC

Lies Utils

  • TBC

Contact Us

Hassan BADIR.

Address

ENSA Tangier, Capus Ziaten, Tangier 90000, Morocco

Phone Number

+212 53930000