Analyser les Big Data

Analyser les Big Data

Analyser les Big Data

Type(s) : PED
Durée : 3 Jours – 21 Heures

Pré-requis

Avoir de l’expérience dans l’utilisation de R. -Connaître les méthodes de statistiques courantes et les meilleures pratiques des analyses de données.-Avoir des connaissances de base sur le système d’exploitation Windows et ses fonctionnalités principales.-Travailler régulièrement sur des bases de données relationnelles.

Objectif de la formation

Expliquer comment Microsoft R Server et Microsoft R client travaillent

Utiliser R client et R Server pour explorer les Big Data dans différents magasins de données

Visualiser les données via les graphiques et les plots

Transformer et nettoyer des jeux de données Big Data

Mettre en œuvre les options pour répartir les travaux d’analyse dans des tâches parallèles

Créer et évaluer des modèles de régression générés à partir des données Big Data

Créer, compter et déployer des modèles de partitionnement générés à partir des données Big Data

Utiliser R dans des environnements SQL Server et Hadoop

Public concerné

Cette formation s’adresse aux personnes qui souhaitent analyser un grand nombre de données à l’intérieur d’un environnement Big Data, ainsi qu’aux développeurs qui souhaitent intégrer des analyses R dans leurs solutions.

 

Profil du formateur

Formateur consultant, expert, pédagogue et certifié dans son domaine

Méthode pédagogique

La formation est constituée d’apports théoriques et d’exercices pratiques. Chaque stagiaire dispose d’un poste de travail et la gestion en petit groupe (jusqu’à 8 stagiaires) permet un suivi individualisé et adapté. Durant les sessions de formation, un support pédagogique est remis aux stagiaires.

Suivi, évaluation, sanction

Des tours de table permettent de suivre la progression du stagiaire au fur et à mesure de la formation. Un suivi de la formation est réalisé par une feuille de présence émargée par demi-journée par les stagiaires et le formateur. Un questionnaire de satisfaction et une validation des acquis sont complétés par chaque stagiaire en fin de formation.

Formation sans certification.

Plan du cours

Microsoft R Server et Microsoft R Client

  • Qu’est-ce que Microsoft R Server ?
  • Utiliser Microsoft R Client
  • Les fonctions ScaleR

Exploration de la Big Data

  • Comprendre les sources de données ScaleR
  • Lire les données dans un objet XDF
  • Résumer les données dans un objet XDF

Visualisation de la Big Data

  • Visualiser les données en mémoire
  • Visualiser la Big Data

Traitement de la Big Data

  • Transformer la Big Data
  • Gérer les jeux de données

Parallélisation des opérations d’analyses

  • Utiliser le contexte de calcul RxLocalParallel avec rxExec
  • Utiliser le package revoPemaR

Création et évaluation des modèles de régression

  • Appliquer des algorithmes sur Big Data
  • Générer des modèles de régression et effectuer des prévisions

Création et évaluation des modèles de partitionnement

  • Créer des modèles de partitionnement basés sur les arbres décisionnels
  • Modèles de partitionnement en effectuant et comparant les prévisions

Traitement de la Big Data dans SQL Server et Hadoop

  • Utiliser R dans SQL Server
  • Utiliser Hadoop MapReduce
  • Utiliser Hadoop Spark

 

 

Nous contacter

AMS Formation (France)
03 83 67 63 05
22 Rue de Medreville
54000 Nancy – France

AMS Formation (Luxembourg)
00 352 26 10 22 58
145, route de Pétange
L-4645 Niederkorn – Luxembourg

ams-formation@ams-training.com

Suivez-nous

Retrouvez toute l'actualité d'AMS Formation sur les réseaux sociaux.