Formations au coeur des technologies

Essayer, tester, échanger les bonnes pratiques, partager les retours d'expériences, ...
toutes nos formations sont disponibles à distance (classes virtuelles) et en centre de formation (présentiel), au choix.
Vous pouvez même changer de modalité en cours de formation, si vous avez des contraintes : par exemple, commencer en présentiel et continuer les jours suivants à distance.
Les outils pédagogiques et l'infrastructure de travaux pratiques mis à disposition sont accessibles depuis nos locaux, ou depuis votre entreprise ou votre lieu de télétravail, à volonté
N'hésitez pas à tester nos formations et nos serious games !

Formation : Les fondamentaux de l'analyse statistique avec R

Durée2 jours
Code coursCB052
Dates4 au 5 décembre

(cliquez sur une date pour vous inscrire)

Public:

Ingénieurs, Data analysts, statisticiens, développeurs en environnement statistique ou toute personne intéressée par l'analyse statistique avec R

Objectifs:

A l’issue de la formation, le stagiaire sera capable de réaliser une analyse statistique avec le logiciel R et d’en restituer les résultats sous forme graphique.

Connaissances préalables nécessaires:

avoir des connaissances de base en statistiques

Objectifs pédagogiques:

  • Savoir installer et utiliser l’environnement d'analyse R
  • Comprendre comment manipuler des données avec R
  • Savoir importer et exporter des données
  • Savoir reconnaître les différents types d'objets de R
  • Créer des programmes d'analyse avec R
  • Être en mesure de réaliser des analyses statistiques basiques avec R
  • Savoir restituer des résultats à l'aide de graphiques

Déroulé pédagogique


Savoir installer et utiliser l’environnement d'analyse R
Durée : 3h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Le projet R Programming. R Project.
Utilisation de R en mode commande.
Commandes de base. Syntaxe de base. Interfaces et environnements : RStudio, Jupyter.
Opérations de base. Expressions, variables, types de données, nombres, chaînes de caractères,
Atelier : installation et tests d'une plateforme R

Atelier : travail sur les chaînes de caractères et sur les types scalaires.


Comprendre comment manipuler des données avec R
Durée : 2h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Base de R : tests, boucles, fonctions.
Transformations de données, conversions de types.
Fonctions mathématiques de base.
Atelier : conversion de données numériques en texte. conversion de données texte en nombres


Savoir reconnaître les différents types d'objets de R
Durée : 2h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Manipulations de nombres, vecteurs, tableaux, matrices, listes, factors.
Liste et DataFrames : Définitions, cas d'utilisation.
Attachement, détachement. Chargement d'un dataframe. La fonction scan.
Tableaux et matrices : Déclaration, dimensionnement, indexation.
Opérations de base : produit de tableaux, transposition, produits de matrices.
Matrices : équations linéaires, inversion, valeur propre, vecteur propre, déterminant, moindre carré, ...
Atelier : exercices sur les objets R : matrice, vecteur


Savoir importer et exporter des données
Durée : 2h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Import/export : formats texte, csv, xml, binaire, largeur fixe, images (jpeg, png).
Encodage. Filtrage. Bibliothèques : rjson, readr, xml2.
Interfaçage avec le BigData : SparkR
Transformation d'un dataframe R en un dataframe Spark.
Importation SQL. Importation depuis un socket réseau.
Atelier : importation de données géodésiques et export au format Json


Créer des programmes d'analyse avec R
Durée : 2h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Structure générale d'un programme d'analyse. Découpage en sections métiers. Notion d'ETL.
Fonctions spécifiques : définition de nouvelles fonctions. Appels. Passage d'argument.
Construction d'une bibliothèque.
Diffusion, installation avec R CMD INSTALL.
Atelier : construction d'un programme de calcul de moyennes en trois parties : chargement, calcul, restitution


Être en mesure de réaliser des analyses statistiques basiques avec R
Durée : 2h
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Statistiques : Distributions embarquées : uniforme, normale, poisson, exponentielle, ...
Calculs statistiques. Modèles statistiques.
Atelier : analyse statistique d'une population


Savoir restituer des résultats à l'aide de graphiques
Durée : 1h30
Méthodes pédagogiques : alternance de théorie et de travaux pratiques
Matériels et moyens : vidéo-projecteur en présentiel, tableau partagé en classe virtuelle, infrastructure distribuée serveurs Linux
Affichage en graphes, histogrammes : Plot, Line, Pie Charts, Scatterplot, Bars.
Atelier : affichage des données de l'atelier précedent sous forme de nuage de points.



Retour au descriptif
Modalités et délais d'accès
Méthodes mobilisées