R: Initiation et Analyses statistiques

4 jours II Code CNCP : 2234 II Certif info : 93835

/R: Initiation et Analyses statistiques

Le langage R est à la fois un langage de programmation et un logiciel de statistique très riche de fonctionnalités.

Cette formation va vous permettre de voir toutes les concepts du langage R afin de l’utiliser pour les analyses statistiques et les représentations graphiques de grande qualité. Il est systématiquement associé à l’installation de la plateforme Big Data et particulièrement performant pour la manipulation des données, le calcul et l’affichage des graphiques.

Les objectifs de la formation R: Initiation et Analyses statistiques

A l’issue de la formation «R : Initiation et Analyses statistiques», les apprenants auront les capacités de :

  • Installer l’environnement d’analyse R
  • Utiliser la console de R, et les environnements de travail Tinn-R et R Studio
  • Créer et regrouper plusieurs types d’objets de R
  • Créer des programmes d’analyse avec R
  • Élaborer des graphiques avec R
  • Utiliser les packages de R pour mettre en oeuvre des modélisations statistiques (régression, ACP..)
Lien vers site CPF

Les prérequis de la formation R: Initiation et Analyses statistiques

Connaître l’utilité du Data Mining et les problématiques du Big Data dans les approches statistiques

Avoir des connaissances de base en statistiques (régressions, analyse en composantes principales, classification)  et également des connaissances de base en programmation.

Vous n’avez pas les prérequis nécessaires pour la formation R: Initiation et Analyses statistiques ? Contactez-nous pour étudier ensemble un parcours sur mesure et garantir ainsi la réussite de votre projet.

Lien vers site CPF

Le public de la formation R: Initiation et Analyses statistiques

La formation certifiante « R : Initiation et Analyses statistiques », s’adresse à tout public salarié, demandeur d’emploi ou en reconversion professionnelle et souhaitant acquérir des compétences en BIG DATA, notamment:

  • Data Scientist / Data Miner
  • Débutant en R
  • Statisticien
  • Marketer spécialiste de la data
  • Utilisateur de bases de données intéressé par l’analyse
  • Responsable système d’informations
  • Développeurs informatiques, ingénieurs d’études
  • Architecte système et logiciel
  • Data scientist (analyse de données) ou Data miner (fouilleur des données)
Lien vers site CPF

0

Certif Info

0

Code CNCP

0

Jours

0

Heures

Contenu de la formation
R: Initiation et Analyses statistiques

Introduction

  • Histoire de R
  • R et l’analyse statique
  • Avantages et inconvénients

Notions de programmation R

  • Utilisation de la console R
  • Apprendre l’environnement
  • Rédaction et exécution de scripts
  • Programmation orientée objet
  • Les objets de type vecteurs, matrix, array, factor, data.frame, list.
  • Manipulation des objets, classe d’objet, fonctions spécifiques, jointure.
  • Sauvegarde, suppression de mémoire.
  • Notions de boucle (for et while), condition (if), switch.
  • Calculs véctorisés
  • Frameworks , Paquets de données
  • Conditions et comparaisons
  • Formules
  • Structures conditionnelles
  • Vectorisation
  • Expressions régulières
  • R Markdown : les rapports automatisés

Atelier Pratique

Atelier Pratique

Manipulation de données

  • Visualiser ses données
  • Recodage de variables
  • Manipuler les données avec dplyr
  • Manipulations avancées avec data.table
  • Tris
  • Sous-ensembles
  • Fusion de tables
  • Gestion des dates
  • Fonctions à fenêtre
  • Manipuler du texte avec stringr
  • Réorganiser ses données avec tidyr
  • Scraping

Exportation

  • Export de données
  • Export de graphiques

Manipulation des dates en R

  • Date et DateTime en R
  • Formatage des dates pour la modélisation

Flux de contrôle

Flux de contrôle

Atelier Pratique

Atelier Pratique

Analyse et statistiques avec R

Analyse et statistiques avec R

Statistiques introductives

  • Statistique univariée
  • Statistique bivariée
  • Introduction à ggplot2, la grammaire des graphiques
  • Graphiques univariés et bivariés avec ggplot2
  • Données pondérées

Statistiques intermédiaires

  • Intervalles de confiance
  • Comparaisons (moyennes et proportions)
  • Définir un plan d’échantillonnage complexe
  • Régression linéaire
  • Régression logistique binaire, multinomiale et ordinale
  • Analyse des correspondances multiples (ACM)
  • Classification ascendante hiérarchique (CAH)

Statistiques avancées

  • Effets d’interaction dans un modèle
  • Introduction à l’analyse d’enquêtes avec R et RStudio
  • Approfondir Multicolinéarité dans la régression .
  • Analyse de survie .
  • Analyse de séquences
  • Trajectoires de soins : un exemple de données longitudinales
  • Analyse de réseaux
  • Analyse spatiale

Fondamentaux de l’analyse de données.

  • Présentation de la notion de package (librairie).
  • Cas de la régression non linéaire multiple.
  • Cas de l’analyse en composantes principales ACP.
  • Cas de la classification CAH. 

Fonctions en profondeur

  • Paramètres
  • Valeurs de retour
  • Portée variable
  • Gestion des exceptions.

Atelier Pratique

Atelier Pratique

Application de fonctions à travers les dimensions

  • Sapply
  • Lapply
  • apply

Analyse des données exploratoires (statistiques descriptives)

  • Données continues
  • Données catégorisées
  • Groupe par calcul avec dplyr
  • Mélange et casting de données.

Statistiques déductives

  • Corrélation bivariée
  • T-test et équivalents non paramétriques
  • Test Chi-quadrillé

Graphiques de base

  • Système graphique de base en R
  • Scatterplots, histogrammes, barcharts, …
  • Étiquettes, légendes, titres, axes
  • Exportation de graphiques vers différents formats

Graphiques R avancés : ggplot2

  • ggplot2 et la grammaire des graphiques
  • Emplacements rapides (fonction qplot)
  • Construction de graphiques par pièces (fonction ggplot).
  • ggplot2 et la grammaire des graphiques
  • Étendre ggplot2
  • Combiner plusieurs graphiques
  • Graphiques interactifs
  • lattice : graphiques et formules
  • Cartes

Régression linéaire générale

  • Modèles linéaires et logistiques
  • Points de régression
  • Confusion / interaction en régression
  • Marquer de nouvelles données à partir de modèles (prédiction)

Atelier Pratique

Atelier Pratique

Une attestation d’assiduité sera délivrée après la validation de toutes les compétences du module R: Initiation et Analyses statistiques.

Modalités De Formations

R: INITIATION ET ANALYSES STATISTIQUES

Le module R: INITIATION ET ANALYSES STATISTIQUES est disponible en 3 modalités : E-learning tutoré, Blended Learning et en présentiel.

FOAD / E-Learning tutoré

La formation certifiante R: Initiation et Analyses statistiques est disponible en e-learning ou à distance tutoré. Vous serez accompagné par un formateur / tuteur tout au long de la formation.

Blended-Learning

La formation certifiante R: Initiation et Analyses statistiques est disponible en Blended learning. La partie apprentissage se déroule en e-learning, et les projets fil rouge en présentiel.

Présentiel

La formation certifiante R: Initiation et Analyses statistiques est disponible en présentiel ou en distanciel.
La formation sera animée par un formateur à distance ou en classe.

Financement et Éligibilité

de la formation R: INITIATION ET ANALYSES STATISTIQUES

CPF

CPF « Compte Personnel de Formation.

VAE

VAE: Validation des Acquis de l’Expérience.

AIF

AIF : Aide Individuelle à la Formation par Pôle Emploi.

CPF de transition

CPF de transition pour une Reconversion Professionnelle.

Contrat PRO

Contrat d’alternance ou de Professionnalisation.

POEc

Préparation Opérationnelle Emploi Collective.

PDC

Plan de Développement de Compétences de l’entreprise.

AFPR

Action de Formation Préalable à l’Embauche.

POEi

Préparation Opérationnelle Emploi Individuelle.

Besoin d'un