Bases en analyses statistiques avec R

Informatique, SIG, modélisation, statistiques
L’analyse des données est omniprésente dans le travail de recherche. Malheureusement, la mauvaise conception d’une expérience ou une mauvaise analyse de données peuvent mener à l’absence de résultats interprétables ou à des conclusions erronées. Comprendre les concepts de base de la statistique est essentiel pour une conduite efficace d’un projet de recherche. Associée à cela, l’utilisation du logiciel R permet des analyses simples, rapides et reproductibles.

Objectifs

A l’issue du stage, vous serez capables d’analyser, de façon autonome, des jeux de données simples à l’aide du logiciel R

Objectifs opérationnels :

  • distinguer les différents types de variables et leurs distributions et identifier les relations entre variables
  • explorer, décrire et visualiser vos données avec R
  • appliquer des tests statistiques de base avec R
  • garantir la traçabilité et la reproductibilité des analyses
  • concevoir des plans d’expérience ou d’échantillonnage, en dialogue avec un statisticien

Public

Cette formation s’adresse aux techniciens (>Bac+2), ingénieurs ou chercheurs souhaitant acquérir des bases en analyse de données avec R, pour une utilisation pratique par la suite.

Les candidatures comprenant un CV détaillé, une lettre de motivation, et des indications sur l’organisme de gestion de la bourse, doivent être adressées par mél à : formation-emvt-fvi@cirad.fr

Le Cirad n’est pas en mesure d’accorder des bourses. Il convient donc d’introduire, le plus tôt possible, une demande auprès des autorités compétentes nationales en charge de l’élevage et/ou de l’octroi des bourses ; des Services de Coopération et d’Action Culturelle des Ambassades de France (SCAC) ; des ambassades d’autres pays ; d’organismes internationaux (FAO, PNUD, Union européenne, AIEA, BID…) ; de projets de développement ou d’organisations non gouvernementales.

Langue

Français, anglais sur demande

Programme

Jour 1
  • Présentation du module : points forts des analyses statistiques avec R
  • Notion de variables aléatoires et distribution à partir de données expérimentales
  • Prise en main de R, environnement de travail, explorations de fichiers de données
  • Visualisation de données avec R
Jour 2
  • Principes d’un test statistique, test de Student
  • Mise en pratique d’un test avec R, interprétation des résultats
  • Visualisation des données, exporter des figures et un rapport de résultats
  • Traçabilité des analyses et des fichiers
Jour 3
  • Utilisation de tests adaptés au dispositif expérimental
  • Mise en pratique avec R : test de Student (suite), Chi², tests non paramétriques
  • Plan expérimental : cofacteurs et puissance statistique
  • Mise en pratique avec R de l’exploration de données complexes
Jour 4
  • La régression linéaire : principe, conditions d’application et mise en œuvre avec R
  • Analyse de variance : principe et conditions d’application et mise en œuvre avec R
  • Visualisation avancée des données
  • Utilisation d’internet pour rechercher de nouvelles fonctions
Jour 5
  • La régression logistique : principe, conditions d’application et mise en œuvre avec R
  • Mise en situation : exercices pratiques d’exploration, visualisation et analyses de données
  • Évaluation finale du module

Cette formation se déroule sur une semaine à temps plein.

Intervenants

S. Thévenon - unité de recherche InterTryp

Prérequis

  • Savoir manipuler des fichiers sous Excel.
  • Idéalement, avoir un jeu de données à analyser ou avoir une expérience à planifier ou en cours, pour une analyse à court terme

Matériel pédagogique

Présentations théoriques en PowerPoint, en alternance avec des travaux pratiques dirigés sur ordinateur de manipulation de l’outil R, avec des jeux de données simulés ou réels et des scripts R préétablis

Mise à disposition d’une salle équipée d’au moins un ordinateur pour 2 participants.