SlideShare uma empresa Scribd logo
1 de 153
Baixar para ler offline
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Atelier sur le logiciel R
Un introduction `a la programmation en R
Sahir Rai Bhatnagar1
29 juillet 2015
1
https://github.com/sahirbhatnagar/atelier-R-GERAD
1 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Programmation de la journ´ee
• 09H00 : D´ebut de l’atelier
• 10H00 - 10H20: pause
• 12H00 - 13H00: lunch
• 15H00 - 15H20: pause
• 17H00 : fin de l’atelier
2 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Remerciements
• John Chambers
• Ross Ihaka et Robert
Gentleman
• Greg Voisin
• Dr. Vahid Partovi Nia
• Toi
3 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Avis #1
• Ceci est une introduction au langage R
4 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Avis #1
• Ceci est une introduction au langage R
• On va faire beaucoup d’exercices
4 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Avis #1
• Ceci est une introduction au langage R
• On va faire beaucoup d’exercices
• N’h´esitez pas `a posez des questions
4 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Avis #2
Je n’ai aucune relation commerciale avec ces logiciels
5 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Avis #3
• Le mat´eriel pour cet atelier est bas´e sur plusieurs
ressources
• Voir ce lien pour une liste compl`ete de r´ef´erences:
https://github.com/sahirbhatnagar/atelier-R-GERAD
• Je vous sugg`ere les livres de Vincent Goulet et Hadley
Wickham
6 / 94
C’est parti
Apr`es cet atelier vous devriez ˆetre capables de
• Comprendre, cr´eer et modifier les 4 objets de bases en R
(vector, data.frame, matrix, list)
• Utiliser des fonctions de bases
• Importer un jeux de donn´ees `a partir d’un fichier externe
• Cr´eer un graphique
1. Pr´esentation du langage R
Objectifs du chapitre
1 Comprendre les avantages d’apprendre R
2 Connaˆıtre la provenance du R et ses caract´eristiques
3 D´emarrer une session R et ex´ecuter des commandes
simples
4 Cr´eer, modifier et sauvegarder ses propres fichiers de
script R
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Pourquoi vous ˆetes l`a?
11 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Le langage R gagne en popularit´e
Les meilleurs langages de programmation en 2015 selon
IEEE Spectrum
12 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Plus de 100 000 questions pos´ees dans les forums
13 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Nombre d’emplois
r´ef´erence: http://r4stats.com/articles/popularity/
14 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Utilis´e dans plusieurs domaines
Publi´e dans Nature
15 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Analyser vos donn´ees
• Plusieurs ressources d’outils statistiques
• Repr´esenter graphiquement des jeux de donn´ees
multivariables
• Int´egrer votre code R dans des applications web
• Assurer la reproductivit´e de vos analyses
16 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Bref historique
17 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
`A l’origine de R fut le S par John M. Chambers
Figure 1 : S, un langage pour programmer avec des donn´ees,
developp´e chez Bell Laboratories dans les ann´ees 1970 par une ´equipe
de chercheurs men´ee par John M. Chambers
18 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Cr´eateurs
Figure 2 : Inspir´es par le S, Ross Ihaka (gauche) et Robert
Gentleman (droite) de l’Universit´e d’Auckland en Nouvelle-Z´elande
ont lanc´e la premi`ere version de R en 1996
19 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Logiciel Libre
• 1990-2010: le S a principalement ´et´e popularis´e par une
mise en oeuvre commerciale nomm´ee S-PLUS
20 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Logiciel Libre
• 1990-2010: le S a principalement ´et´e popularis´e par une
mise en oeuvre commerciale nomm´ee S-PLUS
• Fin des ann´ees 2000: L’utilisation de S-PLUS diminue en
faveur du R, surtout dans les milieux acad´emiques
20 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Logiciel Libre
• 1990-2010: le S a principalement ´et´e popularis´e par une
mise en oeuvre commerciale nomm´ee S-PLUS
• Fin des ann´ees 2000: L’utilisation de S-PLUS diminue en
faveur du R, surtout dans les milieux acad´emiques
• 2 raisons qui ont fortement contribu´e `a la perte d’influence
de S-PLUS
1 Disponible gratuitement
20 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Logiciel Libre
• 1990-2010: le S a principalement ´et´e popularis´e par une
mise en oeuvre commerciale nomm´ee S-PLUS
• Fin des ann´ees 2000: L’utilisation de S-PLUS diminue en
faveur du R, surtout dans les milieux acad´emiques
• 2 raisons qui ont fortement contribu´e `a la perte d’influence
de S-PLUS
1 Disponible gratuitement
2 Ouvert aux contributions de tous
20 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Caract´eristiques de R
21 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Langage de programmation orient´ee objet
• Cela permet de facilement trouver et r´e-utiliser les
r´esultats de tes analyses
22 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Langage de programmation orient´ee objet
• Cela permet de facilement trouver et r´e-utiliser les
r´esultats de tes analyses
• Une fonction peut compl´eter plusieurs tˆaches
22 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Langage de programmation interpr´et´e
• Langage de programmation interpr´et´e (versus C, C++,
JAVA)
• Plus accessible qu’un langage compil´e → ce qui permet
aux ´economistes, ´ecologistes, biologistes, statisticiens,
´epid´emiologistes, etc. d’utiliser R
23 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Langage de programmation interpr´et´e
• Langage de programmation interpr´et´e (versus C, C++,
JAVA)
• Plus accessible qu’un langage compil´e → ce qui permet
aux ´economistes, ´ecologistes, biologistes, statisticiens,
´epid´emiologistes, etc. d’utiliser R
• Le programme que l’on lance pour utiliser R est l’interpr`ete
23 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Langage de programmation interpr´et´e
• Langage de programmation interpr´et´e (versus C, C++,
JAVA)
• Plus accessible qu’un langage compil´e → ce qui permet
aux ´economistes, ´ecologistes, biologistes, statisticiens,
´epid´emiologistes, etc. d’utiliser R
• Le programme que l’on lance pour utiliser R est l’interpr`ete
• Celui-ci prend des commandes en R qu’il ex´ecutera
imm´ediatement
23 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Langage de programmation interpr´et´e
• Langage de programmation interpr´et´e (versus C, C++,
JAVA)
• Plus accessible qu’un langage compil´e → ce qui permet
aux ´economistes, ´ecologistes, biologistes, statisticiens,
´epid´emiologistes, etc. d’utiliser R
• Le programme que l’on lance pour utiliser R est l’interpr`ete
• Celui-ci prend des commandes en R qu’il ex´ecutera
imm´ediatement
• Autre exemple: Python
23 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Logiciel libre (Open Source)
• D´eveloppement actif pour la cr´eation de nouveaux outils
dans plusieurs domaines
• https://cran.r-project.org/web/views/
• Facilement voir le code des autres avec GitHub
• http://www.r-pkg.org/
• Bien documenter avec beaucoup de ressources gratuites
disponibles sur l’internet
• stackoverflow
• http://www.rdocumentation.org/
• http://www.r-bloggers.com/
• twitter
• R user groups
• Google
24 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Outil statistique qui optimize l’approche matricielle
• Langage bas´e sur la notion de vecteur, ce qui simplifie les
calculs math´ematiques (non seulement la computation
mais l’´ecriture aussi)
25 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Outil statistique qui optimize l’approche matricielle
• Langage bas´e sur la notion de vecteur, ce qui simplifie les
calculs math´ematiques (non seulement la computation
mais l’´ecriture aussi)
• R´eduit consid´erablement le recours aux structures
it´eratives (boucles for, while , etc.)
25 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Outil statistique qui optimize l’approche matricielle
• Langage bas´e sur la notion de vecteur, ce qui simplifie les
calculs math´ematiques (non seulement la computation
mais l’´ecriture aussi)
• R´eduit consid´erablement le recours aux structures
it´eratives (boucles for, while , etc.)
R code 1.1
c(1,2,3) + c(4,5,6)
## [1] 5 7 9
25 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
O`u trouver de l’aide pour une fonction
• ?nom_de_la_fonction
26 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
O`u trouver de l’aide pour une fonction
• ?nom_de_la_fonction
R code 1.2
# l'aide pour la fonction de r´egression lin´eaire 'lm'
?lm
26 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La rubrique d’aide
• Usage: le nom de la fonction, tous ses arguments et les
valeurs par d´efaut
27 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La rubrique d’aide
• Usage: le nom de la fonction, tous ses arguments et les
valeurs par d´efaut
• Value: le type d’objet retourn´e par la fonction
27 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
D´emarrer une session
28 / 94
R code 1.3
# D´emarrer l'interface pour la documentation
# et naviguer les diff´erentes ressources
help.start()
# trouver l'aide pour la fonction rnorm
?rnorm
# Connaitre le r´epertoire de travail
getwd()
R code 1.4
# On additionne
39 + 3
# On soustrait
58 - 16
# On multiplie
6 * 7
# Et on peut m^eme diviser
8 / 3
R code 1.5
# G´en´erer deux vecteurs de nombres pseudo-al´eatoires
# issus d’une loi normale centr´ee r´eduite.
x <- rnorm(50)
y <- rnorm(50)
# Graphique des couples (x, y)
plot(x, y)
# Graphique d'un histogramme de x
hist(x)
R code 1.6
# voir la mati`ere de x
x
# voir les objets de votre workspace
ls()
# supprimer les deux vecteurs x et y
rm(x,y)
# voir la mati`ere de x
x
# voir les objets de votre workspace
ls()
R code 1.7
# G´en´erer la suite 1, 2, ..., 20.
x <- 1:20
# cr´eer un autre vecteur en fonction de x
y <- 2*x+3
# cr´eer un data frame de deux colonnes et
# voir sa mati`ere
dt <- data.frame(x, y)
dt
# estimer un mod`ele lin´eaire et voir les
# r´esultats
fit <- lm(y ~ x, data = dt)
summary(fit)
2. Bases du langage R
Objectifs du chapitre
1 Comprendre ce qui est un fonction et comment l’utiliser
2 Identifier les principaux types d’objets dans R: vector,
matrix, data frame et list
3 Cr´eer et manipuler ces objets
4 Importer des fichiers .txt et .csv
5 Installer un package
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Les fonctions
36 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
D´efinition et appel de fonctions
• Plutˆot que d’´ecrire plusieurs lignes de codes pour des
choses assez simples et r´ep´etitives on fait appel `a des
fonctions
37 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
D´efinition et appel de fonctions
• Plutˆot que d’´ecrire plusieurs lignes de codes pour des
choses assez simples et r´ep´etitives on fait appel `a des
fonctions
• Une fonction est caract´eris´ee par deux composantes:
37 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
D´efinition et appel de fonctions
• Plutˆot que d’´ecrire plusieurs lignes de codes pour des
choses assez simples et r´ep´etitives on fait appel `a des
fonctions
• Une fonction est caract´eris´ee par deux composantes:
1 son nom: c’est ce nom qui nous permettra d’appeler
la fonction
37 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
D´efinition et appel de fonctions
• Plutˆot que d’´ecrire plusieurs lignes de codes pour des
choses assez simples et r´ep´etitives on fait appel `a des
fonctions
• Une fonction est caract´eris´ee par deux composantes:
1 son nom: c’est ce nom qui nous permettra d’appeler
la fonction
2 une liste d’arguments: ce sont les informations dont
la fonction a besoin pour travailler et renvoyer son
r´esultat
37 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La syntaxe pour appeler une fonction
• Il faut ´ecrire son nom suivi de parenth`eses
38 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La syntaxe pour appeler une fonction
• Il faut ´ecrire son nom suivi de parenth`eses
• Entre ces parenth`eses, nous indiquerons les arguments
dont la fonction a besoin:
nom_de_la_fonction(arguments)
38 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La syntaxe pour appeler une fonction
• Il faut ´ecrire son nom suivi de parenth`eses
• Entre ces parenth`eses, nous indiquerons les arguments
dont la fonction a besoin:
nom_de_la_fonction(arguments)
R code 2.1
# chercher la rubrique d'aide pour racine carr´ee
?sqrt
# on voit que la fonction prend un argument
sqrt(49)
38 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Arguments facultatifs
• Certaines fonctions n´ecessitent plusieurs arguments et
certains de ces arguments sont optionnels (aussi possible
d’avoir aucun argument: getwd())
39 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Arguments facultatifs
• Certaines fonctions n´ecessitent plusieurs arguments et
certains de ces arguments sont optionnels (aussi possible
d’avoir aucun argument: getwd())
• Les arguments optionnels poss`edent une valeur par d´efaut
39 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Arguments facultatifs
• Certaines fonctions n´ecessitent plusieurs arguments et
certains de ces arguments sont optionnels (aussi possible
d’avoir aucun argument: getwd())
• Les arguments optionnels poss`edent une valeur par d´efaut
• Si on ne sp´ecifie pas de valeur, ces arguments prendront la
valeur d´efinie par d´efaut, sinon ils prendront la valeur
sp´ecifi´ee
39 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Arguments facultatifs
• Certaines fonctions n´ecessitent plusieurs arguments et
certains de ces arguments sont optionnels (aussi possible
d’avoir aucun argument: getwd())
• Les arguments optionnels poss`edent une valeur par d´efaut
• Si on ne sp´ecifie pas de valeur, ces arguments prendront la
valeur d´efinie par d´efaut, sinon ils prendront la valeur
sp´ecifi´ee
R code 2.2
# chercher la rubrique d'aide pour logarithme
?log
# on ne pr´ecise pas de valeur pour le second argument
log(2)
# On peut sp´ecifier le second argument en l'appelant par son nom
log(2, base = exp(1)) 39 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Les objets R
40 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Les objets R
Table 1 : Les principaux objets en R et le nom de
leurs fonctions
dimension homog`enea
h´et´erog`eneb
1d Atomic vector List
c() list()
2d Matrix Data frame
matrix() data.frame()
a
tous les ´el´ements doivent ˆetre du mˆeme type
b
les ´el´ements peuvent ˆetre de diff´erents types
41 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Atomic vectors
• En R, `a toutes fins pratiques, tout est un vecteur
42 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Atomic vectors
• En R, `a toutes fins pratiques, tout est un vecteur
• La fonction de base pour cr´eer un vecteur est c()
(concat´enation)
42 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Atomic vectors
• En R, `a toutes fins pratiques, tout est un vecteur
• La fonction de base pour cr´eer un vecteur est c()
(concat´enation)
R code 2.3
c(1, 2, 5)
## [1] 1 2 5
42 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Atomic vectors
• Les quatre types d’atomic vectors les plus utilis´es:
1 double (´egalement appel´e numeric)
2 integer
3 character
4 logical
43 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Atomic vectors
• Les quatre types d’atomic vectors les plus utilis´es:
1 double (´egalement appel´e numeric)
2 integer
3 character
4 logical
R code 2.4
c(1, 2.5, 4.5) # numeric
c(1L, 6L, 10L) # integer
c("ceci sont", "des characters") #character
c(TRUE, FALSE, T, F) # logical
43 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Coercion
• Tous les ´el´ements d’un atomic vector doivent ˆetre du
mˆeme type
44 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Coercion
• Tous les ´el´ements d’un atomic vector doivent ˆetre du
mˆeme type
• Lorsque vous essayez de combiner diff´erents types, ils
seront convertis au type le plus flexible
44 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Coercion
• Tous les ´el´ements d’un atomic vector doivent ˆetre du
mˆeme type
• Lorsque vous essayez de combiner diff´erents types, ils
seront convertis au type le plus flexible
• Types du moins au plus flexible sont:
1 logical
2 integer
3 double
4 character
R code 2.5
# combiner un character et integer donne un character
str(c("a", 1))
## chr [1:2] "a" "1" 44 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Coercion
• La plupart des op´erations math´ematiques vont convertir
un atomic vector `a un double ou integer
R code 2.6
x <- c(FALSE, FALSE, TRUE)
as.numeric(x)
## [1] 0 0 1
# Nombre total de TRUE
sum(x)
## [1] 1
# La proportion de TRUE
mean(x)
## [1] 0.33
45 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
List
• Les lists sont diff´erent des atomic vectors parce que leurs
´el´ements peuvent ˆetre de tout type
• La fonction pour cr´eer un list est list()
46 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
List
• Les lists sont diff´erent des atomic vectors parce que leurs
´el´ements peuvent ˆetre de tout type
• La fonction pour cr´eer un list est list()
R code 2.7
(x <- list(1:3, "a", c(TRUE, FALSE, TRUE), c(2.3, 5.9)))
## [[1]]
## [1] 1 2 3
##
## [[2]]
## [1] "a"
##
## [[3]]
## [1] TRUE FALSE TRUE
##
## [[4]]
## [1] 2.3 5.9
46 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Matrix
• Les matrices ne sont rien d’autre que des vecteurs en 2
dimensions
47 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Matrix
• Les matrices ne sont rien d’autre que des vecteurs en 2
dimensions
• Surtout utilis´ees pour faire les calculs math´ematiques
(pensez `a vos cours d’alg`ebre lin´eaire)
47 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Matrix
• Les matrices ne sont rien d’autre que des vecteurs en 2
dimensions
• Surtout utilis´ees pour faire les calculs math´ematiques
(pensez `a vos cours d’alg`ebre lin´eaire)
• La fonction pour cr´eer un matrix est matrix()
47 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Matrix
• Les matrices ne sont rien d’autre que des vecteurs en 2
dimensions
• Surtout utilis´ees pour faire les calculs math´ematiques
(pensez `a vos cours d’alg`ebre lin´eaire)
• La fonction pour cr´eer un matrix est matrix()
R code 2.8
# rempli par colonne par d´efaut
matrix(c(1,2,3,4,5,6), nrow = 2, ncol = 3)
## [,1] [,2] [,3]
## [1,] 1 3 5
## [2,] 2 4 6
47 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Matrix
R code 2.9
# automatiquement converti en donn´ees homog`enes
matrix(c(1,2,3,"a","b","c"), nrow = 2, ncol = 3)
## [,1] [,2] [,3]
## [1,] "1" "3" "b"
## [2,] "2" "a" "c"
48 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Data frame
• Le data frame est un tableau de donn´ees h´et´erog`enes
49 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Data frame
• Le data frame est un tableau de donn´ees h´et´erog`enes
• La fonction pour cr´eer un data frame est data.frame()
49 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Data frame
• Le data frame est un tableau de donn´ees h´et´erog`enes
• La fonction pour cr´eer un data frame est data.frame()
R code 2.10
# une colonne 'id' pour identifier les sujets
# une colonne 'age' pour leur age
data.frame(id = c("didier","patrice","laurent"),
age = c(37,34,32))
## id age
## 1 didier 37
## 2 patrice 34
## 3 laurent 32
49 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La diff´erence entre data frame et matrix?
• matrix: calculs matriciels
• data.frame: toutes autres analyses de donn´ees
h´et´erog`enes
50 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Commandes R
51 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Expression et affectation
1 Une expression est imm´ediatement ´evalu´ee et le r´esultat
est affich´e `a l’´ecran:
52 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Expression et affectation
1 Une expression est imm´ediatement ´evalu´ee et le r´esultat
est affich´e `a l’´ecran:
R code 2.11
2 + 3
## [1] 5
pi
## [1] 3.1
cos(pi/4)
## [1] 0.71
52 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Expression et affectation
2 Lors d’une affectation, une expression est ´evalu´ee, mais le
r´esultat est stock´e dans un objet (variable) et rien n’est
affich´e `a l’´ecran
• Le symbole d’affectation est <-
• les deux caract`eres < et - plac´es obligatoirement l’un `a la
suite de l’autre:
53 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Expression et affectation
3 Lors d’une affectation, une expression est ´evalu´ee, mais le
r´esultat est stock´e dans un objet (variable) et rien n’est
affich´e `a l’´ecran
• Le symbole d’affectation est <-
• les deux caract`eres < et - plac´es obligatoirement l’un `a la
suite de l’autre:
R code 2.12
a <- 5
a
## [1] 5
b <- a - 2
b
## [1] 3
53 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Indexation d’un vector
• L’indexation sert principalement `a deux choses
54 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Indexation d’un vector
• L’indexation sert principalement `a deux choses
1 extraire des ´el´ements
2 remplacer des ´el´ements
54 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Indexation d’un vector
• L’indexation sert principalement `a deux choses
1 extraire des ´el´ements
2 remplacer des ´el´ements
R code 2.13
# cr´eation d'un vecteur
x <- c(a = -1, b = 2, c = 8, d = 10)
# extraction par position
x[1]
# extraction par ´etiquette
x["c"]
# remplacer le deuxi`eme ´el´ement par 5
x[2] <- 5 54 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Indexation d’un data frame et matrix
• L’indexation des observations se fait `a partir des rang´ees
et colonnes du data frame et matrix:
d[rang´ee,colonne]
55 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Indexation d’un data frame et matrix
• L’indexation des observations se fait `a partir des rang´ees
et colonnes du data frame et matrix:
d[rang´ee,colonne]
R code 2.14
# cr´eation d'un data frame
d <- data.frame(Noms = c("Pierre", "Jean", "Jacques"),
Age = c(42, 34, 19),
Fumeur = c(TRUE, TRUE, FALSE))
d[1, ] # premi`ere rang´ee
d[ ,1] # premi`ere colonne
d[3,2] # troisi`eme rang´ee, deuxi`eme colonne
55 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Indexation d’un list
R code 2.15
# cr´eation d'un list
x <- list(joueur = c("V", "C"),
score = c(10, 12))
# premier ´el´ement de la list
x[[1]]
# 1er ´el´ement du 2e ´el´ement de la list
x[[2]][1]
56 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Importer et enregistrer des donn´ees et du code
Table 2 : Les fonctions de bases pour importer et enregistrer
des donn´ees et du code R
fichiers objetsc
script R
importer read.table()a
load() source()
read.csv()b
enregistrer write.table() save() File -> Save As..
write.csv()
a
chaque valeur est s´epar´ee par un espace
b
chaque valeur est s´epar´ee par une virgule
c
objets dans ton espace de travail (Environment)
57 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Importer des donn´ees
• Il est n´ecessaire de pr´eciser le chemin d’acc`es au fichier s’il
n’est pas dans le r´epertoire de travail
58 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Importer des donn´ees
• Il est n´ecessaire de pr´eciser le chemin d’acc`es au fichier s’il
n’est pas dans le r´epertoire de travail
• getwd(): connaˆıtre le r´epertoire de travail
58 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Importer des donn´ees
• Il est n´ecessaire de pr´eciser le chemin d’acc`es au fichier s’il
n’est pas dans le r´epertoire de travail
• getwd(): connaˆıtre le r´epertoire de travail
• setwd(): modifier le r´epertoire de travail
58 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Importer des donn´ees
• Il est n´ecessaire de pr´eciser le chemin d’acc`es au fichier s’il
n’est pas dans le r´epertoire de travail
• getwd(): connaˆıtre le r´epertoire de travail
• setwd(): modifier le r´epertoire de travail
R code 2.16
# modifier le r´epertoire de travail
setwd("~/git_repositories/atelier-R-GERAD/data")
# importer les fichiers
# affectation aux objets 'lung' et 'admit'
lung <- read.csv("lung.csv")
admit <- read.table("admit.txt")
58 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Importer du code R `a partir d’un script
R code 2.17
# modifier le r´epertoire de travail
setwd("~/git_repositories/atelier-R-GERAD/script")
# ex´ecute les commandes R du script 'mtcars.R'
# et montre le output
source("mtcars.R", echo = TRUE)
# sauvegarde les objets du environment
save(df, fit, file = "mtcars.RData")
# supprime les objets de ton environment
rm(df, fit)
# importer les objets R de 'mtcars.RData'
load("mtcars.RData")
59 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Installer des packages additionnels dans R
• Un package R est un ensemble coh´erent de fonctions, de
jeux de donn´ees et de documentation permettant de
compl´eter les fonctionnalit´es du syst`eme ou d’en ajouter
de nouvelles
• La liste compl`ete de ces packages est disponible sur le site
METACRAN
60 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Installer des packages additionnels dans R
• Un package R est un ensemble coh´erent de fonctions, de
jeux de donn´ees et de documentation permettant de
compl´eter les fonctionnalit´es du syst`eme ou d’en ajouter
de nouvelles
• La liste compl`ete de ces packages est disponible sur le site
METACRAN
R code 2.18
# installer des packages pour cr´eer des rapports
# reproductibles
install.packages(c("knitr","rmarkdown"))
# pour avoir acc`es aux fonctions dans ces packages
library(knitr)
library(rmarkdown)
60 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Sommaire
61 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Sommaire des commandes de bases
sessionInfo()
install.packages()
library()texxxx
setwd()teccc
getwd()teccc
rm()tevvvvvvv
ls()tevvvvvvv
c()
data.frame()
matrix()
list()
read.table()
write.table()
load()
save()text
source()
Espace de travail
Objets R les plus utilis´es
Acc´eder les donn´ees et scripts R
62 / 94
3. Graphiques
Objectifs du chapitre
1 Comprendre la syntaxe de la fonction plot
2 Cr´eer des boxplot, histogram et density plot
3 Comment sauvegarder des graphiques
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction plot
65 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Introduction aux graphiques en R
• R offre une vari´et´e de graphiques remarquables
• Pour avoir une petite id´ee des possibilit´es offertes, il suffit
de taper la commande demo(graphics)
66 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction plot
• La fonction plot peut prendre plusieurs arguments et
types d’objets
67 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction plot
• La fonction plot peut prendre plusieurs arguments et
types d’objets
R code 3.1
# Plot des valeurs d'un vecteur contre leurs indices
# ´equivalent `a plot(mtcars[,"mpg"])
plot(mtcars$mpg, xlab = "Index", ylab = "mpg",
main = "Titre")
# Graphique des couples (x, y)
plot(mtcars$mpg, mtcars$disp, xlab = "mpg",
ylab = "disp", main = "mpg vs. disp")
67 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction plot
• La fonction plot peut aussi prendre un objet du mod`ele
lin´eaire comme argument
68 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction plot
• La fonction plot peut aussi prendre un objet du mod`ele
lin´eaire comme argument
• Ceci est un exemple qui d´emontre pourquoi R est un
langage orient´ee objet
68 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction plot
• La fonction plot peut aussi prendre un objet du mod`ele
lin´eaire comme argument
• Ceci est un exemple qui d´emontre pourquoi R est un
langage orient´ee objet
R code 3.2
# importer 'mtcars.RData'
load("mtcars.RData")
# Graphiques des 4 diagnostiques
# du mod`ele lin´eaire
# placer dans 2 rang´es et 2 colonnes
par(mfrow=c(2,2))
plot(fit)
68 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
histogram et boxplot
69 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction histogram
• Utile pour voir la distribution des donn´ees
• Pour les donn´ees continues et univari´ees
70 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction histogram
• Utile pour voir la distribution des donn´ees
• Pour les donn´ees continues et univari´ees
R code 3.3
# la taille de 237 ´etudiants disponibles dans le jeu
# de donn´ees 'survey' du library(MASS)
library(MASS)
# voir le nom des colonnes
names(survey)
# histogram de la taille et montrer la fr´equence
# de chaque barre
hist(survey$Height, labels = TRUE)
70 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction boxplot
• Utile pour voir la diff´erence d’une variable continue parmi
plusieurs groupes
71 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction boxplot
• Utile pour voir la diff´erence d’une variable continue parmi
plusieurs groupes
R code 3.4
# visualiser la diff´erence de taille entre les
# hommes et les femmes dans le jeux
# de donn´ees 'survey' du library(MASS)
boxplot(survey$Height ~ survey$Sex,
ylab = "Taille (cm)",
col = c("lightpink","lightblue"))
71 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Sauvegarder les graphiques
• 2 fonctions principales: pdf() et png()
• l’argument de ces fonctions est le nom du fichier d´esir´e
72 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Sauvegarder les graphiques
• 2 fonctions principales: pdf() et png()
• l’argument de ces fonctions est le nom du fichier d´esir´e
R code 3.5
# enregistrer dans le r´epertoire de travail courant
pdf("boxplot_survey.pdf")
boxplot(survey$Height ~ survey$Sex,
ylab = "Taille (cm)")
dev.off()
72 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Sommaire
73 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Sommaire des commandes de graphiques
plot()
hist()texxxx
boxplot()texxxx
xlab
ylabtextttt
maintextttt
typetextttt
coltextttt
pdf()
png()textttt
dev.off()textttt
Fonctions pour cr´eer les graphiques
Arguments communs pour ces fonctions
Fonctions pour enregistrer les graphiques
74 / 94
4. Statistiques
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Moyenne, ´ecart type
76 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Moyenne, variance, ´ecart type, minimum, maximum
• fonctions principales: mean(), var(), sd(), min(),
max()
77 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Moyenne, variance, ´ecart type, minimum, maximum
• fonctions principales: mean(), var(), sd(), min(),
max()
• la fonction summary() est utile pour calculer quelques
statistiques de bases pour un data frame
77 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Moyenne, variance, ´ecart type, minimum, maximum
• fonctions principales: mean(), var(), sd(), min(),
max()
• la fonction summary() est utile pour calculer quelques
statistiques de bases pour un data frame
R code 4.1
# enregistrer dans le r´epertoire de travail courant
summary(mtcars)
77 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction apply
• Pour calculer des statistiques plus compliqu´ees sur un data
frame (ou matrix), on utilise la fonction apply
78 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction apply
• Pour calculer des statistiques plus compliqu´ees sur un data
frame (ou matrix), on utilise la fonction apply
• La fonction apply sert `a appliquer une fonction
quelconque sur une partie d’un matrix ou data frame
78 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction apply
• La syntaxe de la fonction est la suivante:
apply(X, MARGIN, FUN)
• X: un matrix ou data frame
• MARGIN: 1 si l’on veut faire des calculs sur les rang´ees, 2
sur les colonnes
• FUN: est la fonction `a appliquer
79 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction apply
• La syntaxe de la fonction est la suivante:
apply(X, MARGIN, FUN)
• X: un matrix ou data frame
• MARGIN: 1 si l’on veut faire des calculs sur les rang´ees, 2
sur les colonnes
• FUN: est la fonction `a appliquer
R code 4.2
# variance par ligne
apply(mtcars, 1, var)
79 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
La fonction apply
R code 4.3
# variance par colonne
apply(mtcars, 2, var)
# ´ecart type par colonne
apply(mtcars, 2, sd)
# minimum de chaque rang´ee
apply(mtcars, 1, min)
# maximum de chaque rang´ee
apply(mtcars, 1, max)
80 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Test t et analyse de variance
81 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Test t
• la fonction pour faire un test t est t.test()
82 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Test t
• la fonction pour faire un test t est t.test()
R code 4.4
# la taille de 237 ´etudiants disponible dans le jeux
# de donn´ees 'survey' du library(MASS)
# est-ce qu'il y a une diff´erence de taille entre
# les hommes et les femmes?
t.test(Height ~ Sex, data = survey)
82 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Analyse de variance
• La fonction pour l’analyse de variance est aov
83 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Analyse de variance
• La fonction pour l’analyse de variance est aov
• Prenons un jeux de donn´ees disponible dans R:
InsectSprays
83 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Analyse de variance
• La fonction pour l’analyse de variance est aov
• Prenons un jeux de donn´ees disponible dans R:
InsectSprays
• 6 insecticides ont ´et´e test´es 12 fois en culture, la r´eponse
observ´ee ´etant le nombre d’insectes
83 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Analyse de variance
• La fonction pour l’analyse de variance est aov
• Prenons un jeux de donn´ees disponible dans R:
InsectSprays
• 6 insecticides ont ´et´e test´es 12 fois en culture, la r´eponse
observ´ee ´etant le nombre d’insectes
• Le but c’est de voir s’il y a une diff´erence importante entre
les 6 insecticides par rapport `a le nombre d’insectes
83 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Analyse de variance
R code 4.5
# boxplot pour voir la diff´erence entre
# les groupes
boxplot(InsectSprays$count ~ InsectSprays$spray)
# Les r´esultats ne sont pas affich´es, ceux-ci sont
# copi´es dans un objet nomm´e aov.spray
aov.spray <- aov(count ~ spray, data = InsectSprays)
# sommaire des r´esultats
summary(aov.spray)
84 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Mod`eles lin´eaires
85 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Les formules
• Les formules repr´esentent un ´el´ement-cl´e des analyses
statistiques avec R
86 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Les formules
• Les formules repr´esentent un ´el´ement-cl´e des analyses
statistiques avec R
• La notation utilis´ee est la mˆeme pour (presque) toutes les
fonctions
86 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Les formules
• Les formules repr´esentent un ´el´ement-cl´e des analyses
statistiques avec R
• La notation utilis´ee est la mˆeme pour (presque) toutes les
fonctions
• Une formule est typiquement de la forme
y ∼ model
86 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Les formules
• Les formules repr´esentent un ´el´ement-cl´e des analyses
statistiques avec R
• La notation utilis´ee est la mˆeme pour (presque) toutes les
fonctions
• Une formule est typiquement de la forme
y ∼ model
1 y: est la r´eponse analys´ee
2 model: est un ensemble de termes pour lesquels les
param`etres sont estim´es
86 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Les formules
• Les formules repr´esentent un ´el´ement-cl´e des analyses
statistiques avec R
• La notation utilis´ee est la mˆeme pour (presque) toutes les
fonctions
• Une formule est typiquement de la forme
y ∼ model
1 y: est la r´eponse analys´ee
2 model: est un ensemble de termes pour lesquels les
param`etres sont estim´es
• Ces termes sont s´epar´es par des symboles arithm´etiques
mais qui ont ici une signification particuli`ere: a+b, a*b
86 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Mod`eles lin´eaires
R code 4.6
# importer 'admit.txt'
admit <- read.table("admit.txt", header = TRUE)
# est-ce que gpa et rank sont reli´es `a gre
fit <- lm(gre ~ gpa+rank, data = admit)
# voir les r´esultats
summary(fit)
87 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
GLM
R code 4.7
# r´egression logistique
fit.glm <- glm(admit ~ gre+gpa+rank, data = admit,
family = binomial(link = "logit"))
# voir les r´esultats
summary(fit.glm)
88 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Sommaire
89 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Sommaire des commandes de statistiques
mean()
var()texxxxxx
sd()texxxx
min()texxxx
max()texxxx
median()texxxx
apply()texxxx
aov()
t.test()textttt
chisq.test()textttt
lm()
glm()textdddttt
Fonctions pour des statistiques descriptives
Tests statistiques
Fonctions pour les mod`eles de r´egression
90 / 94
5. Cr´eer des rapports
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Introduction
92 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Introduction
• http://rmarkdown.rstudio.com/
• http://shiny.rstudio.com/gallery/
93 / 94
Atelier sur le
logiciel R
1.Pr´esentation
du langage R
Pourquoi ˆetes-vous
l`a?
Bref historique
Caract´eristiques de R
D´emarrer une session
2.Bases du
langage R
Les fonctions
Les objets R
Commandes R
Sommaire
3. Graphiques
La fonction plot
histogram et
boxplot
Sommaire
4. Statistiques
Moyenne, ´ecart type
Test t et analyse de
variance
Mod`eles lin´eaires
Sommaire
5. Rapports
reproductibles
Introduction
Session Information
• R version 3.2.1 (2015-06-18), x86_64-pc-linux-gnu
• Base packages: base, datasets, graphics, grDevices,
methods, stats, utils
• Other packages: data.table 1.9.4, dplyr 0.4.1,
ggplot2 1.0.1, knitr 1.10.5, xtable 1.7-4
• Loaded via a namespace (and not attached):
assertthat 0.1, chron 2.3-45, colorspace 1.2-6, DBI 0.3.1,
digest 0.6.8, evaluate 0.7, formatR 1.2, grid 3.2.1,
gtable 0.1.2, highr 0.5, magrittr 1.5, MASS 7.3-43,
munsell 0.4.2, parallel 3.2.1, plyr 1.8.3, proto 0.3-10,
Rcpp 0.11.6, reshape2 1.4.1, scales 0.2.5, stringi 0.5-5,
stringr 1.0.0, tools 3.2.1
94 / 94

Mais conteúdo relacionado

Destaque

Cours econometrie-uqam-st-2-v2
Cours econometrie-uqam-st-2-v2Cours econometrie-uqam-st-2-v2
Cours econometrie-uqam-st-2-v2Arthur Charpentier
 
Le Numérique Pilier d'innovation sociétale et économique ? - Antoine CHOTARD ...
Le Numérique Pilier d'innovation sociétale et économique ? - Antoine CHOTARD ...Le Numérique Pilier d'innovation sociétale et économique ? - Antoine CHOTARD ...
Le Numérique Pilier d'innovation sociétale et économique ? - Antoine CHOTARD ...UNITEC
 
Sujets de pfe pour etudiants en grh
Sujets de  pfe pour etudiants en  grhSujets de  pfe pour etudiants en  grh
Sujets de pfe pour etudiants en grhezzeddine mbarek
 
How to value your tech startup
How to value your tech startupHow to value your tech startup
How to value your tech startupBenjamin Rohé
 
Matej Ftacnik - The Spot - Slovakia - Stanford Engineering - Feb 23 2015
Matej Ftacnik - The Spot - Slovakia - Stanford Engineering - Feb 23 2015Matej Ftacnik - The Spot - Slovakia - Stanford Engineering - Feb 23 2015
Matej Ftacnik - The Spot - Slovakia - Stanford Engineering - Feb 23 2015Burton Lee
 
BUSINESS MODEL MOVIEMAKING: Rapidly Visualize, Prototype, and Test Your BUSIN...
BUSINESS MODEL MOVIEMAKING: Rapidly Visualize, Prototype, and Test Your BUSIN...BUSINESS MODEL MOVIEMAKING: Rapidly Visualize, Prototype, and Test Your BUSIN...
BUSINESS MODEL MOVIEMAKING: Rapidly Visualize, Prototype, and Test Your BUSIN...Rod King, Ph.D.
 
Atelier #2 initiation à css
Atelier #2 initiation à cssAtelier #2 initiation à css
Atelier #2 initiation à cssLes-Tilleuls.coop
 
Catalogue Idwatt 2016
Catalogue Idwatt 2016Catalogue Idwatt 2016
Catalogue Idwatt 2016SOREA
 
Y Combinator Startup Class #12 : Building for the Enterprise
Y Combinator Startup Class #12 : Building for the EnterpriseY Combinator Startup Class #12 : Building for the Enterprise
Y Combinator Startup Class #12 : Building for the EnterpriseFabien Grenet
 
Gerenciando Serviços com Systemd
Gerenciando Serviços com SystemdGerenciando Serviços com Systemd
Gerenciando Serviços com SystemdRodrigo Missiaggia
 
How to fund your documentary like a startup
How to fund your documentary like a startupHow to fund your documentary like a startup
How to fund your documentary like a startupBjarke Calvin
 
Le Pitch de positionnement - 3 minutes pour convaincre
Le Pitch de positionnement - 3 minutes pour convaincreLe Pitch de positionnement - 3 minutes pour convaincre
Le Pitch de positionnement - 3 minutes pour convaincreMarseille Innovation
 
Business Plan vs. Business Model vs. Strategy. Eliminate the Blah-Blah-Blah i...
Business Plan vs. Business Model vs. Strategy. Eliminate the Blah-Blah-Blah i...Business Plan vs. Business Model vs. Strategy. Eliminate the Blah-Blah-Blah i...
Business Plan vs. Business Model vs. Strategy. Eliminate the Blah-Blah-Blah i...Rod King, Ph.D.
 
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...HAFID Ait Bihi
 
42 MW vibration. You can download and practice by enter at any "letter blocks...
42 MW vibration. You can download and practice by enter at any "letter blocks...42 MW vibration. You can download and practice by enter at any "letter blocks...
42 MW vibration. You can download and practice by enter at any "letter blocks...Manorom Chiewpanich
 

Destaque (18)

Cours econometrie-uqam-st-2-v2
Cours econometrie-uqam-st-2-v2Cours econometrie-uqam-st-2-v2
Cours econometrie-uqam-st-2-v2
 
Le Numérique Pilier d'innovation sociétale et économique ? - Antoine CHOTARD ...
Le Numérique Pilier d'innovation sociétale et économique ? - Antoine CHOTARD ...Le Numérique Pilier d'innovation sociétale et économique ? - Antoine CHOTARD ...
Le Numérique Pilier d'innovation sociétale et économique ? - Antoine CHOTARD ...
 
Xml
XmlXml
Xml
 
Sujets de pfe pour etudiants en grh
Sujets de  pfe pour etudiants en  grhSujets de  pfe pour etudiants en  grh
Sujets de pfe pour etudiants en grh
 
Produtos AG
Produtos AGProdutos AG
Produtos AG
 
Webinar Lean Startup
Webinar Lean StartupWebinar Lean Startup
Webinar Lean Startup
 
How to value your tech startup
How to value your tech startupHow to value your tech startup
How to value your tech startup
 
Matej Ftacnik - The Spot - Slovakia - Stanford Engineering - Feb 23 2015
Matej Ftacnik - The Spot - Slovakia - Stanford Engineering - Feb 23 2015Matej Ftacnik - The Spot - Slovakia - Stanford Engineering - Feb 23 2015
Matej Ftacnik - The Spot - Slovakia - Stanford Engineering - Feb 23 2015
 
BUSINESS MODEL MOVIEMAKING: Rapidly Visualize, Prototype, and Test Your BUSIN...
BUSINESS MODEL MOVIEMAKING: Rapidly Visualize, Prototype, and Test Your BUSIN...BUSINESS MODEL MOVIEMAKING: Rapidly Visualize, Prototype, and Test Your BUSIN...
BUSINESS MODEL MOVIEMAKING: Rapidly Visualize, Prototype, and Test Your BUSIN...
 
Atelier #2 initiation à css
Atelier #2 initiation à cssAtelier #2 initiation à css
Atelier #2 initiation à css
 
Catalogue Idwatt 2016
Catalogue Idwatt 2016Catalogue Idwatt 2016
Catalogue Idwatt 2016
 
Y Combinator Startup Class #12 : Building for the Enterprise
Y Combinator Startup Class #12 : Building for the EnterpriseY Combinator Startup Class #12 : Building for the Enterprise
Y Combinator Startup Class #12 : Building for the Enterprise
 
Gerenciando Serviços com Systemd
Gerenciando Serviços com SystemdGerenciando Serviços com Systemd
Gerenciando Serviços com Systemd
 
How to fund your documentary like a startup
How to fund your documentary like a startupHow to fund your documentary like a startup
How to fund your documentary like a startup
 
Le Pitch de positionnement - 3 minutes pour convaincre
Le Pitch de positionnement - 3 minutes pour convaincreLe Pitch de positionnement - 3 minutes pour convaincre
Le Pitch de positionnement - 3 minutes pour convaincre
 
Business Plan vs. Business Model vs. Strategy. Eliminate the Blah-Blah-Blah i...
Business Plan vs. Business Model vs. Strategy. Eliminate the Blah-Blah-Blah i...Business Plan vs. Business Model vs. Strategy. Eliminate the Blah-Blah-Blah i...
Business Plan vs. Business Model vs. Strategy. Eliminate the Blah-Blah-Blah i...
 
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
 
42 MW vibration. You can download and practice by enter at any "letter blocks...
42 MW vibration. You can download and practice by enter at any "letter blocks...42 MW vibration. You can download and practice by enter at any "letter blocks...
42 MW vibration. You can download and practice by enter at any "letter blocks...
 

Semelhante a Atelier r-gerad

Analyse_desDonnées_sousR.pptx
Analyse_desDonnées_sousR.pptxAnalyse_desDonnées_sousR.pptx
Analyse_desDonnées_sousR.pptxanashoummas
 
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Yi YANG
 
Soutenance séminaire bibliographique
Soutenance séminaire bibliographiqueSoutenance séminaire bibliographique
Soutenance séminaire bibliographiqueMaxime ALAY-EDDINE
 
Langage de Programmation.pdf
Langage de Programmation.pdfLangage de Programmation.pdf
Langage de Programmation.pdfAboubacarDiarra10
 
Alphorm.com Formation Data science avec R - Prise en main des IDE
Alphorm.com Formation Data science avec R - Prise en main des IDEAlphorm.com Formation Data science avec R - Prise en main des IDE
Alphorm.com Formation Data science avec R - Prise en main des IDEAlphorm
 
COURS C++ [Enregistrement automatique]Complet (1).pptx
COURS C++ [Enregistrement automatique]Complet (1).pptxCOURS C++ [Enregistrement automatique]Complet (1).pptx
COURS C++ [Enregistrement automatique]Complet (1).pptxLuneSabsPericolo1
 

Semelhante a Atelier r-gerad (7)

Analyse_desDonnées_sousR.pptx
Analyse_desDonnées_sousR.pptxAnalyse_desDonnées_sousR.pptx
Analyse_desDonnées_sousR.pptx
 
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données ! Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
Avec le langage R, prenez de la hauteur dans l’analyse de vos données !
 
Soutenance séminaire bibliographique
Soutenance séminaire bibliographiqueSoutenance séminaire bibliographique
Soutenance séminaire bibliographique
 
Langage de Programmation.pdf
Langage de Programmation.pdfLangage de Programmation.pdf
Langage de Programmation.pdf
 
Alphorm.com Formation Data science avec R - Prise en main des IDE
Alphorm.com Formation Data science avec R - Prise en main des IDEAlphorm.com Formation Data science avec R - Prise en main des IDE
Alphorm.com Formation Data science avec R - Prise en main des IDE
 
COURS C++ [Enregistrement automatique]Complet (1).pptx
COURS C++ [Enregistrement automatique]Complet (1).pptxCOURS C++ [Enregistrement automatique]Complet (1).pptx
COURS C++ [Enregistrement automatique]Complet (1).pptx
 
Maths II
Maths IIMaths II
Maths II
 

Mais de sahirbhatnagar

Strong Heredity Models in High Dimensional Data
Strong Heredity Models in High Dimensional DataStrong Heredity Models in High Dimensional Data
Strong Heredity Models in High Dimensional Datasahirbhatnagar
 
Methods for High Dimensional Interactions
Methods for High Dimensional InteractionsMethods for High Dimensional Interactions
Methods for High Dimensional Interactionssahirbhatnagar
 
An introduction to knitr and R Markdown
An introduction to knitr and R MarkdownAn introduction to knitr and R Markdown
An introduction to knitr and R Markdownsahirbhatnagar
 
Reproducible Research: An Introduction to knitr
Reproducible Research: An Introduction to knitrReproducible Research: An Introduction to knitr
Reproducible Research: An Introduction to knitrsahirbhatnagar
 
Analysis of DNA methylation and Gene expression to predict childhood obesity
Analysis of DNA methylation and Gene expression to predict childhood obesityAnalysis of DNA methylation and Gene expression to predict childhood obesity
Analysis of DNA methylation and Gene expression to predict childhood obesitysahirbhatnagar
 
Estimation and Accuracy after Model Selection
Estimation and Accuracy after Model SelectionEstimation and Accuracy after Model Selection
Estimation and Accuracy after Model Selectionsahirbhatnagar
 
Absolute risk estimation in a case cohort study of prostate cancer
Absolute risk estimation in a case cohort study of prostate cancerAbsolute risk estimation in a case cohort study of prostate cancer
Absolute risk estimation in a case cohort study of prostate cancersahirbhatnagar
 
Computational methods for case-cohort studies
Computational methods for case-cohort studiesComputational methods for case-cohort studies
Computational methods for case-cohort studiessahirbhatnagar
 
Factors influencing participation in cancer screening
Factors influencing participation in cancer screeningFactors influencing participation in cancer screening
Factors influencing participation in cancer screeningsahirbhatnagar
 
Methylation and Expression data integration
Methylation and Expression data integrationMethylation and Expression data integration
Methylation and Expression data integrationsahirbhatnagar
 

Mais de sahirbhatnagar (12)

Strong Heredity Models in High Dimensional Data
Strong Heredity Models in High Dimensional DataStrong Heredity Models in High Dimensional Data
Strong Heredity Models in High Dimensional Data
 
Methods for High Dimensional Interactions
Methods for High Dimensional InteractionsMethods for High Dimensional Interactions
Methods for High Dimensional Interactions
 
An introduction to knitr and R Markdown
An introduction to knitr and R MarkdownAn introduction to knitr and R Markdown
An introduction to knitr and R Markdown
 
Reproducible Research: An Introduction to knitr
Reproducible Research: An Introduction to knitrReproducible Research: An Introduction to knitr
Reproducible Research: An Introduction to knitr
 
Analysis of DNA methylation and Gene expression to predict childhood obesity
Analysis of DNA methylation and Gene expression to predict childhood obesityAnalysis of DNA methylation and Gene expression to predict childhood obesity
Analysis of DNA methylation and Gene expression to predict childhood obesity
 
Estimation and Accuracy after Model Selection
Estimation and Accuracy after Model SelectionEstimation and Accuracy after Model Selection
Estimation and Accuracy after Model Selection
 
Absolute risk estimation in a case cohort study of prostate cancer
Absolute risk estimation in a case cohort study of prostate cancerAbsolute risk estimation in a case cohort study of prostate cancer
Absolute risk estimation in a case cohort study of prostate cancer
 
Computational methods for case-cohort studies
Computational methods for case-cohort studiesComputational methods for case-cohort studies
Computational methods for case-cohort studies
 
Factors influencing participation in cancer screening
Factors influencing participation in cancer screeningFactors influencing participation in cancer screening
Factors influencing participation in cancer screening
 
Introduction to LaTeX
Introduction to LaTeXIntroduction to LaTeX
Introduction to LaTeX
 
Methylation and Expression data integration
Methylation and Expression data integrationMethylation and Expression data integration
Methylation and Expression data integration
 
Reproducible Research
Reproducible ResearchReproducible Research
Reproducible Research
 

Atelier r-gerad

  • 1. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Atelier sur le logiciel R Un introduction `a la programmation en R Sahir Rai Bhatnagar1 29 juillet 2015 1 https://github.com/sahirbhatnagar/atelier-R-GERAD 1 / 94
  • 2. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Programmation de la journ´ee • 09H00 : D´ebut de l’atelier • 10H00 - 10H20: pause • 12H00 - 13H00: lunch • 15H00 - 15H20: pause • 17H00 : fin de l’atelier 2 / 94
  • 3. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Remerciements • John Chambers • Ross Ihaka et Robert Gentleman • Greg Voisin • Dr. Vahid Partovi Nia • Toi 3 / 94
  • 4. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Avis #1 • Ceci est une introduction au langage R 4 / 94
  • 5. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Avis #1 • Ceci est une introduction au langage R • On va faire beaucoup d’exercices 4 / 94
  • 6. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Avis #1 • Ceci est une introduction au langage R • On va faire beaucoup d’exercices • N’h´esitez pas `a posez des questions 4 / 94
  • 7. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Avis #2 Je n’ai aucune relation commerciale avec ces logiciels 5 / 94
  • 8. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Avis #3 • Le mat´eriel pour cet atelier est bas´e sur plusieurs ressources • Voir ce lien pour une liste compl`ete de r´ef´erences: https://github.com/sahirbhatnagar/atelier-R-GERAD • Je vous sugg`ere les livres de Vincent Goulet et Hadley Wickham 6 / 94
  • 10. Apr`es cet atelier vous devriez ˆetre capables de • Comprendre, cr´eer et modifier les 4 objets de bases en R (vector, data.frame, matrix, list) • Utiliser des fonctions de bases • Importer un jeux de donn´ees `a partir d’un fichier externe • Cr´eer un graphique
  • 11. 1. Pr´esentation du langage R
  • 12. Objectifs du chapitre 1 Comprendre les avantages d’apprendre R 2 Connaˆıtre la provenance du R et ses caract´eristiques 3 D´emarrer une session R et ex´ecuter des commandes simples 4 Cr´eer, modifier et sauvegarder ses propres fichiers de script R
  • 13. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Pourquoi vous ˆetes l`a? 11 / 94
  • 14. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Le langage R gagne en popularit´e Les meilleurs langages de programmation en 2015 selon IEEE Spectrum 12 / 94
  • 15. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Plus de 100 000 questions pos´ees dans les forums 13 / 94
  • 16. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Nombre d’emplois r´ef´erence: http://r4stats.com/articles/popularity/ 14 / 94
  • 17. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Utilis´e dans plusieurs domaines Publi´e dans Nature 15 / 94
  • 18. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Analyser vos donn´ees • Plusieurs ressources d’outils statistiques • Repr´esenter graphiquement des jeux de donn´ees multivariables • Int´egrer votre code R dans des applications web • Assurer la reproductivit´e de vos analyses 16 / 94
  • 19. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Bref historique 17 / 94
  • 20. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction `A l’origine de R fut le S par John M. Chambers Figure 1 : S, un langage pour programmer avec des donn´ees, developp´e chez Bell Laboratories dans les ann´ees 1970 par une ´equipe de chercheurs men´ee par John M. Chambers 18 / 94
  • 21. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Cr´eateurs Figure 2 : Inspir´es par le S, Ross Ihaka (gauche) et Robert Gentleman (droite) de l’Universit´e d’Auckland en Nouvelle-Z´elande ont lanc´e la premi`ere version de R en 1996 19 / 94
  • 22. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Logiciel Libre • 1990-2010: le S a principalement ´et´e popularis´e par une mise en oeuvre commerciale nomm´ee S-PLUS 20 / 94
  • 23. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Logiciel Libre • 1990-2010: le S a principalement ´et´e popularis´e par une mise en oeuvre commerciale nomm´ee S-PLUS • Fin des ann´ees 2000: L’utilisation de S-PLUS diminue en faveur du R, surtout dans les milieux acad´emiques 20 / 94
  • 24. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Logiciel Libre • 1990-2010: le S a principalement ´et´e popularis´e par une mise en oeuvre commerciale nomm´ee S-PLUS • Fin des ann´ees 2000: L’utilisation de S-PLUS diminue en faveur du R, surtout dans les milieux acad´emiques • 2 raisons qui ont fortement contribu´e `a la perte d’influence de S-PLUS 1 Disponible gratuitement 20 / 94
  • 25. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Logiciel Libre • 1990-2010: le S a principalement ´et´e popularis´e par une mise en oeuvre commerciale nomm´ee S-PLUS • Fin des ann´ees 2000: L’utilisation de S-PLUS diminue en faveur du R, surtout dans les milieux acad´emiques • 2 raisons qui ont fortement contribu´e `a la perte d’influence de S-PLUS 1 Disponible gratuitement 2 Ouvert aux contributions de tous 20 / 94
  • 26. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Caract´eristiques de R 21 / 94
  • 27. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Langage de programmation orient´ee objet • Cela permet de facilement trouver et r´e-utiliser les r´esultats de tes analyses 22 / 94
  • 28. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Langage de programmation orient´ee objet • Cela permet de facilement trouver et r´e-utiliser les r´esultats de tes analyses • Une fonction peut compl´eter plusieurs tˆaches 22 / 94
  • 29. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Langage de programmation interpr´et´e • Langage de programmation interpr´et´e (versus C, C++, JAVA) • Plus accessible qu’un langage compil´e → ce qui permet aux ´economistes, ´ecologistes, biologistes, statisticiens, ´epid´emiologistes, etc. d’utiliser R 23 / 94
  • 30. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Langage de programmation interpr´et´e • Langage de programmation interpr´et´e (versus C, C++, JAVA) • Plus accessible qu’un langage compil´e → ce qui permet aux ´economistes, ´ecologistes, biologistes, statisticiens, ´epid´emiologistes, etc. d’utiliser R • Le programme que l’on lance pour utiliser R est l’interpr`ete 23 / 94
  • 31. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Langage de programmation interpr´et´e • Langage de programmation interpr´et´e (versus C, C++, JAVA) • Plus accessible qu’un langage compil´e → ce qui permet aux ´economistes, ´ecologistes, biologistes, statisticiens, ´epid´emiologistes, etc. d’utiliser R • Le programme que l’on lance pour utiliser R est l’interpr`ete • Celui-ci prend des commandes en R qu’il ex´ecutera imm´ediatement 23 / 94
  • 32. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Langage de programmation interpr´et´e • Langage de programmation interpr´et´e (versus C, C++, JAVA) • Plus accessible qu’un langage compil´e → ce qui permet aux ´economistes, ´ecologistes, biologistes, statisticiens, ´epid´emiologistes, etc. d’utiliser R • Le programme que l’on lance pour utiliser R est l’interpr`ete • Celui-ci prend des commandes en R qu’il ex´ecutera imm´ediatement • Autre exemple: Python 23 / 94
  • 33. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Logiciel libre (Open Source) • D´eveloppement actif pour la cr´eation de nouveaux outils dans plusieurs domaines • https://cran.r-project.org/web/views/ • Facilement voir le code des autres avec GitHub • http://www.r-pkg.org/ • Bien documenter avec beaucoup de ressources gratuites disponibles sur l’internet • stackoverflow • http://www.rdocumentation.org/ • http://www.r-bloggers.com/ • twitter • R user groups • Google 24 / 94
  • 34. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Outil statistique qui optimize l’approche matricielle • Langage bas´e sur la notion de vecteur, ce qui simplifie les calculs math´ematiques (non seulement la computation mais l’´ecriture aussi) 25 / 94
  • 35. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Outil statistique qui optimize l’approche matricielle • Langage bas´e sur la notion de vecteur, ce qui simplifie les calculs math´ematiques (non seulement la computation mais l’´ecriture aussi) • R´eduit consid´erablement le recours aux structures it´eratives (boucles for, while , etc.) 25 / 94
  • 36. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Outil statistique qui optimize l’approche matricielle • Langage bas´e sur la notion de vecteur, ce qui simplifie les calculs math´ematiques (non seulement la computation mais l’´ecriture aussi) • R´eduit consid´erablement le recours aux structures it´eratives (boucles for, while , etc.) R code 1.1 c(1,2,3) + c(4,5,6) ## [1] 5 7 9 25 / 94
  • 37. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction O`u trouver de l’aide pour une fonction • ?nom_de_la_fonction 26 / 94
  • 38. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction O`u trouver de l’aide pour une fonction • ?nom_de_la_fonction R code 1.2 # l'aide pour la fonction de r´egression lin´eaire 'lm' ?lm 26 / 94
  • 39. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La rubrique d’aide • Usage: le nom de la fonction, tous ses arguments et les valeurs par d´efaut 27 / 94
  • 40. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La rubrique d’aide • Usage: le nom de la fonction, tous ses arguments et les valeurs par d´efaut • Value: le type d’objet retourn´e par la fonction 27 / 94
  • 41. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction D´emarrer une session 28 / 94
  • 42. R code 1.3 # D´emarrer l'interface pour la documentation # et naviguer les diff´erentes ressources help.start() # trouver l'aide pour la fonction rnorm ?rnorm # Connaitre le r´epertoire de travail getwd()
  • 43. R code 1.4 # On additionne 39 + 3 # On soustrait 58 - 16 # On multiplie 6 * 7 # Et on peut m^eme diviser 8 / 3
  • 44. R code 1.5 # G´en´erer deux vecteurs de nombres pseudo-al´eatoires # issus d’une loi normale centr´ee r´eduite. x <- rnorm(50) y <- rnorm(50) # Graphique des couples (x, y) plot(x, y) # Graphique d'un histogramme de x hist(x)
  • 45. R code 1.6 # voir la mati`ere de x x # voir les objets de votre workspace ls() # supprimer les deux vecteurs x et y rm(x,y) # voir la mati`ere de x x # voir les objets de votre workspace ls()
  • 46. R code 1.7 # G´en´erer la suite 1, 2, ..., 20. x <- 1:20 # cr´eer un autre vecteur en fonction de x y <- 2*x+3 # cr´eer un data frame de deux colonnes et # voir sa mati`ere dt <- data.frame(x, y) dt # estimer un mod`ele lin´eaire et voir les # r´esultats fit <- lm(y ~ x, data = dt) summary(fit)
  • 47. 2. Bases du langage R
  • 48. Objectifs du chapitre 1 Comprendre ce qui est un fonction et comment l’utiliser 2 Identifier les principaux types d’objets dans R: vector, matrix, data frame et list 3 Cr´eer et manipuler ces objets 4 Importer des fichiers .txt et .csv 5 Installer un package
  • 49. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Les fonctions 36 / 94
  • 50. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction D´efinition et appel de fonctions • Plutˆot que d’´ecrire plusieurs lignes de codes pour des choses assez simples et r´ep´etitives on fait appel `a des fonctions 37 / 94
  • 51. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction D´efinition et appel de fonctions • Plutˆot que d’´ecrire plusieurs lignes de codes pour des choses assez simples et r´ep´etitives on fait appel `a des fonctions • Une fonction est caract´eris´ee par deux composantes: 37 / 94
  • 52. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction D´efinition et appel de fonctions • Plutˆot que d’´ecrire plusieurs lignes de codes pour des choses assez simples et r´ep´etitives on fait appel `a des fonctions • Une fonction est caract´eris´ee par deux composantes: 1 son nom: c’est ce nom qui nous permettra d’appeler la fonction 37 / 94
  • 53. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction D´efinition et appel de fonctions • Plutˆot que d’´ecrire plusieurs lignes de codes pour des choses assez simples et r´ep´etitives on fait appel `a des fonctions • Une fonction est caract´eris´ee par deux composantes: 1 son nom: c’est ce nom qui nous permettra d’appeler la fonction 2 une liste d’arguments: ce sont les informations dont la fonction a besoin pour travailler et renvoyer son r´esultat 37 / 94
  • 54. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La syntaxe pour appeler une fonction • Il faut ´ecrire son nom suivi de parenth`eses 38 / 94
  • 55. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La syntaxe pour appeler une fonction • Il faut ´ecrire son nom suivi de parenth`eses • Entre ces parenth`eses, nous indiquerons les arguments dont la fonction a besoin: nom_de_la_fonction(arguments) 38 / 94
  • 56. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La syntaxe pour appeler une fonction • Il faut ´ecrire son nom suivi de parenth`eses • Entre ces parenth`eses, nous indiquerons les arguments dont la fonction a besoin: nom_de_la_fonction(arguments) R code 2.1 # chercher la rubrique d'aide pour racine carr´ee ?sqrt # on voit que la fonction prend un argument sqrt(49) 38 / 94
  • 57. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Arguments facultatifs • Certaines fonctions n´ecessitent plusieurs arguments et certains de ces arguments sont optionnels (aussi possible d’avoir aucun argument: getwd()) 39 / 94
  • 58. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Arguments facultatifs • Certaines fonctions n´ecessitent plusieurs arguments et certains de ces arguments sont optionnels (aussi possible d’avoir aucun argument: getwd()) • Les arguments optionnels poss`edent une valeur par d´efaut 39 / 94
  • 59. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Arguments facultatifs • Certaines fonctions n´ecessitent plusieurs arguments et certains de ces arguments sont optionnels (aussi possible d’avoir aucun argument: getwd()) • Les arguments optionnels poss`edent une valeur par d´efaut • Si on ne sp´ecifie pas de valeur, ces arguments prendront la valeur d´efinie par d´efaut, sinon ils prendront la valeur sp´ecifi´ee 39 / 94
  • 60. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Arguments facultatifs • Certaines fonctions n´ecessitent plusieurs arguments et certains de ces arguments sont optionnels (aussi possible d’avoir aucun argument: getwd()) • Les arguments optionnels poss`edent une valeur par d´efaut • Si on ne sp´ecifie pas de valeur, ces arguments prendront la valeur d´efinie par d´efaut, sinon ils prendront la valeur sp´ecifi´ee R code 2.2 # chercher la rubrique d'aide pour logarithme ?log # on ne pr´ecise pas de valeur pour le second argument log(2) # On peut sp´ecifier le second argument en l'appelant par son nom log(2, base = exp(1)) 39 / 94
  • 61. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Les objets R 40 / 94
  • 62. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Les objets R Table 1 : Les principaux objets en R et le nom de leurs fonctions dimension homog`enea h´et´erog`eneb 1d Atomic vector List c() list() 2d Matrix Data frame matrix() data.frame() a tous les ´el´ements doivent ˆetre du mˆeme type b les ´el´ements peuvent ˆetre de diff´erents types 41 / 94
  • 63. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Atomic vectors • En R, `a toutes fins pratiques, tout est un vecteur 42 / 94
  • 64. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Atomic vectors • En R, `a toutes fins pratiques, tout est un vecteur • La fonction de base pour cr´eer un vecteur est c() (concat´enation) 42 / 94
  • 65. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Atomic vectors • En R, `a toutes fins pratiques, tout est un vecteur • La fonction de base pour cr´eer un vecteur est c() (concat´enation) R code 2.3 c(1, 2, 5) ## [1] 1 2 5 42 / 94
  • 66. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Atomic vectors • Les quatre types d’atomic vectors les plus utilis´es: 1 double (´egalement appel´e numeric) 2 integer 3 character 4 logical 43 / 94
  • 67. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Atomic vectors • Les quatre types d’atomic vectors les plus utilis´es: 1 double (´egalement appel´e numeric) 2 integer 3 character 4 logical R code 2.4 c(1, 2.5, 4.5) # numeric c(1L, 6L, 10L) # integer c("ceci sont", "des characters") #character c(TRUE, FALSE, T, F) # logical 43 / 94
  • 68. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Coercion • Tous les ´el´ements d’un atomic vector doivent ˆetre du mˆeme type 44 / 94
  • 69. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Coercion • Tous les ´el´ements d’un atomic vector doivent ˆetre du mˆeme type • Lorsque vous essayez de combiner diff´erents types, ils seront convertis au type le plus flexible 44 / 94
  • 70. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Coercion • Tous les ´el´ements d’un atomic vector doivent ˆetre du mˆeme type • Lorsque vous essayez de combiner diff´erents types, ils seront convertis au type le plus flexible • Types du moins au plus flexible sont: 1 logical 2 integer 3 double 4 character R code 2.5 # combiner un character et integer donne un character str(c("a", 1)) ## chr [1:2] "a" "1" 44 / 94
  • 71. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Coercion • La plupart des op´erations math´ematiques vont convertir un atomic vector `a un double ou integer R code 2.6 x <- c(FALSE, FALSE, TRUE) as.numeric(x) ## [1] 0 0 1 # Nombre total de TRUE sum(x) ## [1] 1 # La proportion de TRUE mean(x) ## [1] 0.33 45 / 94
  • 72. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction List • Les lists sont diff´erent des atomic vectors parce que leurs ´el´ements peuvent ˆetre de tout type • La fonction pour cr´eer un list est list() 46 / 94
  • 73. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction List • Les lists sont diff´erent des atomic vectors parce que leurs ´el´ements peuvent ˆetre de tout type • La fonction pour cr´eer un list est list() R code 2.7 (x <- list(1:3, "a", c(TRUE, FALSE, TRUE), c(2.3, 5.9))) ## [[1]] ## [1] 1 2 3 ## ## [[2]] ## [1] "a" ## ## [[3]] ## [1] TRUE FALSE TRUE ## ## [[4]] ## [1] 2.3 5.9 46 / 94
  • 74. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Matrix • Les matrices ne sont rien d’autre que des vecteurs en 2 dimensions 47 / 94
  • 75. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Matrix • Les matrices ne sont rien d’autre que des vecteurs en 2 dimensions • Surtout utilis´ees pour faire les calculs math´ematiques (pensez `a vos cours d’alg`ebre lin´eaire) 47 / 94
  • 76. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Matrix • Les matrices ne sont rien d’autre que des vecteurs en 2 dimensions • Surtout utilis´ees pour faire les calculs math´ematiques (pensez `a vos cours d’alg`ebre lin´eaire) • La fonction pour cr´eer un matrix est matrix() 47 / 94
  • 77. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Matrix • Les matrices ne sont rien d’autre que des vecteurs en 2 dimensions • Surtout utilis´ees pour faire les calculs math´ematiques (pensez `a vos cours d’alg`ebre lin´eaire) • La fonction pour cr´eer un matrix est matrix() R code 2.8 # rempli par colonne par d´efaut matrix(c(1,2,3,4,5,6), nrow = 2, ncol = 3) ## [,1] [,2] [,3] ## [1,] 1 3 5 ## [2,] 2 4 6 47 / 94
  • 78. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Matrix R code 2.9 # automatiquement converti en donn´ees homog`enes matrix(c(1,2,3,"a","b","c"), nrow = 2, ncol = 3) ## [,1] [,2] [,3] ## [1,] "1" "3" "b" ## [2,] "2" "a" "c" 48 / 94
  • 79. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Data frame • Le data frame est un tableau de donn´ees h´et´erog`enes 49 / 94
  • 80. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Data frame • Le data frame est un tableau de donn´ees h´et´erog`enes • La fonction pour cr´eer un data frame est data.frame() 49 / 94
  • 81. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Data frame • Le data frame est un tableau de donn´ees h´et´erog`enes • La fonction pour cr´eer un data frame est data.frame() R code 2.10 # une colonne 'id' pour identifier les sujets # une colonne 'age' pour leur age data.frame(id = c("didier","patrice","laurent"), age = c(37,34,32)) ## id age ## 1 didier 37 ## 2 patrice 34 ## 3 laurent 32 49 / 94
  • 82. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La diff´erence entre data frame et matrix? • matrix: calculs matriciels • data.frame: toutes autres analyses de donn´ees h´et´erog`enes 50 / 94
  • 83. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Commandes R 51 / 94
  • 84. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Expression et affectation 1 Une expression est imm´ediatement ´evalu´ee et le r´esultat est affich´e `a l’´ecran: 52 / 94
  • 85. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Expression et affectation 1 Une expression est imm´ediatement ´evalu´ee et le r´esultat est affich´e `a l’´ecran: R code 2.11 2 + 3 ## [1] 5 pi ## [1] 3.1 cos(pi/4) ## [1] 0.71 52 / 94
  • 86. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Expression et affectation 2 Lors d’une affectation, une expression est ´evalu´ee, mais le r´esultat est stock´e dans un objet (variable) et rien n’est affich´e `a l’´ecran • Le symbole d’affectation est <- • les deux caract`eres < et - plac´es obligatoirement l’un `a la suite de l’autre: 53 / 94
  • 87. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Expression et affectation 3 Lors d’une affectation, une expression est ´evalu´ee, mais le r´esultat est stock´e dans un objet (variable) et rien n’est affich´e `a l’´ecran • Le symbole d’affectation est <- • les deux caract`eres < et - plac´es obligatoirement l’un `a la suite de l’autre: R code 2.12 a <- 5 a ## [1] 5 b <- a - 2 b ## [1] 3 53 / 94
  • 88. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Indexation d’un vector • L’indexation sert principalement `a deux choses 54 / 94
  • 89. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Indexation d’un vector • L’indexation sert principalement `a deux choses 1 extraire des ´el´ements 2 remplacer des ´el´ements 54 / 94
  • 90. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Indexation d’un vector • L’indexation sert principalement `a deux choses 1 extraire des ´el´ements 2 remplacer des ´el´ements R code 2.13 # cr´eation d'un vecteur x <- c(a = -1, b = 2, c = 8, d = 10) # extraction par position x[1] # extraction par ´etiquette x["c"] # remplacer le deuxi`eme ´el´ement par 5 x[2] <- 5 54 / 94
  • 91. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Indexation d’un data frame et matrix • L’indexation des observations se fait `a partir des rang´ees et colonnes du data frame et matrix: d[rang´ee,colonne] 55 / 94
  • 92. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Indexation d’un data frame et matrix • L’indexation des observations se fait `a partir des rang´ees et colonnes du data frame et matrix: d[rang´ee,colonne] R code 2.14 # cr´eation d'un data frame d <- data.frame(Noms = c("Pierre", "Jean", "Jacques"), Age = c(42, 34, 19), Fumeur = c(TRUE, TRUE, FALSE)) d[1, ] # premi`ere rang´ee d[ ,1] # premi`ere colonne d[3,2] # troisi`eme rang´ee, deuxi`eme colonne 55 / 94
  • 93. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Indexation d’un list R code 2.15 # cr´eation d'un list x <- list(joueur = c("V", "C"), score = c(10, 12)) # premier ´el´ement de la list x[[1]] # 1er ´el´ement du 2e ´el´ement de la list x[[2]][1] 56 / 94
  • 94. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Importer et enregistrer des donn´ees et du code Table 2 : Les fonctions de bases pour importer et enregistrer des donn´ees et du code R fichiers objetsc script R importer read.table()a load() source() read.csv()b enregistrer write.table() save() File -> Save As.. write.csv() a chaque valeur est s´epar´ee par un espace b chaque valeur est s´epar´ee par une virgule c objets dans ton espace de travail (Environment) 57 / 94
  • 95. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Importer des donn´ees • Il est n´ecessaire de pr´eciser le chemin d’acc`es au fichier s’il n’est pas dans le r´epertoire de travail 58 / 94
  • 96. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Importer des donn´ees • Il est n´ecessaire de pr´eciser le chemin d’acc`es au fichier s’il n’est pas dans le r´epertoire de travail • getwd(): connaˆıtre le r´epertoire de travail 58 / 94
  • 97. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Importer des donn´ees • Il est n´ecessaire de pr´eciser le chemin d’acc`es au fichier s’il n’est pas dans le r´epertoire de travail • getwd(): connaˆıtre le r´epertoire de travail • setwd(): modifier le r´epertoire de travail 58 / 94
  • 98. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Importer des donn´ees • Il est n´ecessaire de pr´eciser le chemin d’acc`es au fichier s’il n’est pas dans le r´epertoire de travail • getwd(): connaˆıtre le r´epertoire de travail • setwd(): modifier le r´epertoire de travail R code 2.16 # modifier le r´epertoire de travail setwd("~/git_repositories/atelier-R-GERAD/data") # importer les fichiers # affectation aux objets 'lung' et 'admit' lung <- read.csv("lung.csv") admit <- read.table("admit.txt") 58 / 94
  • 99. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Importer du code R `a partir d’un script R code 2.17 # modifier le r´epertoire de travail setwd("~/git_repositories/atelier-R-GERAD/script") # ex´ecute les commandes R du script 'mtcars.R' # et montre le output source("mtcars.R", echo = TRUE) # sauvegarde les objets du environment save(df, fit, file = "mtcars.RData") # supprime les objets de ton environment rm(df, fit) # importer les objets R de 'mtcars.RData' load("mtcars.RData") 59 / 94
  • 100. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Installer des packages additionnels dans R • Un package R est un ensemble coh´erent de fonctions, de jeux de donn´ees et de documentation permettant de compl´eter les fonctionnalit´es du syst`eme ou d’en ajouter de nouvelles • La liste compl`ete de ces packages est disponible sur le site METACRAN 60 / 94
  • 101. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Installer des packages additionnels dans R • Un package R est un ensemble coh´erent de fonctions, de jeux de donn´ees et de documentation permettant de compl´eter les fonctionnalit´es du syst`eme ou d’en ajouter de nouvelles • La liste compl`ete de ces packages est disponible sur le site METACRAN R code 2.18 # installer des packages pour cr´eer des rapports # reproductibles install.packages(c("knitr","rmarkdown")) # pour avoir acc`es aux fonctions dans ces packages library(knitr) library(rmarkdown) 60 / 94
  • 102. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Sommaire 61 / 94
  • 103. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Sommaire des commandes de bases sessionInfo() install.packages() library()texxxx setwd()teccc getwd()teccc rm()tevvvvvvv ls()tevvvvvvv c() data.frame() matrix() list() read.table() write.table() load() save()text source() Espace de travail Objets R les plus utilis´es Acc´eder les donn´ees et scripts R 62 / 94
  • 105. Objectifs du chapitre 1 Comprendre la syntaxe de la fonction plot 2 Cr´eer des boxplot, histogram et density plot 3 Comment sauvegarder des graphiques
  • 106. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction plot 65 / 94
  • 107. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Introduction aux graphiques en R • R offre une vari´et´e de graphiques remarquables • Pour avoir une petite id´ee des possibilit´es offertes, il suffit de taper la commande demo(graphics) 66 / 94
  • 108. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction plot • La fonction plot peut prendre plusieurs arguments et types d’objets 67 / 94
  • 109. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction plot • La fonction plot peut prendre plusieurs arguments et types d’objets R code 3.1 # Plot des valeurs d'un vecteur contre leurs indices # ´equivalent `a plot(mtcars[,"mpg"]) plot(mtcars$mpg, xlab = "Index", ylab = "mpg", main = "Titre") # Graphique des couples (x, y) plot(mtcars$mpg, mtcars$disp, xlab = "mpg", ylab = "disp", main = "mpg vs. disp") 67 / 94
  • 110. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction plot • La fonction plot peut aussi prendre un objet du mod`ele lin´eaire comme argument 68 / 94
  • 111. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction plot • La fonction plot peut aussi prendre un objet du mod`ele lin´eaire comme argument • Ceci est un exemple qui d´emontre pourquoi R est un langage orient´ee objet 68 / 94
  • 112. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction plot • La fonction plot peut aussi prendre un objet du mod`ele lin´eaire comme argument • Ceci est un exemple qui d´emontre pourquoi R est un langage orient´ee objet R code 3.2 # importer 'mtcars.RData' load("mtcars.RData") # Graphiques des 4 diagnostiques # du mod`ele lin´eaire # placer dans 2 rang´es et 2 colonnes par(mfrow=c(2,2)) plot(fit) 68 / 94
  • 113. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction histogram et boxplot 69 / 94
  • 114. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction histogram • Utile pour voir la distribution des donn´ees • Pour les donn´ees continues et univari´ees 70 / 94
  • 115. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction histogram • Utile pour voir la distribution des donn´ees • Pour les donn´ees continues et univari´ees R code 3.3 # la taille de 237 ´etudiants disponibles dans le jeu # de donn´ees 'survey' du library(MASS) library(MASS) # voir le nom des colonnes names(survey) # histogram de la taille et montrer la fr´equence # de chaque barre hist(survey$Height, labels = TRUE) 70 / 94
  • 116. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction boxplot • Utile pour voir la diff´erence d’une variable continue parmi plusieurs groupes 71 / 94
  • 117. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction boxplot • Utile pour voir la diff´erence d’une variable continue parmi plusieurs groupes R code 3.4 # visualiser la diff´erence de taille entre les # hommes et les femmes dans le jeux # de donn´ees 'survey' du library(MASS) boxplot(survey$Height ~ survey$Sex, ylab = "Taille (cm)", col = c("lightpink","lightblue")) 71 / 94
  • 118. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Sauvegarder les graphiques • 2 fonctions principales: pdf() et png() • l’argument de ces fonctions est le nom du fichier d´esir´e 72 / 94
  • 119. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Sauvegarder les graphiques • 2 fonctions principales: pdf() et png() • l’argument de ces fonctions est le nom du fichier d´esir´e R code 3.5 # enregistrer dans le r´epertoire de travail courant pdf("boxplot_survey.pdf") boxplot(survey$Height ~ survey$Sex, ylab = "Taille (cm)") dev.off() 72 / 94
  • 120. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Sommaire 73 / 94
  • 121. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Sommaire des commandes de graphiques plot() hist()texxxx boxplot()texxxx xlab ylabtextttt maintextttt typetextttt coltextttt pdf() png()textttt dev.off()textttt Fonctions pour cr´eer les graphiques Arguments communs pour ces fonctions Fonctions pour enregistrer les graphiques 74 / 94
  • 123. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Moyenne, ´ecart type 76 / 94
  • 124. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Moyenne, variance, ´ecart type, minimum, maximum • fonctions principales: mean(), var(), sd(), min(), max() 77 / 94
  • 125. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Moyenne, variance, ´ecart type, minimum, maximum • fonctions principales: mean(), var(), sd(), min(), max() • la fonction summary() est utile pour calculer quelques statistiques de bases pour un data frame 77 / 94
  • 126. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Moyenne, variance, ´ecart type, minimum, maximum • fonctions principales: mean(), var(), sd(), min(), max() • la fonction summary() est utile pour calculer quelques statistiques de bases pour un data frame R code 4.1 # enregistrer dans le r´epertoire de travail courant summary(mtcars) 77 / 94
  • 127. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction apply • Pour calculer des statistiques plus compliqu´ees sur un data frame (ou matrix), on utilise la fonction apply 78 / 94
  • 128. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction apply • Pour calculer des statistiques plus compliqu´ees sur un data frame (ou matrix), on utilise la fonction apply • La fonction apply sert `a appliquer une fonction quelconque sur une partie d’un matrix ou data frame 78 / 94
  • 129. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction apply • La syntaxe de la fonction est la suivante: apply(X, MARGIN, FUN) • X: un matrix ou data frame • MARGIN: 1 si l’on veut faire des calculs sur les rang´ees, 2 sur les colonnes • FUN: est la fonction `a appliquer 79 / 94
  • 130. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction apply • La syntaxe de la fonction est la suivante: apply(X, MARGIN, FUN) • X: un matrix ou data frame • MARGIN: 1 si l’on veut faire des calculs sur les rang´ees, 2 sur les colonnes • FUN: est la fonction `a appliquer R code 4.2 # variance par ligne apply(mtcars, 1, var) 79 / 94
  • 131. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction La fonction apply R code 4.3 # variance par colonne apply(mtcars, 2, var) # ´ecart type par colonne apply(mtcars, 2, sd) # minimum de chaque rang´ee apply(mtcars, 1, min) # maximum de chaque rang´ee apply(mtcars, 1, max) 80 / 94
  • 132. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Test t et analyse de variance 81 / 94
  • 133. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Test t • la fonction pour faire un test t est t.test() 82 / 94
  • 134. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Test t • la fonction pour faire un test t est t.test() R code 4.4 # la taille de 237 ´etudiants disponible dans le jeux # de donn´ees 'survey' du library(MASS) # est-ce qu'il y a une diff´erence de taille entre # les hommes et les femmes? t.test(Height ~ Sex, data = survey) 82 / 94
  • 135. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Analyse de variance • La fonction pour l’analyse de variance est aov 83 / 94
  • 136. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Analyse de variance • La fonction pour l’analyse de variance est aov • Prenons un jeux de donn´ees disponible dans R: InsectSprays 83 / 94
  • 137. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Analyse de variance • La fonction pour l’analyse de variance est aov • Prenons un jeux de donn´ees disponible dans R: InsectSprays • 6 insecticides ont ´et´e test´es 12 fois en culture, la r´eponse observ´ee ´etant le nombre d’insectes 83 / 94
  • 138. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Analyse de variance • La fonction pour l’analyse de variance est aov • Prenons un jeux de donn´ees disponible dans R: InsectSprays • 6 insecticides ont ´et´e test´es 12 fois en culture, la r´eponse observ´ee ´etant le nombre d’insectes • Le but c’est de voir s’il y a une diff´erence importante entre les 6 insecticides par rapport `a le nombre d’insectes 83 / 94
  • 139. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Analyse de variance R code 4.5 # boxplot pour voir la diff´erence entre # les groupes boxplot(InsectSprays$count ~ InsectSprays$spray) # Les r´esultats ne sont pas affich´es, ceux-ci sont # copi´es dans un objet nomm´e aov.spray aov.spray <- aov(count ~ spray, data = InsectSprays) # sommaire des r´esultats summary(aov.spray) 84 / 94
  • 140. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Mod`eles lin´eaires 85 / 94
  • 141. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Les formules • Les formules repr´esentent un ´el´ement-cl´e des analyses statistiques avec R 86 / 94
  • 142. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Les formules • Les formules repr´esentent un ´el´ement-cl´e des analyses statistiques avec R • La notation utilis´ee est la mˆeme pour (presque) toutes les fonctions 86 / 94
  • 143. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Les formules • Les formules repr´esentent un ´el´ement-cl´e des analyses statistiques avec R • La notation utilis´ee est la mˆeme pour (presque) toutes les fonctions • Une formule est typiquement de la forme y ∼ model 86 / 94
  • 144. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Les formules • Les formules repr´esentent un ´el´ement-cl´e des analyses statistiques avec R • La notation utilis´ee est la mˆeme pour (presque) toutes les fonctions • Une formule est typiquement de la forme y ∼ model 1 y: est la r´eponse analys´ee 2 model: est un ensemble de termes pour lesquels les param`etres sont estim´es 86 / 94
  • 145. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Les formules • Les formules repr´esentent un ´el´ement-cl´e des analyses statistiques avec R • La notation utilis´ee est la mˆeme pour (presque) toutes les fonctions • Une formule est typiquement de la forme y ∼ model 1 y: est la r´eponse analys´ee 2 model: est un ensemble de termes pour lesquels les param`etres sont estim´es • Ces termes sont s´epar´es par des symboles arithm´etiques mais qui ont ici une signification particuli`ere: a+b, a*b 86 / 94
  • 146. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Mod`eles lin´eaires R code 4.6 # importer 'admit.txt' admit <- read.table("admit.txt", header = TRUE) # est-ce que gpa et rank sont reli´es `a gre fit <- lm(gre ~ gpa+rank, data = admit) # voir les r´esultats summary(fit) 87 / 94
  • 147. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction GLM R code 4.7 # r´egression logistique fit.glm <- glm(admit ~ gre+gpa+rank, data = admit, family = binomial(link = "logit")) # voir les r´esultats summary(fit.glm) 88 / 94
  • 148. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Sommaire 89 / 94
  • 149. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Sommaire des commandes de statistiques mean() var()texxxxxx sd()texxxx min()texxxx max()texxxx median()texxxx apply()texxxx aov() t.test()textttt chisq.test()textttt lm() glm()textdddttt Fonctions pour des statistiques descriptives Tests statistiques Fonctions pour les mod`eles de r´egression 90 / 94
  • 150. 5. Cr´eer des rapports
  • 151. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Introduction 92 / 94
  • 152. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Introduction • http://rmarkdown.rstudio.com/ • http://shiny.rstudio.com/gallery/ 93 / 94
  • 153. Atelier sur le logiciel R 1.Pr´esentation du langage R Pourquoi ˆetes-vous l`a? Bref historique Caract´eristiques de R D´emarrer une session 2.Bases du langage R Les fonctions Les objets R Commandes R Sommaire 3. Graphiques La fonction plot histogram et boxplot Sommaire 4. Statistiques Moyenne, ´ecart type Test t et analyse de variance Mod`eles lin´eaires Sommaire 5. Rapports reproductibles Introduction Session Information • R version 3.2.1 (2015-06-18), x86_64-pc-linux-gnu • Base packages: base, datasets, graphics, grDevices, methods, stats, utils • Other packages: data.table 1.9.4, dplyr 0.4.1, ggplot2 1.0.1, knitr 1.10.5, xtable 1.7-4 • Loaded via a namespace (and not attached): assertthat 0.1, chron 2.3-45, colorspace 1.2-6, DBI 0.3.1, digest 0.6.8, evaluate 0.7, formatR 1.2, grid 3.2.1, gtable 0.1.2, highr 0.5, magrittr 1.5, MASS 7.3-43, munsell 0.4.2, parallel 3.2.1, plyr 1.8.3, proto 0.3-10, Rcpp 0.11.6, reshape2 1.4.1, scales 0.2.5, stringi 0.5-5, stringr 1.0.0, tools 3.2.1 94 / 94