ex=read.table("I:/dateien/Mathematik/111Math/Math_fr_fixes/R/ex.txt",header=T)
head(ex)  #edite les premières 5 lignes d'un data.frame (tableau des données)
str(ex) #edite la structure d'un objet

mean(ex$formation) #moyenne arithmétique
help(mean) # aide pour la commande mean; 

var(ex$formation) #variance
sd(ex$formation) #écart-type
median(ex$formation)  #médiane
quantile(ex$formation) # les quatres quartiles
quantile(ex$formation,0.38)  #le 0.38-quantile
quantile(ex$formation,seq(0.1,1,0.1))  #seq(a,b,c) produit une suite arithmétique de a à b par pas de c) 

(tg=table(ex$genre)); #en mettant une paranthèse autour le tout R edite l'objet et l'enregistre sous tg)
names(tg)=c("femmes","hommes");tg
# diagramme en colonnes 
(a=barplot(tg,names=c("femmes","hommes"),main="genre",ylab="fréquences",ylim=c(0,350))) 
text(y=tg-15,x=a,labels=tg)


ts=table(ex$satisfact)
(b=barplot(ts,names=c("mécontent","peu content","content","très content"),
        main="satisfaction avec le travail",ylab="fréquences",ylim=c(0,200)))
text(y=ts-15,x=b,labels=ts)

#fonction de répartition empirique
plot(ecdf(ex$revenu),main="Fonction de répartition empirique",xlab="revenu imposable",
     ylab="fréquences relatives cumulatives")

#histogrammes
hist(ex$revenu, main="histogramme du revenu imposable", xlab="revenus classifiés",
     ylab="fréquences absolues")
hist(ex$revenu, main="histogramme du revenu imposable", prob=T,xlab="revenus classifiés",
     ylab="fréquences relatives")


#bivarié
#tableau croisé
table(ex$genre,ex$satisfact)
tgs=table(ex$genre,ex$satisfact)
colnames(tgs)=c("mécontent","peu content","content","très contents")
rownames(tgs)=c("femmes","hommes");tgs #deux commandes sur une linge séparées par ; 

(bp=barplot(tgs,width = 2,beside=T,col=c(2,3),main="Satisfaction avec le travail * genre",
        xlab="satisfaction avec le travail",ylab="fréquences absolues",ylim=c(0,160)))
legend("topright",title="genre",legend=c("femmes","hommes"),pch=15,col=c(2,3))
#col=c(1,2), horiz=F, beside=T)

text(tgs[1,],y=tgs[1,]+5,x=bp[1,],cex=0.5)
text(tgs[2,],y=tgs[2,]+5,x=bp[2,],cex=0.5)

#boxplot
boxplot(ex$revenu~ex$genre,names=c("femmes","hommes"),
        main="boxplot genre * revenu",ylab="revenu")
#calcul  de mesures pour des sous-groupes
splitgenre=split(ex$revenu,ex$genre) #première variable séparée selon la deuxième variable
lapply(splitgenre,mean) #lapply: applique une commande sur les éléments d'une liste, la fonction appliqueé à la deuxième place
lapply(splitgenre,sd)

plot(ex$revenu~ex$formation,main="formation * revenu",xlab="formation",ylab="revenu")

#corrélation de Pearson et de Spearman
cor(ex$revenu,ex$formation)
cor(ex$revenu,ex$formation,method="spearman")

#regression
(m1=lm(ex$revenu~ex$formation))
abline(coef(m1),col=2) #ajoute droite de regression au plot
c(1,14)%*%coef(m1) #calcule la valeur estimée du revenu pour une formation = 14.
str(m1)  #montre la structure de l'objet m1.