| median.test {varia} | R Documentation |
Nichtparametrischer Zweistichprobentest, um zwei Stichproben zu vergleichen. Es wird der Median M des gesamten Datensatzes berechnet. Dann werden folgende Grössen berechnet: B: Anzahl Daten der ersten Stichprobe, die grösser M sind. Dies ist der Testwert. A: Anzahl Daten der ersten Stichprobe, die kleiner-gleich M sind. C: Anzahl der Daten der zweiten Stichprobe, die kleiner-gleich M sind. D: Anzahl der Daten der zweiten Stichprobe, die grösser M sind. Es wird mit Hilfe der hypergeometrischen Verteilung berechnet, wie hoch die Wahrscheinlichkeit ist, einen Wert kleiner, grösser oder ungleich dem Testwert zu erhalten, wobei die Anzahl der "günstigen Ergebnisse" A+B sind, die Grundgesamtheit N= A+B+C+D und die Stichprobengrösse B+D ist.
median.test(daten, gruppen, alternative = "two.sided")
daten |
eine mindestens ordinalskalierte Variable |
gruppen |
Variable, welche die beiden Stichproben angibt |
alternative |
rechts-, links- oder zweiseitiger Test - "less" für "linksseitig", "greater" für rechtsseitig und "two.sided" für zweiseitig |
Statt der exakten hypergeometrischen Verteilung wird bei grösseren Stichprobenumfängen oft eine Normalverteilungsnäherung oder auch ein Chi-Quadrattest verwendet. Diese Tests sind hier nicht implementiert.
data |
Es wird der Name der analysierten mindestens ordinal-skalierten Variable angegeben |
groups |
Es wird der Name der Stichprobenvariable angegeben |
statistic |
Es wird die Anzahl der Daten der ersten Stichprobe angegeben, die grösser als der Median sind |
p-value |
Es wird der p-Wert angegeben |
alternative hypothesis |
Es wird angegeben, ob links-, rechts- oder zweiseitig getestet wurde |
sample estimates |
Es werden die Zahlen A, B, C und D geliefert, s. unter "description" |
number of available data |
Es werden die Anzahl der Daten angegeben, die bei der Berechnung verwendet wurden |
length of data vector |
Es wird die Anzahl der Daten inklusive ungültige angegeben |
expected value under null hypotheses |
Es wird der Erwartungswert der hypergeometrischen Verteilung bei unter "sample estimates" gegebener Situation geliefert |
median |
Es wird der Median der Daten geliefert |
Paul Ruppen
Büning, H., Trenkler, G., Nichtparametrische statistische Methoden, Berlin: Walter de Gruyter, 1994, S. 142
#Beispiel 1:
bei=data.frame(Ausgaben=c(rnorm(80,50,10),rnorm(50,40,10)), #Beispieldaten Datenvariable
stichprobe=as.factor(c(rep(1,80),rep(2,50)))) #Beispieldaten Stichprobenvariable
levels(bei$stichprobe)=c("1.Stichprobe", "2.Stichprobe")
median.test(bei$Ausgaben,bei$stichprobe)
#Beispiel 2:
median.test(ErfundDat$Einkommen,ErfundDat$Stichprobe)