| Simpson {varia} | R Documentation |
Der (normierte) Simpson-Index ist ein Streumass für die Verteilung klassierter Daten. Er nimmt bei gleicher Verteilung auf alle Klassen den Wert 1 an, bei Konzentration aller Daten in einer Klasse den Wert 0
Simpson(daten, AHVerteilung = F, rel = F)
daten |
Datensatz |
AHVerteilung |
Absolute Häufigkeitsverteilung; nur anzugeben, wenn statt der Daten ein Vektor von absoluten Häufigkeiten eingegeben wird |
rel |
relative Häufigkeitsverteilung; nur anzugeben wenn statt der Daten ein Vektor von relativen Häufigkeiten eingegeben wird. |
Es wird der Simpsonindex ausgegeben.
Paul Ruppen
Statistisches Basiswissen: die Summe der quadrierten relativen Häufigkeiten wird von 1 abgezogen. Das Resultat wird mit m/(m-1) gewichtet, wobei m die Anzahl der Klassen ist
bei=data.frame("zu"=round(1+5*runif(200))) #Beispieldaten
Simpson(bei$zu)