Ich habe einen Datenrahmen, der Variablen enthält:
Group high weigh age col5
row1 A 12 57 18 AA
row2 C 22 80 29 BB
row3 B 17 70 20 CC
row4 A 13 60 26 DD
row5 D 19 69 25 AA
row6 B 10 15 19 BB
row7 C 20 66 22 CC
row8 D 13 53 18 DD
Ich möchte den Standardfehler mit der Funktion std.error aus dem Paket Plotrix oder mit einer anderen Methode (wie die direkte Berechnung von sd / sqrt (Länge (Daten [, Spalte])) aller quantitativen Fehler nach Gruppe in (erste Spalte) berechnen, also die Ergebnis, das ich will, ist
Group se_high se_weigh se_age
row1 A 0.223 0.023 0.1
row3 B 0.12 0.1 0.12
row7 C 0.1 0.04 0.09
row8 D 0.05 0.12 0.07
Ich habe versucht, group_by dplyr fubction zu verwenden, um Spalte eins zu gruppieren und dann std.error zu verwenden, aber ich weiß nicht, wie ich sie kombinieren soll
#this is the dplyr function to calculate the mean by group
library(dplyr)
data %>%
group_by(group) %>%
summarise_at(vars("A", "B", "C","D"), mean)
Ich würde auch gerne wissen, wie man std.error durch zwei Gruppen berechnet (Spalte 1 und letzte Spalte 5 zum Beispiel)
Danke
Lösung des Problems
Du warst nah! Summarize_at ist jetzt eigentlich veraltet, also würde ich Folgendes tun:
library(dplyr)
data %>%
group_by(Group) %>%
summarize(se_high=plotrix::std.error(high),
se_weigh=plotrix::std.error(weigh),
se_age=plotrix::std.error(age))
die zurückkehrt
# A tibble: 4 x 4
Group se_high se_weigh se_age
<chr> <dbl> <dbl> <dbl>
1 A 0.5 1.5 4
2 B 3.5 27.5 0.5
3 C 1 7 3.5
4 D 3 8 3.5
Keine Kommentare:
Kommentar veröffentlichen