GOOGLE ADS

Dienstag, 3. Mai 2022

wie man den Standardfehler aller Variablen pro Gruppe berechnet

Ich habe einen Datenrahmen, der Variablen enthält:

 Group high weigh age col5
row1 A 12 57 18 AA
row2 C 22 80 29 BB
row3 B 17 70 20 CC
row4 A 13 60 26 DD
row5 D 19 69 25 AA
row6 B 10 15 19 BB
row7 C 20 66 22 CC
row8 D 13 53 18 DD

Ich möchte den Standardfehler mit der Funktion std.error aus dem Paket Plotrix oder mit einer anderen Methode (wie die direkte Berechnung von sd / sqrt (Länge (Daten [, Spalte])) aller quantitativen Fehler nach Gruppe in (erste Spalte) berechnen, also die Ergebnis, das ich will, ist

 Group se_high se_weigh se_age 
row1 A 0.223 0.023 0.1
row3 B 0.12 0.1 0.12
row7 C 0.1 0.04 0.09
row8 D 0.05 0.12 0.07

Ich habe versucht, group_by dplyr fubction zu verwenden, um Spalte eins zu gruppieren und dann std.error zu verwenden, aber ich weiß nicht, wie ich sie kombinieren soll

#this is the dplyr function to calculate the mean by group
library(dplyr)
data %>%
group_by(group) %>%
summarise_at(vars("A", "B", "C","D"), mean)

Ich würde auch gerne wissen, wie man std.error durch zwei Gruppen berechnet (Spalte 1 und letzte Spalte 5 zum Beispiel)

Danke


Lösung des Problems

Du warst nah! Summarize_at ist jetzt eigentlich veraltet, also würde ich Folgendes tun:

library(dplyr)
data %>%
group_by(Group) %>%
summarize(se_high=plotrix::std.error(high),
se_weigh=plotrix::std.error(weigh),
se_age=plotrix::std.error(age))

die zurückkehrt

# A tibble: 4 x 4
Group se_high se_weigh se_age
<chr> <dbl> <dbl> <dbl>
1 A 0.5 1.5 4
2 B 3.5 27.5 0.5
3 C 1 7 3.5
4 D 3 8 3.5

Keine Kommentare:

Kommentar veröffentlichen

Warum werden SCHED_FIFO-Threads derselben physischen CPU zugewiesen, obwohl CPUs im Leerlauf verfügbar sind?

Lösung des Problems Wenn ich das richtig verstehe, versuchen Sie, SCHED_FIFO mit aktiviertem Hyperthreading ("HT") zu verwenden, ...