Hallo, ich versuche, eine for-Schleife zu machen, bei der der Datenrahmen mit der maximalen Datumsrückgabe aus der Datumsspalte gefiltert wird, und wenn die Länge der Zeilen == 1 ist, dann lasse es fallen und mache so weiter, bis das maximale Datum! = 1 ist. Das maximale Datum bezieht sich hier auf das maximale Datum in der Datumsspalte im Datenrahmen. Der Grund, warum ich hier absteigend mache, ist, dass ich, da Daten täglich an den Datenrahmen angehängt werden, das letzte Datum überprüfe, wenn es nur 1 Zeile zurückgibt, wenn ja, lösche, damit die Anhängefunktion von einer anderen Funktion weiter anhängen kann maximales Datum. Der Tisch ist so
Datum | Namen | Alter |
---|---|---|
01.04.2022 | John | fünfzehn |
01.04.2022 | Jane | fünfzehn |
01.04.2022 | Schwansa | fünfzehn |
2022-04-02 | Timmy | fünfzehn |
2022-04-02 | (Null) | fünfzehn |
2022-04-02 | (Null) | fünfzehn |
2022-04-03 | (Null) | fünfzehn |
2022-04-04 | (Null) | (Null) |
2022-04-05 | (Null) | (Null) |
Lösung des Problems
Sie können versuchen, groupby
und zu verwendentransform
df['date'] = pd.to_datetime(df['date'])
df_filtered = df[(df.groupby('date')['names'].transform('count')!=1) | (df['date'].dt.year!= 2022)]
Datum | Namen | Alter | |
---|---|---|---|
0 | 01.04.2022 | John | fünfzehn |
ein | 01.04.2022 | Jane | fünfzehn |
2 | 01.04.2022 | Schwansa | fünfzehn |
3 | 2022-04-02 | Timmy | fünfzehn |
4 | 2022-04-02 | (Null) | fünfzehn |
5 | 2022-04-02 | (Null) | fünfzehn |
Keine Kommentare:
Kommentar veröffentlichen