DF4LOOP unterstützt allgemeine Prozesse, die eine Kombination von Pandas.Dataframe und Loop erfordert. Insbesondere besteht die Mission von DF4Loop darin, die Verarbeitung zu beschleunigen und "komplexe Code intuitiv zu machen" bei geringen Installationskosten.
pip install df4loopDer folgende Datenrahmen ist definiert, um den Benutzern die Verwendung von DF4LOOP vorzustellen.
import pandas as pd
sample_dict = {
"column_1" : [ 100 , 200 , 300 , 400 , 500 ],
"column_2" : [ "A" , "B" , "C" , "D" , "E" ],
"column_3" : [ "a" , "b" , "c" , "d" , "e" ],
}
df = pd . DataFrame . from_dict ( sample_dict )
df| Spalte_1 | Spalte_2 | Spalte_3 | |
|---|---|---|---|
| 0 | 100 | A | A |
| 1 | 200 | B | B |
| 2 | 300 | C | C |
| 3 | 400 | D | D |
| 4 | 500 | E | e |
Dfiterator hilft Entwicklern, den folgenden Code zu schreiben. Dieser Code wird mit pandas.dataframe.iterrowrows geschrieben, um einen Wert nach Zeile zu verweisen.
for index , row in df . iterrows ():
tmp = row [ "column_1" ]Dfiterator reproduziert diesen Prozess und beschleunigt ihn. Tatsächlich werden DataFrame und seine Zeilen -Pandas.Series in Listen und Wörterbücher umgewandelt, um zu beschleunigen. Die Verwendung ist jedoch fast gleich.
from df4loop import DFIterator
df_iterator = DFIterator ( df )
for index , row in df_iterator . iterrows ():
tmp = row [ "column_1" ] Wenn Sie den Index nicht ausgeben müssen, setzen Sie return_indexes=False .
from df4loop import DFIterator
df_iterator = DFIterator ( df )
for row in df_iterator . iterrows ( return_indexes = False ):
tmp = row [ "column_1" ]DFGenerator unterstützt die Erzeugung von Datenframe mit Zeilen, die von Schleifen festgelegt wurden. Das Hinzufügen von Zeilen zum DataFrame in einer Schleife dauert lange. Das Geheimnis des Beschleunigens besteht darin, Zeilen in einer Liste oder einem Wörterbuch zu organisieren und sie dann gleichzeitig zu pandas.dataframe zu machen. DFGenerator unterstützt diesen Prozess für die intuitive Implementierung.
Der folgende Code ist ein Beispiel für die Auswahl des DICT -Typs als Zeile.
from df4loop import DFGenerator
# It is not necessary to specify columns.
df_generator = DFGenerator ( columns = df . columns . values . tolist ())
for _ , row in df . iterrows ():
tmp_row = {
"column_1" : row [ "column_1" ],
"column_2" : row [ "column_2" ],
"column_3" : row [ "column_3" ],
}
df_generator . append ( tmp_row )
new_df = df_generator . generate_df ()Der folgende Code ist ein Beispiel für die Auswahl des Listentyps als Zeile. Spalten müssen während der Initialisierung angegeben werden.
from df4loop import DFGenerator
df_generator = DFGenerator ( columns = df . columns . values . tolist ())
for _ , row in df . iterrows ():
tmp_row = [
row [ "column_1" ],
row [ "column_2" ],
row [ "column_3" ],
]
df_generator . append ( tmp_row )
new_df = df_generator . generate_df ()