DF4Loop mendukung proses tujuan umum yang membutuhkan kombinasi dari kedua panda. Dataframe dan loop. Secara khusus, misi DF4Loop adalah untuk "mempercepat pemrosesan" dan "membuat kode kompleks intuitif" dengan biaya instalasi rendah.
pip install df4loopDataFrame berikut didefinisikan untuk membantu pengguna membayangkan penggunaan DF4Loop.
import pandas as pd
sample_dict = {
"column_1" : [ 100 , 200 , 300 , 400 , 500 ],
"column_2" : [ "A" , "B" , "C" , "D" , "E" ],
"column_3" : [ "a" , "b" , "c" , "d" , "e" ],
}
df = pd . DataFrame . from_dict ( sample_dict )
df| kolom_1 | kolom_2 | kolom_3 | |
|---|---|---|---|
| 0 | 100 | A | A |
| 1 | 200 | B | B |
| 2 | 300 | C | C |
| 3 | 400 | D | D |
| 4 | 500 | E | e |
Dfiterator membantu pengembang menulis kode berikut. Ini adalah kode yang ditulis menggunakan pandas.dataframe.Iterrows untuk tujuan merujuk nilai berdasarkan baris.
for index , row in df . iterrows ():
tmp = row [ "column_1" ]Dfiterator mereproduksi proses ini dan mempercepatnya. Sebenarnya, DataFrame dan Pandas barisnya. Seri dikonversi ke daftar dan kamus untuk mempercepat. Namun, penggunaannya hampir sama.
from df4loop import DFIterator
df_iterator = DFIterator ( df )
for index , row in df_iterator . iterrows ():
tmp = row [ "column_1" ] Jika Anda tidak perlu mengeluarkan indeks, atur return_indexes=False .
from df4loop import DFIterator
df_iterator = DFIterator ( df )
for row in df_iterator . iterrows ( return_indexes = False ):
tmp = row [ "column_1" ]DFGenerator mendukung pembuatan DataFrame dengan baris yang ditetapkan oleh loop. Menambahkan baris ke DataFrame dalam satu loop akan membutuhkan waktu lama untuk diproses. Rahasia untuk mempercepat adalah mengatur baris dalam daftar atau kamus dan kemudian membuatnya panda. Dataframe sekaligus. DFGenerator mendukung proses ini untuk implementasi intuitif.
Kode berikut adalah contoh pemilihan tipe dikt sebagai baris.
from df4loop import DFGenerator
# It is not necessary to specify columns.
df_generator = DFGenerator ( columns = df . columns . values . tolist ())
for _ , row in df . iterrows ():
tmp_row = {
"column_1" : row [ "column_1" ],
"column_2" : row [ "column_2" ],
"column_3" : row [ "column_3" ],
}
df_generator . append ( tmp_row )
new_df = df_generator . generate_df ()Kode berikut adalah contoh memilih jenis daftar sebagai baris. Kolom harus ditentukan selama inisialisasi.
from df4loop import DFGenerator
df_generator = DFGenerator ( columns = df . columns . values . tolist ())
for _ , row in df . iterrows ():
tmp_row = [
row [ "column_1" ],
row [ "column_2" ],
row [ "column_3" ],
]
df_generator . append ( tmp_row )
new_df = df_generator . generate_df ()