DF4LOOP สนับสนุนกระบวนการวัตถุประสงค์ทั่วไปที่ต้องใช้การรวมกันของทั้ง pandas.dataframe และ Loop โดยเฉพาะภารกิจของ DF4Loop คือการ "เร่งความเร็วการประมวลผล" และ "สร้างรหัสที่ซับซ้อน" ในราคาติดตั้งต่ำ
pip install df4loopdataframe ต่อไปนี้ถูกกำหนดเพื่อช่วยให้ผู้ใช้จินตนาการถึงการใช้ DF4Loop
import pandas as pd
sample_dict = {
"column_1" : [ 100 , 200 , 300 , 400 , 500 ],
"column_2" : [ "A" , "B" , "C" , "D" , "E" ],
"column_3" : [ "a" , "b" , "c" , "d" , "e" ],
}
df = pd . DataFrame . from_dict ( sample_dict )
df| คอลัมน์ _1 | คอลัมน์ _2 | คอลัมน์ _3 | |
|---|---|---|---|
| 0 | 100 | อัน | อัน |
| 1 | 200 | ข | ข |
| 2 | 300 | C | C |
| 3 | 400 | d | d |
| 4 | 500 | อี | อี |
Dfiterator ช่วยให้นักพัฒนาเขียนโค้ดต่อไปนี้ นี่คือรหัสที่เขียนโดยใช้ pandas.dataframe.iterrows เพื่อจุดประสงค์ในการอ้างอิงค่าตามแถว
for index , row in df . iterrows ():
tmp = row [ "column_1" ]Dfiterator ทำซ้ำกระบวนการนี้และเพิ่มความเร็วขึ้น ที่จริงแล้ว DataFrame และ Row Pandas ซีรี่ส์จะถูกแปลงเป็นรายการและพจนานุกรมเพื่อเร่งความเร็ว อย่างไรก็ตามการใช้งานเกือบจะเหมือนกัน
from df4loop import DFIterator
df_iterator = DFIterator ( df )
for index , row in df_iterator . iterrows ():
tmp = row [ "column_1" ] หากคุณไม่จำเป็นต้องส่งออกดัชนีให้ตั้งค่า return_indexes=False
from df4loop import DFIterator
df_iterator = DFIterator ( df )
for row in df_iterator . iterrows ( return_indexes = False ):
tmp = row [ "column_1" ]DFGenerator รองรับการสร้าง DataFrame ด้วยแถวที่ตั้งค่าโดยลูป การเพิ่มแถวลงใน dataframe ในลูปจะใช้เวลานานในการประมวลผล ความลับในการเร่งความเร็วคือการจัดระเบียบแถวในรายการหรือพจนานุกรมแล้วทำให้พวกเขา pandas.dataframe ในครั้งเดียว DFGenerator สนับสนุนกระบวนการนี้สำหรับการใช้งานที่ใช้งานง่าย
รหัสต่อไปนี้เป็นตัวอย่างของการเลือกประเภท DICT เป็นแถว
from df4loop import DFGenerator
# It is not necessary to specify columns.
df_generator = DFGenerator ( columns = df . columns . values . tolist ())
for _ , row in df . iterrows ():
tmp_row = {
"column_1" : row [ "column_1" ],
"column_2" : row [ "column_2" ],
"column_3" : row [ "column_3" ],
}
df_generator . append ( tmp_row )
new_df = df_generator . generate_df ()รหัสต่อไปนี้เป็นตัวอย่างของการเลือกประเภทรายการเป็นแถว คอลัมน์จะต้องระบุในระหว่างการเริ่มต้น
from df4loop import DFGenerator
df_generator = DFGenerator ( columns = df . columns . values . tolist ())
for _ , row in df . iterrows ():
tmp_row = [
row [ "column_1" ],
row [ "column_2" ],
row [ "column_3" ],
]
df_generator . append ( tmp_row )
new_df = df_generator . generate_df ()