DF4LOOP поддерживает процессы общего назначения, которые требуют комбинации как Pandas.DataFrame, так и цикла. В частности, миссия DF4loop заключается в «ускорении обработки» и «сделать сложный код интуитивно понятным» при низких затратах на установку.
pip install df4loopСледующий DataFrame определяется, чтобы помочь пользователям представить себе использование DF4LOOP.
import pandas as pd
sample_dict = {
"column_1" : [ 100 , 200 , 300 , 400 , 500 ],
"column_2" : [ "A" , "B" , "C" , "D" , "E" ],
"column_3" : [ "a" , "b" , "c" , "d" , "e" ],
}
df = pd . DataFrame . from_dict ( sample_dict )
df| Column_1 | Column_2 | Column_3 | |
|---|---|---|---|
| 0 | 100 | А | а |
| 1 | 200 | Беременный | беременный |
| 2 | 300 | В | в |
| 3 | 400 | Дюймовый | дюймовый |
| 4 | 500 | Эн | эн |
Dfiterator помогает разработчикам писать следующий код. Это код, написанный с использованием pandas.dataframe.iterrows с целью ссылки на значение по строке.
for index , row in df . iterrows ():
tmp = row [ "column_1" ]Dfiterator воспроизводит этот процесс и ускоряет его. На самом деле, DataFrame и его строки Pandas.series преобразуются в списки и словари для ускорения. Однако использование почти одинаково.
from df4loop import DFIterator
df_iterator = DFIterator ( df )
for index , row in df_iterator . iterrows ():
tmp = row [ "column_1" ] Если вам не нужно выводить индекс, установите return_indexes=False .
from df4loop import DFIterator
df_iterator = DFIterator ( df )
for row in df_iterator . iterrows ( return_indexes = False ):
tmp = row [ "column_1" ]DFGenerator поддерживает генерацию DataFrame с помощью строк, установленных петлями. Добавление строк в DataFrame в цикле займет много времени для обработки. Секрет ускорения состоит в том, чтобы организовать ряды в списке или словаре, а затем сделать их Pandas.DataFrame одновременно. DFGenerator поддерживает этот процесс для интуитивной реализации.
Следующий код является примером выбора типа DICT в качестве строки.
from df4loop import DFGenerator
# It is not necessary to specify columns.
df_generator = DFGenerator ( columns = df . columns . values . tolist ())
for _ , row in df . iterrows ():
tmp_row = {
"column_1" : row [ "column_1" ],
"column_2" : row [ "column_2" ],
"column_3" : row [ "column_3" ],
}
df_generator . append ( tmp_row )
new_df = df_generator . generate_df ()Следующий код является примером выбора типа списка в качестве строки. Столбцы должны быть указаны во время инициализации.
from df4loop import DFGenerator
df_generator = DFGenerator ( columns = df . columns . values . tolist ())
for _ , row in df . iterrows ():
tmp_row = [
row [ "column_1" ],
row [ "column_2" ],
row [ "column_3" ],
]
df_generator . append ( tmp_row )
new_df = df_generator . generate_df ()