Descarga de federleicht - Descargar el código fuente de federleicht

federleicht

Código Fuente de IA

v0.1.0

Descargar

federleicht

federleicht es un paquete de Python que proporciona un decorador de caché para pandas.DataFrame , utilizando el formato de archivo de plumas pyarrow liviano y eficiente.

federleicht.cache_dataframe está diseñado para decorar funciones que devuelvan los objetos pandas.DataFrame . El decorador guarda el marco de datos en un archivo de plumas en la primera llamada y lo carga automáticamente en las llamadas posteriores si el archivo existe.

Características clave

Integración de plumas: guardar y cargar pandas.DataFrame sin esfuerzo utilizando el formato de plumas, conocido por su velocidad y simplicidad.
Simplicidad del decorador: agregue la funcionalidad de almacenamiento en caché a sus funciones con una sola línea de decorador.
El almacenamiento en caché eficiente: evite los cálculos redundantes reutilizando los resultados en caché.

Cache expiración

Para implementar el vencimiento de la caché, federleicht requiere que todos los argumentos de la función decorada sean serializables. El caché caducará en las siguientes condiciones:

Sensibilidad del argumento: el caché caducará si los argumentos ( args / kwargs ) de la función decorada cambian.
Cuando se pasa un objeto os.PathLike como argumento, el caché caducará si cambia el tamaño del archivo y / o el tiempo de modificación.
Detección de cambio de código: Cache caducará si la implementación / código de la función decorada cambia durante el desarrollo.
Vestido basado en el tiempo: Cache caducará cuando sea más antiguo que un timedelta determinado.
Además de los tipos de datos incorporados inmutables, se respaldan los siguientes tipos para argumentos:
- os.PathLike
- pandas.DataFrame
- pandas.Series
- numpy.ndarray
- datetime.datetime
- types.FunctionType

Instalación

Instale Federleicht de Pypi:

pip install federleicht

Normalmente, md5 se usa para hash los argumentos, pero para el hashing aún más rápido, puede probar xxhash como una dependencia opcional:

pip install federleicht[xxhash]

Uso

Aquí hay un ejemplo rápido:

 import pandas as pd
from federleicht import cache_dataframe

@ cache_dataframe
def generate_large_dataframe ():
    # Simulate a heavy computation
    return pd . DataFrame ({ "col1" : range ( 10000 ), "col2" : range ( 10000 )})

df = generate_large_dataframe ()

Punto de referencia

Archivo : Eartquakes-1990-2023.csv
Tamaño : 494.8 MB
Líneas : 3.445.752

Funciones que se utilizan para comparar el rendimiento del decorador cache_dataframe .

 def read_data ( file : str , ** kwargs ) -> pd . DataFrame :
    """
    Read the earthquake dataset from a CSV file to Benchmark cache.

    Perform some data type conversions and return the DataFrame.
    """
    df = pd . read_csv (
        file ,
        header = 0 ,
        dtype = {
            "status" : "category" ,
            "tsunami" : "boolean" ,
            "data_type" : "category" ,
            "state" : "category" ,
        },
        ** kwargs ,
    )

    df [ "time" ] = pd . to_datetime ( df [ "time" ], unit = "ms" )
    df [ "date" ] = pd . to_datetime ( df [ "date" ], format = "mixed" )

    return df

El pandas.DataFrame sin el diccionario attrs se almacenará en caché en el directorio .pandas_cache y solo caducará si el archivo cambia. Para obtener más detalles, consulte la sección de cadena de caché.

 @ cache_dataframe
def read_cache ( file : pathlib . Path , ** kwargs ) -> pd . DataFrame :
    return read_data ( file , ** kwargs )

Resultados de referencia

Los resultados dependen fuertemente de la configuración del sistema y del sistema de archivos. Los siguientes resultados se obtienen en:

OS : Windows
Versión del sistema operativo : 10.0.19044
Python : 3.11.9
CPU : AMD64 Familia 23 Modelo 104 Paseado 1, Authenticamd

nrows	read_data [s]	build_cache [s]	read_cache [s]
10000	0.060	0.076	0.037
32170	0.172	0.193	0.033
103493	0.536	0.569	0.067
332943	1.658	1.791	0.143
1071093	5.383	5.465	0.366
3445752	16.750	17.720	1.141

Dependencias

Expandir

Información adicional

Versión v0.1.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-30
tamaño 123.55KB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo