federleicht Download - federleicht Source Code Télécharger

federleicht

Code Source AI

v0.1.0

Télécharger

Federleicht

federleicht est un package Python fournissant un décorateur de cache pour pandas.DataFrame , en utilisant le format de fichier de plumes pyarrow léger et efficace.

federleicht.cache_dataframe est conçu pour décorer des fonctions qui renvoient les objets pandas.DataFrame . Le décorateur enregistre le DataFrame à un fichier de plumes lors du premier appel et le charge automatiquement sur les appels ultérieurs si le fichier existe.

Caractéristiques clés

Intégration des plumes: sauvegarde et chargez pandas.DataFrame sans effort en utilisant le format de plumes, connu pour sa vitesse et sa simplicité.
Simplicité du décorateur: Ajoutez des fonctionnalités de mise en cache à vos fonctions avec une seule ligne de décorateur.
Cache efficace: Évitez les calculs redondants en réutilisant les résultats mis en cache.

Expiration du cache

Pour implémenter l'expiration du cache, federleicht exige que tous les arguments de la fonction décorée soient sérialisables. Le cache expirera dans les conditions suivantes:

Sensibilité à l'argument: le cache expirera si les arguments ( args / kwargs ) de la fonction décorée changent.
Lorsqu'un objet os.PathLike est passé comme argument, le cache expirera si la taille du fichier et / ou le temps de modification change.
Détection du changement de code: le cache expirera si l'implémentation / le code de la fonction décorée change pendant le développement.
Expiration temporelle: le cache expirera lorsqu'il sera plus âgé qu'un timedelta donné.
En plus des types de données intégrés immuables, les types suivants pour les arguments sont pris en charge:
- os.PathLike
- pandas.DataFrame
- pandas.Series
- numpy.ndarray
- datetime.datetime
- types.FunctionType

Installation

Installez Federleicht depuis PYPI:

pip install federleicht

Normalement, md5 est utilisé pour hacher les arguments, mais pour un hachage encore plus rapide, vous pouvez essayer xxhash comme dépendance facultative:

pip install federleicht[xxhash]

Usage

Voici un exemple rapide:

 import pandas as pd
from federleicht import cache_dataframe

@ cache_dataframe
def generate_large_dataframe ():
    # Simulate a heavy computation
    return pd . DataFrame ({ "col1" : range ( 10000 ), "col2" : range ( 10000 )})

df = generate_large_dataframe ()

Référence

Fichier : EartQuaks-1990-2023.csv
Taille : 494,8 Mo
lignes : 3 445 752

Fonctions utilisées pour comparer les performances du décorateur cache_dataframe .

 def read_data ( file : str , ** kwargs ) -> pd . DataFrame :
    """
    Read the earthquake dataset from a CSV file to Benchmark cache.

    Perform some data type conversions and return the DataFrame.
    """
    df = pd . read_csv (
        file ,
        header = 0 ,
        dtype = {
            "status" : "category" ,
            "tsunami" : "boolean" ,
            "data_type" : "category" ,
            "state" : "category" ,
        },
        ** kwargs ,
    )

    df [ "time" ] = pd . to_datetime ( df [ "time" ], unit = "ms" )
    df [ "date" ] = pd . to_datetime ( df [ "date" ], format = "mixed" )

    return df

Le pandas.DataFrame sans le dictionnaire attrs sera mis en cache dans le répertoire .pandas_cache et ne fera expirer que si le fichier change. Pour plus de détails, consultez la section d'expiration du cache.

 @ cache_dataframe
def read_cache ( file : pathlib . Path , ** kwargs ) -> pd . DataFrame :
    return read_data ( file , ** kwargs )

Résultats de référence

Les résultats dépendent fortement de la configuration du système et du système de fichiers. Les résultats suivants sont obtenus sur:

OS : Windows
Version du système d'exploitation : 10.0.19044
Python : 3.11.9
CPU : AMD64 Famille 23 Modèle 104 Stepping 1, Authenticamd

nrows	read_data [s]	build_cache [s]	read_cache [s]
10000	0,060	0,076	0,037
32170	0,172	0.193	0,033
103493	0,536	0,569	0,067
332943	1.658	1.791	0,143
1071093	5.383	5.465	0,366
3445752	16.750	17.720	1.141

Dépendances

Développer

Informations supplémentaires

Version v0.1.0
Type Code Source AI
Date de mise à jour 2025-08-30
taille 123.55KB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout