Descargar MLstatkit - Descargar el código fuente de MLstatkit

MLstatkit

Código Fuente de IA

v0.1.4

Descargar

Mlstatkit

MlStatkit es una biblioteca integral de Python diseñada para integrar a la perfección métodos estadísticos en proyectos de aprendizaje automático. Abarca una variedad de herramientas, incluida la prueba de Delong para comparar áreas bajo dos curvas operativas de operación del receptor correlacionado (ROC), arranque para calcular los intervalos de confianza, AUC2OR para convertir el área bajo la curva de características operativas del receptor (AUC) en varias estadísticas relacionadas como Cohen's D, RPB de Pearson, Odds-Ratio y Natural Logts-Ratio-Ratio, y Permutation, para evaluar la Dods-Ratio de Cohen, para evaluar la RPB, Odds-Ratio y Natural log-ratio, y para el Logutación de Cohen, y Permutation, y Permutation, y Permutation y Permutation, y Permutation, y Permutation, y Permutation, y Permutation, y Permutation, y Permutation, y permuten, y lo permuten, y lo permuten, y lo permuten, y lo permuten. La importancia estadística de la diferencia entre las métricas de dos modelos al barajar aleatoriamente los datos y recalcular las métricas para crear una distribución de diferencias. Con su diseño modular, MlStatkit ofrece a los investigadores y científicos de datos un conjunto de herramientas flexible y poderoso para aumentar sus análisis y evaluaciones de modelos, atendiendo a un amplio espectro de necesidades de pruebas estadísticas dentro del dominio del aprendizaje automático.

Instalación

Instale mlStatkit directamente desde Pypi usando PIP:

pip install MLstatkit

Uso

Prueba de Delong

La función Delong_test permite una evaluación estadística de las diferencias entre las áreas bajo dos curvas operativas de operación del receptor correlacionado (ROC) derivadas de modelos distintos . Esto facilita una comprensión más profunda del rendimiento del modelo comparativo.

Parámetros:

Verdadero : Like de forma de matriz (n_samples,)
True etiquetas binarias en el rango {0, 1}.
Prob_a : matriz de forma (n_samples,)
Probabilidades predichas por el primer modelo.
Prob_b : matriz de forma (n_samples,)
Probabilidades predichas por el segundo modelo.

Devoluciones:

Z_Score : flotante
La puntuación Z al comparar los AUC de dos modelos.
p_value : flotante
El valor de P de comparar los AUC de dos modelos.

Ejemplo:

 from MLstatkit . stats import Delong_test

# Example data
true = np . array ([ 0 , 1 , 0 , 1 ])
prob_A = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 ])
prob_B = np . array ([ 0.2 , 0.3 , 0.4 , 0.7 ])

# Perform DeLong's test
z_score , p_value = Delong_test ( true , prob_A , prob_B )

print ( f"Z-Score: { z_score } , P-Value: { p_value } " )

Esto demuestra el uso de Delong_test para comparar estadísticamente los AUC de dos modelos basados en sus probabilidades y las verdaderas etiquetas. El puntaje Z devuelto y el valor P ayudan a comprender si la diferencia en el rendimiento del modelo es estadísticamente significativa.

Bootstrapping para intervalos de confianza

La función Bootstrapping calcula los intervalos de confianza para las métricas de rendimiento especificadas utilizando Bootstrapping, proporcionando una medida de la confiabilidad de la estimación. Admite el cálculo de AUROC (área bajo la curva ROC), AUPRC (área bajo la curva de recolección de precisión) y métricas de puntuación F1.

Parámetros:

Verdadero : Like de forma de matriz (n_samples,)
Verdaderas etiquetas binarias, donde las etiquetas son {0, 1}.
PROBLE : matriz de forma (n_samples,)
Probabilidades predichas, según lo devuelto por el método Predict_proba de un clasificador, o predicciones binarias basadas en la función de puntuación especificada y el umbral.
Metric_str : str, default = 'f1'
Identificador para la función de puntuación para usar. Los valores compatibles incluyen 'F1', 'Precisión', 'Retirar', 'Precisión', 'Roc_auc', 'PR_AUC' y 'promedio_precision'.
n_bootstraps : int, default = 1000
El número de iteraciones de arranque para realizar. El aumento de este número mejora la confiabilidad de la estimación del intervalo de confianza, pero también aumenta el tiempo computacional.
confianza_level : float, predeterminado = 0.95
El nivel de confianza para la estimación del intervalo. Por ejemplo, 0.95 representa un intervalo de confianza del 95%.
Umbral : Float, predeterminado = 0.5
Un valor umbral utilizado para convertir las probabilidades en etiquetas binarias para métricas como 'F1', cuando corresponda.
promedio : str, default = 'macro'
Especifica el método de promedio para aplicarse a objetivos de múltiples clases/múltiples etiquetas. Otras opciones incluyen 'micro', 'muestras', 'ponderado' y 'binario'.
random_state : int, default = 0
Semilla para el generador de números aleatorios. Este parámetro garantiza la reproducibilidad de los resultados.

Devoluciones:

Original_score : flotante
La puntuación calculada a partir del conjunto de datos original sin botas de arranque.
confianza_lower : flotante
El límite inferior del intervalo de confianza.
confianza_upper : flotante
El límite superior del intervalo de confianza.

Ejemplos:

 from MLstatkit . stats import Bootstrapping

# Example data
y_true = np . array ([ 0 , 1 , 0 , 0 , 1 , 1 , 0 , 1 , 0 ])
y_prob = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 , 0.2 , 0.3 , 0.4 , 0.7 , 0.05 ])

# Calculate confidence intervals for AUROC
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'roc_auc' )
print ( f"AUROC: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for AUPRC
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'pr_auc' )
print ( f"AUPRC: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for F1 score with a custom threshold
original_score , confidence_lower , confidence_upper = Bootstrapping ( y_true , y_prob , 'f1' , threshold = 0.5 )
print ( f"F1 Score: { original_score :.3f } , Confidence interval: [ { confidence_lower :.3f } - { confidence_upper :.3f } ]" )

# Calculate confidence intervals for AUROC, AUPRC, F1 score
for score in [ 'roc_auc' , 'pr_auc' , 'f1' ]:
    original_score , conf_lower , conf_upper = Bootstrapping ( y_true , y_prob , score , threshold = 0.5 )
    print ( f" { score . upper () } original score: { original_score :.3f } , confidence interval: [ { conf_lower :.3f } - { conf_upper :.3f } ]" )

Prueba de permutación para la significación estadística

La función Permutation_test evalúa la importancia estadística de la diferencia entre las métricas de dos modelos barajando aleatoriamente los datos y recalculando las métricas para crear una distribución de diferencias. Este método no asume una distribución específica de los datos, lo que lo convierte en una opción sólida para comparar el rendimiento del modelo.

Parámetros:

Y_true : matriz de forma (n_samples,)
Verdaderas etiquetas binarias, donde las etiquetas son {0, 1}.
Prob_model_a : matriz de forma (n_samples,)
Probabilidades predichas del primer modelo.
Prob_model_b : matriz de forma (n_samples,)
Probabilidades predichas del segundo modelo.
Metric_str : str, default = 'f1'
La métrica para la comparación. Las métricas compatibles incluyen 'F1', 'Precisión', 'Retiro', 'Precisión', 'Roc_auc', 'Pr_AUC' y 'promedio_precision'.
n_bootstraps : int, default = 1000
El número de muestras de permutación para generar.
Umbral : Float, predeterminado = 0.5
Un valor umbral utilizado para convertir las probabilidades en etiquetas binarias para métricas como 'F1', cuando corresponda.
promedio : str, default = 'macro'
Especifica el método de promedio para aplicarse a objetivos de múltiples clases/múltiples etiquetas. Otras opciones incluyen 'micro', 'muestras', 'ponderado' y 'binario'.
random_state : int, default = 0
Semilla para el generador de números aleatorios. Este parámetro garantiza la reproducibilidad de los resultados.

Devoluciones:

Metric_a : flotante
La métrica calculada para el Modelo A utilizando los datos originales.
Metric_B : flotante
La métrica calculada para el Modelo B utilizando los datos originales.
p_value : flotante
El valor p de la prueba de permutación, que indica la probabilidad de observar una diferencia tan extrema como más extrema que la diferencia observada bajo la hipótesis nula.
Benchmark : Float
La diferencia observada entre las métricas del modelo A y el modelo B.
muestras_mean : flotante
La media de las diferencias permutadas.
muestras_std : flotante
La desviación estándar de las diferencias permutadas.

Ejemplos:

 from MLstatkit . stats import Permutation_test

y_true = np . array ([ 0 , 1 , 0 , 0 , 1 , 1 , 0 , 1 , 0 ])
prob_model_A = np . array ([ 0.1 , 0.4 , 0.35 , 0.8 , 0.2 , 0.3 , 0.4 , 0.7 , 0.05 ])
prob_model_B = np . array ([ 0.2 , 0.3 , 0.25 , 0.85 , 0.15 , 0.35 , 0.45 , 0.65 , 0.01 ])

# Conduct a permutation test to compare F1 scores
metric_a , metric_b , p_value , benchmark , samples_mean , samples_std = Permutation_test (
    y_true , prob_model_A , prob_model_B , 'f1'
)

print ( f"F1 Score Model A: { metric_a :.5f } , Model B: { metric_b :.5f } " )
print ( f"Observed Difference: { benchmark :.5f } , p-value: { p_value :.5f } " )
print ( f"Permuted Differences Mean: { samples_mean :.5f } , Std: { samples_std :.5f } " )

Conversión de AUC a odds ratio (o)

La función AUC2OR convierte un área bajo el valor de la curva (AUC) en una probabilidad (OR) y opcionalmente devuelve valores intermedios como T, Z, D y Ln_or. Esta conversión es útil para comprender la relación entre AUC, una métrica común en la clasificación binaria, y o, que a menudo se usa en análisis estadísticos.

Parámetros:

AUC : flotante
El área bajo el valor de la curva (AUC) a convertir.
return_all : bool, default = false
Si es verdadero, devuelve valores intermedios (t, z, d, ln_or) además de o.

Devoluciones:

O : flotar
La probabilidad calculada (OR) del valor AUC dado.
t : flotante, opcional
Valor intermedio calculado a partir de AUC.
z : flotante, opcional
Valor intermedio calculado a partir de t.
D : flotante, opcional
Valor intermedio calculado a partir de z.
ln_or : flotante, opcional
El logaritmo natural de la odds ratio.

Ejemplos:

 from MLstatkit . stats import AUC2OR

AUC = 0.7  # Example AUC value

# Convert AUC to OR and retrieve all intermediate values
t , z , d , ln_OR , OR = AUC2OR ( AUC , return_all = True )

print ( f"t: { t :.5f } , z: { z :.5f } , d: { d :.5f } , ln_OR: { ln_OR :.5f } , OR: { OR :.5f } " )

# Convert AUC to OR without intermediate values
OR = AUC2OR ( AUC )
print ( f"OR: { OR :.5f } " )

Referencias

Prueba de Delong

La implementación de Delong_test en MlStatkit se basa en la siguiente publicación:

Xu Sun y Weichao Xu, "Implementación rápida del algoritmo de Delong para comparar las áreas bajo curvas características operativas del receptor correlacionado", en IEEE Signal Processing Letters , vol. 21, no. 11, pp. 1389-1393, 2014, IEEE.

Bootstrapping

El método Bootstrapping para calcular los intervalos de confianza no hace referencia directamente a una sola publicación, pero es una técnica estadística ampliamente aceptada para estimar la distribución de una métrica mediante el remuestreo con reemplazo. Para obtener una descripción completa de los métodos de arranque, consulte:

B. Efron y R. Tibshirani, "Una introducción a la bootstrap", Monografías de Chapman & Hall/CRC sobre estadísticas y probabilidad aplicada, 1994.

Prueba de permutación

Los Permutation_tests se utilizan para evaluar la importancia de la diferencia en las métricas de rendimiento entre dos modelos reasignando aleatoriamente las observaciones a los grupos y calculando la métrica. Este enfoque no hace supuestos de distribución específicos, lo que lo hace versátil para varios tipos de datos. Para una discusión fundamental sobre las pruebas de permutación, consulte:

P. bueno, "Pruebas de permutación: una guía práctica para los métodos de remuestreo para probar hipótesis", Serie Springer en estadísticas, 2000.

Estas referencias sientan las bases para las pruebas y metodologías estadísticas implementadas en MlStatkit, proporcionando a los usuarios una comprensión profunda de su base científica y aplicabilidad.

Auc2or

La función AUR2OR convierte el área bajo la curva característica de operación del receptor (AUC) en varias estadísticas relacionadas, incluidas las D de Cohen, RPB de Pearson, relación de probabilidades y relación de probabilidades de logarítmica natural. Esta conversión es particularmente útil para interpretar el rendimiento de los modelos de clasificación. Para una explicación detallada de las fórmulas matemáticas utilizadas en esta conversión, consulte:

Salgado, JF (2018). "Transformando el área bajo la curva normal (AUC) en la D de Cohen, RPB de Pearson, relación de probabilidades y ratio de probabilidades de registro natural: dos tablas de conversión". European Journal of Psychology aplicado al contexto legal, 10 (1), 35-47.

Estas referencias proporcionan la base matemática para la función AUR2OR, asegurando que los usuarios puedan interpretar con precisión la significación estadística y las implicaciones prácticas de las métricas de rendimiento de su modelo.

Que contribuye

¡Agradecemos contribuciones a MlStatkit! Consulte nuestras pautas de contribución para obtener más detalles.

Licencia

MlStatkit se distribuye bajo la licencia MIT. Para obtener más información, consulte el archivo de licencia en el repositorio de GitHub.

Registro de actualizaciones

0.1.7 Actualizar README.md
0.1.6 Depuración.
0.1.5 Actualizar README.md , agregue la función AUC2OR .
0.1.4 Actualizar README.md , agregue la función Permutation_tests , Vuelva a hacer parámetros Bootstrapping .
0.1.3 Actualizar README.md .
0.1.2 Agregue la pantalla de progreso del proceso de operación Bootstrapping .
0.1.1 Actualizar README.md , setup.py . Agregar CONTRIBUTING.md .
0.1.0 Primera edición

Expandir

Información adicional

Versión v0.1.4
Tipo Código Fuente de IA
Fecha de actualización 2025-08-29
tamaño 39.61KB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo