Descarga de ecco - Descarga del código fuente de ecco

ecco

Otro código fuente

v0.1.2: hotfix

Descargar

ECCO es una biblioteca de Python para explorar y explicar modelos de procesamiento del lenguaje natural utilizando visualizaciones interactivas.

ECCO proporciona múltiples interfaces para ayudar a la explicación e intuición de los modelos de lenguaje basados en transformadores. LEA: Interfaces para explicar los modelos de lenguaje de transformadores.

Ecco se ejecuta dentro de los cuadernos Jupyter. Está construido sobre Pytorch y Transformers.

ECCO no le preocupa la capacitación o los modelos de ajuste fino. Solo explorar y comprender los modelos previamente capacitados existentes. La biblioteca es actualmente un lanzamiento alfa de un proyecto de investigación. ¡Eres bienvenido a contribuir a hacerlo mejor!

Documentación: Ecco.ReadThedocs.io

Características

Soporte para una amplia variedad de modelos de idiomas (GPT2, Bert, Roberta, T5, T0 y otros) [cuaderno e instrucciones para agregar más modelos].
Capacidad para agregar sus propios modelos locales (si se basan en los modelos de pytorch de abrazadera).
Atribución de características (Gradientes integrados, prominencia, inputxgradient, profundo, shaptshap, guiedbackprop, guiedgradcam, deconvolution y LRP a través de Captum)
Capturar activaciones de neuronas en la capa FFNN en el bloque de transformador
Identificar y visualizar patrones de activación de neuronas (a través de la factorización de la matriz no negativa)
Examine las activaciones de las neuronas a través de comparaciones de espacios de activaciones utilizando SVCCA, PWCCA y CKA (vea este video sobre inspeccionar redes neuronales con CCA)
Visualizaciones para:
- Evolución del procesamiento de un token a través de las capas del modelo (lente logit)
- Tokens de salida candidatos y sus probabilidades (en cada capa del modelo)

Instalación

Puede instalar ecco con pip o con conda .

con Pip

pip install ecco

con conda

conda install -c conda-forge ecco

Ejemplos:

Puede ejecutar todos estos ejemplos de este [cuaderno] | [Colab].

¿Cuál es el sentimiento de esta revisión de la película?

Use un modelo de idioma grande (T5 en este caso) para detectar el sentimiento de texto. Además del sentimiento, vea los tokens en el que el modelo rompió el texto (lo que puede ayudar a depurar algunos casos de borde).

¿Qué palabras en esta revisión llevan al modelo a clasificar su sentimiento como "negativo"?

La atribución de características utilizando gradientes integrados lo ayuda a explorar las decisiones del modelo. En este caso, cambiar "debilidad" a "inclinación" permite que el modelo cambie correctamente la predicción a positivo .

Explore el conocimiento mundial de los modelos GPT planteando preguntas en blanco.

¿GPT2 sabe dónde está el aeropuerto de Heathrow? Sí. Lo hace.

¿Qué otras ciudades/palabras consideraron el modelo además de Londres?

Visualice los tokens de salida candidatos y sus puntajes de probabilidad.

¿Qué palabras de entrada lo llevan a pensar en Londres?

¿En qué capas reunieron el modelo de confianza de que Londres es la respuesta correcta?

El modelo eligió Londres haciendo la mayor probabilidad de token (clasificándolo #1) después de la última capa en el modelo. ¿Cuánto contribuyó cada capa a aumentar la clasificación de Londres ? Esta es una visualización de lentes logit que ayuda a explorar la actividad de diferentes capas de modelo.

¿Cuáles son los patrones en la activación de Bert Neuron cuando procesa un texto?

Un grupo de neuronas en Bert tiende a disparar en respuesta a las comas y otra puntuación. Otros grupos de neuronas tienden a disparar en respuesta a los pronombres. Use esta visualización para factorizar la actividad de las neuronas en capas FFNN individuales o en todo el modelo.

Lea el documento:

ECCO: una biblioteca de código abierto para la explicabilidad de las demostraciones del sistema de la Asociación de Modelos de Lenguaje de Transformador para Lingüística Computacional (ACL), 2021

Tutoriales

VIDEO: Eche un vistazo a los modelos de idiomas con ECCO. [Cuaderno de colab]

Guías de cómo hacer

Interfaces para explicar los modelos de lenguaje de transformadores
Encontrar las palabras para decir: visualizaciones de estado ocultas para modelos de idiomas

Referencia de API

La referencia de API y la página de arquitectura explican los componentes de Ecco y cómo trabajan juntos.

Galería y ejemplos

Tokens predichos: vea la predicción del modelo para el siguiente token (con puntajes de probabilidad). Vea cómo evolucionaron las predicciones a través de las capas del modelo. [Cuaderno] [Colab]

Rankings entre capas: después de que el modelo elige un token de salida, mira hacia atrás a cómo cada capa clasificaba esa token. [Cuaderno] [Colab]

Predicciones de capa: compare las clasificaciones de múltiples tokens como candidatos para una determinada posición en la secuencia. [Cuaderno] [Colab]

Atribuciones primarias: ¿Cuánto contribuyó cada token de entrada a producir el token de salida? [Cuaderno] [Colab]

Atribuciones primarias detalladas: consulte valores de atribuciones de entrada más precisos utilizando la vista detallada. [Cuaderno] [Colab]

Análisis de activación de neuronas: examine los patrones subyacentes en las activaciones de las neuronas utilizando la factorización de la matriz no negativa. [Cuaderno] [Colab]

Obtener ayuda

¿Tiene problemas?

El tablero de discusión podría tener información relevante. Si no, puede publicar sus preguntas allí.
Informar errores en el rastreador de problemas de ECCO

Bibtex para citas:

 @inproceedings { alammar-2021-ecco ,
    title = " Ecco: An Open Source Library for the Explainability of Transformer Language Models " ,
    author = " Alammar, J " ,
    booktitle = " Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: System Demonstrations " ,
    year = " 2021 " ,
    publisher = " Association for Computational Linguistics " ,
}

Expandir

Información adicional

Versión v0.1.2: hotfix
Tipo Otro código fuente
Fecha de actualización 2025-04-15
tamaño 1.12MB
Proviene de Github

Aplicaciones relacionadas

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo