Download do ecco - Download do código -fonte ecco

ecco

Outro código-fonte

v0.1.2: hotfix

Baixar

A ECCO é uma biblioteca Python para explorar e explicar modelos de processamento de linguagem natural usando visualizações interativas.

A ECCO fornece várias interfaces para ajudar na explicação e intuição dos modelos de idiomas baseados em transformadores. Leia: Interfaces para explicar modelos de linguagem de transformadores.

A ECCO corre dentro de notebooks Jupyter. Ele é construído em cima de Pytorch e Transformers.

A ECCO não está preocupada com modelos de treinamento ou ajuste fino. Apenas explorar e entender os modelos pré-treinados existentes. Atualmente, a biblioteca é um lançamento alfa de um projeto de pesquisa. Você pode contribuir para torná -lo melhor!

Documentação: Ecco.readThedocs.io

Características

Suporte para uma ampla variedade de modelos de idiomas (GPT2, Bert, Roberta, T5, T0 e outros) [Notebooks e instruções para adicionar mais modelos].
Capacidade de adicionar seus próprios modelos locais (se eles são baseados em abraçar modelos de pytorch de rosto).
Atribuição de recursos (integrados gradientes, saliência, inputxgradient, deeplift, deepliftshap, guidedbackprop, guidedgradcam, deconvolução e LRP via capitum)
Capture ativações de neurônios na camada FFNN no bloco de transformador
Identifique e visualize os padrões de ativação de neurônios (via faturização de matriz não negativa)
Examine as ativações dos neurônios por meio de comparações de espaços de ativações usando SVCCA, PWCCA e CKA (consulte este vídeo sobre a inspeção de redes neurais com a CCA)
Visualizações para:
- Evolução do processamento de um token através das camadas do modelo (Lente Logit)
- Tokens de saída candidatos e suas probabilidades (em cada camada no modelo)

Instalação

Você pode instalar ecco com pip ou com conda .

com pip

pip install ecco

com conda

conda install -c conda-forge ecco

Exemplos:

Você pode executar todos esses exemplos deste [Notebook] | [colab].

Qual é o sentimento desta resenha do filme?

Use um modelo de idioma grande (T5 neste caso) para detectar o sentimento de texto. Além do sentimento, consulte os tokens em que o modelo divulgou o texto (que pode ajudar a depurar alguns casos de borda).

Quais palavras nesta revisão levam o modelo a classificar seu sentimento como "negativo"?

A atribuição de recursos usando gradientes integrados ajuda a explorar as decisões do modelo. Nesse caso, a troca de "fraqueza" para a "inclinação" permite que o modelo mude corretamente a previsão para positivo .

Explore o conhecimento mundial dos modelos GPT, colocando as perguntas em branco.

O GPT2 sabe onde está o aeroporto de Heathrow? Sim. Isso faz.

Que outras cidades/palavras o modelo considerou além de Londres?

Visualize os tokens de saída do candidato e suas pontuações de probabilidade.

Quais palavras de entrada levam a pensar em Londres?

Em que camadas o modelo reuniu confiança de que Londres é a resposta certa?

O modelo escolheu Londres, tornando o token de probabilidade mais alto (classificando -o nº 1) após a última camada no modelo. Quanto cada camada contribuiu para aumentar o ranking de Londres ? Esta é uma visualizações de lente de logit que ajuda a explorar a atividade de diferentes camadas de modelo.

Quais são os padrões na ativação do neurônio Bert quando processa um texto?

Um grupo de neurônios em Bert tende a disparar em resposta a vírgulas e outras pontuações. Outros grupos de neurônios tendem a disparar em resposta a pronomes. Use essa visualização para fatorar a atividade dos neurônios em camadas individuais do FFNN ou em todo o modelo.

Leia o artigo:

ECCO: Uma biblioteca de código aberto para a explicação da Associação de Modelos de Linguagem para Transformadores para Linguística Computacional (ACL) Demonstrações, 2021

Tutoriais

VÍDEO: Dê uma olhada dentro dos modelos de idiomas com ECCO. [Notebook Colab]

Guias de instruções

Interfaces para explicar modelos de linguagem de transformadores
Encontrando as palavras a dizer: Visualizações de estado ocultas para modelos de idiomas

Referência da API

A referência da API e a página de arquitetura explicam os componentes da ECCO e como eles trabalham juntos.

Galeria e exemplos

Tokens previstos: Veja a previsão do modelo para o próximo token (com pontuações de probabilidade). Veja como as previsões evoluíram através das camadas do modelo. [Notebook] [Colab]

Rankings através de camadas: depois que o modelo escolher um token de saída, olhe para trás em como cada camada classificou esse token. [Notebook] [Colab]

Previsões de camadas: Compare as classificações de vários tokens como candidatos a uma determinada posição na sequência. [Notebook] [Colab]

Atribuições primárias: quanto cada token de entrada contribuiu para a produção do token de saída? [Notebook] [Colab]

Atribuições primárias detalhadas: consulte os valores de atribuições de entrada mais precisos usando a visualização detalhada. [Notebook] [Colab]

Análise de ativação dos neurônios: examine os padrões subjacentes nas ativações de neurônios usando fatoração de matriz não negativa. [Notebook] [Colab]

Obtendo ajuda

Tendo problemas?

O quadro de discussão pode ter algumas informações relevantes. Caso contrário, você pode postar suas perguntas lá.
Relatório bugs no rastreador de edição da Ecco

Bibtex para citações:

 @inproceedings { alammar-2021-ecco ,
    title = " Ecco: An Open Source Library for the Explainability of Transformer Language Models " ,
    author = " Alammar, J " ,
    booktitle = " Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: System Demonstrations " ,
    year = " 2021 " ,
    publisher = " Association for Computational Linguistics " ,
}

Expandir

Informações adicionais

Versão v0.1.2: hotfix
Tipo Outro código-fonte
Data da Última Atualização 2025-04-15
tamanho 1.12MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos