attention networks for classification - attention networks for classification

attention networks for classification

Outro código-fonte

1.0.0

Baixar

Redes de atenção hierárquica para classificação de documentos

Sabemos que os documentos têm uma estrutura hierárquica, as palavras se combinam para formar frases e frases combinadas para formar documentos. Podemos tentar aprender essa estrutura ou podemos inserir essa estrutura hierárquica no modelo e ver se ela melhora o desempenho dos modelos existentes. Este artigo explora essa estrutura para construir um modelo de classificação.

Esta é uma implementação (próxima) do modelo em Pytorch.

Observação:

Otimizo em conjunto a palavra e a sentença de modelos de atenção com o mesmo otimizador.
Os minibatches são acolchoados com zeros. Isso pode ser aprimorado, pode -se classificar os Senteces com comprimento semelhante juntos e minimizar os padrões.
Pytorch ainda não suporta máscara de gradiente, então os zeros acolchoados terão gradientes que fluem através deles durante a retropolulação. Pode -se criar uma máscara, mas como estou interessado em usar o GRU bidirecional, não é possível usar uma máscara. Eu já vi que o comprimento variável RNN Suptoort também está chegando a Pytorch. ATUALIZAÇÃO: O Pytorch mascarou o RNN mascarado agora com o método pack_padded_sequence.

Esta imagem do Blog Explosion explica a estrutura perfeitamente.

alt text

Caderno

O notebook contém um exemplo de modelo treinado no conjunto de dados de revisão de filmes do IMDB. Não consegui obter o conjunto de dados IMDB original ao qual o artigo mencionou, então usei esses dados

Os dados pré -processados estão disponíveis aqui

A melhor precisão que recebi foi de ~ 0,35. Este conjunto de dados possui apenas 84919 amostras e 10 classes. Aqui está a perda de treinamento para o conjunto de dados.

alt text

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-04-15
tamanho 105.33KB
Vindo de Github

Aplicativos Relacionados

foda-se para

2024-06-19
WNPM para Windows

2009-06-26
ZLPMServer para IIS

2009-06-23
FlashGot para Firefox

2009-06-22
iTunes para Windows

2009-06-03
Ajax para leigos

2009-05-23

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos