PyTorch Batch Attention Seq2seq Download - PyTorch Batch Attention Seq2seq Descargar código fuente Descargar

PyTorch Batch Attention Seq2seq

Otro código fuente

1.0.0

Descargar

Una implementación rápida de codificador de BI-RNN (GRU) y decodificador de atención en Pytorch

Este código está escrito en Pytorch 0.2. Cuando el Pytorch ha lanzado su versión 1.0, hay muchos paquetes de aprendizaje SEQ2SEQ excepcionales construidos en Pytorch, como OpenNMT, Allennlp y, etc., puede aprender de su código fuente.

Uso: consulte el tutorial de Pytorch Oficial sobre la traducción automática de atención de atención, excepto que esta implementación maneja las entradas por lotes, y que implementa un mecanismo de atención ligeramente diferente.
Para averiguar la diferencia de implementación a nivel de fórmula, las ilustraciones a continuación ayudarán mucho.

Ilustración del mecanismo de la versión de Pytorch, ver aquí:
http://pytorch.org/tutorials/_images/decoder-network.png
Tutorial de traducción automática de SEQ2SEQ de Pytorch:
http://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html
Ilustración de atención de Bahdanau, ver aquí:
http://images2015.cnblogs.com/blog/670089/201610/670089-20161012111504671-910168246.png

Versión de Pytorch Decoder de atención alimentada "Word_embedding" para calcular los pesos de atención, mientras que en el documento de origen se supone que es "Encoder_outputs". En este repositorio, implementamos el decodificador de atención de origen de acuerdo con el documento

Actualización: el codificador dinámico agregado y no requiere que las entradas se ordenen por longitud en un lote.

Acelerar con la manipulación del tensor por lotes

Pytorch admite la recuperación de elementos y la asignación de valores de tensor durante el procedimiento, pero en realidad es lento, especialmente cuando se ejecuta en GPU. En un tutorial (https://github.com/spro/practical-pytorch), los valores de atención se asignan alemanes; Es absolutamente correcto (e intuitivo de las fórmulas en papel), pero lento en nuestra GPU. Por lo tanto, volvimos a implementar una versión de manipulación de tensor por lotes real, y logra más de 10x mejora de velocidad.

Este código funciona bien en proyectos personales.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-04-16
tamaño 3.86KB
Proviene de Github

Aplicaciones relacionadas

PixivUtil2 batch plus plus

2024-11-11
Anime batch downloader gui

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
pytorch image models

2024-11-03
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Cambiar el tamaño de imágenes por lotes

2009-06-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo