PyTorch Batch Attention Seq2seq Téléchargement - PyTorch Batch Attention Seq2seq du code source

PyTorch Batch Attention Seq2seq

Autre code source

1.0.0

Télécharger

Un encodeur BI-RNN rapide et lots (GRU) et une implémentation de décodeur d'attention à Pytorch

Ce code est écrit en Pytorch 0.2. Au moment où le Pytorch a publié sa version 1.0, il existe de nombreux packages d'apprentissage SEQ2SEQ exceptionnels construits sur Pytorch, tels que OpenNMT, ALLENNLP et etc. Vous pouvez apprendre de leur code source.

Utilisation: veuillez vous référer au didacticiel Pytorch officiel sur la traduction machine de l'attention, sauf que cette implémentation gère les entrées par lots, et qu'elle implémente un mécanisme d'attention légèrement différent.
Pour découvrir la différence de mise en œuvre au niveau de la formule, les illustrations ci-dessous vous aideront beaucoup.

Illustration de mécanisme de version de Pytorch, voir ici:
http://pytorch.org/tutorials/_images/decoder-network.png
Pytorch Offical SEQ2SEQ Tutoriel de traduction machine:
http://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html
Illustration de l'attention de Bahdanau, voir ici:
http://images2015.cnblogs.com/blog/670089/201610/670089-20161012111504671-910168246.png

Le décodeur d'attention de la version Pytorch a nourri "word_embedding" pour calculer les poids d'attention, tandis que dans le papier d'origine, il est censé être "Encoder_Outputs". Dans ce référentiel, nous avons mis en œuvre le décodeur d'attention d'origine selon le document

Mise à jour: Encodeur dynamique ajouté et ne nécessite pas que les entrées soient triées par longueur dans un lot.

Accélérer avec une manipulation du tenseur lot

Pytorch prend en charge la récupération et l'attribution des valeurs du tenseur au cours des éléments pendant la procédure, mais en fait, il est lent, surtout lors de l'exécution sur GPU. Dans un tutoriel (https://github.com/spro/practitical-pytorch), les valeurs d'attention sont attribuées au niveau de l'élément; C'est absolument correct (et intuitif des formules sur papier), mais lent sur notre GPU. Ainsi, nous avons réimplémenté une véritable version de manipulation du tenseur par lots, et il réalise plus de 10x amélioration de la vitesse.

Ce code fonctionne bien sur les projets personnels.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-04-16
taille 3.86KB
Provenant de Github

Applications connexes

PixivUtil2 batch plus plus

2024-11-11
Anime batch downloader gui

2024-11-06
GitHub sgrebnov/cordova plugin background download

2024-11-05
pytorch image models

2024-11-03
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Redimensionneur d'image par lots

2009-06-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout